本文重點
- 二甲雙胍與黃斑部病變風險降低的關聯,在多項觀察性研究中具有一定重複性,機制層面也有合理說明,但尚未達到建議使用的證據等級,需要前瞻性 RCT 驗證。
- 老藥新用的核心困境,在於訊號分散、商業誘因缺位,難以系統性推進至臨床決策。
- TwTxGNN 以五級證據分類(L1-L5)為核心,整合 PubMed、ClinicalTrials、TFDA 與藥物交互作用資料庫,讓分散的文獻訊號轉化為有分級依據的知識節點。
- 訊號要進入臨床決策,還需要資料互通、流程整合、角色責任與治理機制同時到位;AI 工具是整合的起點,不是終點。
- 糖尿病患者可以用二甲雙胍預防黃斑部病變嗎?
- 目前的研究仍屬觀察性證據,尚未建立因果關係。二甲雙胍的核准適應症為第二型糖尿病的血糖管理,是否具有眼科保護效果需要前瞻性隨機對照試驗驗證。糖尿病患者若有眼科相關疑慮,應與主治醫師討論定期追蹤計畫,不建議基於目前研究自行調整用藥目的。
- 非糖尿病患者可以使用二甲雙胍預防黃斑部病變嗎?
- 現有研究對象均為第二型糖尿病患者,無法直接推論至非糖尿病族群。二甲雙胍在台灣核准的適應症為第二型糖尿病,非適應症使用需要明確的臨床評估與醫師判斷,不建議自行取得或使用。
- TwTxGNN 和一般老藥新用 AI 系統有什麼不同?
- TwTxGNN 的主要差異有三點:採用五級證據分類(L1-L5)讓使用者清楚知道每個預測背後的文獻基礎層次;整合台灣食藥署(TFDA)核准藥品資料,提供本地化覆蓋;以及結合四大藥物交互作用資料庫,讓查詢結果能同步呈現用藥安全資訊。這個設計針對的是臨床工作者「需要理由才能參考」的實際使用需求,而非單純追求預測精準度。
二甲雙胍(Metformin)是全球最廣泛使用的第二型糖尿病口服用藥之一,上市超過 60 年,安全性紀錄完整,每年使用人次以億計。然而,最近幾項研究提出了一個值得注意的問題:長期使用這款老藥的糖尿病患者,罹患年齡相關性黃斑部病變(AMD)的風險明顯較低。
這類訊號,如果是新藥,早就進了快速通道。問題在於,它是老藥。
這件事的困難,不只是「研究夠不夠多」的問題。真正要先搞清楚的是:從「觀察到相關性」到「有足夠證據支撐的可參考建議」之間,這段路為什麼這麼難走?又需要什麼樣的基礎設施,才能讓這類訊號不至於永遠停留在文獻層次?
一、糖尿病老藥,出現了一個意外的眼科訊號
多項觀察性研究發現,長期使用二甲雙胍的糖尿病患者,罹患年齡相關性黃斑部病變的風險顯著較低,其中一項英國研究發現中期 AMD 風險下降達 37%,但目前仍屬觀察性證據,因果關係尚未確立。
年齡相關性黃斑部病變(AMD,Age-related Macular Degeneration)是 50 歲以上族群最常見的不可逆視力喪失原因之一。黃斑位於視網膜中心,負責提供清晰的中央視覺,一旦損傷,讀字、辨臉、駕駛等日常功能都會受到嚴重影響。目前 AMD 的治療選項有限:濕性 AMD 可注射抗 VEGF 藥物延緩惡化,乾性 AMD 則幾乎沒有有效治療,只能仰賴生活型態管理與定期追蹤。
在這個背景下,二甲雙胍的眼科訊號顯得格外值得關注。
2026 年發表於 BMJ Open Ophthalmology 的一項英國人群研究,追蹤 2,545 名第二型糖尿病患者長達五年,發現使用二甲雙胍者發生中期 AMD 的風險降低了 37%(OR 0.63, 95% CI 0.43-0.92)(Romdhoniyyah 等人,見參考文獻 1)。同年另一項發表於 Ophthalmology Retina 的案例對照研究,使用美國醫療保險理賠資料庫,涵蓋逾 22,000 名新診斷 AMD 患者,發現任何劑量的二甲雙胍使用都與新發 AMD 風險降低相關(aOR 0.84, 95% CI 0.74-0.95),且這個關聯在沒有糖尿病視網膜病變的次族群中持續成立(Xiao 等人,見參考文獻 2)。
這不是孤立現象。過去幾年已累積多項來自不同國家、不同設計的觀察性研究,方向大致一致。訊號的可重複性,是讓這個問題值得認真對待的原因之一。但「訊號值得關注」和「可以臨床應用」,中間還有一段很長的距離。
二、為什麼二甲雙胍可能保護黃斑?機制拆解
目前研究指向兩條路徑:一是二甲雙胍能降低視網膜色素上皮細胞的氧化壓力、減少活性氧自由基(ROS)堆積;二是透過活化 AMPK 通路改善粒線體功能,而這兩個機制恰好對應 AMD 的核心病理。
要理解二甲雙胍為何可能有保護效果,需要先看 AMD 是怎麼形成的。
AMD 的核心病理,與氧化壓力和粒線體功能退化密切相關。視網膜色素上皮(RPE,Retinal Pigment Epithelium)細胞是維持光感受器正常功能的關鍵,也是整個視網膜中代謝最旺盛、對氧化損傷最敏感的細胞類型之一。隨著年齡增長,RPE 細胞的粒線體功能逐漸下降、活性氧自由基堆積,最終導致細胞功能喪失與外層視網膜退化。
二甲雙胍在這個機制路徑上的作用,大致分兩層:
第一層:抗氧化保護。 體外研究顯示,二甲雙胍能降低 RPE 細胞內的 ROS 濃度,並上調抗氧化酶的表達,對 RPE 細胞形成細胞保護效果。
第二層:粒線體功能維持。 二甲雙胍的主要作用機制是抑制粒線體複合體 I,進而活化 AMP 活化蛋白激酶(AMPK,AMP-activated protein kinase)。AMPK 是細胞能量感測的核心調控器,活化後能增強粒線體自噬(mitophagy),清除受損粒線體,維持整體粒線體健康。
這兩條路徑,恰好對應了 AMD 病理的核心問題:氧化壓力累積、粒線體功能退化。
2026 年發表於 Cureus 的一篇系統性文獻回顧,整合了 2015 年至 2025 年間的 10 項研究,結論指向「二甲雙胍對 RPE 細胞具有細胞保護效果,與氧化壓力降低及粒線體功能維持有關」,但也指出在某些特殊壓力條件下,此效果可能呈現雙向性,需進一步研究確認劑量與安全邊際(Neupane 等人,見參考文獻 3)。
機制的合理性,提升了訊號的可信度。但合理的機制加上觀察性證據,仍然不等於可以推薦使用。
「二甲雙胍與糖尿病患者中期 AMD 發生率降低相關,這個結果支持進行前瞻性臨床試驗,以進一步探索其作為老藥新用的潛在治療價值。」— Romdhoniyyah 等人(BMJ Open Ophthalmology, 2026)
三、從「觀察到相關性」到「有足夠支撐的建議」,卡在哪裡?

觀察性研究只能顯示相關,不能建立因果;糖尿病族群的用藥選擇本身存在選擇偏差,現有研究設計難以排除混淆變數,需要前瞻性隨機對照試驗才能確立適應症。
這裡要先把問題定義清楚。訊號存在,不等於「這個藥對這個適應症有效」的結論成立。現有研究的主要限制,可以歸納成幾個層次:
選擇偏差(Selection Bias)。 能長期使用二甲雙胍的糖尿病患者,通常整體血糖控制較好、腎功能較穩定、追蹤率較高。這些特徵本身,就可能與較低的 AMD 風險相關,跟二甲雙胍本身的效果難以切割。
混淆變數難以完全排除。 即使用統計方法調整已知混淆因素(如年齡、血糖控制、HbA1c、其他用藥),觀察性研究仍然無法完全控制未測量的混淆因素(如飲食習慣、運動量、陽光暴露等)。
效果的條件依賴性。 Xiao 等人(見參考文獻 2)的研究發現,以無視網膜病變的糖尿病次族群為例,二甲雙胍與 AMD 的關聯持續成立,但在已有視網膜病變者中消失。這個發現說明效果可能有高度的條件依賴性,不能簡單推論為普遍性保護作用。
劑量效果曲線不明。 同一項研究觀察到「中等劑量範圍(271-600 克累積劑量)關聯最強」,高劑量時關聯反而減弱。這個非線性關係,意味著若要發展成預防性用藥,需要更精確的劑量設計研究。
要把這些訊號轉化為有臨床依據的建議,下一步必然是隨機對照試驗(RCT)。但這裡就進入了老藥新用最核心的困境。
四、老藥新用的系統性困境:商業誘因缺位,訊號停在期刊
核心問題有兩個:製藥公司缺乏重新申請適應症的商業誘因(老藥已過專利期,無法獨佔市場),而學術界的研究往往點狀分散,缺乏跨國資料整合,難以形成足夠的申報依據。
二甲雙胍的情況很有代表性。這個藥的主要成分已是學名藥,任何廠商都可以生產,市場競爭充分,價格低廉。對製藥公司而言,即使成功將眼科保護效果申請為新適應症,也無法藉此建立價格壁壘,投入 RCT 的成本回收邏輯根本跑不通。
這個困境屬於整個老藥新用領域共同面對的結構性問題,二甲雙胍只是其中一個典型案例:
訊號點狀分散。 研究由各個學術機構獨立進行,使用不同的資料庫、不同的研究設計、不同的暴露量定義,結果無法直接比較或合併分析。
跨疾病資料缺乏整合。 一個老藥對多個疾病的潛在效果,若沒有系統性的知識架構,很難被同時評估與比較。研究者各做各的,訊號累積到什麼程度才算足夠,也沒有公認的判斷機制。
缺乏系統性推進機制。 學術期刊的發表邏輯是單篇研究的顯著性結果,整合型的再用訊號評估,沒有系統性的整合與篩選機制。
結果就是:大量具有潛力的再用訊號,停留在期刊文獻層次。臨床工作者即使有意參考,也缺乏經過系統整理的知識基礎。從「某研究發現相關」到「有足夠文獻支撐的可參考建議」,這段距離是系統性的,不是靠個別研究者努力可以解決的。
五、TwTxGNN 的設計思路:把分散訊號分級整合成可追溯的知識節點
TwTxGNN 建立在哈佛大學 TxGNN 模型之上,以五級證據分類系統(L1-L5)為核心,整合 PubMed 文獻、ClinicalTrials.gov 試驗資料與台灣食藥署核准資訊,讓每個預測結果都有對應的證據等級與可追溯依據,而非只輸出模型信心分數。
面對上述困境,TwTxGNN(Taiwan TxGNN,Therapeutic knowledge Graph Neural Network 台灣版)的設計思路從一個具體問題出發:老藥新用的訊號,本質上是圖(Graph)結構問題。藥物、疾病、基因、通路、臨床試驗之間的關係,構成一張巨大的知識網絡,而單一研究看到的只是這張網的某個局部。
雙引擎並行的預測架構。 TwTxGNN 底層沿用 TxGNN 的雙引擎設計,同時運行知識圖譜(Knowledge Graph)與深度學習兩種推理機制,以交叉驗證提升可信度,避免單一模型過度擬合的盲點。知識圖譜路徑依賴人工建立的醫學知識結構,可解釋性強但受限於已知知識的邊界;深度學習路徑能從資料中發現潛在的隱性關聯,但黑箱風險較高。兩者並行、互相校驗,是在預測能力與可信度之間取得平衡的架構選擇。
五級證據分類系統(L1-L5)。 在臨床應用情境中,光有預測結果是不夠的。TwTxGNN 針對每個藥物-疾病預測,按照現有臨床文獻的強度分為五個等級:L1 代表多項 Phase 3 隨機對照試驗支持,L2 為單一 RCT 或 Phase 2 試驗,L3 為觀察性研究,L4 為前臨床或機轉研究,L5 則為僅有模型預測、尚無臨床文獻支撐。這個分級讓臨床工作者可以一眼判斷「這個再用候選的現有證據基礎在哪個層次」,而非僅憑模型輸出做判斷。
以二甲雙胍對黃斑部病變的保護訊號為例,在目前以觀察性研究為主的證據基礎下,這類候選在系統中大約落在 L3 等級——有文獻支撐但尚未達到 RCT 驗證,這正是系統希望系統性捕捉並結構化呈現的核心類型。
台灣本地焦點與四大交互作用資料庫。 TwTxGNN 目前涵蓋 189 種台灣食藥署(TFDA)核准藥品,提供 704 個預測適應症的驗證報告,整合藥物-藥物交互作用(DDI,30 萬筆)、藥物-補充品(DDSI,8,359 筆)、藥物-食物(DFI,857 筆)及藥物-疾病(DHI,35 筆)四大交互作用資料庫,讓查詢結果能同步呈現用藥安全資訊。
2024 年發表於 Nature Medicine 的 TxGNN 論文顯示,在零樣本評估條件下,藥物新適應症預測準確度相較基線提升 49.2%,禁忌症預測提升 35.1%,且模型的預測與大型醫療系統中臨床工作者的實際處方用法高度相符(Huang 等人,見參考文獻 4)。
| 現有問題 | TwTxGNN 設計回應 |
|---|---|
| 觀察訊號點狀分散,缺乏整合 | 建立跨疾病、跨藥物的知識圖譜,系統性連結 |
| 單一模型可靠性存疑 | 雙引擎(知識圖譜 + 深度學習)交叉驗證 |
| 黑箱預測難以取信臨床工作者 | 五級證據分類(L1-L5)+ 可追溯 PubMed 與 ClinicalTrials 資料 |
| 罕見疾病資料量不足 | 零樣本學習機制,支援資訊稀少的疾病預測 |
| 台灣藥品資訊與國際資料庫脫節 | 整合 TFDA 核准藥品資料,189 種藥品在地化覆蓋 |
「TxGNN 在零樣本評估條件下,藥物新適應症預測準確度提升 49.2%,禁忌症預測提升 35.1%,且每個預測都附帶可追溯的多跳文獻路徑(即跨藥物、跨疾病、跨機制的多層文獻連結),讓臨床工作者得以評估預測背後的證據強度。」— Huang 等人(Nature Medicine, 2024)
六、從訊號到決策:還差哪幾步?
AI 預測是整合的起點,但訊號要進入臨床決策,還需要三個條件同時成立:資料互通基礎(FHIR 標準讓跨系統資料可比較)、角色責任清晰(誰負責審查預測結果)、治理機制到位(誰負責驗證 AI 的預測品質)。
這件事不能只看 AI 工具的預測能力強不強。
訊號到決策之間的系統性落差,涉及幾個層次的問題,技術只是其中一層:
資料互通問題。 要讓 TwTxGNN 這類系統能夠持續學習和更新,需要跨醫療系統的資料能夠被整合比較。FHIR(Fast Healthcare Interoperability Resources,快速醫療互通資源)是目前最有可能成為基礎標準的架構,但實際導入仍面臨本地化差異、填寫品質不一致等問題。有了標準不等於有了品質一致的資料,後者才是真正的瓶頸。
流程整合問題。 AI 系統的預測輸出,需要放在臨床工作流的哪個環節?誰要看到這個資訊?以什麼形式呈現?在什麼情況下需要採取後續行動?這些問題如果沒有在流程設計層面解決,即使系統部署了,也可能只是多了一個看板,而不是真正改變決策品質。
角色責任問題。 老藥新用的預測,本質上是「建議臨床工作者考慮的候選訊號」,而非「可以直接執行的醫囑」。審查這些預測、決定是否納入臨床考量的責任,需要明確歸屬。系統輸出的可信度評估,也需要有人負責定期驗核,因為模型效能會隨時間漂移,沒有治理機制,訊號品質只會下降。
監管定位問題。 AI 輔助藥物再利用的預測,涉及醫療決策輔助的監管範疇。在不同國家和地區,這類工具的定位、審查要求和責任框架各不相同。把它設計成「決策輔助」而非「決策替代」,不只是監管策略,也是讓臨床工作者願意使用的前提。
可執行步驟
評估老藥新用 AI 工具的核查清單
- 證據分級是否透明:工具是否提供類似 L1-L5 的證據等級,讓使用者判斷預測背後的文獻基礎深度?
- 預測可追溯性:每個預測結果是否附帶可核查的文獻依據(PMID、NCT 等),而非只輸出信心分數?
- 本地化覆蓋:工具是否整合當地監管機關(如 TFDA)核准資訊,而非單純依賴國際資料庫?
- 流程整合設計:工具在哪個臨床工作環節介入?由誰審查預測結果?
- 效能監控機制:有沒有定期驗核預測準確度的機制?如何應對模型效能漂移?
糖尿病患者可以用二甲雙胍預防黃斑部病變嗎?
目前的研究仍屬觀察性證據,尚未建立因果關係。二甲雙胍的核准適應症為第二型糖尿病的血糖管理,是否具有眼科保護效果需要前瞻性隨機對照試驗驗證。糖尿病患者若有眼科相關疑慮,應與主治醫師討論定期追蹤計畫,不建議基於目前研究自行調整用藥目的。
非糖尿病患者可以使用二甲雙胍預防黃斑部病變嗎?
現有研究對象均為第二型糖尿病患者,無法直接推論至非糖尿病族群。二甲雙胍在台灣核准的適應症為第二型糖尿病,非適應症使用需要明確的臨床評估與醫師判斷,不建議自行取得或使用。
TwTxGNN 和一般老藥新用 AI 系統有什麼不同?
TwTxGNN 的主要差異有三點:採用五級證據分類(L1-L5)讓使用者清楚知道每個預測背後的文獻基礎層次;整合台灣食藥署(TFDA)核准藥品資料,提供本地化覆蓋;以及結合四大藥物交互作用資料庫,讓查詢結果能同步呈現用藥安全資訊。這個設計針對的是臨床工作者「需要理由才能參考」的實際使用需求,而非單純追求預測精準度。
老藥新用的訊號,為什麼不能靠 AI 直接確立效果?
AI 系統做的是「預測潛在候選」,不是「驗證臨床效果」。驗證仍需要隨機對照試驗(RCT)。AI 的貢獻在於加速發現值得進一步驗證的候選,以及讓既有文獻訊號更容易被系統性整合,而非取代臨床試驗的角色。訊號強不代表效果確立,這兩件事需要明確區分。
如何評估一個老藥新用 AI 工具的可靠性?
核心指標有三個:預測是否有文獻可追溯(而非黑箱),且提供明確的證據等級分類;效能評估是否採用嚴格的零樣本或前瞻性設計(避免訓練資料洩漏);以及是否有明確的使用情境定義(在哪個臨床環節、由誰審查)。工具的使用場景設計,往往比模型精準度本身更能決定它能不能真正被採用。
重點摘要
- 二甲雙胍與黃斑部病變風險降低的關聯,在多項觀察性研究中具有一定重複性,機制層面也有合理說明,但尚未達到建議使用的證據等級,需要前瞻性 RCT 驗證。
- 老藥新用的核心困境,在於訊號分散、商業誘因缺位,難以系統性推進至臨床決策。
- TwTxGNN 以五級證據分類(L1-L5)為核心,整合 PubMed、ClinicalTrials、TFDA 與藥物交互作用資料庫,讓分散的文獻訊號轉化為有分級依據的知識節點。
- 訊號要進入臨床決策,還需要資料互通、流程整合、角色責任與治理機制同時到位;AI 工具是整合的起點,不是終點。
參考文獻
-
Romdhoniyyah DF, et al. (2026). Metformin and incidence of age-related macular degeneration in people with diabetes: a population-based 5-year case-control study. BMJ Open Ophthalmology, doi:10.1136/bmjophth-2025-002339. https://pubmed.ncbi.nlm.nih.gov/41633708/
-
Xiao JF, et al. (2026). Association of Metformin Use and New-Onset International Classification of Diseases Coding of Neovascular Age-Related Macular Degeneration. Ophthalmology Retina, doi:10.1016/j.oret.2026.01.019. https://pubmed.ncbi.nlm.nih.gov/41621806/
-
Neupane R, et al. (2026). Effects of Metformin on Mitochondrial Health and Oxidative Stress in Age-Related Macular Degeneration: A Systematic Review. Cureus, doi:10.7759/cureus.104820. https://pubmed.ncbi.nlm.nih.gov/41948241/
-
Huang K, et al. (2024). A foundation model for clinician-centered drug repurposing. Nature Medicine, doi:10.1038/s41591-024-03233-x. https://pubmed.ncbi.nlm.nih.gov/39322717/