當老藥新用走進 EHR：AI 預測什麼時候才算真正進入工作流

本文重點

預測分數只是候選生成，不等於判斷依據
決策需要臨床試驗、文獻、證據等級、安全性資料的完整脈絡
現有工具的瓶頸在於資訊整合，而非模型準確度

多數老藥新用工具停在同一個位置：給一個分數，說這個藥對這個疾病「可能有效」。

這裡要先把問題定義清楚。研究人員看到分數之後，實際上需要做什麼？他們需要判斷這個候選組合值不值得進一步驗證——而要做出這個判斷，需要完整的證據脈絡：有沒有臨床試驗、文獻支撐是什麼等級、安全性風險怎麼評估。

「預測」和「可判斷」不是同一件事。這是現在多數老藥新用工具卡住的位置。

多層銀色鋁箔藥品泡殼包裝特寫，藍色光影映照

一、「預測」和「可判斷」是兩件事

AI 模型提供的是候選方向，不是決策依據。研究人員要做的判斷需要臨床試驗紀錄、文獻索引、證據等級、安全性與交互作用資料，這些資訊分散在多個資料庫，現有工具幾乎都沒有整合。

老藥新用工具的核心邏輯是：用已知藥物與疾病關係訓練模型，預測哪些現有藥物可能對其他疾病有效。哈佛 TxGNN 模型透過知識圖譜加深度學習，預測出超過 14 萬個候選藥物-疾病組合。

但從這個預測結果到「這個組合值得先驗」，中間存在一個資訊缺口：

模型說可能有效，研究人員需要知道是否有臨床試驗在進行、文獻支撐是什麼等級
分數高不代表優先，要判斷優先順序還需要看安全性資料的完整度
缺乏安全性脈絡，藥物交互作用資料必須一併納入評估

工具停在「分數」的位置，讓研究人員仍需跨平台自行整合資訊，這是問題真正形成的原因。

重點摘要

預測分數只是候選生成，不等於判斷依據
決策需要臨床試驗、文獻、證據等級、安全性資料的完整脈絡
現有工具的瓶頸在於資訊整合，而非模型準確度

二、研究人員真正需要的是什麼

研究人員在評估候選組合時，需要同時掌握六個面向：ClinicalTrials.gov 臨床試驗紀錄、PubMed 文獻索引、DrugBank 藥物資訊、台灣 TFDA 核准與健保狀態、DDInter 藥物交互作用資料，以及知識圖譜的模型預測基礎。這六個來源的整合程度，決定了工具能不能真正進入評估流程。

研究人員的評估流程通常需要依序回答：這個候選有無臨床試驗、文獻支撐等級、台灣核准與健保狀態、安全性風險是否充分記錄、整體證據等級如何判定。每一個問題對應不同的資料來源，過去的工具只提供模型預測，沒有整合後面的資訊。

「藥物再利用研究的主要瓶頸，不在於缺乏候選藥物，而在於缺乏系統性整合臨床證據的工具。多數 AI 預測工具產生大量候選，但沒有提供研究人員快速判斷優先順序所需的完整脈絡。」— Drug Repurposing Hub（Broad Institute）研究報告

資訊面向	傳統流程	整合工具
候選藥物生成	文獻回顧 + 假設	AI 知識圖譜預測
臨床試驗查找	手動查 ClinicalTrials.gov	自動整合 NCT 編號
文獻索引	手動查 PubMed	自動整合 PMID
藥物交互作用	手動查 DrugBank、DDInter	整合 22 萬筆交互作用資料
台灣藥品狀態	手動查 TFDA	整合 TFDA 核准與健保資料
證據等級判定	人工評估	L1-L5 自動分級

三、從預測到可判斷：四步驗證流程

核心架構是四步流程：TxGNN 做候選生成 → Bundle 自動蒐集臨床試驗與文獻 → Evidence Pack 判定 L1-L5 證據等級 → Notes 產出結構化驗證報告。每一步的輸出都是下一步的輸入，最終讓研究人員在一個介面內完成需要跨平台的判斷工作。

TwTxGNN 是以哈佛 TxGNN 為基礎、針對台灣藥品環境整合的老藥新用驗證平台，把四個步驟串成一條流程：

Step 1：TxGNN 預測
知識圖譜加深度學習，從 677 種藥物和 1,035 項適應症中預測 14 萬個候選組合。輸出是排序後的候選清單，不是結論。

Step 2：Bundle 資料蒐集
對每個候選組合，自動蒐集 ClinicalTrials.gov 臨床試驗編號（NCT，即 ClinicalTrials.gov 的唯一識別碼）、PubMed 文獻索引（PMID，PubMed 文章識別碼），以及 TFDA 台灣核准與健保狀態。

Step 3：Evidence Pack 證據整理
依據蒐集到的臨床試驗和文獻，判定 L1-L5 證據等級，並整合 DDInter 的 22 萬筆藥物交互作用資料。L1 表示有多個 Phase 3 隨機對照試驗（RCT），L5 表示目前僅有模型預測。等級判定讓研究人員能快速比較不同候選組合的證據強度。

Step 4：Notes 報告產出
產出結構化驗證報告，包含預測基礎、臨床試驗數量、文獻支撐、證據等級、安全性摘要，以及 Go / Proceed / Hold 的決策建議。

「SMART on FHIR（Substitutable Medical Applications, Reusable Technologies on FHIR）框架讓第三方應用能安全嵌入既有 EHR 系統，透過 OAuth 2.0 授權控制存取範圍，無需患者資料複製到外部伺服器。」— HL7 International，SMART App Launch 規範文件

TwTxGNN 同時提供 SMART on FHIR 應用（FHIR，即 Fast Healthcare Interoperability Resources，醫療資訊交換標準），讓工具可以直接嵌入支援 FHIR R4 標準的 EHR 系統。當醫師或研究人員在 EHR 介面查看病患藥物清單時，SMART App 自動讀取 RxNorm 藥物代碼（RxNorm 是美國國家醫學圖書館編制的標準化藥物代碼系統），對應至 TwTxGNN 的藥物資料庫，顯示再利用潛力與對應的證據等級，不需要切換到外部平台。

四、Go / Proceed / Hold 是優先順序，不是結論

這三個標籤不是「做或不做」的最終裁決，而是研究優先順序的參考訊號。Go（L1-L2）表示已有強證據支撐，值得優先投入資源；Proceed（L2-L3）表示有初步證據但需進一步驗證；Hold（L4-L5）表示目前證據基礎薄弱，建議先觀望或補充前臨床研究。

常見誤解是把「AI 建議 Go」解讀為「這個藥有效」。Go / Proceed / Hold 的判定邏輯是根據現有臨床試驗和文獻的證據等級，不是根據 AI 模型的預測分數。

這個設計的實際價值是：讓研究人員在面對 14 萬個候選組合時，能快速識別哪些已有足夠證據可以直接進入驗證設計，哪些還需要補充前臨床數據才有意義推進。

可執行步驟

如何用 Go / Proceed / Hold 安排老藥新用研究的優先順序

先篩 Go 清單：從 L1-L2 候選中確認有無台灣健保藥品，優先考慮可直接取得的藥物
審查 Proceed 候選的試驗設計：讀取 NCT 臨床試驗摘要，確認 Phase 2 試驗的主要終點與族群是否符合目標
評估安全性門檻：查看每個候選的藥物交互作用評分（DDI/DDSI），排除高風險候選
對比 TFDA 核准狀態：已核准適應症以外的使用需評估法規路徑可行性
記錄 Hold 候選用於後續追蹤：L4-L5 候選可建立觀察清單，等待前臨床證據補充

五、進入工作流的真正條件是什麼

進入工作流有兩個條件：一是工具的輸出必須出現在工作流中的正確決策點上，而不是在決策點外提供參考；二是工具的操作成本必須低於手動查找資訊的成本，否則研究人員不會持續使用。

很多工具沒辦法進入工作流，原因不是功能不夠強，而是位置放錯了。研究人員工作流有明確的決策點——「這個候選要不要進入下一階段？」如果工具的輸出不能直接回答這個問題，研究人員就會繞過工具自己找資料。

SMART on FHIR 的設計是在解這個問題。當研究人員在查看病患用藥時，工具直接在同一個介面顯示再利用潛力和對應證據，輸出出現在決策點上，使用成本最低。

反過來從流程看，最好的老藥新用系統，不是預測最多，而是能讓研究人員最快知道三件事：哪些候選值得先驗、為什麼值得先驗、這個候選的主要風險在哪裡。這三個問題對應的，正好是 Evidence Pack 的證據等級、Bundle 的文獻與試驗脈絡，以及 DDInter 的交互作用資料。

重點摘要

工具能否進入工作流，取決於輸出是否出現在正確的決策點上
SMART on FHIR 整合讓證據資訊在 EHR 介面直接可見，降低使用切換成本
四步驗證流程的核心是把跨平台查找工作收斂在一個工具內
最好的設計是讓研究人員最快判斷「哪些值得先驗、為什麼、風險在哪裡」

## 常見問題

研究人員最常詢問的問題，集中在工具差異、證據等級定義、FHIR 整合的實際意義，以及預測結果的使用範圍。以下整理最常見的五個問題。

Q1：TwTxGNN 和其他老藥新用工具的主要差異是什麼？

多數工具提供 AI 候選預測，但不整合臨床試驗、文獻索引和安全性資料。TwTxGNN 把預測 → 蒐集臨床與文獻證據 → 判定 L1-L5 證據等級 → 產出結構化報告串成一條流程。另一個差異是針對台灣藥品環境，整合了 TFDA 核准狀態和健保資訊。

Q2：L1-L5 證據等級怎麼判定？

L1 代表有多個 Phase 3 隨機對照試驗支撐，L2 是單一 RCT 或 Phase 2 試驗，L3 是觀察性研究，L4 是前臨床或機轉研究，L5 是僅有模型預測。L1-L2（Go/Proceed）的候選有現成的臨床證據可以評估，L4-L5（Hold）的候選需要先補充前臨床依據才有意義推進。

Q3：SMART on FHIR 整合對研究人員的實際意義是什麼？

FHIR（Fast Healthcare Interoperability Resources）是讓不同醫療系統資料能夠互通的標準格式。SMART on FHIR 讓第三方應用安全嵌入 EHR 系統。對研究人員來說，工具不再是獨立的外部系統，而是直接在 EHR 介面中顯示，不需要切換平台，降低了使用成本和資訊遺漏的風險。

Q4：工具的預測結果能直接用於臨床決策嗎？

不可以直接用於臨床決策。預測結果和 Evidence Pack 都是研究評估的輔助工具，不構成醫療建議。實際用藥需遵循醫師指示，老藥新用的適應症擴展也需要通過正式的臨床試驗驗證和主管機關核准程序。

Q5：台灣的藥品資料在平台上有多完整？

TwTxGNN 目前涵蓋 189 種 TFDA 核准藥品、704 個預測適應症，整合四個交互作用資料庫：DDI（藥物-藥物，30 萬筆）、DDSI（藥物-補充品）、DFI（藥物-食品）、DHI（藥物-草藥）。資料的完整程度反映現有公開資料庫的覆蓋範圍，不代表所有可能的交互作用都已知。

分享這篇文章

Facebook
LINE
X

用 AI 聊這篇文章

ChatGPT
Claude
Gemini

appi.news 編輯部

Author

View All Posts

發佈留言取消回覆

Related Stories

問題不在 AI 能不能取代醫生，而在我們是不是搞錯了醫療的本質

AI 能讓精準判斷真正被支付嗎？解析醫療支付制度的核心矛盾

當病人先問 AI，醫療現場改變的不只是知識取得，而是信任與責任的分配

You May Have Missed

問題不在 AI 能不能取代醫生，而在我們是不是搞錯了醫療的本質

AI 能讓精準判斷真正被支付嗎？解析醫療支付制度的核心矛盾

當病人先問 AI，醫療現場改變的不只是知識取得，而是信任與責任的分配

對比各國外送生態，為什麼 foodpanda 做不下去？

本文重點

一、「預測」和「可判斷」是兩件事

重點摘要

二、研究人員真正需要的是什麼

三、從預測到可判斷：四步驗證流程

四、Go / Proceed / Hold 是優先順序，不是結論

可執行步驟

五、進入工作流的真正條件是什麼

重點摘要

Q1：TwTxGNN 和其他老藥新用工具的主要差異是什麼？

Q2：L1-L5 證據等級怎麼判定？

Q3：SMART on FHIR 整合對研究人員的實際意義是什麼？

Q4：工具的預測結果能直接用於臨床決策嗎？

Q5：台灣的藥品資料在平台上有多完整？

About the Author

發佈留言 取消回覆

Related Stories

You May Have Missed

發佈留言取消回覆