如何評估中醫 AI 是否可信：診斷推理、藥材溯源、炮製管控的 3 層核心問題

本文重點

中醫 AI 的可信度，核心在推理邏輯是否透明、可追溯、可被驗證，準確率只是起點
藥材品質問題分兩類：自然品質變異（管理缺口）與刻意造假（洗產地、加料通過檢驗），後者針對性地規避現有管控機制
洗產地難靠成分指標抓出，需建立以化學指紋為基礎的產地對照資料庫，並搭配完整的供應鏈溯源記錄
「加料通過檢驗」的造假邏輯正是針對「以指標成分濃度判合格」的漏洞；全光譜化學指紋分析比單點指標更難被規避
信任體系需要技術、法規、組織治理三個層次同步推進，缺一不可

AI 中醫診斷系統目前在哪些場景實際應用？: 目前較成熟的應用集中在輔助教學與初篩，如舌診圖像辨識、脈象數位化記錄。臨床場景中，多數系統定位為「輔助工具」，最終診斷仍由持照中醫師負責。以 AI 直接取代中醫師出具診斷，目前在多數地區不符合法規要求。
台灣購買的中藥材有被把關嗎？: 有。衛生福利部食品藥物管理署（TFDA）對進口中藥材設有邊境抽批查驗機制，不合格者退運或銷毀；國內中藥廠製造的濃縮製劑須符合中藥 GMP 規範。消費者可確認產品是否具有衛福部核准的藥品許可字號，選擇有完整標示的正規通路。現行機制對成分安全有一定保障，但對洗產地的把關能力相對有限。
近紅外光譜（NIR）辨識中藥材的準確率如何？: NIR 辨識準確率高度依賴訓練資料的品質與代表性。在研究條件下，特定藥材辨識和摻假偵測可達到高準確率。更重要的是：面對「加料通過檢驗」等針對性造假，全光譜指紋分析比單點成分測定更具鑑別力，準確率數字本身不能反映防偽能力的全貌。

談到中醫 AI，多數人第一個問的是「準不準？」。這個問題當然重要，但有一個更前面的問題還沒被定義清楚：準確率是怎麼算出來的、依據是什麼、由誰驗證？

中醫現代化的核心挑戰，不只在技術能不能做到，更在「信任體系能不能被建立起來」。這裡的信任，涵蓋三個層次：AI 診斷推理的信任、藥材來源的信任、炮製品質的信任。三個層次各有不同的問題形成原因，需要不同的解決路徑。

先把問題定義清楚，再追問原因，最後才談方法與更好的做法。

一、四診合參遇上 AI：辨證邏輯的黑箱困境

技術上已有系統整合脈診、面診、舌診、問診四個診斷維度，但能建立信任的前提，是辨證推理過程可以被閱讀和驗證，而非只看輸出結論。

中醫四診合參的核心邏輯是「多源訊號的綜合判斷」。在傳統學習脈絡中，辨證思路依靠師承口授，透過大量臨床案例和師生討論逐步內化，很難轉換成可系統化傳遞的形式。

當 AI 被引入這個場景，問題就出現了。若只讓大型語言模型（LLM）直接學習中醫診療記錄，輸出辨證建議，推理過程仍然是黑箱，使用者只能看到「結論」，卻無法追溯「這個結論依據哪些規則推導出來」。

往下追問一層：為什麼黑箱輸出在中醫場景特別成問題？

第一，中醫辨證需要可視化的思路交接。 師承傳遞的核心機制在於思路的可讀化移轉，若 AI 的辨證邏輯無法被閱讀，年輕中醫師從中學習辨證思路的機會就大幅壓縮，「賦能傳承」便淪為空話。

第二，醫療場景需要責任追溯。 臨床人員需要能判斷「這個建議合不合理」，推理路徑不透明的建議，在臨床場景很難取得足夠信任。

第三，辨證規則的品質決定系統邊界。 同一組症狀在不同辨證框架下可能導向不同結論，若規則沒有被明文化，使用者無從得知系統用的是哪套框架、適用於什麼情境。

解法的方向由此清楚：讓辨證邏輯從設計起點就具備可審閱的結構。具體路徑包括：將辨證判斷依據整理為明文規則（如八綱辨證、臟腑辨證的規則庫）；讓每個推理結論都記錄完整的判斷路徑；提供建議時標示所依賴的證據來源。

根據 Tian D et al.（2024）的系統性回顧，機器學習在四診各維度的應用已有相當進展，但核心挑戰在於診斷標準的主觀性與資料品質不一致，使得跨機構驗證仍然困難。技術能力的提升和信任體系的建立，需要同步推進，無法相互替代。

二、藥材來源的信任斷層：品質問題從哪裡開始？

品質風險分布在自然變異與刻意造假兩大類型，前者來自種植、加工、儲存的管理缺口，後者來自利益驅動的產地造假與以次充好，兩類問題的成因不同，管控機制也不能一概而論。

討論中藥安全，容易把問題簡化成「重金屬超標」或「農藥殘留超量」。這兩個指標固然重要，卻只是整個品質鏈的末端截點。只盯末端，就會錯過問題真正形成的位置。

品質問題的形成，分成兩類性質截然不同的來源。

第一類：供應鏈的自然品質變異

這類問題源於種植、加工、儲存各環節的管理缺口：產地氣候與土壤差異造成同一藥材在不同產地的有效成分含量差異顯著，道地藥材的概念根深柢固但品質一致性難以在無溯源資訊的情況下保證；炮製技術的標準化缺口讓品質穩定性因廠而異；重金屬與農藥汙染在種植用藥不規範或土壤汙染的環境下難以避免；儲存流通中不當條件則可能引發發霉或二氧化硫殘留問題。

第二類：利益驅動的刻意造假

這類問題性質截然不同：它是針對品質管理機制漏洞設計的規避策略，根源在於利益驅動。

「道地藥材」在市場上享有顯著溢價。以當歸為例，甘肅岷縣的當歸往往是其他產區的數倍價格。這種溢價結構為「洗產地」提供了強烈的利益動機：將低價產區藥材透過文件偽造或重新包裝，以道地藥材名義流入市場。洗產地的特殊之處在於：送去終端抽樣的藥材成分本身未必有問題，無法透過常規化學指標檢驗發現，問題出在產地資訊的真實性上，而這恰恰是現有末端把關機制最難驗證的環節。Zhou L et al.（2026）的研究顯示，即便是同一品種的當歸，甘肅岷縣與其他產區的樣品，化學指紋（中紅外光譜）仍有顯著差異，這提供了產地辨別的技術基礎，但前提是建立可信任的對照資料庫。

以台灣為例，衛生福利部食品藥物管理署（TFDA）對中藥材設有邊境查驗機制，進口藥材須通過抽批檢驗，不合格者退運或銷毀；國內中藥廠製造的濃縮製劑，出廠前須符合中藥優良製造規範（GMP）。

問題類型	典型表現	主要管控手段	難點
重金屬（砷、鉛、鎘、汞）	土壤或加工汙染	邊境抽批檢驗	超標才抓得到
農藥殘留	種植用藥不規範	邊境抽批檢驗	農藥種類多樣，難以全覆蓋
黃麴毒素	易發霉藥材儲存不當	出廠前檢驗	同批次不均勻分布
二氧化硫殘留	燻蒸防腐過量	抽樣濃度測定	處理批次品質不穩
洗產地（產地造假）	低產區偽稱道地	產地溯源資料	成分指標無法識別，須靠化學指紋或產地資料鏈
加料通過檢驗	針對指標成分刻意添加	全光譜化學指紋分析	傳統單點成分測定被直接繞過

這套檢驗框架能過濾部分不合格品，但本質上是「事後把關」，無法解決鏈條更前端的品質變異與刻意造假。要建立完整的信任，需要從源頭開始的溯源體系，而不只是終點的抽檢。

產地、炮製批次、流通紀錄之間若缺乏可追溯的資料連結，末端的抽樣檢驗只能覆蓋有限的風險範圍。— Pan D et al.（2024），American Journal of Chinese Medicine（機器學習與中醫藥整合研究系統性回顧）

三、AI 辨識藥材真偽：技術邊界在哪裡？

現有技術在受控條件下已能達到高準確率的藥材辨識，但更精密的造假手段（如針對特定檢驗指標加料）正在把問題從「辨識形態」推向「辨識真實化學組成」，技術有效的邊界取決於整條供應鏈的採集與治理設計。

電腦視覺（Computer Vision）與深度學習（CNN、ViT）可在大量標注圖像中建立藥材視覺特徵與品種的對應關係，對未知樣本進行分類鑑別。在可見光圖像之外，近紅外光譜（NIR）能在不破壞樣品的情況下快速取得藥材的化學指紋，特別適合現場快篩。Sun X et al.（2021）展示了 NIR 搭配化學計量學在山楂粉中快速偵測摻假物（麥芽糊精、澱粉）的可行性，適合應用於多種草本植物或功能性食品的摻假快速偵測。

造假的動機來自利益，手段也在持續演進，越來越針對性地鎖定防偽機制本身的邏輯漏洞。

比洗產地更難被常規檢驗抓出的，是「加料通過檢驗」。造假者掌握官方或採購方所用的指標成分（如黃芪的多醣含量），在送檢批次中刻意添加足量目標成分使其達到合格標準，實際出售的大量藥材品質卻遠低於此。這種做法針對「以指標成分濃度判斷合格」的管控邏輯進行設計，讓末端化學分析成為可被操控的環節。

Yang J et al.（2021）針對黃芪摻假偵測的研究顯示，採用全光譜化學指紋（中紅外光譜結合化學計量學）分析整體化學組成比例，辨識準確率可達 95% 以上，因為整體組成比例的異常難以用加料方式完全掩蓋。「測目標成分」和「分析整體化學指紋」在防偽策略上有根本差異：前者提供單點驗證，容易被針對；後者要求多維度的組成模式一致，偽造門檻更高。

更關鍵的問題在於資料採集點的設計。若辨識系統只部署在流通末端，即使辨識準確率很高，依然無法防止造假發生在更上游的環節。技術的有效邊界，取決於供應鏈中哪些節點有可信的採集機制，供應鏈治理的設計決定了技術能發揮多大的作用。

四、炮製品質數位化：隱性知識最難處理的一個環節

炮製涉及工藝師的感官判斷與操作經驗，這類隱性知識的數位化面臨資料稀少、標準化程度低兩個根本難題，製程感測化與光譜快篩是目前最可行的切入路徑。

炮製是中醫藥最具工藝性格的環節。「蜜炙黃芪」和「生黃芪」的功效差異、「制附子」與生附子之間的毒性變化，都取決於炮製過程中的溫度、時間、輔料比例，以及操作者對火候、色澤、香氣的感官判斷。傳統的品質判斷標準大量依賴個人經驗，很難透過文字或數字完整傳遞，當資深炮製師退休，部分工藝知識可能隨之流失。

AI 介入炮製品質管控，目前主要有兩個方向：

製程感測化：透過溫度、濕度感測器與影像識別，即時記錄炮製過程關鍵參數，建立「製程數據」與「品質指標」之間的對應關係，讓炮製過程從依賴操作者主觀判斷逐步過渡到可量化的製程控制。

有效成分的快速分析：用 NIR 或其他光譜技術，在炮製完成後快速確認有效成分含量是否達標，取代部分傳統感官評估，讓品質判斷有更客觀的依據。

這兩個方向都有技術可行性，但落地的前提是：有意願投入數位化改造的炮製廠、足夠資料量建立可靠模型，以及採集過程不因成本考量而犧牲品質。炮製廠的商業利益和品質真實性之間存在張力，若無外部稽核機制，再好的數位化工具都可能淪為形式。

五、建立可信任體系：技術、法規、組織的三層協同

信任體系需要技術、法規與組織治理三個層次同步推進。任何一層缺失，其他層次的努力都難以轉化為長期可信的系統。

前面三個面向（診斷、藥材、炮製）放在一起，可以看到共同的底層結構：中醫現代化的核心挑戰，是讓高度依賴個人經驗與人際信任的知識體系，轉換成可被數位記錄、系統驗證、跨機構傳遞的形式。技術是工具，決定了「某些過程能否被記錄、比對、計算」。記錄下來的資料要被信任，還需要兩個更重要的條件：

法規框架定義邊界：什麼樣的辨識精確度才能在臨床場景使用？藥材溯源資料需要記錄到哪個層次才算合規？炮製品質的數位記錄要保存多久？這些是法規設計的範疇，技術本身無法自行回答。

組織治理決定資料品質：資料採集的責任屬於誰？品質由誰審核？資料出現異常時，誰負責啟動稽核？技術平台可以建立資料流，但資料流的可信度，取決於組織是否真的落實了對應的責任制度。沒有責任制度配套的資料，再多也很難建立信任。

技術、法規、組織，三者缺一不可。評估任何「中醫 AI」系統是否可信，最終要回到這三個層次同時檢視，而非只看準確率數字。

可執行步驟

評估中醫 AI 系統可信度的三個檢查點

辨證推理透明度：系統是否能呈現每個辨證結論的推理依據和規則來源？可以逐條追溯推理路徑，而非只看最終建議文字。
藥材資料溯源性：藥材的產地、炮製批次、檢驗結果是否有完整的數位記錄？從最終產品應能回溯到採收批次的基本資訊，產地資訊是否具備可交叉驗證的化學指紋對照。
組織治理責任明確性：系統的資料輸入、審核、異常回報是否有明確的責任分工？出現問題時有人負責，而不是系統「自動判斷」後沒人追責。

傳統醫學的評估框架，需要在療效、安全性與標準化三個維度同步推進；任何一個維度缺失，評估結果的可信度就會受到質疑。— 世界衛生組織《傳統醫學研究與評估方法指引》（WHO, 2000）

六、常見問題

AI 中醫診斷系統目前在哪些場景實際應用？

目前較成熟的應用集中在輔助教學與初篩，如舌診圖像辨識、脈象數位化記錄。臨床場景中，多數系統定位為「輔助工具」，最終診斷仍由持照中醫師負責。以 AI 直接取代中醫師出具診斷，目前在多數地區不符合法規要求。

台灣購買的中藥材有被把關嗎？

有。衛生福利部食品藥物管理署（TFDA）對進口中藥材設有邊境抽批查驗機制，不合格者退運或銷毀；國內中藥廠製造的濃縮製劑須符合中藥 GMP 規範。消費者可確認產品是否具有衛福部核准的藥品許可字號，選擇有完整標示的正規通路。現行機制對成分安全有一定保障，但對洗產地的把關能力相對有限。

近紅外光譜（NIR）辨識中藥材的準確率如何？

NIR 辨識準確率高度依賴訓練資料的品質與代表性。在研究條件下，特定藥材辨識和摻假偵測可達到高準確率。更重要的是：面對「加料通過檢驗」等針對性造假，全光譜指紋分析比單點成分測定更具鑑別力，準確率數字本身不能反映防偽能力的全貌。

如何判斷一套中醫 AI 系統是否值得信任？

信任評估需要從三個層次同時檢視。技術層面：辨證推理是否透明可追溯、藥材辨識是否採用全光譜而非單點指標？法規層面：系統是否符合當地醫療法規、定位明確為「輔助工具」？組織層面：資料輸入、審核、異常回報是否有明確的責任人？三個問題都能得到清楚答案，才算具備基本的信任基礎。

中藥材的道地性可以被 AI 驗證嗎？

技術上，目前可透過化學指紋（如中紅外光譜、近紅外光譜）和 DNA 條形碼辨識評估產地相關性。但「道地」的判斷在學術上本身有爭議：地理來源、氣候條件、有效成分目標範圍，各方定義不一。標準未統一前，AI 的驗證只能針對已定義的指標進行，同時也需要資料鏈的治理配套，否則洗產地的問題仍可能從資料輸入端被規避。

重點摘要

中醫 AI 的可信度，核心在推理邏輯是否透明、可追溯、可被驗證，準確率只是起點
藥材品質問題分兩類：自然品質變異（管理缺口）與刻意造假（洗產地、加料通過檢驗），後者針對性地規避現有管控機制
洗產地難靠成分指標抓出，需建立以化學指紋為基礎的產地對照資料庫，並搭配完整的供應鏈溯源記錄
「加料通過檢驗」的造假邏輯正是針對「以指標成分濃度判合格」的漏洞；全光譜化學指紋分析比單點指標更難被規避
信任體系需要技術、法規、組織治理三個層次同步推進，缺一不可

參考文獻

Tian D, Chen W, Xu D, Xu L, Xu G, Guo Y, Yao Y. (2024). A review of traditional Chinese medicine diagnosis using machine learning: Inspection, auscultation-olfaction, inquiry, and palpation. Computers in Biology and Medicine. https://pubmed.ncbi.nlm.nih.gov/38330826/
Pan D, Guo Y, Fan Y, Wan H. (2024). Development and Application of Traditional Chinese Medicine Using AI Machine Learning and Deep Learning Strategies. American Journal of Chinese Medicine, 52(3):605–623. https://pubmed.ncbi.nlm.nih.gov/38715181/
Sun X, Li H, Yi Y, Hua H, Guan Y, Chen C. (2021). Rapid detection and quantification of adulteration in Chinese hawthorn fruits powder by near-infrared spectroscopy combined with chemometrics. Spectrochim Acta A Mol Biomol Spectrosc. https://pubmed.ncbi.nlm.nih.gov/33387806/
Yang J, Yin C, Miao X, Meng X, Liu Z, Hu L. (2021). Rapid discrimination of adulteration in Radix Astragali combining diffuse reflectance mid-infrared Fourier transform spectroscopy with chemometrics. Spectrochim Acta A Mol Biomol Spectrosc. https://pubmed.ncbi.nlm.nih.gov/33302218/
Zhou L, Ma F, Yan Y, Yan J, Zhao Z, Sun Z. (2026). A Systematic Evaluation of Angelica sinensis Discrimination Based on FT-MIR Spectroscopic Analysis Combined with Machine Learning. Foods. https://pubmed.ncbi.nlm.nih.gov/42121548/
World Health Organization. (2000). General guidelines for methodologies on research and evaluation of traditional medicine. WHO/EDM/TRM/2000.1. https://www.who.int/publications/i/item/9789241506090
衛生福利部國家中醫藥研究所. 中藥品質分析平台（qaTCM）及中醫藥研究資源. https://www.nricm.edu.tw/

分享這篇文章

Facebook
LINE
X

用 AI 聊這篇文章

ChatGPT
Claude
Gemini

appi.news 編輯部

Author

View All Posts

發佈留言取消回覆

Related Stories

心理健康服務完整指南：台灣從幼兒到長者的全齡支持架構

如何建立醫療 AI 合規守門引擎：從法規解讀到工程落地

老藥新用完整指南：二甲雙胍的黃斑保護潛力、轉化困境與 AI 應對

You May Have Missed