有沒有發現,你問AI一個問題,它給出的答案聽起來頭頭是道,但一查資料發現——引用的論文是假的、提到的法規是編的、連頁碼都不存在?
更可怕的是,有些機構已經開始用AI回答公共服務咨詢、輔助醫療診斷、撰寫法律文書了……
清華大學這份《2026年AI幻覺深度研究報告》,看完我只想說:我們可能一直誤解了AI的“錯誤”——那不是偶然的“口誤”,而是它“天生如此”的“系統 bug”。
一、幻覺不是“出錯”,是“基因”
報告開篇就引用了NIST(美國國家標準與技術研究院)的定義:AI的“幻覺”不叫hallucination,叫confabulation——這個詞在醫學上指“患者無意識地用虛構內容填補記憶空白”。AI不是在“撒謊”,它只是“不知道自己不知道”。
關鍵洞察有三條:
- 幻覺是“生成—采信—執行”鏈條上的系統性風險,不是單點準確率問題。一句錯話被用戶當真、被團隊執行,后果才可怕。
- 基準分數無法替代場景化評估。一個模型在榜單上99%準確,放到醫療場景里,那1%的錯可能直接誤診。
- 真正有效的方案不是“一個萬能技術”,而是一套復合治理棧:檢索錨定、拒答機制、人工復核、日志監測、責任制度,缺一不可。
二、六類幻覺,你遇到過幾種?
報告把幻覺細分成六種,不是學術堆砌,而是為了“不同錯誤配不同護欄”:
![]()
三、為什么“高可信品牌”反而更危險?
報告有一個非常反直覺的結論:公共服務、醫院、高校、金融機構這類“權威界面”,比普通聊天場景更容易放大幻覺風險。
原因是:用戶會因為信任你的品牌,而低估系統的失真風險。
- GOV.UK Chat(英國政府官網的AI問答工具)用戶滿意度不低,但官方觀察到若干幻覺案例后,專門提醒:官方的可信度,會讓用戶過度信任AI的輸出,放棄自行核驗。
- 同理,當一家三甲醫院、一家上市銀行、一所985高校推出AI助手時,用戶天然會把它當成“官方說法”。
結論:權威界面不是風險緩沖器,而是風險放大器。
四、高風險場景的“兩難”:壓低幻覺,可能抬高遺漏
MHRA(英國藥品和健康產品管理局)的案例揭示了一個核心權衡:
- 加更嚴格的護欄(比如只允許模型回答有明確來源的問題),可以顯著降低重大幻覺。
- 但代價是:拒答率上升、遺漏率上升、信息不全率上升。
在醫療場景,這就變成了一個“兩難”:
- 如果系統頻繁說“我不知道”,臨床人員可能失去效率,甚至錯過關鍵提示。
- 如果系統為了顯得全面而繼續補全,則可能直接誤導臨床決策。
因此,高風險場景的工程設計,必須把“遺漏風險”和“幻覺風險”放在同一張決策表上。
五、給組織的行動框架:六層治理棧
報告最后給出了一個非常實操的框架,不是“技術方案”,而是“組織工程”:
![]()
六、五個原創概念,值得記住
報告提煉了五個“壓縮式”概念,便于組織內部溝通:
- 概率真相陷阱:把“最像真的輸出”誤認為“最接近真的答案”。
- 引用幻影鏈:偽造的引用,以正規格式偽裝成已核驗知識,在組織中持續傳播。
- 低置信高傷害區:模型自己都沒把握,組織卻讓它介入高后果任務。
- 遺漏—幻覺蹺蹺板:壓低幻覺率,可能抬高遺漏率;反之亦然。
- 責任折返門:表面有人工復核,但復核者無時間、無標準、無否決權,只是機械點確認。
總結與啟示
一句話總結:AI幻覺不是一個“技術問題”,而是一個“組織治理問題”。
對技術團隊:
- 不要追求“零幻覺”——那是不可能的。
- 追求“可識別、可約束、可追責、可持續優化”。
- 在高風險場景,設計“拒答機制”比提升準確率更重要。
對管理層:
- 不要把AI當“萬能回答機”,要畫任務風險地圖。
- 明確哪些任務“不能上生成式AI”,哪些任務“只能輔助”。
- 人工復核必須有意義、可抽檢、可追責,否則就是“責任表演”。
對政府/公共機構/醫療機構:
- 品牌可信度會放大幻覺風險,用戶會高估你的AI。
- 必須設置顯性護欄:明確告知用戶“這是AI生成內容,請核實來源”。
真正有競爭力的組織,不是讓AI看起來無所不知,而是讓它在不知道時停下來、在高風險時退后一步。
報告節選
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.