AI 點解會一本正經亂噏？拆解 AI 幻覺嘅真正成因同應對方法

2026-06-11

江

江啟明博士

4.80/5.00(15個評分)

※ 本文由 AI 根據影片內容整理，如有錯漏敬請指正。
📺 觀看完整影片：[AI點解會一本正經亂噏？AI幻覺嘅原因及應對方法]

你有沒有試過問 AI 一條問題，佢給你的答案看上去有紋有路：有背景、有原因、甚至引用一堆來源，感覺非常專業。但當你認真去查證，卻發現那個案例根本不存在，那些論文也找不到，整件事其實是 AI 自己生成出來的。這就是近年越來越受關注的「AI 幻覺」（hallucination）問題。

本集學識 AI 由江啟明主講，從大型語言模型的根本架構講起，解釋幻覺為甚麼會發生、為甚麼無法徹底消滅，以及作為用家，我們實際上可以怎樣做去把風險降到最低。

甚麼才算是 AI 幻覺？
首先要釐清定義。AI 幻覺不是指 AI 說了一些你不同意的意見，也不是指你不喜歡的表達方式。AI 幻覺，是指 AI 生成了一些聽起來很合理、語氣很肯定，但事實上根本沒有根據、與事實不符的答案。例如某位學者其實沒有說過某句話，某篇被引用的論文根本不存在，又或者它幫你「總結」了一篇從未說過那些內容的文章。

同樣重要的是分清楚甚麼不算幻覺：AI 猜錯你的意思，是理解錯誤；AI 用了過時資料，是未更新；你本身就要求 AI 去創作虛構內容，那更不是它的錯。幻覺最核心的特徵，是當你問事實性問題時，它給你一個看似真實、實際卻是虛構的答案。

有趣的是，今天的 AI 出錯機會其實已經比以前低很多，甚至比你問一個真人更可靠。人會錯、資料庫會錯、搜尋結果會錯，AI 自然也會錯。問題不在於「AI 會唔會錯」，而在於**它出錯的方式**和其他資料來源不一樣——這正是我們要理解的地方。

由規則到神經網絡：AI 架構的轉變
要明白幻覺的成因，要先看傳統 AI 怎樣運作。由 1950 年代到大約 2000 年代，許多 AI 依賴人手一句一句編寫的數據與規矩，也就是程式中熟悉的 if-then-else 關係，這就是所謂 Rule-based 的思路，傳統上叫做專家系統（Expert System）。它的強項是透明：每一條規則都寫得清清楚楚，出錯時人類專家可以找到問題在哪。

但現實世界太複雜、太凌亂。同一句話在不同上下文有不同意思，同一個概念又可以有無數種表達方式；甚麼時候是說笑、諷刺、試探還是有暗示，根本無法逐條規矩寫盡。於是當深度學習興起，AI 改為透過**每個字之間的統計關係**去建立模型，這就是今天大型語言模型的雛形。

我們有時稱它為人工神經網絡，運作上有點像人腦：網絡裡每一個點獨立看沒有意義，但連結在一起，經過大量數據訓練後，就能準確預測「下一個字」。它儲存的不是死板的資料庫，而是一張概念之間關係的機率分佈網，因此可以舉一反三，回應從未見過的句子。2017 年出現的 Transformer 及其「注意力」（attention）機制，更讓模型懂得分辨同一個字（例如「蘋果公司」與「食一個蘋果」）在不同位置的不同意思，令預測更可靠。

幻覺為甚麼會發生？
理解了架構，就能總結幻覺的幾個根本成因：

- 生成不等於搜尋：模型的基本任務是生成「最合理」的內容，而不是在資料庫中查出答案。當你叫它介紹某學者的某理論，它會依照句子的框架與格式，生成一段看似吻合的文字。
- 未必主動查證：除非你明確要求，或它判斷需要用工具、上網、讀文件，否則它不一定會停下來核實來源。
- 太懂得包裝：新聞、論文摘要、法律或醫學分析都有既定格式。諷刺的是，AI 學「格式」往往比學「內容」更好，於是格式正確、內容卻未必正確。
- 傾向填補空白：就像人聽到一個缺了中段的故事會自動腦補，語言模型本質上就是為了填補空白而訓練的。資料不足時，它就會自己生成一個「最似對」的答案。

換言之，幻覺不是因為 AI 太廢，而是它模型本質使然——它擅長模仿專業、可靠、有自信的語氣風格，而我們判斷可信度時偏偏最依賴這種風格，於是特別容易被騙。

為甚麼幻覺無法徹底消滅？
過去兩三年，業界對幻覺的研究越來越多。OpenAI 去年的一篇論文就指出，現有的訓練與評估方式往往獎勵模型去「猜」：猜中有獎、猜錯卻沒有懲罰，情況就像多項選擇題考試，留空和答錯同樣是零分，於是「亂猜」反而平均分更高。基於這個發現，新一代模型已作出改善：

1. 更好的訓練：建立更合理的獎罰機制，答錯要罰，懂得承認「找不到答案」反而獲獎勵。
2. 更懂得用工具：上網搜尋、計算、執行程式、讀取文件、查詢資料庫，而不是純靠生成。
3. 自動選用推理模式：遇到較複雜的問題，採用 Chain of Thought，一步步拆解甚至覆核答案。

但即使如此，幻覺仍然無法根治，原因有三：
其一，可靠性是一種 trade-off——你越想 AI 多答、多幫、多創作，它就越會跨越證據的邊界；想它保守一點，創造性又會下降，創新與幻覺可說是同一個銀仔的兩面。
其二，世界上太多冷門知識，例如某個不出名的人的生日、某公司從未公開的文件，無論模型怎樣改善都不可能憑空找到正確答案，而你不斷追問就有機會誘發幻覺。
其三，外部工具本身也有風險，網上資料可能出錯，文件也可能過時。

實際應該怎樣做？
既然幻覺不會消失，作為用家，可以用以下四個方法把風險降到最低：

- 提供參考資料：預先找一些可靠資料上載給 AI，讓它先參考再作答。若經常用同一批文件，甚至可以建立一個 RAG（retrieval-augmented generation，檢索增強生成）——即一個私人的小型數據庫，讓 AI 每次先查它再生成。
- 要求提供來源：明確要求 AI 必須附上來源。這會促使它去查證，你也可以親自核對來源是否真的支持答案，而不必單靠它的 AI 摘要。
- 不要叫 AI 扮專家：「扮律師」「扮醫生」近年已被證明有風險，因為這會令 AI 多了一層包袱，覺得身為專家就不可以承認自己不懂。
- 問問題要清楚：跟 AI 溝通和跟真人溝通一樣，講清楚背景與你想要甚麼，AI 才有機會完成任務。這其實已超出幻覺範疇，是一般使用 AI 的守則。

總結：最終的把關人是我們自己
今時今日的 AI 並不是一個數據庫，它必然要透過「生成」來回應，因此無法完全避免幻覺。但這並不需要太過擔心——現代模型已有各種防範機制，我們也有相應的應對方法。最關鍵的一點是：無論你用 AI 還是傳統上網搜尋，最終把關的，始終是我們自己。

理解 AI 幻覺的成因，不只是學會防範一個技術缺陷，更是理解現代大型語言模型運作原理的一扇窗。當你知道它「為甚麼會這樣錯」，你就能用得更聰明、更安心。

其他同類文章

返回文章列表