
※ 本文由 AI 根據影片內容整理,如有錯漏敬請指正。
📺 觀看完整影片:[AI點解會一本正經亂噏?AI幻覺嘅原因及應對方法]
你有沒有試過問 AI 一條問題,佢給你的答案看上去有紋有路:有背景、有原因、甚至引用一堆來源,感覺非常專業。但當你認真去查證,卻發現那個案例根本不存在,那些論文也找不到,整件事其實是 AI 自己生成出來的。這就是近年越來越受關注的「AI 幻覺」(hallucination)問題。
本集學識 AI 由江啟明主講,從大型語言模型的根本架構講起,解釋幻覺為甚麼會發生、為甚麼無法徹底消滅,以及作為用家,我們實際上可以怎樣做去把風險降到最低。
甚麼才算是 AI 幻覺?
首先要釐清定義。AI 幻覺不是指 AI 說了一些你不同意的意見,也不是指你不喜歡的表達方式。AI 幻覺,是指 AI 生成了一些聽起來很合理、語氣很肯定,但事實上根本沒有根據、與事實不符的答案。例如某位學者其實沒有說過某句話,某篇被引用的論文根本不存在,又或者它幫你「總結」了一篇從未說過那些內容的文章。
同樣重要的是分清楚甚麼不算幻覺:AI 猜錯你的意思,是理解錯誤;AI 用了過時資料,是未更新;你本身就要求 AI 去創作虛構內容,那更不是它的錯。幻覺最核心的特徵,是當你問事實性問題時,它給你一個看似真實、實際卻是虛構的答案。
有趣的是,今天的 AI 出錯機會其實已經比以前低很多,甚至比你問一個真人更可靠。人會錯、資料庫會錯、搜尋結果會錯,AI 自然也會錯。問題不在於「AI 會唔會錯」,而在於**它出錯的方式**和其他資料來源不一樣——這正是我們要理解的地方。
由規則到神經網絡:AI 架構的轉變
要明白幻覺的成因,要先看傳統 AI 怎樣運作。由 1950 年代到大約 2000 年代,許多 AI 依賴人手一句一句編寫的數據與規矩,也就是程式中熟悉的 if-then-else 關係,這就是所謂 Rule-based 的思路,傳統上叫做專家系統(Expert System)。它的強項是透明:每一條規則都寫得清清楚楚,出錯時人類專家可以找到問題在哪。
但現實世界太複雜、太凌亂。同一句話在不同上下文有不同意思,同一個概念又可以有無數種表達方式;甚麼時候是說笑、諷刺、試探還是有暗示,根本無法逐條規矩寫盡。於是當深度學習興起,AI 改為透過**每個字之間的統計關係**去建立模型,這就是今天大型語言模型的雛形。
我們有時稱它為人工神經網絡,運作上有點像人腦:網絡裡每一個點獨立看沒有意義,但連結在一起,經過大量數據訓練後,就能準確預測「下一個字」。它儲存的不是死板的資料庫,而是一張概念之間關係的機率分佈網,因此可以舉一反三,回應從未見過的句子。2017 年出現的 Transformer 及其「注意力」(attention)機制,更讓模型懂得分辨同一個字(例如「蘋果公司」與「食一個蘋果」)在不同位置的不同意思,令預測更可靠。
幻覺為甚麼會發生?
理解了架構,就能總結幻覺的幾個根本成因:
- 生成不等於搜尋:模型的基本任務是生成「最合理」的內容,而不是在資料庫中查出答案。當你叫它介紹某學者的某理論,它會依照句子的框架與格式,生成一段看似吻合的文字。
- 未必主動查證:除非你明確要求,或它判斷需要用工具、上網、讀文件,否則它不一定會停下來核實來源。
- 太懂得包裝:新聞、論文摘要、法律或醫學分析都有既定格式。諷刺的是,AI 學「格式」往往比學「內容」更好,於是格式正確、內容卻未必正確。
- 傾向填補空白:就像人聽到一個缺了中段的故事會自動腦補,語言模型本質上就是為了填補空白而訓練的。資料不足時,它就會自己生成一個「最似對」的答案。
換言之,幻覺不是因為 AI 太廢,而是它模型本質使然——它擅長模仿專業、可靠、有自信的語氣風格,而我們判斷可信度時偏偏最依賴這種風格,於是特別容易被騙。
為甚麼幻覺無法徹底消滅?
過去兩三年,業界對幻覺的研究越來越多。OpenAI 去年的一篇論文就指出,現有的訓練與評估方式往往獎勵模型去「猜」:猜中有獎、猜錯卻沒有懲罰,情況就像多項選擇題考試,留空和答錯同樣是零分,於是「亂猜」反而平均分更高。基於這個發現,新一代模型已作出改善:
1. 更好的訓練:建立更合理的獎罰機制,答錯要罰,懂得承認「找不到答案」反而獲獎勵。
2. 更懂得用工具:上網搜尋、計算、執行程式、讀取文件、查詢資料庫,而不是純靠生成。
3. 自動選用推理模式:遇到較複雜的問題,採用 Chain of Thought,一步步拆解甚至覆核答案。
但即使如此,幻覺仍然無法根治,原因有三:
其一,可靠性是一種 trade-off——你越想 AI 多答、多幫、多創作,它就越會跨越證據的邊界;想它保守一點,創造性又會下降,創新與幻覺可說是同一個銀仔的兩面。
其二,世界上太多冷門知識,例如某個不出名的人的生日、某公司從未公開的文件,無論模型怎樣改善都不可能憑空找到正確答案,而你不斷追問就有機會誘發幻覺。
其三,外部工具本身也有風險,網上資料可能出錯,文件也可能過時。
實際應該怎樣做?
既然幻覺不會消失,作為用家,可以用以下四個方法把風險降到最低:
- 提供參考資料:預先找一些可靠資料上載給 AI,讓它先參考再作答。若經常用同一批文件,甚至可以建立一個 RAG(retrieval-augmented generation,檢索增強生成)——即一個私人的小型數據庫,讓 AI 每次先查它再生成。
- 要求提供來源:明確要求 AI 必須附上來源。這會促使它去查證,你也可以親自核對來源是否真的支持答案,而不必單靠它的 AI 摘要。
- 不要叫 AI 扮專家:「扮律師」「扮醫生」近年已被證明有風險,因為這會令 AI 多了一層包袱,覺得身為專家就不可以承認自己不懂。
- 問問題要清楚:跟 AI 溝通和跟真人溝通一樣,講清楚背景與你想要甚麼,AI 才有機會完成任務。這其實已超出幻覺範疇,是一般使用 AI 的守則。
總結:最終的把關人是我們自己
今時今日的 AI 並不是一個數據庫,它必然要透過「生成」來回應,因此無法完全避免幻覺。但這並不需要太過擔心——現代模型已有各種防範機制,我們也有相應的應對方法。最關鍵的一點是:無論你用 AI 還是傳統上網搜尋,最終把關的,始終是我們自己。
理解 AI 幻覺的成因,不只是學會防範一個技術缺陷,更是理解現代大型語言模型運作原理的一扇窗。當你知道它「為甚麼會這樣錯」,你就能用得更聰明、更安心。





