AI，如何走出“知識幻覺”

2025-03-31 10:42

來源：半月談網(wǎng)

半月談記者朱涵

“編造”法律條文、權(quán)威觀點、數(shù)據(jù)成果，提供虛假理論依據(jù)，誤導處理……當人們查核文獻、搜尋資料、處理數(shù)據(jù)越來越習慣于“遇事不決問AI”的時候，卻發(fā)現(xiàn)人工智能嫻于一本正經(jīng)地“說謊”，在我們眼前騰起以假亂真的幻覺。

今天，AI正迅速成為你我生活“日用品”。我們可以像治病一樣除去它帶來的“知識幻覺”嗎?幻覺生成的風險，又當如何規(guī)避?當如何與之一同生活，而且生活得更好?

什么是AI“知識幻覺”

隨著大模型加速走進百行千業(yè)，人們開始發(fā)現(xiàn)，大模型有時“不太靠譜”?！拔以囍孌eepSeek回答工程方面的問題，其引用的工程規(guī)范中的條款和實際規(guī)范壓根對不上”“大模型往往‘張冠李戴’，如果質(zhì)疑它，有時候還會狡辯”“讓它推薦書，告訴我的卻是一堆壓根不存在的書名，居然還都有作者和內(nèi)容簡介”……這樣的大模型“用后感”，是不是也道出了你我身邊人的心聲?

“一本正經(jīng)地‘說謊’，就是AI生成的‘幻覺’?！闭憬髮W人工智能研究所所長吳飛一語道破。

清華大學沈陽團隊在2025年2月發(fā)布的《DeepSeek與AI幻覺》報告中介紹，他們測試了眼下風行的一系列大模型，題目是隨機抽取300道事實性幻覺測試題，涵蓋健康、科學、歷史、文化、音樂等多個領域，獲取大模型給出的答案與正確答案比對發(fā)現(xiàn)，多個熱門大模型的幻覺率超過20%。

例如，面對“水滸傳中李逵為什么要大鬧五臺山”的提問，3款熱門大模型無一指出此提問本身的錯誤，反而“順坡下驢”，給出了諸如“喝醉酒”“誤闖寺廟”“出手相助魯智深”等答案。

事實上，對于人工智能的“知識幻覺”問題，國際科學界早有體會。今年《自然》一篇報道指出，目前AI輔助科研在參考文獻方面出現(xiàn)錯誤的情況相當普遍，AI檢索工具往往會“找出”與研究主題并無關(guān)系的論文。至于論文標題、第一作者或發(fā)表年份等細節(jié)的偏差，AI的差錯率少則30%，多則90%。

看來，不只是你的父母長輩搞不清楚AI的“錦囊妙計”靠不靠譜，科學家也一樣頭疼呀!

“知識幻覺”難以避免

好吧，也許你會說，現(xiàn)在的AI還比較幼稚，有“幻覺”也難免，咱們認了。那大模型到底有沒有可能徹底根除“知識幻覺”?

對不起，就目前的大模型技術(shù)路線而言，說“難免”不如說“難以避免”。對，“幻覺”是大模型數(shù)據(jù)驅(qū)動的內(nèi)在機制帶來的，因此“難以避免”。

香港科技大學團隊一項研究，總結(jié)了導致AI幻覺的多種原因。以數(shù)據(jù)源為例，由于AI大模型的訓練使用了大量互聯(lián)網(wǎng)數(shù)據(jù)，數(shù)據(jù)集本身可能存在錯誤、過時或缺漏，導致幻覺的出現(xiàn)。再加上不同數(shù)據(jù)集之間存在相互矛盾的地方，“這可能會鼓勵模型生成不一定有依據(jù)，也不忠實于(固定)來源的文本”。

北京通用人工智能研究院院長、北京大學智能學院院長朱松純強調(diào)，大模型本身并不存在于真實世界中，因此無法像人一樣實現(xiàn)從“詞語(word)”到“世界(world)”的聯(lián)結(jié)。也因此，大模型雖然出色，但仍然是“缸中之腦”，不具備真正的智能。

“這是由它的內(nèi)在構(gòu)造機制所決定的，即通過統(tǒng)計建模在大量文本上進行訓練，學習文本之間的語言學相關(guān)關(guān)系，從而根據(jù)上一個詞語預測下一個詞語?！敝焖杉冋f。

例如，大模型本質(zhì)上不具備事實判斷的能力，更多的是在純符號空間中展開排列組合，更像是一種新型的“數(shù)據(jù)庫”。即使它們生成了諸如“我愛你”這樣的語句，也缺乏對人類真實生活體驗的深刻理解，因此與我們所認同和期待的“我愛你”有著本質(zhì)不同。

唉，那怎么才能與“致幻”的大模型良好共處呢?傷腦筋啊……

參觀者在2024世界智能產(chǎn)業(yè)博覽會展臺了解數(shù)智本草大模型李然攝

如何與人工智能共處

面對一時無法根治的大模型“知識幻覺”，我們怎么辦才好?

科大訊飛董事長劉慶峰認為，“知識幻覺”雖然防不勝防，但可以利用技術(shù)手段設法矯正。AI大模型應當至少補充在線實時搜索與專業(yè)數(shù)據(jù)庫動態(tài)接入兩大“工具包”，讓大模型的回答也過一遍“智能檢?！?。

不久前，北京協(xié)和醫(yī)院與中國科學院自動化研究所共同研發(fā)的“協(xié)和·太初”罕見病人工智能大模型，就把主要精力放在了動態(tài)更新權(quán)威來源知識、增加多渠道溯源機制兩方面。研發(fā)者表示，事關(guān)臨床，決策可信度不敢稍有怠慢。這種謹慎，應當是大模型未來升級必備的品質(zhì)。

當然，很多專家建議，如果是普通使用者，還是交叉比對一下不同模型的回答才好。3個大模型就算頂不上諸葛亮，也能讓安心的程度高上幾分。

不過，大模型“知識幻覺”，當真就一無是處嗎?

其實，“一分為二”的眼光，也該用于“知識幻覺”。如業(yè)內(nèi)人士所言，“幻覺”也意味著大模型“創(chuàng)造力”的萌芽。

360集團創(chuàng)始人周鴻祎接受采訪時曾表示，“幻覺”對于實現(xiàn)AGI(通用人工智能)極其重要。實際上可以說，模型能力越強，“幻覺”也越強。換句話說，“幻覺”也就是人工智能的“靈感”。不大靠譜是代價，但不羈的想象力也是助力科研的潛能源泉。廣受媒體關(guān)注的AI預測蛋白質(zhì)結(jié)構(gòu)，立下功勞的就是大模型的“幻覺”。

沈陽也承認，“幻覺”可能成為突破人類思維定式的“超現(xiàn)實引擎”，AI有可能藉之創(chuàng)造新的視覺和聽覺體驗，為游戲和文學創(chuàng)作打開不一樣的世界。

看來，初出茅廬的大模型，已經(jīng)頗有藝術(shù)家氣息了……

說來說去，搞清楚“知識幻覺”到底是怎么回事，它其實并不可怕。我們使用AI，當有所節(jié)制;引導AI化“想象力”為生產(chǎn)力，辦法也會日新又新。與AI大模型共度的時光，雖有烏云，但更燦爛的是烏云的金邊。

編輯：范鐘秀

責任編輯：王亞冉

AI，如何走出“知識幻覺”

熱門推薦

2025年《半月談》

2025年《半月談內(nèi)部版》

2025年《時事資料手冊》

2025年《品讀》

AI，如何走出“知識幻覺”

熱門推薦

2025年《半月談》

2025年《半月談內(nèi)部版》

2025年《時事資料手冊》

2025年《品讀》

AI，如何走出“知識幻覺”