大模型再怎么“胡說(shuō)八道”,也不像人類(lèi)的胡說(shuō)八道那么惡劣
隨著生成式AI的崛起,大模型的“胡說(shuō)八道”(即“大模型幻覺(jué)”)引發(fā)了廣泛爭(zhēng)議,許多人擔(dān)心它會(huì)污染互聯(lián)網(wǎng)信息生態(tài),甚至摧毀人類(lèi)的知識(shí)體系。本文作者通過(guò)親身經(jīng)歷和多個(gè)生動(dòng)案例,揭示了一個(gè)更深刻的事實(shí):人類(lèi)自身的胡說(shuō)八道能力遠(yuǎn)勝于大模型,且其影響更為惡劣。
自從生成式AI崛起以來(lái),經(jīng)常有人傳播一個(gè)觀點(diǎn):AI大模型的“胡說(shuō)八道”(學(xué)名是“大模型幻覺(jué)”)會(huì)導(dǎo)致整個(gè)互聯(lián)網(wǎng)充斥垃圾信息,最終毀掉人類(lèi)的知識(shí)體系。當(dāng)初ChatGPT爆紅之后,以及最近DeepSeek爆紅之后,都有大量的專業(yè)媒體和自媒體,像鸚鵡學(xué)舌一樣,不斷重復(fù)著上述說(shuō)法。就在昨天,我的朋友圈里又有好幾個(gè)人轉(zhuǎn)發(fā)了類(lèi)似的文章。鑒于這類(lèi)文章內(nèi)容大同小異,看個(gè)標(biāo)題就知道內(nèi)文在寫(xiě)什么了,所以我沒(méi)有打開(kāi)閱讀,今后應(yīng)該也不會(huì)閱讀。
作為一個(gè)GPT/DeepSeek的雙料重度用戶,我當(dāng)然知道“大模型幻覺(jué)”的威力。我是歷史學(xué)愛(ài)好者,經(jīng)常跟AI討論歷史問(wèn)題,要求AI幫我收集史料。大約半年前,我問(wèn)了GPT-4o一個(gè)問(wèn)題:“清朝初年的佟佳氏家族,在康熙年間一度有‘佟半朝’之稱,但是自從雍正年間隆科多被查辦、乾隆年間慶復(fù)被賜死之后,似乎就遠(yuǎn)離歷史舞臺(tái)了。這個(gè)家族在清朝中后期還出過(guò)名人嗎?”
十幾秒后,GPT-4o告訴我:“隆科多、慶復(fù)先后獲罪之后,佟佳氏確實(shí)大不如前,但是瘦死的駱駝比馬大,還是出了一些中高層官員,例如:乾隆時(shí)期的副都統(tǒng)佟世榮、晚清的內(nèi)務(wù)府官員佟永德、晚清的八旗領(lǐng)隊(duì)大臣佟志和等。在此附上他們的簡(jiǎn)歷(下略)?!?/p>
我馬上發(fā)覺(jué)不對(duì)勁:佟佳氏是一個(gè)“滿洲化”程度很深的漢軍旗家族,起名習(xí)慣也逐漸采納了滿洲的“稱名不舉姓”,像隆科多、慶復(fù)都是很典型的滿洲人名,怎么到了晚清反而全是漢化姓名?而且,諸如佟永德、佟志和之流,不但《清史稿》查無(wú)此人,在所有主流搜索引擎都搜不到。于是我再次詢問(wèn):“你說(shuō)的這幾個(gè)人,我沒(méi)有找到任何相關(guān)史料,你的信息來(lái)源是什么?”
GPT-4o宣稱自己的信息來(lái)源是《清史稿》和《八旗通志》。我明確表示,在這兩部書(shū)中找不到上面幾個(gè)名字,于是它終于認(rèn)錯(cuò)了:“不好意思,這些人在歷史上確實(shí)不存在。佟佳氏在清朝中期以后確實(shí)沒(méi)有出現(xiàn)值得一提的人物。”無(wú)論如何,我還是基本達(dá)到了目的,盡管我差一點(diǎn)點(diǎn)就上當(dāng)了。
在想象力之深厚、編段子之狂野方面,DeepSeek似乎比GPT有過(guò)之而無(wú)不及,這可能是由于其對(duì)齊機(jī)制(Alignment)與GPT不同。所以有些人很喜歡讓DeepSeek寫(xiě)小說(shuō)、寫(xiě)同人文;但由于個(gè)人審美口味不同,我對(duì)它編的故事不太感冒,還是更喜歡看GPT編故事。如果我們隱去這些故事的虛構(gòu)屬性,把它當(dāng)做真實(shí)資料貼到網(wǎng)上,確實(shí)能夠騙住一大批人,就連相關(guān)領(lǐng)域的專業(yè)人士也難以免俗。
由此回到了本文開(kāi)頭的那個(gè)問(wèn)題:大模型如此擅長(zhǎng)“一本正經(jīng)地胡說(shuō)八道”,它會(huì)毀掉人類(lèi)的知識(shí)體系嗎?
我的答案很簡(jiǎn)單:人類(lèi)的知識(shí)體系還輪不到大模型來(lái)摧毀,因?yàn)槿祟?lèi)自己胡說(shuō)八道的能力遠(yuǎn)勝于大模型,其影響也遠(yuǎn)遠(yuǎn)更惡劣。大模型只是胡說(shuō)八道的效率比較高,人類(lèi)則早已把胡說(shuō)八道發(fā)展成了一種“藝術(shù)”,不僅是一本正經(jīng)地胡說(shuō)八道,而且是心安理得的胡說(shuō)八道。作為一個(gè)接受過(guò)高等教育,而且在投資行業(yè)從業(yè)多年的人,我的記憶中留下了無(wú)數(shù)“人類(lèi)胡說(shuō)八道”的高光時(shí)刻;我自己當(dāng)然也不能免俗。下面說(shuō)說(shuō)讓我印象最深刻的幾個(gè)案例吧。
差不多二十年前, 我在大學(xué)里學(xué)一門(mén)《財(cái)務(wù)會(huì)計(jì)》課,那是金融專業(yè)的必修課。課程的結(jié)尾,每個(gè)學(xué)生都要挑選一家上市公司做財(cái)務(wù)分析,然后做PPT演講。絕大部分同學(xué)選的都是A股或港股公司,我記得有人選了青島啤酒,有人選了中國(guó)石化,我自己選的是達(dá)爾曼(一家因?yàn)橹卮筘?cái)務(wù)造假而退市的公司)。但是有一位同學(xué)藝高人膽大,選了AMD。這讓包括老師在內(nèi)的所有人都比較震驚:
AMD是一家美股公司,財(cái)報(bào)都是英文,而且美股財(cái)務(wù)會(huì)計(jì)準(zhǔn)則(US GAAP)與中國(guó)不太一樣。對(duì)于本科生來(lái)說(shuō),難度顯然更大。
AMD是做芯片的,芯片是一個(gè)十分復(fù)雜、科技含量很高的業(yè)務(wù)。何況當(dāng)初AMD不止做芯片設(shè)計(jì),還做制造,財(cái)務(wù)分析的難度更是呈幾何級(jí)數(shù)提升。、
那一年恰好是AMD業(yè)務(wù)劇烈變化的時(shí)期:推出了自家第一個(gè)雙核處理器,剝離了閃存業(yè)務(wù);次年還收購(gòu)了ATI。對(duì)于這種劇烈變化中的公司,哪怕資深分析師也很難分析透徹,何況是學(xué)生?
這并沒(méi)有妨礙我的老同學(xué)一本正經(jīng)地胡說(shuō)八道。我迄今還記得他的PPT標(biāo)題叫做“The Rebirth of AMD”(AMD的重生)。我之所以印象如此深刻,是因?yàn)樗赑PT的前幾頁(yè)就犯了幾個(gè)重大技術(shù)錯(cuò)誤,把當(dāng)時(shí)AMD的幾款主力CPU搞混了,銷(xiāo)量估計(jì)似乎也錯(cuò)了。我不是電腦DIY高手,但我前一年恰好裝過(guò)機(jī)器,對(duì)這些基本常識(shí)還是懂的。所以接下來(lái)十幾分鐘我就沒(méi)怎么聽(tīng)了,直到該同學(xué)激情四射地發(fā)出了“在新任CEO的率領(lǐng)下,AMD必將浴火重生”的結(jié)論。我強(qiáng)忍住了舉手提問(wèn)的沖動(dòng),因?yàn)槲蚁胩岬膯?wèn)題是:“您是怎么做到,在連x86-64架構(gòu)是什么都不懂的情況下研究AMD的?”
神奇的是,在事后評(píng)分環(huán)節(jié),該同學(xué)得到了不錯(cuò)的分?jǐn)?shù)(盡管不是最高分)。老師的理由是:“他的演講臺(tái)風(fēng)很好,PPT全部使用了英文,而且穿了西裝。”當(dāng)時(shí)我并不理解,用英文做PPT、穿西裝做演講跟研究AMD有啥關(guān)系;現(xiàn)在我還是不理解。但是,跟我此后十幾年工作中印證的更多驚悚案例相比,老同學(xué)穿著西裝的胡說(shuō)八道就算不了什么了。
2010年,A股TMT行業(yè)最熱門(mén)的概念之一是“物聯(lián)網(wǎng)”。當(dāng)年年底,在無(wú)錫舉行了一場(chǎng)關(guān)于物聯(lián)網(wǎng)的展會(huì),會(huì)議現(xiàn)場(chǎng)傳出消息:“國(guó)家要投資幾萬(wàn)億建設(shè)車(chē)聯(lián)網(wǎng),今后所有的汽車(chē)之間都會(huì)聯(lián)網(wǎng),這是百年一遇的投資機(jī)會(huì)!”很遺憾,我并沒(méi)有去現(xiàn)場(chǎng)出席會(huì)議,又不懂汽車(chē),所以對(duì)這個(gè)話題毫無(wú)發(fā)言權(quán),只能跟大部分人一樣看著“車(chē)聯(lián)網(wǎng)概念股”集體拉漲停。一位我熟悉的買(mǎi)方朋友打來(lái)電話:“活見(jiàn)鬼,怎么搞的?這么多股票都漲停了?”
圖片
我說(shuō):“今天無(wú)錫的會(huì)議上,不是有專家說(shuō),國(guó)家要投幾萬(wàn)億建設(shè)車(chē)聯(lián)網(wǎng)嗎?”
對(duì)方說(shuō):“WTF? 我就在無(wú)錫,今天的會(huì)我從頭到尾聽(tīng)了,哪兒有投幾萬(wàn)億建設(shè)車(chē)聯(lián)網(wǎng)的說(shuō)法?”
我說(shuō):“那我就不知道是誰(shuí)編的段子了?!?/p>
事實(shí)上,編段子的不止一個(gè)人;準(zhǔn)確的說(shuō)全市場(chǎng)都在編段子。一個(gè)月之后,好幾家知名券商幾乎同時(shí)發(fā)布深度研究報(bào)告,宣布明年將進(jìn)入“X聯(lián)網(wǎng)時(shí)代”:物聯(lián)網(wǎng)、車(chē)聯(lián)網(wǎng),我們身邊的一切皆可聯(lián)網(wǎng)。這可實(shí)在太魔幻了,因?yàn)楫?dāng)時(shí)連移動(dòng)互聯(lián)網(wǎng)都尚未普及,3G建設(shè)都才進(jìn)展到一半,就連WiFi都尚在普及之中。我仔細(xì)閱讀了上述所有報(bào)告,發(fā)現(xiàn)其中沒(méi)有一篇提到“X聯(lián)網(wǎng)”的技術(shù)基建問(wèn)題如何解決;但這并不妨礙大家異口同聲地描述幾百億、幾千億乃至幾萬(wàn)億的市場(chǎng)規(guī)模。
2011年初,上文提到的那位買(mǎi)方的朋友,在自家會(huì)議室里跟我討論了一個(gè)小時(shí):“車(chē)聯(lián)網(wǎng)到底會(huì)使用哪種通信技術(shù)?”我沒(méi)學(xué)過(guò)通信,但他是通信專業(yè)畢業(yè)的,還在運(yùn)營(yíng)商工作過(guò)。他在小白板上寫(xiě)下了一個(gè)又一個(gè)技術(shù)名詞,又搖搖頭,指出它們?yōu)槭裁床荒苡糜谲?chē)聯(lián)網(wǎng),然后把它們劃掉。最后他自言自語(yǔ)道:“看樣子,懂的太多就賺不到錢(qián)。還是一知半解好啊?!?/p>
我補(bǔ)充道:“不如說(shuō),一知半解加上胡說(shuō)八道更好。一知半解是為了胡說(shuō)八道而服務(wù)的,胡說(shuō)八道才能賺錢(qián)嘛。”
斗轉(zhuǎn)星移,現(xiàn)在大家都在譴責(zé)大模型的胡說(shuō)八道,而罔顧自己慣于胡說(shuō)八道的現(xiàn)實(shí)。我必須說(shuō)句公道話:當(dāng)大模型胡說(shuō)八道的時(shí)候,只要你堅(jiān)定質(zhì)疑它,它就會(huì)認(rèn)錯(cuò);可是我沒(méi)見(jiàn)過(guò)任何人類(lèi)就自己的胡說(shuō)八道認(rèn)錯(cuò)。從來(lái)都沒(méi)有,一個(gè)都沒(méi)有!
從技術(shù)角度看,大模型幻覺(jué)是無(wú)解的。因?yàn)榇竽P筒⒉徽嬲袄斫狻眴?wèn)題,它是一個(gè)token一個(gè)token地組織回答的,統(tǒng)計(jì)學(xué)規(guī)律決定了它有時(shí)候必然會(huì)給出不靠譜的回答。何況,現(xiàn)在大模型的訓(xùn)練語(yǔ)料早已從人類(lèi)社會(huì)的自然語(yǔ)料,進(jìn)化到了大模型自身生成的語(yǔ)料,這就進(jìn)一步加劇了胡說(shuō)八道的風(fēng)險(xiǎn)。但是大模型不會(huì)基于任何“目的”而胡說(shuō)八道——目前尚未有任何證據(jù)顯示大模型產(chǎn)生了自我意識(shí),也就談不上有計(jì)劃、有目的地生成錯(cuò)誤信息。
人類(lèi)的胡說(shuō)八道,則是基于各種復(fù)雜的目的:賺錢(qián),博取名譽(yù),或者單純的自我滿足。上文提到過(guò),我是一個(gè)歷史學(xué)愛(ài)好者,所以我經(jīng)常在各大社交媒體觀看歷史問(wèn)題的討論。有些“愛(ài)好者”編造史料的功底令人嘆為觀止,確實(shí)把胡說(shuō)八道變成了一種“藝術(shù)”。令我記憶猶新的,是一位知乎答主宣稱“三國(guó)時(shí)期的魏國(guó)是一個(gè)禽獸之國(guó)”,因?yàn)槭妨巷@示“魏,犬名也”,拿狗的名字給自己命名的國(guó)家能好到哪里去?
很久很久以后,有人去查找原始史料,發(fā)現(xiàn)原文是“魏,大名也”。這種不動(dòng)聲色的胡說(shuō)八道,我相信大模型永遠(yuǎn)學(xué)不會(huì)。這位知乎答主胡說(shuō)八道的目的,僅僅是因?yàn)樗绨輨?、討厭曹操而已。這是一種樸素的目的,甚至不失可愛(ài),但并不妨礙他對(duì)中文歷史知識(shí)庫(kù)造成了不可逆轉(zhuǎn)的、近乎永久性的污染,因?yàn)槟瞧拔?,犬名也”的雄文已?jīng)被無(wú)數(shù)個(gè)自媒體轉(zhuǎn)載過(guò)了。
你可以想象,為了那些更“現(xiàn)實(shí)”,以及更“崇高”的目的,人類(lèi)是怎么面不改色心不跳地胡說(shuō)八道的。我甚至可以大膽推斷:大模型的許多“胡說(shuō)八道”行為,來(lái)自人類(lèi)用戶有意識(shí)的誘導(dǎo)。因?yàn)槿祟?lèi)自己先有胡說(shuō)八道的意愿,才拿大模型當(dāng)槍使,更高效地生成胡說(shuō)八道性質(zhì)的內(nèi)容;最后這些內(nèi)容的傳播還得依靠人類(lèi)的鼠標(biāo)、鍵盤(pán)、觸摸屏,因?yàn)橹钡浆F(xiàn)在,絕大部分AI Agent尚不具備自我傳播內(nèi)容的能力。
在輕松愉快地生成并傳播一大堆胡說(shuō)八道內(nèi)容,滿足自己不可告人的心理之后,這些人類(lèi)用戶又會(huì)伸伸手指,發(fā)布另一段內(nèi)容:“大模型的胡說(shuō)八道如何污染乃至摧毀了人類(lèi)的知識(shí)庫(kù)?今后還有沒(méi)有客觀真實(shí)可言?”
就連這樣的內(nèi)容,可能也是由GPT或DeepSeek生成的。大型滑稽。
本文沒(méi)有得到OpenAI, DeepSeek或其競(jìng)爭(zhēng)對(duì)手的任何資助或背書(shū)。
本文沒(méi)有得到AMD或其競(jìng)爭(zhēng)對(duì)手的任何資助或背書(shū)。自從生成式AI崛起以來(lái),經(jīng)常有人傳播一個(gè)觀點(diǎn):AI大模型的“胡說(shuō)八道”(學(xué)名是“大模型幻覺(jué)”)會(huì)導(dǎo)致整個(gè)互聯(lián)網(wǎng)充斥垃圾信息,最終毀掉人類(lèi)的知識(shí)體系。當(dāng)初ChatGPT爆紅之后,以及最近DeepSeek爆紅之后,都有大量的專業(yè)媒體和自媒體,像鸚鵡學(xué)舌一樣,不斷重復(fù)著上述說(shuō)法。就在昨天,我的朋友圈里又有好幾個(gè)人轉(zhuǎn)發(fā)了類(lèi)似的文章。鑒于這類(lèi)文章內(nèi)容大同小異,看個(gè)標(biāo)題就知道內(nèi)文在寫(xiě)什么了,所以我沒(méi)有打開(kāi)閱讀,今后應(yīng)該也不會(huì)閱讀。
作為一個(gè)GPT/DeepSeek的雙料重度用戶,我當(dāng)然知道“大模型幻覺(jué)”的威力。我是歷史學(xué)愛(ài)好者,經(jīng)常跟AI討論歷史問(wèn)題,要求AI幫我收集史料。大約半年前,我問(wèn)了GPT-4o一個(gè)問(wèn)題:“清朝初年的佟佳氏家族,在康熙年間一度有‘佟半朝’之稱,但是自從雍正年間隆科多被查辦、乾隆年間慶復(fù)被賜死之后,似乎就遠(yuǎn)離歷史舞臺(tái)了。這個(gè)家族在清朝中后期還出過(guò)名人嗎?”
十幾秒后,GPT-4o告訴我:“隆科多、慶復(fù)先后獲罪之后,佟佳氏確實(shí)大不如前,但是瘦死的駱駝比馬大,還是出了一些中高層官員,例如:乾隆時(shí)期的副都統(tǒng)佟世榮、晚清的內(nèi)務(wù)府官員佟永德、晚清的八旗領(lǐng)隊(duì)大臣佟志和等。在此附上他們的簡(jiǎn)歷(下略)。”
我馬上發(fā)覺(jué)不對(duì)勁:佟佳氏是一個(gè)“滿洲化”程度很深的漢軍旗家族,起名習(xí)慣也逐漸采納了滿洲的“稱名不舉姓”,像隆科多、慶復(fù)都是很典型的滿洲人名,怎么到了晚清反而全是漢化姓名?而且,諸如佟永德、佟志和之流,不但《清史稿》查無(wú)此人,在所有主流搜索引擎都搜不到。于是我再次詢問(wèn):“你說(shuō)的這幾個(gè)人,我沒(méi)有找到任何相關(guān)史料,你的信息來(lái)源是什么?”
GPT-4o宣稱自己的信息來(lái)源是《清史稿》和《八旗通志》。我明確表示,在這兩部書(shū)中找不到上面幾個(gè)名字,于是它終于認(rèn)錯(cuò)了:“不好意思,這些人在歷史上確實(shí)不存在。佟佳氏在清朝中期以后確實(shí)沒(méi)有出現(xiàn)值得一提的人物?!睙o(wú)論如何,我還是基本達(dá)到了目的,盡管我差一點(diǎn)點(diǎn)就上當(dāng)了。
在想象力之深厚、編段子之狂野方面,DeepSeek似乎比GPT有過(guò)之而無(wú)不及,這可能是由于其對(duì)齊機(jī)制(Alignment)與GPT不同。所以有些人很喜歡讓DeepSeek寫(xiě)小說(shuō)、寫(xiě)同人文;但由于個(gè)人審美口味不同,我對(duì)它編的故事不太感冒,還是更喜歡看GPT編故事。如果我們隱去這些故事的虛構(gòu)屬性,把它當(dāng)做真實(shí)資料貼到網(wǎng)上,確實(shí)能夠騙住一大批人,就連相關(guān)領(lǐng)域的專業(yè)人士也難以免俗。
由此回到了本文開(kāi)頭的那個(gè)問(wèn)題:大模型如此擅長(zhǎng)“一本正經(jīng)地胡說(shuō)八道”,它會(huì)毀掉人類(lèi)的知識(shí)體系嗎?
我的答案很簡(jiǎn)單:人類(lèi)的知識(shí)體系還輪不到大模型來(lái)摧毀,因?yàn)槿祟?lèi)自己胡說(shuō)八道的能力遠(yuǎn)勝于大模型,其影響也遠(yuǎn)遠(yuǎn)更惡劣。大模型只是胡說(shuō)八道的效率比較高,人類(lèi)則早已把胡說(shuō)八道發(fā)展成了一種“藝術(shù)”,不僅是一本正經(jīng)地胡說(shuō)八道,而且是心安理得的胡說(shuō)八道。作為一個(gè)接受過(guò)高等教育,而且在投資行業(yè)從業(yè)多年的人,我的記憶中留下了無(wú)數(shù)“人類(lèi)胡說(shuō)八道”的高光時(shí)刻;我自己當(dāng)然也不能免俗。下面說(shuō)說(shuō)讓我印象最深刻的幾個(gè)案例吧。
差不多二十年前, 我在大學(xué)里學(xué)一門(mén)《財(cái)務(wù)會(huì)計(jì)》課,那是金融專業(yè)的必修課。課程的結(jié)尾,每個(gè)學(xué)生都要挑選一家上市公司做財(cái)務(wù)分析,然后做PPT演講。絕大部分同學(xué)選的都是A股或港股公司,我記得有人選了青島啤酒,有人選了中國(guó)石化,我自己選的是達(dá)爾曼(一家因?yàn)橹卮筘?cái)務(wù)造假而退市的公司)。但是有一位同學(xué)藝高人膽大,選了AMD。這讓包括老師在內(nèi)的所有人都比較震驚:
AMD是一家美股公司,財(cái)報(bào)都是英文,而且美股財(cái)務(wù)會(huì)計(jì)準(zhǔn)則(US GAAP)與中國(guó)不太一樣。對(duì)于本科生來(lái)說(shuō),難度顯然更大。
AMD是做芯片的,芯片是一個(gè)十分復(fù)雜、科技含量很高的業(yè)務(wù)。何況當(dāng)初AMD不止做芯片設(shè)計(jì),還做制造,財(cái)務(wù)分析的難度更是呈幾何級(jí)數(shù)提升。、
那一年恰好是AMD業(yè)務(wù)劇烈變化的時(shí)期:推出了自家第一個(gè)雙核處理器,剝離了閃存業(yè)務(wù);次年還收購(gòu)了ATI。對(duì)于這種劇烈變化中的公司,哪怕資深分析師也很難分析透徹,何況是學(xué)生?
這并沒(méi)有妨礙我的老同學(xué)一本正經(jīng)地胡說(shuō)八道。我迄今還記得他的PPT標(biāo)題叫做“The Rebirth of AMD”(AMD的重生)。我之所以印象如此深刻,是因?yàn)樗赑PT的前幾頁(yè)就犯了幾個(gè)重大技術(shù)錯(cuò)誤,把當(dāng)時(shí)AMD的幾款主力CPU搞混了,銷(xiāo)量估計(jì)似乎也錯(cuò)了。我不是電腦DIY高手,但我前一年恰好裝過(guò)機(jī)器,對(duì)這些基本常識(shí)還是懂的。所以接下來(lái)十幾分鐘我就沒(méi)怎么聽(tīng)了,直到該同學(xué)激情四射地發(fā)出了“在新任CEO的率領(lǐng)下,AMD必將浴火重生”的結(jié)論。我強(qiáng)忍住了舉手提問(wèn)的沖動(dòng),因?yàn)槲蚁胩岬膯?wèn)題是:“您是怎么做到,在連x86-64架構(gòu)是什么都不懂的情況下研究AMD的?”
神奇的是,在事后評(píng)分環(huán)節(jié),該同學(xué)得到了不錯(cuò)的分?jǐn)?shù)(盡管不是最高分)。老師的理由是:“他的演講臺(tái)風(fēng)很好,PPT全部使用了英文,而且穿了西裝?!碑?dāng)時(shí)我并不理解,用英文做PPT、穿西裝做演講跟研究AMD有啥關(guān)系;現(xiàn)在我還是不理解。但是,跟我此后十幾年工作中印證的更多驚悚案例相比,老同學(xué)穿著西裝的胡說(shuō)八道就算不了什么了。
2010年,A股TMT行業(yè)最熱門(mén)的概念之一是“物聯(lián)網(wǎng)”。當(dāng)年年底,在無(wú)錫舉行了一場(chǎng)關(guān)于物聯(lián)網(wǎng)的展會(huì),會(huì)議現(xiàn)場(chǎng)傳出消息:“國(guó)家要投資幾萬(wàn)億建設(shè)車(chē)聯(lián)網(wǎng),今后所有的汽車(chē)之間都會(huì)聯(lián)網(wǎng),這是百年一遇的投資機(jī)會(huì)!”很遺憾,我并沒(méi)有去現(xiàn)場(chǎng)出席會(huì)議,又不懂汽車(chē),所以對(duì)這個(gè)話題毫無(wú)發(fā)言權(quán),只能跟大部分人一樣看著“車(chē)聯(lián)網(wǎng)概念股”集體拉漲停。一位我熟悉的買(mǎi)方朋友打來(lái)電話:“活見(jiàn)鬼,怎么搞的?這么多股票都漲停了?”
我說(shuō):“今天無(wú)錫的會(huì)議上,不是有專家說(shuō),國(guó)家要投幾萬(wàn)億建設(shè)車(chē)聯(lián)網(wǎng)嗎?”
對(duì)方說(shuō):“WTF? 我就在無(wú)錫,今天的會(huì)我從頭到尾聽(tīng)了,哪兒有投幾萬(wàn)億建設(shè)車(chē)聯(lián)網(wǎng)的說(shuō)法?”
我說(shuō):“那我就不知道是誰(shuí)編的段子了?!?/p>
事實(shí)上,編段子的不止一個(gè)人;準(zhǔn)確的說(shuō)全市場(chǎng)都在編段子。一個(gè)月之后,好幾家知名券商幾乎同時(shí)發(fā)布深度研究報(bào)告,宣布明年將進(jìn)入“X聯(lián)網(wǎng)時(shí)代”:物聯(lián)網(wǎng)、車(chē)聯(lián)網(wǎng),我們身邊的一切皆可聯(lián)網(wǎng)。這可實(shí)在太魔幻了,因?yàn)楫?dāng)時(shí)連移動(dòng)互聯(lián)網(wǎng)都尚未普及,3G建設(shè)都才進(jìn)展到一半,就連WiFi都尚在普及之中。我仔細(xì)閱讀了上述所有報(bào)告,發(fā)現(xiàn)其中沒(méi)有一篇提到“X聯(lián)網(wǎng)”的技術(shù)基建問(wèn)題如何解決;但這并不妨礙大家異口同聲地描述幾百億、幾千億乃至幾萬(wàn)億的市場(chǎng)規(guī)模。
2011年初,上文提到的那位買(mǎi)方的朋友,在自家會(huì)議室里跟我討論了一個(gè)小時(shí):“車(chē)聯(lián)網(wǎng)到底會(huì)使用哪種通信技術(shù)?”我沒(méi)學(xué)過(guò)通信,但他是通信專業(yè)畢業(yè)的,還在運(yùn)營(yíng)商工作過(guò)。他在小白板上寫(xiě)下了一個(gè)又一個(gè)技術(shù)名詞,又搖搖頭,指出它們?yōu)槭裁床荒苡糜谲?chē)聯(lián)網(wǎng),然后把它們劃掉。最后他自言自語(yǔ)道:“看樣子,懂的太多就賺不到錢(qián)。還是一知半解好啊?!?/p>
我補(bǔ)充道:“不如說(shuō),一知半解加上胡說(shuō)八道更好。一知半解是為了胡說(shuō)八道而服務(wù)的,胡說(shuō)八道才能賺錢(qián)嘛。”
斗轉(zhuǎn)星移,現(xiàn)在大家都在譴責(zé)大模型的胡說(shuō)八道,而罔顧自己慣于胡說(shuō)八道的現(xiàn)實(shí)。我必須說(shuō)句公道話:當(dāng)大模型胡說(shuō)八道的時(shí)候,只要你堅(jiān)定質(zhì)疑它,它就會(huì)認(rèn)錯(cuò);可是我沒(méi)見(jiàn)過(guò)任何人類(lèi)就自己的胡說(shuō)八道認(rèn)錯(cuò)。從來(lái)都沒(méi)有,一個(gè)都沒(méi)有!
從技術(shù)角度看,大模型幻覺(jué)是無(wú)解的。因?yàn)榇竽P筒⒉徽嬲袄斫狻眴?wèn)題,它是一個(gè)token一個(gè)token地組織回答的,統(tǒng)計(jì)學(xué)規(guī)律決定了它有時(shí)候必然會(huì)給出不靠譜的回答。何況,現(xiàn)在大模型的訓(xùn)練語(yǔ)料早已從人類(lèi)社會(huì)的自然語(yǔ)料,進(jìn)化到了大模型自身生成的語(yǔ)料,這就進(jìn)一步加劇了胡說(shuō)八道的風(fēng)險(xiǎn)。但是大模型不會(huì)基于任何“目的”而胡說(shuō)八道——目前尚未有任何證據(jù)顯示大模型產(chǎn)生了自我意識(shí),也就談不上有計(jì)劃、有目的地生成錯(cuò)誤信息。
人類(lèi)的胡說(shuō)八道,則是基于各種復(fù)雜的目的:賺錢(qián),博取名譽(yù),或者單純的自我滿足。上文提到過(guò),我是一個(gè)歷史學(xué)愛(ài)好者,所以我經(jīng)常在各大社交媒體觀看歷史問(wèn)題的討論。有些“愛(ài)好者”編造史料的功底令人嘆為觀止,確實(shí)把胡說(shuō)八道變成了一種“藝術(shù)”。令我記憶猶新的,是一位知乎答主宣稱“三國(guó)時(shí)期的魏國(guó)是一個(gè)禽獸之國(guó)”,因?yàn)槭妨巷@示“魏,犬名也”,拿狗的名字給自己命名的國(guó)家能好到哪里去?
很久很久以后,有人去查找原始史料,發(fā)現(xiàn)原文是“魏,大名也”。這種不動(dòng)聲色的胡說(shuō)八道,我相信大模型永遠(yuǎn)學(xué)不會(huì)。這位知乎答主胡說(shuō)八道的目的,僅僅是因?yàn)樗绨輨?、討厭曹操而已。這是一種樸素的目的,甚至不失可愛(ài),但并不妨礙他對(duì)中文歷史知識(shí)庫(kù)造成了不可逆轉(zhuǎn)的、近乎永久性的污染,因?yàn)槟瞧拔海病钡男畚囊呀?jīng)被無(wú)數(shù)個(gè)自媒體轉(zhuǎn)載過(guò)了。
你可以想象,為了那些更“現(xiàn)實(shí)”,以及更“崇高”的目的,人類(lèi)是怎么面不改色心不跳地胡說(shuō)八道的。我甚至可以大膽推斷:大模型的許多“胡說(shuō)八道”行為,來(lái)自人類(lèi)用戶有意識(shí)的誘導(dǎo)。因?yàn)槿祟?lèi)自己先有胡說(shuō)八道的意愿,才拿大模型當(dāng)槍使,更高效地生成胡說(shuō)八道性質(zhì)的內(nèi)容;最后這些內(nèi)容的傳播還得依靠人類(lèi)的鼠標(biāo)、鍵盤(pán)、觸摸屏,因?yàn)橹钡浆F(xiàn)在,絕大部分AI Agent尚不具備自我傳播內(nèi)容的能力。
在輕松愉快地生成并傳播一大堆胡說(shuō)八道內(nèi)容,滿足自己不可告人的心理之后,這些人類(lèi)用戶又會(huì)伸伸手指,發(fā)布另一段內(nèi)容:“大模型的胡說(shuō)八道如何污染乃至摧毀了人類(lèi)的知識(shí)庫(kù)?今后還有沒(méi)有客觀真實(shí)可言?”
就連這樣的內(nèi)容,可能也是由GPT或DeepSeek生成的。
大型滑稽。
本文沒(méi)有得到OpenAI, DeepSeek或其競(jìng)爭(zhēng)對(duì)手的任何資助或背書(shū)。
本文沒(méi)有得到AMD或其競(jìng)爭(zhēng)對(duì)手的任何資助或背書(shū)。
本文由人人都是產(chǎn)品經(jīng)理作者【互聯(lián)網(wǎng)怪盜團(tuán)】,微信公眾號(hào):【互聯(lián)網(wǎng)怪盜團(tuán)】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!