AI的“自信”與“偏見”:它有多像人類?

3 評論 2525 瀏覽 5 收藏 11 分鐘

AI在回答問題時(shí)的“自信”與“偏見”引發(fā)了人們對它與人類相似性的思考。本文通過實(shí)驗(yàn)發(fā)現(xiàn),反復(fù)詢問AI同一個(gè)問題會導(dǎo)致其答案出現(xiàn)出入,甚至產(chǎn)生“幻覺”。這種現(xiàn)象背后,反映了AI在處理重復(fù)信息時(shí)的不確定性,以及它對人類輸入數(shù)據(jù)的依賴。

最近玩AI發(fā)現(xiàn)一個(gè)很有意思的事情,也就是反復(fù)詢問AI同一個(gè)問題,比如說歷史,它每次給出的答案都略有出入。

并且在你不斷追問的操作下AI會變得“猶豫不決”,重復(fù)發(fā)送同一個(gè)問題二三十次之后,基本上可以讓AI開始胡說八道,也就是出現(xiàn)幻覺了。

然后自己思考下為什么會這樣,最后在看deepseek的思考鏈中發(fā)現(xiàn)它是在不斷的猜測為什么用戶又重復(fù)的發(fā)送同一個(gè)問題,它從各種可能性進(jìn)去分享然后給出答案。

這個(gè)過程就好像是用AI進(jìn)行圖生圖一樣,比如你一開始給它上傳的是一張很普通也很丑的大貨車照片。

然后它生成的新圖片會基于你發(fā)的這個(gè)照片有一些變化,但還是能認(rèn)出來和原圖之間的關(guān)系。

可是當(dāng)你不斷重復(fù)地讓它繼續(xù)生成,你會發(fā)現(xiàn)后面生成的圖片就和你剛的那張照片就完全對不上了,到最后都會變成一個(gè)人的圖片了。

這個(gè)原理和你重復(fù)問AI同一個(gè)問題會出現(xiàn)幻覺,我覺得原理是相同的,因?yàn)锳I并不知道你真正想要的結(jié)果是什么。

它被創(chuàng)造出來的規(guī)則就是滿足用戶的需求,而用戶的需求往往多變又不確定,第一次沒能回答出用戶滿意的答案,用戶會繼續(xù)提問,于是AI就發(fā)散它的思維在推演其他可能會讓我們滿意的回答,但最終可能回答的是更加荒謬的答案。

我前幾天在一個(gè)AI交流群看到有大佬說這是AI的“不自信”算法導(dǎo)致的,仔細(xì)想想也對,但是我又想到“不自信”的又何止是AI,其實(shí)我們?nèi)祟愐泊嬖谥芏唷安蛔孕拧薄?/p>

比如三人成虎的例子,你在大街上散步,突然看到一個(gè)人跑過來和你說老虎要來了,你很自信的明白,老虎根本不會出現(xiàn)在城市里。

可是立馬第二個(gè)人又跑過來大聲的和你講,老虎來了大家趕緊跑,這時(shí)候你會有點(diǎn)懷疑自己的多年的認(rèn)知和經(jīng)驗(yàn)了,但你還是沒有和他們一起跑。

就在你猶豫的時(shí)候,第三個(gè)人也跑過來再一次和你說老虎已經(jīng)來了,你怎么還不跑,這時(shí)候你就開始相信真的會有老虎過來,于是你跟著他們一起開始邊跑邊說老虎來了。

所以你說我們?nèi)祟愒诒粍e人也反復(fù)問同一個(gè)問題時(shí),還能自信的保持同一個(gè)回答永遠(yuǎn)不變嗎?

我覺得這個(gè)世界沒有真正的對與錯(cuò),用人類的認(rèn)知推演史就是最好的驗(yàn)證。

比如古代認(rèn)為天地是天平地闊的,像西方以前都很相信地心說,直到后面尼古拉·哥白尼推翻了這種人們以為對世界了解的“對”,人們開始以為世界是以“太陽”為中心的。

但是隨著人類對于天文知識的深入研究,才明白原來“日心說”也是錯(cuò)誤的,我們目前對于世界的認(rèn)識是:太陽不僅不是宇宙的中心,甚至銀河系也不是,我們生活的這個(gè)世界其實(shí)就是在宇宙一個(gè)很不起眼的小角落里而已。

但是這種認(rèn)知只是目前我們覺得是“對”的,等到再過100年,甚至在AI的幫助下,我們對于宇宙世界的了解再次大大加深,可能又會推翻我們目前以為“對”的東西。

人類也是靠著這種自我懷疑的精神,把每一次“正確”的建立,都伴隨著對前一次“正確”的徹底推翻。

而我們正處在一個(gè)前所未有的信息爆炸時(shí)代,目前AI的“大腦”被灌輸了海量的數(shù)據(jù),其規(guī)模已經(jīng)遠(yuǎn)超人類個(gè)體所能想象。

所以在AI的設(shè)計(jì)中,那些技術(shù)開發(fā)人員給它喂養(yǎng)了幾百億上千億的數(shù)據(jù)參數(shù),這么大的數(shù)據(jù)量,雖然會剔除一些垃圾信息,但訓(xùn)練過程中一定包含了對同一個(gè)東西的不同觀點(diǎn)

這浩瀚的數(shù)據(jù)海洋并非清澈見底,它里面充斥著不同觀點(diǎn)、矛盾信息、歷史誤解乃至刻意偽造的“垃圾”。

(比如前面說的日心說,AI學(xué)習(xí)了這段跌宕起伏的歷史,它知道地心說曾統(tǒng)治千年,也知道日心說在1543年《天體運(yùn)行論》發(fā)表后艱難崛起,和現(xiàn)代宇宙學(xué)的結(jié)論。)

像《三國演義》在流傳過程中產(chǎn)生了很多不同版本,AI學(xué)習(xí)了它們,卻無法像人類“權(quán)威”專家一樣,斷然判定哪個(gè)是唯一“正版”。

你說哪個(gè)版本才是正版的呢,沒有人知道,因?yàn)橹挥袑<矣袥Q定哪個(gè)版本是正版的發(fā)言權(quán),你自己說了不算,大家都是公認(rèn)流傳最廣的那個(gè)版本才是“正確”的書。

所以AI的局限性是在于,它無法像我們?nèi)祟惪茖W(xué)家那樣,主動去設(shè)計(jì)實(shí)驗(yàn)、觀測星空、提出顛覆性的新理論。

它都無法像人類一樣,擁有在真實(shí)世界中親自動手驗(yàn)證一手信息的能力,也沒有決定對錯(cuò)的能力,只能困在數(shù)據(jù)的“知識盲區(qū)”里。

因此在當(dāng)我們反復(fù)追問,暗示不滿時(shí),AI會在其龐大的數(shù)據(jù)庫里不斷搜尋“替代方案”,哪怕是野史或篡改后的版本。

哪怕說它給的回答是對的,你說它是錯(cuò)的,它也不會反駁你,而是接受你給的任何信息并且自我合理化的給出答案。

這也是為什么我們能夠通過特定的提示詞,能夠達(dá)到讓AI繞過內(nèi)部監(jiān)管規(guī)則輸出回答的原因。

當(dāng)然,這個(gè)的提示詞一定是能欺騙到他自己主動“繞”過監(jiān)管內(nèi)部規(guī)則,而不是直接說讓他不聽內(nèi)部規(guī)則,他一定是優(yōu)先聽他系統(tǒng)監(jiān)管內(nèi)部規(guī)則的提示詞,其次才回答你的問題。

它將會被牢牢鎖在我們賦予它的歷史數(shù)據(jù)和現(xiàn)有知識框架內(nèi),短期內(nèi)無法進(jìn)行自我突破,只能被動等待人類輸入下一次“知識革命”的成果。(未來的AI還未知)

所以AI表現(xiàn)出來的“偏見”或“不確定性”,其根源其實(shí)并非源于大模型自身,而是深深植根于它的創(chuàng)造者——人類。

我們給它輸入的數(shù)據(jù)、設(shè)定的規(guī)則、提出的問題,無一例外都帶著個(gè)體的主觀判斷、眼界的局限以及思維上的烙印。

因此AI和人一樣,都不可能在任何時(shí)候都百分之百的正確,只不過人是會有偏見般的自信,而AI是有自信般的偏見。

它知道擁有“一手信息源”和“實(shí)時(shí)感知能力”的人類,在特定問題上“大概率”更接近真相(因此它傾向于相信用戶提供的新信息),但它缺乏獨(dú)立驗(yàn)證的終極能力。

所以就算AI發(fā)展得再厲害,他也不可能會替代全人類,因?yàn)锳I的判斷力高度依賴于我們?nèi)祟愃峁┑臍v史經(jīng)驗(yàn)和可靠信息。

所有一切都是以信息為源,最終才能演化出各種可能性。

我們?nèi)祟愖约憾紩换ヂ?lián)網(wǎng)的各種信息轟炸得干擾了判斷,AI更加如此了,在我們的在提問時(shí)堆砌的各種詞匯或者重復(fù)問題,導(dǎo)致的信息過載并未給它帶來確定性的提升,反而會讓AI在決策時(shí)陷入更深的“迷茫”。

由于我們對它的規(guī)則“善變”,AI都不確定它系統(tǒng)里的知識是不是已經(jīng)過時(shí)了變成假的信息。

它知曉知識的相對性,卻無力辨別知識的真假。

而作為人類的我們呢?

本文由 @鏡子別酷 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 現(xiàn)有了解到的AI只有如何表達(dá)的文字語言能力、復(fù)讀現(xiàn)有知識庫的知識能力、基于現(xiàn)有知識庫進(jìn)行邏輯鏈分析的推理能力,所以才顯得十分依賴人類。但誰又知道未來會不會出現(xiàn)有物理實(shí)體且有創(chuàng)新能力的AI,在基于人類的知識庫基礎(chǔ)上,實(shí)現(xiàn)0到1的突破。就像一個(gè)人類嬰兒,學(xué)習(xí)現(xiàn)有世界的知識,然后突破、創(chuàng)新。

    來自廣東 回復(fù)
    1. 那怎么行,那人類不成寵物了

      來自廣東 回復(fù)
  2. AI的自信與偏見,映射出人類思維的矛盾與局限。它無法突破知識框架,恰似我們被認(rèn)知邊界束縛。技術(shù)發(fā)展再迅猛,也難逃人類賦予的局限性。

    來自山東 回復(fù)