多模態(tài)都是假的:最強(qiáng)模型數(shù)不清手指、認(rèn)不出雷碧
把六指圖喂進(jìn)“最強(qiáng)”多模態(tài)模型,它依然堅(jiān)稱只有五根手指;讓它認(rèn)“雷碧”,也會(huì)被文字帶偏。作者用一連串實(shí)測(cè)拆穿幻象:模型并非“看見(jiàn)”,只是高維概率復(fù)讀機(jī)。數(shù)據(jù)偏差、任務(wù)粒度、長(zhǎng)尾缺失才是幻覺(jué)根源。認(rèn)清邊界,才能補(bǔ)數(shù)據(jù)、改架構(gòu),把 AI 真正用在刀刃上。