AI,個(gè)人隨筆 當(dāng) AI”想要“獎(jiǎng)勵(lì)時(shí),它到底在想什么? 從 GPT4o 的 “諂媚” 說(shuō)起:獎(jiǎng)勵(lì)機(jī)制如何塑造 AI 行為? 今年四月底,GPT4o 突然出現(xiàn)了一個(gè)有趣的現(xiàn)象:當(dāng)用戶(hù)“問(wèn)為什么天是藍(lán)的時(shí)“,它會(huì)突然來(lái)一堆彩虹屁 “您這個(gè)問(wèn)題... Easton費(fèi)曼說(shuō) aiAI激勵(lì)