"LLM"相關(guān)的文章
AI,個(gè)人隨筆
李飛飛對(duì)話 a16z:LLM 是有損壓縮,世界模型才是真正重要方向,應(yīng)用遠(yuǎn)超機(jī)器人

李飛飛對(duì)話 a16z:LLM 是有損壓縮,世界模型才是真正重要方向,應(yīng)用遠(yuǎn)超機(jī)器人

近日,李飛飛與 a16z 合伙人展開了一場(chǎng)深度對(duì)話,首次公開分享了創(chuàng)辦 World Labs 的理念、研究方向與宏大愿景。她指出,語言是一種“有損壓縮”的認(rèn)知方式,而世界模型才是 AI 真正理解并構(gòu)建世界的關(guān)鍵??臻g智能的應(yīng)用遠(yuǎn)超機(jī)器人,將為工業(yè)設(shè)計(jì)、電影制作、建筑構(gòu)圖、游戲開發(fā)等領(lǐng)域帶來前所未有的變革。
AI,個(gè)人隨筆
淺顯理解LLM底層技術(shù)

淺顯理解LLM底層技術(shù)

大語言模型(LLM)作為人工智能領(lǐng)域的重要分支,近年來在自然語言處理(NLP)方面取得了顯著進(jìn)展。然而,對(duì)于非技術(shù)出身的人來說,理解LLM的底層技術(shù)往往顯得晦澀難懂。本文作者通過類比和通俗易懂的方式,深入淺出地介紹了LLM的底層技術(shù)原理,包括詞元(token)的概念、有監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)的區(qū)別,以及語言生成技術(shù)如GPT和BERT的工作機(jī)制。
AI
Llama 4 發(fā)布:我看到了 DeepSeek 的影子

Llama 4 發(fā)布:我看到了 DeepSeek 的影子

隨著人工智能技術(shù)的飛速發(fā)展,大型語言模型(LLM)的競(jìng)爭(zhēng)日益激烈。Meta 最新發(fā)布的 Llama 4 模型,以其獨(dú)特的架構(gòu)和策略,引發(fā)了行業(yè)的廣泛關(guān)注。本文深入分析了 Llama 4 的三大核心特點(diǎn):采用混合專家(MoE)架構(gòu)、原生多模態(tài)能力以及將大模型作為訓(xùn)練過程的工具。
AI,個(gè)人隨筆
言變圖的“LLM時(shí)刻”,還有AI全家桶,Google殺瘋了

言變圖的“LLM時(shí)刻”,還有AI全家桶,Google殺瘋了

在生成式AI快速崛起的浪潮中,Google以全新的產(chǎn)品矩陣和技術(shù)升級(jí)迎來屬于它的“LLM時(shí)刻”。從文本到圖像,從工具到生態(tài),AI全家桶的發(fā)布讓人們看到技術(shù)無邊的可能性。本文將帶你深入解讀這些突破背后的技術(shù)邏輯與市場(chǎng)策略,探討Google如何在AI競(jìng)賽中拔得頭籌,并展望行業(yè)未來的新格局。
對(duì)話Deepseek R1 :隨著LLM能力的躍升,類似coze等Agent編排工具是否還有應(yīng)用價(jià)值?

對(duì)話Deepseek R1 :隨著LLM能力的躍升,類似coze等Agent編排工具是否還有應(yīng)用價(jià)值?

強(qiáng)大的LLM正在消解傳統(tǒng)Agent設(shè)計(jì)中“顯式工程化”的部分價(jià)值,但這不意味著Agent概念的終結(jié),而是其形態(tài)向更靈活的方向進(jìn)化。開發(fā)者應(yīng)積極擁抱兩種范式的融合——LLM負(fù)責(zé)認(rèn)知層級(jí)的抽象與調(diào)度,傳統(tǒng)Agent專注確定性的高效執(zhí)行。這種分層協(xié)作或許才是下一代智能系統(tǒng)的常態(tài)。
“(LLM產(chǎn)品)評(píng)估”背后,再深一層和兩層的關(guān)鍵能力,到底是什么

“(LLM產(chǎn)品)評(píng)估”背后,再深一層和兩層的關(guān)鍵能力,到底是什么

在人工智能迅速發(fā)展的今天,如何有效評(píng)估大語言模型(LLM)產(chǎn)品成為了產(chǎn)品經(jīng)理的重要課題。本文將深入探討評(píng)估 LLM 產(chǎn)品背后的關(guān)鍵能力,強(qiáng)調(diào)業(yè)務(wù)認(rèn)知和理想產(chǎn)品形態(tài)的“畫面感”對(duì)于成功評(píng)估的重要性。