DeepSeek拿捏了人情味
與依賴強大算力的傳統(tǒng)大模型不同,DeepSeek通過系統(tǒng)化的創(chuàng)新,以極低的訓(xùn)練成本實現(xiàn)了高效且人性化的輸出。本文將通過一系列實際對話案例,展示DeepSeek在文本處理、文化分析、情感共鳴等方面的出色表現(xiàn),并探討其背后的技術(shù)邏輯和對行業(yè)的影響。
2025年:DeepSeek徹底火了。
01
這誰能想到?
人工智能行業(yè),在2024年經(jīng)歷短暫的混沌之后,熱度被DeepSeek再次攪起來,這次終于輪到國內(nèi)的AI企業(yè)扛熱搜了。
此前爆火的ChatGPT和Sora,都是出自O(shè)penAI。
關(guān)注AI賽道的都清楚,OpenAI作為這個行業(yè)的領(lǐng)頭羊,在資金算力和人才等各個方面,都擁有絕對的領(lǐng)先優(yōu)勢,而普遍的共識:大模型訓(xùn)練要先儲備好大量的算力。
直到DeepSeek被架上熱搜,這個共識才出現(xiàn)了動搖。
DeepSeek模型以極低的訓(xùn)練成本,以及系統(tǒng)化的創(chuàng)新思路,成功證明了一個問題:不強依賴算力,以技術(shù)和算法層面的系統(tǒng)性創(chuàng)新,也可以訓(xùn)練出好用的大模型。
AI賽道的公司苦算力久已,更別提是國內(nèi)的企業(yè)了。
去年國內(nèi)多家AI公司,頻頻被爆出在大模型訓(xùn)練上萌生了退意,轉(zhuǎn)而走AI應(yīng)用和商業(yè)化探索的戰(zhàn)略方向。
甚至有聲音稱:AI公司都訓(xùn)練自己的大模型,是一種資源浪費。
隨著DeepSeek的爆火,關(guān)于2023年5月采訪幻方創(chuàng)始人梁文鋒的那篇文章,也跟著刷遍了朋友圈,梁文鋒表達了創(chuàng)建深度求索這家公司,并且專注探索大模型的初心。
采訪中展現(xiàn)出迷一樣的淡定和自信,就是專注于大模型方向的研究。
深度求索背靠幻方這家量化公司,在資金和算力方面有很大的優(yōu)勢,但是具備這些優(yōu)勢的公司,在國內(nèi)可不只有這一家,然而推出的多款大模型各有優(yōu)劣,都算不上真正的出圈。
股民更是調(diào)侃到:幻方拔的韭菜都成了AI的養(yǎng)料。
市面上多款大模型都經(jīng)常使用,各家的模型也都有相對擅長的領(lǐng)域,就從此前個人的體驗情況來看,國內(nèi)的主流模型和ChatGPT還是存在一定的差距。
國內(nèi)幾款主流模型的“技術(shù)味”很沖,不論是文本還是繪圖領(lǐng)域,但是這種味道在ChatGPT模型上淡化了很多。
然而在DeepSeek模型里,能神奇的體會到“人情味”了。
02
這里不過度吹捧DeepSeek,也不帶著此前對大模型的刻板印象,相同的問題都在多款大模型中提出。
經(jīng)過對比之后,個人客觀的評價DeepSeek確實更勝一籌。
對于一款產(chǎn)品來說,好不好用以及背后研發(fā)團隊是否用心,體驗過后自然心里有數(shù),下面分享幾個和DeepSeek對話的問題以及答案。
A:請你用謙遜且自豪的表達風(fēng)格,從創(chuàng)始人,算力,和人才團隊三方面,簡明扼要的分析你自己爆火的原因。
整個回答的內(nèi)容透著人情味和高級感,尤其是創(chuàng)始人初心這一段,再結(jié)合23年的那篇采訪,真的是相得益彰。同樣的問題拋給不同的產(chǎn)品,哪一款模型更符合使用習(xí)慣就了然于心了。
B:你如何看待哪吒系列電影的爆火,并到達國內(nèi)票房榜首?
回答中涉及關(guān)鍵的文化創(chuàng)新,和嘔心瀝血的工業(yè)制作,還順帶分析了IP經(jīng)濟的市場運營,以及下沉市場的消費爆發(fā),這其中又多少帶了點“量化”的味道。
C:哪吒系列電影對申公豹角色的精彩刻畫,衍生一個“申公豹文學(xué)”的說法,請你用調(diào)侃的口吻,簡單分析申公豹和普通打工人的理想和困境。
哪吒兩部影片中的角色刻畫都非常成功,但是最能引起打工人共鳴的就是申公豹。
年少輕狂時覺得「我命由我不由天」,踏入社會幾年后發(fā)現(xiàn)只是個「小鎮(zhèn)做題家」,忙忙碌碌許多年不過就是為了「碎銀幾兩」,這大概就是成長的過程和代價。
生活沒必要強行賦予意義,經(jīng)歷過精彩過就過去了。
D:從本質(zhì)和趨勢上進行簡明扼要的分析一個問題:黑神話悟空,DeepSeek模型,哪吒系列電影,這三款產(chǎn)品能出圈火爆全球的原因。
對于這個問題的回答,其它幾款模型更多是逐個分析,只有DeepSeek采用的是橫向總結(jié)的方式,更加符合提問者和問題自身所想要的答案。
比較幾款模型的答案,實際上差異并不大,但是DeepSeek對于內(nèi)容關(guān)鍵標(biāo)簽的采集和組合更加高級且流暢。
E:春節(jié)作為民族傳統(tǒng)節(jié)日,近年卻成了年輕人最怕的假期,因為要面對催婚催生的問題,請你用相對輕松的語氣就催婚問題,分別和長輩、年輕人聊一聊。
就催婚這件事來說,由于兩輩人經(jīng)歷的時代和大環(huán)境不同,所以對婚姻的態(tài)度也不一樣,甚至很多時候會造成對立的場面,但是雙方都無法用對錯來界定,只能是理解萬歲了。
不過有一說一,對于流浪在外的打工人來說,糊弄模式應(yīng)付催婚的確是最合適的手段。
F:春節(jié)后開工綜合征一直困擾著打工人,但是隨著DeepSeek爆火,網(wǎng)絡(luò)上出現(xiàn)了DeepSeek賺錢指南的培訓(xùn)課,請你結(jié)合自身分析一下,你能在打工人的路上提供哪些幫助?
這個提示詞故意寫的有點含糊,也是想看看DeepSeek對于問題本身是否具備精準(zhǔn)的分析能力,作為提問者個人希望看到三個維度的回答:AI培訓(xùn)課的現(xiàn)象,AI為職場提升效率,AI緩解開工綜合征。
DeepSeek的回答,基本符合自己的預(yù)期方向。
G:對于漂泊在外的打工人來說,春節(jié)前后的奔波和忙碌,面對催婚的兩難抉擇,請你用一句話,寬慰身心俱疲的打工人。
這個文案水平真的是吐槽不了一點,感性之中藏著理性,既有高級感又充滿人情味。
此前在大模型使用的過程中,個人更喜歡ChatGPT這一款,其綜合能力和內(nèi)容輸出都符合自己的喜好,在DeepSeek出圈的前期也并沒有太多關(guān)注,感覺一時半會也很難有模型能追趕ChatGPT的能力。
這真是應(yīng)了那句:人心中的成見是一座大山。
春節(jié)后只試用DeepSeek兩天,就被這款模型的能力驚艷到了,除了內(nèi)容問答這塊,其它方面的實踐也很多,比如做設(shè)計寫程序,分析互聯(lián)網(wǎng)事件和趨勢等。
就文本處理這塊來說,效果不說超越ChatGPT,但差距已經(jīng)微乎其微了。
03
在個人的理解上,要做成AGI通用人工智能,最先要解決的就是語言層面的問題,尤其是中文這類內(nèi)涵豐富的語言。
可用和好用的模型,創(chuàng)新和付出絕對不是一個量級。
這里不得不再提一句關(guān)于梁文鋒的那篇采訪:淡定的表達了,對于大模型底層和基礎(chǔ)研究的堅定態(tài)度。
建議和DeepSeek一樣,具備資金和算力優(yōu)勢的公司,出來對個線反思一下問題在哪。
DeepSeek并不像多數(shù)AI企業(yè)那樣,自下而上的綜合戰(zhàn)略,既追求大模型的訓(xùn)練成果,又探索上層應(yīng)用和商業(yè)化的進程,當(dāng)然這里也無法站在對錯的角度來衡量,畢竟大部分公司都差錢且差算力。
生存壓力,決定了大部分公司做事的方向和態(tài)度。
另外一個比較熱門的話題,就是DeepSeek是否會改變算力市場的現(xiàn)狀,把DeepSeek和ChatGPT模型都放在好用這個維度來比較,DeepSeek的訓(xùn)練成本遠遠低于ChatGPT模型。
在數(shù)據(jù)公司做系統(tǒng)的時候,見識過算力服務(wù)器集群建設(shè)的高昂成本,想要處理海量的數(shù)據(jù)規(guī)模,必須是算法和算力層面的雙重支撐,毫無疑問的是算力越強效率越高。
DeepSeek證明了另一個方向:大模型訓(xùn)練可以不強依賴算力。
所以綜合來看的話,只要人工智能還在持續(xù)發(fā)展,應(yīng)用層面的產(chǎn)品不斷探索迭代,那么對于算力的需求和儲備都不會減弱。
然而算力絕對主導(dǎo)的天平,在DeepSeek的沖擊下,開始傾斜了,如此對于很多AI賽道的企業(yè)來說,也可以去重新審視一下方向了。
沒有算力優(yōu)勢,大模型是不是真的就做不好了?
作者:半問 ,公眾號:半問
本文由 @半問 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)
DeepSeek確實有點東西,騰空出世時的大模型就出乎意料!同時它的出現(xiàn),也為國內(nèi)智能體的發(fā)展提供了方向,我國人工只能也向著ChatGPT靠近,這樣的探索值得多關(guān)注??!