国外亚洲成av人片在线观看,热99re久久精品这里都是精品,天堂网在线最新版www,国产成人av区一区二区三,51久久成人国产精品麻豆

APP

起點課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標(biāo)識

{{ userInfo.member ? '查看權(quán)益' : '開通會員' }}

發(fā)布

注冊 | 登錄

網(wǎng)頁編程眾測排名：DeepSeek-R1超越Claude 4加冕全球第一

量子位

2025-06-18

0 評論 456 瀏覽 0 收藏

7 分鐘

在編程領(lǐng)域，DeepSeek新版R1憑借出色表現(xiàn)拿下網(wǎng)頁編程第一，超越Claude Opus 4。其在實測中展現(xiàn)了強大的編程能力，對國內(nèi)用戶更是免費友好，不過仍有進步空間，一起來深入了解吧。

編程王者Claude地位不穩(wěn)了？？

大模型競技場最新戰(zhàn)報出爐，DeepSeek新版R1拿下網(wǎng)頁編程第一，小勝Claude Opus 4。

要知道Claude Opus 4可是公認(rèn)的“全球最強編碼模型”。

so，能在編程上戰(zhàn)勝Claude Opus 4，DeepSeek-R1-0528到底啥來頭？

看名字你可能以為是個小版本更新，但實際上——

它在LiveCodeBench上幾乎與OpenAI o3-high相當(dāng)，乃至一眾網(wǎng)友猜測其為傳說中的R2。

這樣一看，在編程這一項上，雙方貌似都不太好惹~

所以話不多說，咱們還是一手實測DeepSeek-R1-0528，康康究竟有多強。

實測一下

目前DeepSeek-R1-0528已上線DeepSeek官方網(wǎng)站、App和小程序（打開深度思考）。

這里咱們直接進入官網(wǎng)體驗。測試1：制作一個太陽系的動畫應(yīng)用程序

提示詞如下：

制作一個太陽系的動畫應(yīng)用程序，使用網(wǎng)絡(luò)搜索。

僅思考49秒后，DeepSeek-R1-0528就給出了一段python代碼。

用VS Code運行后，結(jié)果如下：

出現(xiàn)了能自主運行的動畫，不過頁面相對粗糙。

不過呢，如果換成其他提示詞，效果則明顯不一樣了。

用Three.js模擬太陽系，鼠標(biāo)懸停在星球上時顯示星球名稱。

僅用時34秒，DeepSeek-R1-0528就理清楚了設(shè)計思路：

關(guān)鍵是這一次能直接一鍵運行了，無需再單獨打開自己的編輯器。（運行功能感覺像開盲盒，不一定都會出現(xiàn)）

而且同樣有動畫、能交互，效果直接進入Next Nevel~

測試2：前端網(wǎng)頁制作

接下來我們要求DeepSeek生成一個主題為AGI的網(wǎng)站，提示詞如下：

請設(shè)計一個以通用人工智能（AGI）為主題的網(wǎng)頁，包含“知識共享”、“社區(qū)”和“未來創(chuàng)造”三個概念部分。每個部分應(yīng)配有相應(yīng)的圖標(biāo)和簡潔描述，整體風(fēng)格現(xiàn)代且科技感十足，突出AGI的創(chuàng)新和協(xié)作精神。使用HTML、CSS和JavaScript實現(xiàn)交互和視覺特效。

思考23秒后，DeepSeek-R1-0528后續(xù)給出了一段HTML代碼，依舊能一鍵運行。

測試3：創(chuàng)建一個俄羅斯方塊小游戲

最后我們試試英文提示詞：

Create a full featured version of tetris with beautiful graphics and controls.創(chuàng)建一個具有精美圖形和控制功能的完整版俄羅斯方塊。

可以看到，DeepSeek-R1-0528思考12秒后就給出了一段python代碼。

運行結(jié)果be like：

雖然確實是俄羅斯方塊小游戲，但基本演示存在明顯bug，而且缺少交互按鈕。

不死心的我們嘗試讓DeepSeek繼續(xù)改進，結(jié)果第二次還是翻車了。

改進后的游戲依舊無法正常運行（總是穿墻而過），且未實現(xiàn)我們明確要求的交互功能。

小結(jié)一下，從以上簡單實測來看，DeepSeek新版R1作為一款開源模型，在編程能力上確實大有進步，但仍有一定提升空間。

不過有一說一，它對咱們國內(nèi)普通用戶明顯更友好（相對Claude模型來說免費又易于獲?。?。

One More Thing

除了編程能力榜單更新，DeepSeek新版R1還當(dāng)選了當(dāng)前最好的開源文本模型。

MIT許可證下，總榜第六，開源當(dāng)中第一。

而在細分領(lǐng)域，它在困難提示方面排名第4，在數(shù)學(xué)方面排名第5，屬于開源模型中相當(dāng)能打的玩家。

不過值得一提的是，Kimi新模型剛剛拿下代碼開源SOTA——

參數(shù)量僅72B的開源代碼模型Kimi-Dev，在SWE-bench Verified上以60.4%的成績?nèi)〉瞄_源SOTA。

不僅編程水平比最新的DeepSeek-R1還強，和閉源模型比較也表現(xiàn)優(yōu)異。

不知道其真實能力又如何呢（doge）~

本文由人人都是產(chǎn)品經(jīng)理作者【量子位】，微信公眾號：【量子位】，原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自Unsplash，基于 CC0 協(xié)議。

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App

量子位

追蹤人工智能新趨勢，關(guān)注科技行業(yè)新突破

104篇作品 237792總閱讀量

破局直播電商的零和游戲：這檔節(jié)目做對了什么？

10-161153 瀏覽

破局直播電商的零和游戲：這檔節(jié)目做對了什么？

當(dāng)你接到獨立負(fù)責(zé)網(wǎng)站定制項目的需求時，你會怎么做？

02-284678 瀏覽

當(dāng)你接到獨立負(fù)責(zé)網(wǎng)站定制項目的需求時，你會怎么做？

哪個民宿平臺更好做？3大平臺對比分析，房東如何尋找新的增長點？

07-266304 瀏覽

哪個民宿平臺更好做？3大平臺對比分析，房東如何尋找新的增長點？

大模型的躍進眾生相

04-141750 瀏覽

大模型的躍進眾生相

小紅書的本地生活，還在玩票期

08-033043 瀏覽

小紅書的本地生活，還在玩票期

評論

目前還沒評論，等你發(fā)揮！

“百億補貼”還適合今天的京東么

02-272440 瀏覽
案例解析｜4個B端改版設(shè)計必須知道的注意事項

02-286002 瀏覽
以BOSS直聘為例，探討招聘平臺為什么這么難用？

10-0710730 瀏覽