欧美人与动牲交大全免费,新版天堂资源中文8在线

搜索

APP

起點(diǎn)課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標(biāo)識

發(fā)布

注冊 | 登錄

在通義App實(shí)測Qwen3，這可能是2025年上半年最強(qiáng)大模型

科技新知

2025-05-01

0 評論 3821 瀏覽 1 收藏

16 分鐘

實(shí)測阿里開源的Qwen3模型，探索其在邏輯推理、創(chuàng)意寫作和代碼生成等方面的卓越表現(xiàn)，以及通義App如何讓這一強(qiáng)大AI技術(shù)變得觸手可及。

“2025年4月29日凌晨，阿里突然開源了新一代通義千問模型Qwen3（下稱千問3）。這個被開發(fā)者稱為「全球最強(qiáng)開源」的模型家族，一夜之間就刷屏了整個AI圈，并且和前一代千問系列模型一樣，千問3的發(fā)布也是滿屏的好評。

作為國內(nèi)首個實(shí)現(xiàn)“混合推理”能力的開源模型，千問3不僅達(dá)到了36萬億token的訓(xùn)練數(shù)據(jù)量，還支持119種語言和方言。通過混合專家（MoE）架構(gòu)與混合推理機(jī)制的深度整合，在參數(shù)效率與任務(wù)適應(yīng)性層面實(shí)現(xiàn)雙重突破。

而在數(shù)學(xué)證明、代碼生成等核心基準(zhǔn)測試中，旗艦?zāi)Ｐ蚎wen3-235B-A22B性能與DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等全球頂尖模型表現(xiàn)相當(dāng)。

紙面數(shù)據(jù)這么強(qiáng)的模型，真實(shí)實(shí)力到底如何？

目前通義App以及通義網(wǎng)頁版（www.tongyi.com）已經(jīng)全面上線千問3，我們也通過通義App的“千問大模型”智能體（默認(rèn)搭載Qwen3-235B-A22B模型）進(jìn)行了文字陷阱、邏輯思維、文案創(chuàng)作、信息獲取再創(chuàng)作等多輪測試，結(jié)果讓我們大吃一驚。

01 今年高考，國產(chǎn)AI要拿高分了

首先為了保證測試的是千問3更為純粹的邏輯以及推理能力，我們在測試前將聯(lián)網(wǎng)功能進(jìn)行了關(guān)閉，并且僅使用旗艦?zāi)Ｐ瓦M(jìn)行測試。

我們先用了兩道經(jīng)典的大模型測試問題為其“開開胃”：9.8和9.11誰大以及strawberry中有幾個r，千問3均能直接果斷的給出推理過程和答案，并且指出了常見誤區(qū)以及用了多種不同的方式來證明答案的正確性。

隨后我們又向千問3提出了此前難倒眾多大模型的國內(nèi)小學(xué)奧賽題目：奧利弗周五摘了 44 個獼猴桃，周六摘了 58 個，周日摘的數(shù)量是周五的兩倍，不過有5個更小一些。問奧利弗一共摘了多少個獼猴桃？

這道題目是北京海淀一所小學(xué)二年級的問題，邏輯很簡單，不需要多么復(fù)雜的數(shù)學(xué)推導(dǎo)，但在此前卻讓GPT4o等大模型“翻車”。然而千問3僅用7秒便準(zhǔn)確的給到了我們正確答案，并且給到的關(guān)鍵點(diǎn)解析中也明確的標(biāo)注出易錯環(huán)節(jié)和驗(yàn)證邏輯。

仔細(xì)看千問3的推理過程，也能看出其準(zhǔn)確的識別到了題目的陷阱，并且對答案進(jìn)行了多輪驗(yàn)證。

簡單的文字游戲難不住千問3，那么更加需要推理的問題呢？于是我們拿出了去年高考理科數(shù)學(xué)中最后一道選擇題，讓千問3來解答：已知b是a,c的等差中項(xiàng),直線ax+by+c=0與圓x2+y2+4y-1=0交于A,B兩點(diǎn),則|AB|的最小值為？

對于這道需多輪推算與核對的難題，千問3并沒有掉鏈子，細(xì)細(xì)查看給到的推理過程以及答案，可以發(fā)現(xiàn)千問3不但答對了題目，更是用了多種解題手段，并且考慮到了多種情況，且每一步都會反復(fù)驗(yàn)證，保證能夠給到準(zhǔn)確的信息。

滑動查看更多高考過的都知道，數(shù)學(xué)最后一道選擇題，往往是卷子中最難的之一，千問3能夠準(zhǔn)確且快速的給到答案，相信在今年的大模型PK高考數(shù)學(xué)的競賽中，定能脫穎而出。

02 AI加持，小白也能成大拿

除了這些常規(guī)問題，我們又深度測試了千問3在創(chuàng)意寫作、角色扮演、多輪對話、指令跟隨等多方面的能力。

需要注意的是，這些問題往往實(shí)時性較高，所以在這個環(huán)節(jié)我們也打開了聯(lián)網(wǎng)功能。

首先，我們作為一個想要買黃金的小白，讓千問3扮演一個職業(yè)金融分析師的角色，看看其能否給到我們專業(yè)，同時又通俗易懂的市場分析建議。

從千問3給到的回答中，我們可以清晰的看到其調(diào)用了極其專業(yè)的知識庫信息，通過多維思考，給到了非常有邏輯的市場狀況、核心驅(qū)動因素以及技術(shù)層面的分析和建議。在其助力下，即便是對經(jīng)濟(jì)市場完全不了解的小白用戶，也能做出理性判斷。

簡單的沒有難到千問3，那更為抽象的問題呢？

我們給了千問3一個“擅長以莎士比亞風(fēng)格來分析金融市場的研究員”的身份，然后讓其分析未來黃金的走勢。沒想到的是，千問3沒有丟掉任何一個要求，不僅有理有據(jù)的分析了市場，還將這些與莎士比亞的經(jīng)典風(fēng)格結(jié)合到了一起，這確實(shí)有點(diǎn)超前了。

滑動查看更多當(dāng)然，一個新的大模型問世，難免逃不過與同行的對比，于是我們也將千問3與目前較火的Deepseek-R1以及豆包1.5pro進(jìn)行了對比測試。不過對于大多數(shù)普通用戶來說，這些都還不夠日常，于是我們以最近比較火的“l(fā)ook in my eyes”作為考點(diǎn)，讓千問3進(jìn)行相關(guān)情景創(chuàng)作。千問3不但準(zhǔn)確的找到了該梗出處，創(chuàng)作出的文案也屬于直接能用的水準(zhǔn)。

值得一提的是，其實(shí)這個環(huán)節(jié)我們也讓在創(chuàng)作者群體中比較火的Deepseek-R1以及豆包1.5pro參與了創(chuàng)作，但讓人意想不到的是豆包和Deepseek都沒能識別出這個梗的出處以及真實(shí)含義，創(chuàng)作出的文案也幾乎是無法直接使用。

03 一個指令，人人都可以是產(chǎn)品經(jīng)理

除了解答問題、創(chuàng)作文案外，代碼生成也是千問3的亮點(diǎn)能力。

在網(wǎng)頁版的通義中（www.tongyi.com），用戶可以進(jìn)入更擅長處理代碼問題的代碼模式，在這個模式中，只要一句話便可生成一個應(yīng)用。

我作為一個完全的代碼小白，想讓千問3幫我生成一個摸魚小游戲，但沒有更為具體的想法，于是就直接向千問3下達(dá)了生成摸魚小游戲的指令。大概10S鐘的時間，一個接金幣小游戲便生成了，并且玩起來也十分絲滑。

隨后我提出新的需求，希望通義幫我做一個通勤助手，要求以卡片形式整合 “天氣+交通+日程”，一站式展示通勤關(guān)鍵信息。通義給出的結(jié)果，再次讓人眼前一亮，不僅實(shí)現(xiàn)了功能需求，還對重點(diǎn)細(xì)節(jié)部分進(jìn)行了詳細(xì)說明，以便用戶直接更改需求使用。

值得一提的是，通義網(wǎng)頁版還配備了指令優(yōu)化功能，可以直接優(yōu)化用戶指令，使其更豐富且更貼合代碼生成邏輯。

小球測試也是難倒眾多大模型代碼能力的測試，我們也拿這個來考考千問3，給到其要求：編寫一個動畫程序，模擬一個紅色小球在順時針旋轉(zhuǎn)的五邊形中晃動，并遵循重力規(guī)律。

千問3快速給到了代碼，并且給到了使用指南，而我們根據(jù)使用指南將代碼運(yùn)行起來，得到了一個符合指令的展示效果。

其實(shí)通過一輪輪測試下來，可以明顯的感知到千問3在復(fù)雜任務(wù)處理上的碾壓級優(yōu)勢——它不是簡單堆砌知識點(diǎn)的答題機(jī)器，而是真正具備思維鏈構(gòu)建能力的智能體。當(dāng)然，一個出色的大模型也需要一個出色的落地產(chǎn)品。

在使用通義App體驗(yàn)千問3的過程中，也能確切的感受到新版通義App在多輪進(jìn)化升級后，無論是產(chǎn)品界面還是交互體驗(yàn)等設(shè)計層面的全方位變化，都變得更加易用，也更具溫度。雖然過去的通義App同樣具備不俗的AI實(shí)力，但在用戶使用體驗(yàn)上仍有優(yōu)化空間。

例如此前的通義App在主界面上集合了不少功能，這種設(shè)計雖然可以幫助用戶快速跳轉(zhuǎn)，但對于新用戶來說，難免會出現(xiàn)摸不著頭腦的情況，需要摸索后才能輕松上手。

如今的通義App整體界面大做減法，產(chǎn)品設(shè)計更加簡潔清爽，將提問、對話、圖片理解與生成、翻譯、寫作等多種核心以及常用的功能放到最顯眼的位置，主智能體“鄰家女孩”這一富有親和力的新形象，能勝任大部分應(yīng)用場景中的需求，保證了所有用戶都能輕松體驗(yàn)。

新版通義App在其他方面的設(shè)計和調(diào)整，也進(jìn)一步降低了用戶使用的門檻。例如左滑便可直接看到對話記錄、我創(chuàng)建的、我聊過的智能體等資產(chǎn)沉淀，右滑就是通義過去積累起來的智能體平臺，有非常豐富的專業(yè)智能體，比如AI視頻、健康顧問、AI生圖、AI擴(kuò)圖、表情包大師等等，通過這些名稱更直觀地找到自己所需的信息，并且整體界面顯得清爽了不少。

另外，通義App在視覺呈現(xiàn)上也下足了功夫，色彩搭配舒適，功能排版清晰，各種功能按鈕的位置設(shè)置合理。

可以說，通義App通過這些貼心的設(shè)計，讓千問3的強(qiáng)大能力得以更好地展現(xiàn)，也讓用戶更加愿意沉浸其中，探索AI的無限可能。

從榜單到場景，千問3真正做到了“能上手、能落地”，而當(dāng)每個開發(fā)者都能基于這套最強(qiáng)開源底座創(chuàng)造價值，當(dāng)每個用戶都能通過一個好用的App去釋放AI潛力，這種讓最強(qiáng)AI觸手可及的普惠性，或許才是千問3以及通義App定義的最強(qiáng)新內(nèi)涵。

作者丨主木 ?編輯丨茯神主編丨九黎

本文由人人都是產(chǎn)品經(jīng)理作者【科技新知】，微信公眾號：【科技新知】，原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自Unsplash，基于 CC0 協(xié)議。

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App