MEUX「七月」AI設(shè)計觀察
在AI技術(shù)飛速發(fā)展的當(dāng)下,設(shè)計領(lǐng)域也迎來了前所未有的變革。本文聚焦于2025年7月的AI設(shè)計動態(tài),為你帶來最新的行業(yè)觀察。
【1】Perplexity推出AI驅(qū)動瀏覽器Comet
【2】谷歌發(fā)布32個T5Gemma模型
【3】馬斯克xAI發(fā)布Grok4
【4】新版 PNG 格式發(fā)布
【5】B站推“代號H”AI創(chuàng)作工具
【6】京東推出兩款A(yù)I社交產(chǎn)品
【7】字節(jié)上線“小荷AI醫(yī)生”
【8】vivo發(fā)布端側(cè)多模態(tài)模型
【9】騰訊元器接入微信支付MCP
【10】字節(jié)發(fā)布Xverse圖像生成模型
1.Perplexity推出AI驅(qū)動瀏覽器Comet
Perplexity 推出首款 AI 驅(qū)動網(wǎng)頁瀏覽器 Comet,旨在挑戰(zhàn)谷歌搜索作為用戶獲取信息主要途徑的地位。該瀏覽器初期向每月 200 美元的 Max 計劃訂閱者及少量等待名單邀請用戶開放,核心特色是預(yù)裝并默認(rèn)設(shè)置 Perplexity 的 AI 搜索引擎,突出展示其核心產(chǎn)品 ——AI 生成的搜索結(jié)果摘要。
同時,瀏覽器內(nèi)置全新 AI 助手 Comet Assistant,可自動完成日常任務(wù),如總結(jié)郵件和日歷事件、管理標(biāo)簽頁、代用戶瀏覽網(wǎng)頁等,用戶可通過側(cè)邊欄調(diào)用該助手,使其查看網(wǎng)頁內(nèi)容并解答相關(guān)問題。
2.谷歌發(fā)布32個T5Gemma模型
谷歌發(fā)布編碼器 – 解碼器架構(gòu)的 T5Gemma 系列模型,同時還推出了用于健康 AI 開發(fā)的多模態(tài)模型 MedGemma。
T5Gemma采用 “適應(yīng)” 技術(shù),將預(yù)訓(xùn)練的僅解碼器模型轉(zhuǎn)換為編碼器 – 解碼器架構(gòu),可靈活組合不同大小模型,平衡質(zhì)量與效率。
實(shí)驗(yàn)顯示,T5Gemma 在多個基準(zhǔn)測試中表現(xiàn)優(yōu)異,尤其在推理密集型任務(wù)上,相比僅解碼器的 Gemma 2 有顯著提升,被認(rèn)為可能推動編碼器 – 解碼器架構(gòu)復(fù)興。MedGemma 包含 4B 和 27B 大小的模型,能輔助醫(yī)療診斷,表現(xiàn)良好。
3.馬斯克xAI發(fā)布Grok4
馬斯克旗下 AI 公司 xAI 發(fā)布最新旗艦大模型Grok 4 及多智能體版本 Grok 4 Heavy,并推出每月 300 美元的高價訂閱計劃 Super Grok Heavy。
在 “人類的最后考試” 中,Grok 4 無工具時準(zhǔn)確率 25.4%,超谷歌 Gemini 2.5 Pro 和 OpenAI o3;Grok 4 Heavy 帶工具得分 44.4%,表現(xiàn)亮眼。其在多學(xué)科測評中成績優(yōu)異,馬斯克稱其科研能力超人類博士,還能處理源代碼文件。
此外,Grok 4 已在庫存管理、游戲創(chuàng)作等領(lǐng)域落地,未來還將推出編碼、多模態(tài)、視頻生成等模型,與 OpenAI 的 GPT-5 形成競爭態(tài)勢。
4.新版PNG格式發(fā)布
新版PNG格式規(guī)范發(fā)布,沉寂20余年的PNG格式重?zé)ɑ盍Α?/p>
美國國會圖書館等機(jī)構(gòu)均推薦該格式,此次更新由 Adobe、蘋果、谷歌等多巨頭參與推動。
新功能包括:
一是完善 HDR 支持,僅用 4 字節(jié)即可實(shí)現(xiàn),且具備前瞻性;
二是正式認(rèn)可 APNG 動畫格式,此前該格式已獲廣泛支持;
三是官方支持 Exif 數(shù)據(jù),可存儲版權(quán)、GPS 等附加信息,同時還進(jìn)行了錯誤修正和說明澄清等整理工作。
目前,Chrome、Safari、Photoshop 等眾多程序已支持新版 PNG 規(guī)范,廣播領(lǐng)域的硬件和工具也在更新適配。
后續(xù)計劃推出第四版更新以提升 HDR 與 SDR 的互操作性,第五版將研究壓縮優(yōu)化及并行編解碼功能。
5.B站推“代號H”AI創(chuàng)作工具
B 站推出 “代號 H” AI 創(chuàng)作工具,聚焦視頻播客領(lǐng)域,該工具可實(shí)現(xiàn)音頻內(nèi)容視頻化,支持文案、音頻輸入,適配播客和泛知識雜談圖文模板,能在 6 分鐘內(nèi)生成千字內(nèi)容視頻,未來預(yù)計縮至 3 分鐘,定向邀請用戶體驗(yàn)反饋超預(yù)期。
6.京東推出兩款A(yù)I社交產(chǎn)品
京東在其 App 內(nèi)推出兩款 AI 社交產(chǎn)品 “寵 TA” 和 “聊愈小宇宙”,虎牙則推出首個 AI 助手產(chǎn)品 “小虎 AI 加工坊”。
“寵 TA” 是以寵物為中心的 AI 社區(qū)產(chǎn)品,用戶可與寵物或?qū)櫸飻?shù)字人形象的智能體聊天,兼具換裝、寵物數(shù)字人等可玩性功能,還設(shè)有寵物醫(yī)生咨詢、食品購買專區(qū),將情感陪伴與消費(fèi)場景結(jié)合,形成 “邊玩邊買” 閉環(huán)。
“聊愈小宇宙” 是 AI 類對話產(chǎn)品,能識別用戶情緒,提供情緒記錄、解壓游戲等服務(wù),用戶可與 AI 心理咨詢師聊天,還可在 “微光社區(qū)” 交流,同時提供專業(yè)心理咨詢師付費(fèi)服務(wù),增強(qiáng)用戶認(rèn)同感。
7.字節(jié)上線“小荷AI醫(yī)生”
字節(jié)首款 AI 醫(yī)療助手獨(dú)立 App “小荷 AI 醫(yī)生” 上線,定位健康管家,提供健康咨詢、報告解讀等服務(wù)。用戶注冊登錄后進(jìn)入對話界面,可咨詢疾病自查、用藥參考等健康問題,AI 會主動收集關(guān)鍵信息(如癥狀持續(xù)時間),并通過讓用戶上傳診斷報告、拍攝病灶圖片等方式,結(jié)合信息給出建議。其還能解讀血常規(guī)等報告,快速分析指標(biāo)異常,評估狀況并給出建議;支持拍攝藥盒查詢藥效說明。
2024 年中國 AI 醫(yī)療器械市場規(guī)模達(dá) 96.41 億元,預(yù)計 2025 年將達(dá) 242.3 億元,大廠競速或重新定義 AI 健康邊界。
8.vivo發(fā)布端側(cè)多模態(tài)模型
vivo AI Lab 發(fā)布端側(cè)多模態(tài)模型 BlueLM-2.5-3B,參數(shù)量僅 2.9B,專為端側(cè)設(shè)計,緊湊高效。
該模型融合文本與圖文理解推理能力,支持長短思考模式切換及思考預(yù)算控制,可直接理解 GUI 界面。
在 20 余項評測中表現(xiàn)突出:
- 文本任務(wù)上,緩解多模態(tài)模型文本能力遺忘問題,與同規(guī)模文本模型效果相近,優(yōu)于同規(guī)模及更大規(guī)模多模態(tài)模型;
- 多模態(tài)任務(wù)領(lǐng)先同規(guī)模模型,部分接近大規(guī)模模型;
- GUI 理解能力在同規(guī)模模型中領(lǐng)先,尤其中文場景表現(xiàn)優(yōu)異。
9.騰訊元器接入微信支付MCP
騰訊元器宣布正式接入微信支付 MCP,成為首個接入該支付解決方案的智能體開發(fā)平臺。
這一舉措支持開發(fā)者在智能體上直接添加下單、贊賞、查詢訂單等功能,打通了智能體商業(yè)化的最后環(huán)節(jié)。開發(fā)者僅需通過簡單的提示詞調(diào)用或工作流編排,就能快速接入微信支付 MCP,使智能體具備支付能力。
目前,元器平臺已向開發(fā)者開放微信支付 MCP 的體驗(yàn)版本,正式版本將在資質(zhì)審核通過后開放。
10.字節(jié)發(fā)布Xverse圖像生成模型
字節(jié)發(fā)布多主體控制生成模型 Xverse,可對設(shè)定的每個主體進(jìn)行精確控制,且不破壞圖像生成質(zhì)量,能應(yīng)對多主體、多光源、多風(fēng)格等場景。
其核心是通過學(xué)習(xí) DiT 中文本流調(diào)制機(jī)制中的偏移量,實(shí)現(xiàn)對多個主體身份和語義屬性的一致控制,包含 T-Mod 適配器、文本流調(diào)制機(jī)制、VAE 編碼圖像特征模塊及兩種正則化技術(shù)等關(guān)鍵組成部分。
對比測試顯示,Xverse 在單主體、多主體任務(wù)及整體表現(xiàn)上均優(yōu)于 MS-Diffusion、OmniGen 等領(lǐng)先技術(shù)。
本文由人人都是產(chǎn)品經(jīng)理作者【百度MEUX】,微信公眾號:【百度MEUX】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!