拒絕概念營銷,Lovart是否稱得上設計Agent?
近期,AI設計工具Lovart引發(fā)了廣泛關注。它究竟是一個簡單的生圖工具,還是真正具備設計Agent能力的創(chuàng)新產(chǎn)品?本文通過一系列深度測評,從定制表情包、設計LOGO及VI效果圖,到制作海報、創(chuàng)意漫畫,甚至生成視頻,全方位檢驗Lovart的理解、規(guī)劃與執(zhí)行能力。測評結果顯示,Lovart在設計領域的表現(xiàn)令人驚艷,它不僅能夠高效完成任務,還展現(xiàn)出強大的記憶與優(yōu)化能力。本文將帶你深入了解Lovart的實戰(zhàn)表現(xiàn),探討AI設計Agent的未來潛力與挑戰(zhàn)。
1. 前言
前兩天睡醒了,洗漱完了我開始慢悠悠的刷公眾號,進行一天的信息攝取。
發(fā)現(xiàn)大家都提及了Lovart產(chǎn)品,我看了看測評覺得蠻有意思的,然后我就去厚著臉皮要了個測試名額,當時體驗了一會發(fā)現(xiàn)做表情包確實比4o方便不少,省的自己在那想創(chuàng)意了。
但我當時沒覺得Lovart有多強,我覺得我還是先把我拖欠的一堆活干完更重要。
然后突然看到群里發(fā),朱嘯虎老師對Lovart的評價。
我當時琢磨了一會,Agent達到商業(yè)化質(zhì)量,這句話含量有點深啊。
那我還是去測測吧,我想看看它到底是和之前一樣的生圖工具還是一個專業(yè)設計Agent。
為此我還拉著Gemini搓了一套設計Agent測評標準,然后又拉著O3確認了一下邏輯有無漏洞。
然后我梳理了一下整體的測評思路:通過提示詞遞減、生成難度遞增的策略,來看Lovart的理解能力、規(guī)劃能力、執(zhí)行能力、上下文能力是否能夠達到一個不錯的Agent水平。
為了保證測評的客觀性,我會和Gemini2.5一起對每一個案例打分。
接下來讓我們一起開始來測評Lovart吧~
2. Lovart案例測評
2.1 案例
1:做一組定制的微信表情包
2.1.1 測評點
第一次測試我們就先熱熱身,就讓它做一次單步任務,我會給它圖像和需求讓它生成表情包,看看它在批量化場景下的效果怎么樣,有沒有不錯的一致性和創(chuàng)造性。
2.1.2 測試過程及結果展示
我把Lovart這次執(zhí)行任務的流程拆了出來畫成了圖,可以見到它有一個清晰的規(guī)劃到落地的路徑,AI會根據(jù)自己的判斷產(chǎn)出方案、選擇模型,然后才是生成圖。
2.1.3 測評打分
在Lovart做好了之后,我直接把狗子表情上傳了微信表情包,第一波測試我給Lovart打滿分!
AI在這一波也給到了93分!它對Lovart的表現(xiàn)評價還不錯。
2.2 案例
2:做LOGO及VI效果圖
2.2.1 測評點
這次測試我們升級了一下難度,把提示詞從單步變成了多步。
這次給到Lovart的是多步提示詞,我希望看到它在Logo及VI(配色方案)上的思考,同時看看它在上下文一致性和連貫性上的體驗怎么樣。
我要求它先生成3個logo,然后在我確認后幫我生成VI及效果圖。測試過程及結果展示
它在生成了這3個icon后,來讓我進行選擇:
我選擇了第三個,這是它產(chǎn)出的VI及效果圖。
Lovart執(zhí)行本次任務的流程圖:
搜尋靈感這個模塊蠻有意思的,當用戶沒有給參考信息時,它會先去自己搜集一下參考,然后再生成。
跟設計師做需求一樣了,哈哈哈~
2.2.3 測評打分
這一輪我繼續(xù)給出滿分,我覺得Lovart完整的按照提示詞進行了執(zhí)行,VI和效果圖都沒有漏掉,我覺得非常不錯。
AI在這一波也給到了94分,看起來我們兩個又一次達成了一致。
2.3 案例
3:做一個線下活動的海報
2.3.1 測評點
這次我們把難度再往上抬一點,我會先給Lovat一個提示詞,讓它幫我生成海報,看看它對視覺的理解力創(chuàng)造力怎么樣,能不能畫出一張好看的海報。
然后基于這張海報,我會讓它去做多輪調(diào)整,看一看在多輪調(diào)整中它是否能夠每次都高效的完成任務,會不會一會就跑偏。2.3.2 測試過程及結果展示
讓它調(diào)整一下:
再調(diào)整一下:
接下來我又測試了一下中文能力,中文海報目前的穩(wěn)定性還是模型不好處理的,Lovart因為還是調(diào)用已有模型進行生成,所以還是有一些細節(jié)不太好。
Lovart執(zhí)行本次任務的流程圖,用戶提需求
2.3.3 測評打分
這次海報我們就直接讓AI來打分,它給到了86分;它給我的反饋是排版精度可以再往上提升一下,第一稿的視覺沖擊力較弱。
整體表現(xiàn)還是不錯的,這是一個可以進行交付的效果圖。
2.4 案例
4:做一組創(chuàng)意漫畫
2.4.1 測評點
上邊的測評里我都給了Lovart詳細的提示詞,那這次我們繼續(xù)往上抬難度。
我們看一看Lovart在低提示詞的描述下,能不能做出來不錯的創(chuàng)意漫畫。2.4.2 提示詞及結果展示
我以為Lovart會問我問題,但它下根據(jù)自己的理解出了一版故事,我覺得還行,然后我給它提出了修改需求。
它直接在加文字的基礎上把6個漫畫合成了一張圖,這個效果是我沒想到的。
我仔細去看了一下它的生成過程,它做了一個布局設計,還是怪聰明的。
于是我決定看看他能不能在一張大圖的基礎上對第四個、第五個面板進行局部調(diào)優(yōu),這個事情的難度在于Lovart到底是在大圖直接做,還是會在第一次的基礎上優(yōu)化完,然后再合成一張大圖。
如果是前者,我覺得可能搞不定;后者的話還有可能。
剛開始Lovart給到我的是這兩個圖,我看了之后有點失望,我感覺它沒有把上下文完整
的接進去。正當我準備問它的時候,我發(fā)現(xiàn)它又給了我一張大圖。我要的修改點它都加了進去了,表現(xiàn)的還是非常錯的。
然后我去深度對比了兩張大圖,我發(fā)現(xiàn)它是完整的又從做了一張大的合成圖,這說明它的記憶能力、理解能力、規(guī)劃能力都是極強的。
模型在接收到調(diào)整圖4、圖5細節(jié)的時候會拆成這樣的規(guī)劃:
1.?先從歷史內(nèi)容中找到第一版的圖片4、圖片5
2.?對其進行用戶需求的微調(diào)
3.?重復用戶添加文字的需求
4.?每個小圖增加文字描述
5.?生成一張大圖
2.4.3 測評打分
這次漫畫我們繼續(xù)讓AI打分,它給出了不錯的評價,我也是非常認可。
雖然細節(jié)上還有一些瑕疵,但Lovart的記憶能力、規(guī)劃能力、執(zhí)行能力都讓我感覺很強,接下來該上點難度了。2.5 案例5:生成小狗冒險視頻2.5.1 測評點
最后一個測評,我們上個賊難的吧。
看看能不能一句話生成一個好玩的視頻,這將是對Agent的終極考驗。2.5.2 提示詞及結果展示
看完了我都驚呆了!我以為它只能搓個半成品,沒想到效果還挺好!
讓我們一起看看Lovart執(zhí)行任務的邏輯:
它這是一次任務完整執(zhí)行下來的,中間我沒有任何的干預。
2.5.3 測評打分
滿分!滿分!滿分!
我的好搭子Gemini保持著它的理性挑了點刺,不過它的問題還是視頻的畫面細節(jié),不過它不了解目前世界AI視頻做到什么地步了,它應該還是用數(shù)據(jù)庫里各種人類的視頻去對比的。
3.測評結論
從這幾個案例測評結果來看,我做為一個人類好像只會從那喊滿分!
還是Gemini更加客觀公正一些。
我在測評完案例后,我其實知道Lovart是一個不錯的Agent設計產(chǎn)品,但我想了半天我該如何給它做一個結論。
我覺得它有很多還可以提升的點,比如生成速度實在是有點慢,做表情包都花了我5分鐘時間;漫畫的人物一致性可讀性都有不少提升空間;視頻生成的細節(jié)也有待提升,最起碼清晰度高一點。
但作為一個AI產(chǎn)品經(jīng)理,我覺得這些細節(jié)也還好,他們都是有看得到的解決方案的。
我想Lovart給我們帶來的更多是:AI在設計賽道上有能力和人一樣進行作業(yè)。
我在敲下這行字的時候我想了半天,真的是這樣的嗎?
然后我又回去看了看我測試的這些案例,如果我之前想達到這樣的效果我該怎么樣呢?
去找設計師,然后提出我的需求,然后他給結果后我繼續(xù)改。
流程是沒什么區(qū)別的,Lovart的結果我敢用嗎?
當然是敢用的,狗子表情包我都傳到微信里邊了。
那它其實就是設計師了。
我想這是個不可逆的趨勢,認可AI或許更容易讓我們進入新世界。
DeepseekV2在24年5月份發(fā)布,那時候企業(yè)低Token成本擁抱AI的種子早已埋下了。
Deepseek用了8個月迭代出來的R1,震驚了世界。
我想或許Lovart、Mauns它們都是那粒種子,它們都在告訴我們:未來已至。
本文由人人都是產(chǎn)品經(jīng)理作者【云舒】,微信公眾號:【云舒的AI實踐筆記】,原創(chuàng)/授權 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!