為了集福,我生成了100個福字

0 評論 2083 瀏覽 0 收藏 12 分鐘

一年一度的集五福又開始了,不過有了AI的幫助,我們可以直接自己生成福字,不用再考慮到處找“?!弊值膯栴}。這篇文章,我們來看看作者測試的效果,AI的表現(xiàn)如何。

臨近過年啊,一年一度的集福大戰(zhàn)又雙叒叕拉開帷幕啦!之前家人不理解,說弄這個能給幾百塊錢啊,我說沒有,人均幾塊錢,或者十幾塊錢的樣子吧,運(yùn)氣好了,能有個幾十左右吧。然后媽媽給我拿了 100 塊錢,說:放下手機(jī),去打掃衛(wèi)生。

將近 40 歲的年紀(jì)啊,還被這么一個小小的利益給拿捏了。當(dāng)集福已成為習(xí)慣,越是到了年底,就會不由自主的想起來這個游戲。看到 “?!?字就像被施了定身咒,挪不動腳,眼睛直勾勾地盯著,滿心想著趕緊掏出手機(jī)掃一掃,說不定就能掃到稀缺福卡。我也完全被這股集福熱潮給 “拿捏” 得死死的,深陷其中,無法自拔。

但,一天了不起能找到十幾二十多個福字,概率還是很低的。如果說依靠數(shù)量取勝,那為什么我不能先給自己生成 100 個福,讓就掃個過癮呢。

一、工具先行

說干就干,我一頭扎進(jìn)了互聯(lián)網(wǎng)的海洋,開始瘋狂搜索如何利用 AI 生成福字的方法 。

我先是考慮使用專門的圖形設(shè)計(jì)軟件,如 photoshop 、Illustrator 、CorelDRAW,畢竟咱是做設(shè)計(jì)出身的,這幾個軟件基礎(chǔ)功能還是掌握的。專業(yè)的設(shè)計(jì)圖形軟件功能強(qiáng)大,可以通過直接選擇字體生成,后面再進(jìn)行配圖就可以了。但萬事開頭難啊,第一步安裝軟件,就花費(fèi)了我好幾個小時(shí)。打開軟件后,發(fā)現(xiàn)一臉的茫然,畢竟十多年沒有碰過了,我覺得我和這三個軟件關(guān)系很熟,都是鐵汁,但這三個軟件對我一臉的茫然。又是一個小時(shí),只生成了幾個,還要排版,調(diào)整,眼瞅著天都黑了,我這點(diǎn)產(chǎn)出量,還不如直接用搜索得到的結(jié)果快呢。

但,大活人哪能讓尿給憋死啊。于是我放棄了專業(yè)的圖形軟件,改用 AI 工具來實(shí)現(xiàn)我的需求。

Kimi

我現(xiàn)打開了常用了kimi,發(fā)現(xiàn)kimi默認(rèn)界面沒有生圖功能。給了我一段字體類型的介紹,然后又給我一些網(wǎng)頁搜索結(jié)果。這 AI,和我想象的有點(diǎn)不不一樣啊。不是說 AI 能夠代替人類寫作、畫畫和思考嗎,這也沒理解我的意思,也沒達(dá)到我的要求啊。

雖然能夠解決問題,但這次的結(jié)果不滿意,放棄~

文心一言

因?yàn)槲男囊谎员举|(zhì)上也是文生文的 AI 工具,所以我在開始指令的時(shí)候,直接添加了場景的條件“畫”。很多小伙伴都說自己對 AI 軟件熟悉,但大多數(shù)都是在常用的基礎(chǔ)上,還有一些細(xì)節(jié)技巧的東西也需要知道和了解。

相對于Kimi的回答,文心一言的答案才是我這個場景需要的。雖然只生成了 9 個(大概率是排版的問題),雖然在同一個對話中我更改了場景,讓其解釋這 10 個福字都是使用什么字體,沒有給我生成答案,而是繼續(xù)生成福字。但相對于第一目標(biāo)而言,結(jié)果還是令人滿意的。

文心一言似乎對上下文關(guān)聯(lián)的理解有時(shí)候不是很好。或者說,它只是在車轱轆話,很少看到真正的「生成式內(nèi)容」。所以理解文心一言的底層模型邏輯上并不是這么簡潔的,很可能也加入了很多中間層的處理,也就是把文章里完整的詞組、句子甚至段落也當(dāng)成了可檢索的對象,并且直出了(還要考慮一些指向性的關(guān)鍵詞觸發(fā))。所以這里就會出現(xiàn)在同一組對話中,如果你突然做了場景變更,文心一言就難以跳出這個邊界的范圍。那么如果我們需要一個不同的場景回答,就需要新建一組對話。

比如我新建了一組對話,沒有加上畫這個關(guān)鍵詞做條件觸發(fā),那么就是文生文的結(jié)果。

我以為我找到了竅門,所以我又返回了Kimi,告訴他,畫:10 個字不同字體的福字。結(jié)果還是文生文。

豆包

再次使用豆包來生成,最近用豆包比較多,覺得豆包文生文,文生圖,對于場景的理解,對于概念的敘述性都很強(qiáng)。我已經(jīng)逐步從文心一言替換到 Kimi,現(xiàn)在又替換到豆包,作為 AI 常用工具了。

先來看結(jié)果:幫我生成圖片:生成 10 個不同字體的福字。

為了避免重復(fù),我直接把場景“圖片”這個要求先加上了。所以給的結(jié)果是圖片,這個是符合要求的。

我是要 10 個不同字體,數(shù)量上不精準(zhǔn)符合要求。但大總比少要少。

最后就是不同字體:肉眼對比了一下,有近一半的字體應(yīng)該是相同的。

相對于 Kimi和文心一言,豆包生成的結(jié)果還是令人滿意的,至少在便利性上面來說,一次就能解決問題。搜索了一下關(guān)于豆包的 AI 功能,在 24 年的 12 月份智能AI助手豆包升級文生圖能力,支持一鍵生成指定文本。用戶可以在生圖提示詞中加入文本要求,如“一張帶有‘新年快樂’的圖”,即可生成帶有指定文字的圖片。

那么根據(jù)這樣的要求,我又重新提出了一個指令:一張帶有“?!钡膱D。結(jié)果令人意想不到。

豆包生成的圖片,更加具有美感,不光是字體樣式有了變化,連帶圖案也有了新的變化。這里猜測,豆包應(yīng)該是在推理模塊增加了一些場景關(guān)聯(lián)。比如福字,在過年時(shí)候的使用場景,是有寓意的代表。那么單純一個字的結(jié)果是不能滿足用戶需要的,所以可以增加一個裝飾性的設(shè)計(jì)。也就是說豆包能理解對話之間的關(guān)系、場景布局以及鏈路的整體含義。其次,豆包是具有復(fù)雜推理能力,不僅能更好地識別內(nèi)容,還能根據(jù)所識別的文字和圖像信息進(jìn)行復(fù)雜的邏輯計(jì)算。

在回到我們最開始的主題:生成 100 個福字。豆包給出了近乎滿意的結(jié)果(70 來個)。

Midjourney 和 StableDiffusion

這里有小伙伴會說了,國外的MJ和 SD 不是很強(qiáng)大嗎,為啥不用呢。其實(shí)我在寫文章最開始的時(shí)候也是考慮了這倆軟件,畢竟之前用來做過一些比較特殊的內(nèi)容。但不知道為啥今天一直登錄不上去,折騰了一下沒辦法操作,也就放棄了。

二、AI的理解與未來

隨著 AI 技術(shù)的不斷發(fā)展,未來我們有望看到更強(qiáng)大的通用人工智能出現(xiàn)。這將使 AI 能夠在更多領(lǐng)域發(fā)揮作用,如科學(xué)研究、藝術(shù)創(chuàng)作等。量子計(jì)算技術(shù)的發(fā)展也可能為 AI 帶來巨大的計(jì)算能力提升,加速模型的訓(xùn)練和優(yōu)化。如果說計(jì)算機(jī)還是一個機(jī)械化的工具,那么 AI 就是自動化的升級應(yīng)用。計(jì)算機(jī)畢竟需要人去設(shè)定指令,需要人去下達(dá)指令;而 AI 則是具有一定的思考性,能夠擬人定義,能夠做出自一定的自我決策。

AI 作為一項(xiàng)具有深遠(yuǎn)影響力的技術(shù),已經(jīng)在眾多領(lǐng)域展現(xiàn)出巨大的應(yīng)用潛力和價(jià)值。通過深入理解 AI 的技術(shù)原理和應(yīng)用場景,我們能夠更好地把握這一技術(shù)帶來的機(jī)遇,推動各行業(yè)的創(chuàng)新發(fā)展。然而,AI 的廣泛應(yīng)用也面臨著諸多挑戰(zhàn),需要政府、企業(yè)、科研機(jī)構(gòu)和社會各界共同努力,加強(qiáng)技術(shù)研發(fā)、完善法律法規(guī)、培養(yǎng)專業(yè)人才,以確保 AI 技術(shù)的健康、可持續(xù)發(fā)展。

展望未來,AI 將繼續(xù)深入滲透到各個領(lǐng)域,與其他新興技術(shù)如物聯(lián)網(wǎng)、區(qū)塊鏈、量子計(jì)算等融合發(fā)展,創(chuàng)造更多的創(chuàng)新應(yīng)用和商業(yè)模式。我們有理由相信,AI 將為人類社會帶來更加美好的未來。

最后放上三張來自大設(shè)AI特效字工具生成的福字,祝福大家新年快樂~

借鑒文章:1天100張福字海報(bào),真的有人接嗎……

圖片生成:Kimi、文心一言、豆包、大社

內(nèi)容生成:豆包(50%),手打(50%)。

專欄作家

老虎~色,公眾號:產(chǎn)品經(jīng)理有話說,人人都是產(chǎn)品經(jīng)理專欄作家。13年產(chǎn)品經(jīng)理經(jīng)歷,涉及商業(yè)設(shè)計(jì)、業(yè)務(wù)轉(zhuǎn)型、產(chǎn)品架構(gòu)定義、個成成長等方面。自學(xué)AIGC落地應(yīng)用,目前在鴻蒙場景做產(chǎn)品服務(wù)工作。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!