AI 大模型應(yīng)用探索3——國(guó)內(nèi)文生圖工具(即夢(mèng)、可靈、豆包等)對(duì)比、文生圖提示詞方法論、使用場(chǎng)景
AI 大模型文生圖的出現(xiàn),為文章配圖、宣傳活動(dòng)、短視頻封面等提供了全新的解決方案,極大地提高了效率和便捷性。本文將對(duì)國(guó)內(nèi)主流文生圖工具如即夢(mèng)、可靈、豆包等進(jìn)行對(duì)比,探討文生圖提示詞的方法論,并展示不同工具在相同提示詞下的生成效果。
之前沒(méi)有大模型生圖的時(shí)候,為了給文章找一個(gè)好的封面配圖,我需要在瀏覽器中逐步查看搜索出來(lái)的圖片,翻找半天,有時(shí)候看到一張合適的圖,但圖片的清晰度又很差,為文章配圖真的很難搞定。如果是說(shuō)給活動(dòng)做宣傳圖,這種圖基本不可能從網(wǎng)上找到,只有求助于平面設(shè)計(jì)師,或者花錢(qián)到網(wǎng)上找人做。
如果設(shè)計(jì)師手上有活,還要排時(shí)間,這已溝通,一等待時(shí)間也比較久了。但是現(xiàn)在有了大模型文生圖之后,對(duì)于文章封面,文章配圖,宣傳活動(dòng),logo,簡(jiǎn)單的圖片編輯都可以直接使用AI來(lái)完成。我最近幾個(gè)月的文章封面和文章內(nèi)的配圖都是用AI完成的。
另外我最近也在做短視頻,短視頻的封面也是AI生成,而且在短視頻封面上還有相關(guān)的文字,
還有商業(yè)宣傳的圖文
我自己做的智能體所需要的數(shù)字人的圖片,背景圖片,這些人像基本很難判斷是真實(shí)照片還是AI生成的。
其它的各種場(chǎng)景還在不斷探索中,比如用戶(hù)商品頭圖,給模特?fù)Q衣服的等等。
那我們接下來(lái):
a、就給大家講講國(guó)內(nèi)有哪些比較常見(jiàn)的文生圖工具,他們的優(yōu)劣點(diǎn)是怎樣的;
b、之后我們對(duì)文生圖的提示詞方法論進(jìn)行一個(gè)簡(jiǎn)單梳理;
c、最后我們?cè)儆猛瑯犹崾驹~在各個(gè)工具生成一下圖片,看看效果。
一、國(guó)內(nèi)
最新評(píng)測(cè)的國(guó)內(nèi)主流文生圖工具對(duì)比表,綜合生成質(zhì)量、功能特色、使用成本及適用場(chǎng)景等維度分析:
免費(fèi)策略?:多數(shù)工具提供基礎(chǔ)免費(fèi)額度(如即夢(mèng)積分制、通義靈感值),但商用高頻需求需訂閱?電商運(yùn)營(yíng)?:通義萬(wàn)相(淘寶數(shù)據(jù)支持)、可靈AI(虛擬試穿)
二、提示詞
文生圖提示詞的構(gòu)建需系統(tǒng)性地考慮多個(gè)維度,以下是根據(jù)業(yè)界主流實(shí)踐總結(jié)的核心要素
1、內(nèi)容描述維度
?主體(Subject)?
*示例:一位身著漢服的少女,手持油紙傘核心對(duì)象:明確人物、動(dòng)物或物體的具體特征(如年齡、服飾、姿態(tài))細(xì)節(jié)強(qiáng)化:包含材質(zhì)(陶瓷杯)、狀態(tài)(熱氣騰騰)、紋理(毛茸茸)等
?環(huán)境與背景(Environment)?
*示例:晨曦中的雪山之巔,冰晶覆蓋松枝物理場(chǎng)景:室內(nèi)/室外、自然景觀(guān)(雪山/森林)、城市街景等動(dòng)態(tài)元素:天氣(暴雨/晴天)、光線(xiàn)(霓虹反射/晨光)
?情感與氛圍(Mood)?
*示例:幽藍(lán)色調(diào),天地蒼茫的孤寂氛圍抽象意境:孤寂感、夢(mèng)幻感、賽博朋克式的未來(lái)壓抑感
2、藝術(shù)控制維度
?風(fēng)格(Style)?
*示例:水墨畫(huà)風(fēng)格,皮克斯動(dòng)畫(huà)質(zhì)感藝術(shù)流派:水墨畫(huà)、浮世繪、賽博朋克、吉卜力風(fēng)格媒介形式:油畫(huà)、水彩、3D渲染、攝影寫(xiě)實(shí)
?構(gòu)圖與視角(Composition)?
*示例:鳥(niǎo)瞰視角,動(dòng)態(tài)構(gòu)圖,留白20%鏡頭語(yǔ)言:廣角/微距/俯拍、中心對(duì)稱(chēng)/三分法構(gòu)圖主體比例:全身像/半身特寫(xiě)、留白空間控制
?畫(huà)質(zhì)與細(xì)節(jié)(Quality)?
*示例:超寫(xiě)實(shí)細(xì)節(jié),焦點(diǎn)銳利,自然光暈技術(shù)參數(shù):8K超清、電影級(jí)光影、細(xì)膩紋理光影效果:體積光、丁達(dá)爾效應(yīng)、HDR3、技術(shù)優(yōu)化維度權(quán)重控制(Weighting)? ? 增強(qiáng)符號(hào):[關(guān)鍵詞]提升重要性? ? 減弱符號(hào):[關(guān)鍵詞]?降低存在感
反向提示詞(Negative Prompt)?排除元素:模糊、畸變手、多余肢體、文字? ? ?*示例:避免水印、低分辨率、4、結(jié)構(gòu)化公式(萬(wàn)能框架)[主體]+[細(xì)節(jié)描述] | [環(huán)境背景] | [藝術(shù)風(fēng)格] | [情感氛圍] | [技術(shù)參數(shù)]?注意點(diǎn)簡(jiǎn)潔精準(zhǔn)?:避免冗余詞,核心詞靠前描述清晰:將模糊描述轉(zhuǎn)為具體的特征*示例:錯(cuò)誤?“一杯咖啡” → 正確?“陶瓷杯裝拿鐵,表面麥穗拉花,熱氣升騰”
三、生成效果
我們使用同一的提示詞:
一位年輕貌美的女士,穿著休閑,坐在一個(gè)復(fù)古風(fēng)格的咖啡館木凳上,她身前的榆木桌上的有一杯陶瓷杯裝拿鐵,表面麥穗拉花,熱氣升騰,她微微偏頭望向玻璃窗外,窗外的夕陽(yáng)正在下落,陽(yáng)光透過(guò)窗戶(hù)照在她的臉上,可以清晰的看到她臉上纖細(xì)的毫毛。
百度打開(kāi)百度,點(diǎn)擊頂部的“AI”,然后在輸入框上面選擇“AI生圖”,在輸入框輸入提示詞就可以,等待幾秒
下面是效果圖
可靈AI打開(kāi)可靈AI的官網(wǎng)https://app.klingai.com/cn,進(jìn)入之后看左側(cè),找到圖片生成,然后進(jìn)入選擇左上角頂部的“文生圖”,把提示詞復(fù)制進(jìn)去
豆包打開(kāi)豆包官網(wǎng),新建一個(gè)對(duì)話(huà),然后選擇對(duì)話(huà)框下的“圖片生成”
生成效果圖,生成的效果圖還可以進(jìn)一步的進(jìn)行編輯
即夢(mèng)AI打開(kāi)即夢(mèng)AI官網(wǎng),在頂部選擇文成圖,將提示詞復(fù)制進(jìn)去,點(diǎn)擊生成
生成效果圖
騰訊元寶進(jìn)入騰訊元寶的官網(wǎng),點(diǎn)擊騰訊元寶,在右側(cè)的輸入框中輸入提示詞,效果如途中所示,這個(gè)確實(shí)不太好,環(huán)境是真實(shí)的,但是任務(wù)是卡通的
通義萬(wàn)相
進(jìn)入通義萬(wàn)相官網(wǎng)https://tongyi.aliyun.com/
在左側(cè)找到生成的圖標(biāo),然后再輸入框下左側(cè)要切換為圖像,之后輸入提示詞,效果如下。
這里面第二章圖片的咖啡杯與提示詞不一致,另外好幾張圖片的凳子不是木凳子,也有問(wèn)題,另外這個(gè)也是要收費(fèi)的,注冊(cè)的時(shí)候會(huì)送一些積分。
總的來(lái)說(shuō),幾個(gè)模型生成的圖片大部分能用,但有些模型對(duì)提示詞的生成效果不一樣。免費(fèi)的百度和豆包相對(duì)都還不錯(cuò)。
本文由人人都是產(chǎn)品經(jīng)理作者【markzou】,微信公眾號(hào):【markzou的筆記】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Sora生成視頻截圖
- 目前還沒(méi)評(píng)論,等你發(fā)揮!