AI 大模型應(yīng)用探索——利用虛擬數(shù)字人批量生成視頻進(jìn)行宣傳推廣

0 評論 466 瀏覽 1 收藏 12 分鐘

隨著AI大模型能力不斷釋放,虛擬數(shù)字人正成為企業(yè)內(nèi)容生產(chǎn)的新引擎。本文結(jié)合真實(shí)項(xiàng)目實(shí)踐,系統(tǒng)解析如何借助大模型與虛擬人技術(shù),實(shí)現(xiàn)視頻內(nèi)容的批量生成與精準(zhǔn)傳播,為品牌宣傳打開新路徑。

今天跟大家聊一下百度曦靈數(shù)字人,這個(gè)主要做的就是面向視頻、直播方面的AI工具。

在傳統(tǒng)的視頻制作中,我們制作一個(gè)視頻,要包含的流程大致如下:

前期策劃

確定主題與目標(biāo)——明確視頻目的,選擇吸引人的主題撰寫腳本——規(guī)劃分鏡腳本,包括景別(遠(yuǎn)景/中景/特寫等)、拍攝角度、臺(tái)詞及畫面描述

拍攝準(zhǔn)備

設(shè)備與場地的準(zhǔn)備——選擇設(shè)備(手機(jī)/相機(jī)/專業(yè)攝像機(jī)),搭配三腳架、麥克風(fēng)、補(bǔ)光燈等;選擇光線充足、背景簡潔的場地

團(tuán)隊(duì)與彩排——組建團(tuán)隊(duì)(導(dǎo)演、演員等)并明確分工,提前彩排熟悉流程

實(shí)際拍攝

鏡頭技巧——靈活運(yùn)用景別(遠(yuǎn)景展現(xiàn)環(huán)境,特寫突出細(xì)節(jié))和角度,多角度拍攝為后期提供素材音頻與光線——確保音質(zhì)清晰(外接麥克風(fēng)),自然光優(yōu)先,室內(nèi)需補(bǔ)光,記錄多次鏡頭以便剪輯時(shí)選擇最佳素材

后期制作

剪輯與調(diào)色——使用剪輯軟件(如Pr、剪映)按腳本拼接鏡頭,調(diào)整節(jié)奏和轉(zhuǎn)場效果,調(diào)色平衡畫面,添加字幕和合法配樂提升觀感

審片與優(yōu)化——多次審片并收集反饋,優(yōu)化細(xì)節(jié)直至滿意

發(fā)布與推廣

內(nèi)容發(fā)布——選擇合適平臺(tái)(如抖音、B站)發(fā)布,根據(jù)流量規(guī)律調(diào)整發(fā)布時(shí)間我去年的時(shí)候,負(fù)責(zé)過一次公司產(chǎn)品宣傳的視頻拍攝,從最開始立項(xiàng),然后談攝影師、模特、擬定大綱、寫腳本、準(zhǔn)備拍攝物資、布置現(xiàn)場、現(xiàn)場拍攝、后期照片視頻選擇、后期效果往來溝通,投入的時(shí)間至少半個(gè)月,然后投入的人力也至少有2人,再加上給攝影公司和模特的費(fèi)用也有1萬多。

大家可以評估一下,總體成本至少在2萬以上。當(dāng)然這個(gè)項(xiàng)目拍攝的視頻是關(guān)于養(yǎng)生的,里面涉及到一些動(dòng)作,目前的AI還無法完成,但是這里面也有單純的CEO講話,單純的講解產(chǎn)品知識(shí),這方面是AI完全可以做到的。

那么我們來看看百度曦靈數(shù)字人,看看它能做什么?百度曦靈數(shù)字人官網(wǎng)https://xiling.cloud.baidu.com/?ref=openi.cn

進(jìn)入之后,我們可以直接登錄,并點(diǎn)擊營銷內(nèi)容創(chuàng)作

進(jìn)入軟件之后,我們創(chuàng)建數(shù)字人

數(shù)字人的創(chuàng)建有四種類型,左邊的最復(fù)雜,右邊的最簡單。每一種數(shù)字人適用的場景不一樣,目前來說創(chuàng)作數(shù)字人都是免費(fèi)的。我選擇了一個(gè)照片的方式創(chuàng)作,大家可以看上一張圖片。

我們點(diǎn)擊“創(chuàng)建數(shù)字人”之后,就進(jìn)入以下界面,然后按照右側(cè)給的數(shù)字人照片標(biāo)準(zhǔn),上傳自己的照片,然后點(diǎn)擊左下角“開始克隆”,等待一會(huì),數(shù)字人就可以創(chuàng)建成功,在主頁的“我的資產(chǎn)》我的人像”中就可以查看

我們還可以創(chuàng)建自己的聲音,在我的資產(chǎn)》我的人像》我的聲音,點(diǎn)擊右側(cè)的“克隆聲音”

這上面不能直接錄音,需要我們按照右側(cè)的錄制建議(標(biāo)準(zhǔn))提前錄制好,然后導(dǎo)入進(jìn)去,它就會(huì)解析你的聲音,在之后使用。另一種方式就是不用自己的聲音,然后使用系統(tǒng)提供的聲音,也是可以的。

當(dāng)然我們也可以不創(chuàng)作自己的數(shù)字人,而采用百度直接提供的數(shù)字形象。大家可以點(diǎn)擊左側(cè)的公共人像,在右側(cè)選擇想要采用的人像的性別,年齡,姿勢,場景等。

通過自己上傳自己的視頻&照片,或者采用公共的人像,那么后期的視頻中的人物就選擇好了。

接下來我們就可以利用已經(jīng)創(chuàng)作好的人像來制作視頻了。

大家可以點(diǎn)擊左側(cè)的“AI視頻”這個(gè)按鈕,就可以看到右側(cè)有四種方式

a、視頻翻譯,就是各語言的翻譯,這個(gè)一般人可能用不到,如果是做出海業(yè)務(wù)或者是做語言知識(shí)相關(guān)的業(yè)務(wù)可以用

b、靈感轉(zhuǎn)視頻——輸入簡單的提示詞,可以快速生成分鏡和腳本

c、精編視頻——可以進(jìn)行剪輯,用AI輔助創(chuàng)作

d、AI廣告視頻——輸入商品信息,批量生成廣告視頻(這個(gè)功能還沒開放,我申請了內(nèi)測但還沒有通過,后面通過了再發(fā)一篇文章講一下)

接下來我們就重點(diǎn)講一下靈感轉(zhuǎn)視頻和精編視頻

靈感轉(zhuǎn)視頻

我們選擇靈感轉(zhuǎn)視頻之后,進(jìn)入到下面這個(gè)界面。

我們按照要求,依次

a、視頻內(nèi)容描述——輸入我們想要制作視頻的主題

b、數(shù)字人選擇——在這里我們可以選擇是用自己創(chuàng)作的數(shù)字人還是使用系統(tǒng)提供的數(shù)字人

c、視頻模版選擇——就是選擇是橫版(PC)還是豎版(手機(jī))的模型

d、視頻目的——比如你這個(gè)視頻是做什么的,向用戶介紹你的產(chǎn)品嗎,還是做科普知識(shí)

e、演講者身份——你是做什么的,便于AI定位你的身份,寫出更貼合你身份的內(nèi)容

f、受眾——就是你的客戶畫像,你的客戶是做什么的

以上這些內(nèi)容本質(zhì)上也是提示詞,這里采用了更結(jié)構(gòu)性的方法,防止大家遺漏,寫好這些之后,我們點(diǎn)擊最下方的“生成視頻大綱”

系統(tǒng)就會(huì)自動(dòng)的生成內(nèi)容,并進(jìn)行腳本的分拆。

寫好的這些內(nèi)容,我們是可以進(jìn)一步的進(jìn)行修改的。修改的方式就是將鼠標(biāo)點(diǎn)擊到對應(yīng)的內(nèi)容上,然后就可以修改。如果我們對這個(gè)分鏡內(nèi)容覺得沒有問題,那么我們就點(diǎn)擊最下方的“基于大綱生成視頻分鏡”。

那它將會(huì)根據(jù)大綱和分鏡生成每個(gè)鏡頭更詳細(xì)的內(nèi)容,并標(biāo)注對應(yīng)文字的語言時(shí)長。我們還可以在這個(gè)頁面中去調(diào)整最開始的提示詞內(nèi)容(比如內(nèi)容描述,數(shù)字人選擇等),也可以點(diǎn)擊下方的“調(diào)整大綱”來調(diào)整之前的大綱和分鏡內(nèi)容重新生成最詳細(xì)的分鏡語言。

如果我們覺得沒有問題,那么我們可以點(diǎn)擊右下角的“進(jìn)入編輯器”

進(jìn)入編輯器之后的界面如下

我們可以在這個(gè)界面在更詳細(xì)的去調(diào)整視頻,比如重新選擇形象,對腳本進(jìn)行修改,試聽腳本的語言,重新選擇語音的聲音,更換背景,為視頻增加文字,添加背景音樂,在視頻中添加PPT,PDF等內(nèi)容。

最終內(nèi)容制作完成之后,我們可以點(diǎn)擊右上角的“導(dǎo)出視頻”,選擇好視頻的分辨率等就可以將視頻導(dǎo)出進(jìn)行分發(fā)了。

大家可以看一下我制作的一個(gè)簡易視頻,我為了把各種功能效果都加上,所以視頻中會(huì)看到一個(gè)PPT界面,還有一些背景文字。

大家可以看到,這個(gè)工具的視頻制作,對于個(gè)人IP打造,還有講師錄制課程,公司介紹,產(chǎn)品介紹,知識(shí)內(nèi)容制作等都非常適合。

本文由人人都是產(chǎn)品經(jīng)理作者【markzou】,微信公眾號(hào):【markzou的筆記】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!