Midjourney:AIGC現(xiàn)象級(jí)應(yīng)用,一年實(shí)現(xiàn)1000萬(wàn)用戶和1億美元營(yíng)收
去年9月23日,美國(guó)紅杉在官網(wǎng)上發(fā)布了一篇報(bào)告《生成式AI:一個(gè)創(chuàng)造性的新世界》,文章插圖全部在Midjourney上生成。同月,在美國(guó)科羅拉多州博覽會(huì)藝術(shù)比賽上,一名沒(méi)有任何繪畫(huà)基礎(chǔ)的參賽者通過(guò)Midjourney生成的《太空歌劇院》斬獲一等獎(jiǎng),這也將人工智能創(chuàng)造內(nèi)容(即AIGC)成為了傳媒領(lǐng)域的新熱點(diǎn)。Midjourney,這款A(yù)IGC現(xiàn)象級(jí)應(yīng)用,你對(duì)它了解多少,歡迎閱讀。
文生圖賽道是 AIGC 概念下商業(yè)模式較成熟的領(lǐng)域,而 Midjourney 是其中最具競(jìng)爭(zhēng)力的選手,是將 AIGC 技術(shù)成功產(chǎn)品化的代表。Midjourney 創(chuàng)始人堅(jiān)持 AI 不是現(xiàn)實(shí)世界的復(fù)刻,而是人類想象力的延伸,塑造了充滿科幻色彩的產(chǎn)品定位。因最早開(kāi)放公眾測(cè)試,能通過(guò)簡(jiǎn)單的 prompt 生成獨(dú)具藝術(shù)感的圖片而收獲大量用戶。Midjourney 用戶數(shù)量飛速增長(zhǎng),并具有很強(qiáng)的盈利能力。其產(chǎn)品搭載在 Discord 上,擁有了超 1000 萬(wàn)社區(qū)成員,是目前用戶最多的服務(wù)器,年?duì)I收約為 1 億美元。
但 AI 技術(shù)發(fā)展日新月異,如近期出現(xiàn)的 ControlNet,將推動(dòng)文生圖進(jìn)一步深入設(shè)計(jì)工作流;而未來(lái)多模態(tài)模型的出現(xiàn)勢(shì)必會(huì)進(jìn)一步顛覆目前的產(chǎn)品形態(tài)。雖通過(guò)差異化產(chǎn)品定位擁有了早期數(shù)據(jù)積累及活躍社區(qū),但作為上層應(yīng)用,Midjourney 并沒(méi)有建立起穩(wěn)固的護(hù)城河,時(shí)刻面臨著挑戰(zhàn)。
雖然無(wú)法確定該行業(yè)的終局,但我們認(rèn)為 Midjourney 憑借著驚艷的圖片生成效果、活躍的 Discord 社群、通過(guò)數(shù)據(jù)飛輪建立的早期壁壘以及逐步的設(shè)計(jì)工作流滲透,在一定時(shí)間內(nèi)能夠保持較強(qiáng)的盈利能力;其團(tuán)隊(duì)的快速迭代能力也使其能夠緊跟技術(shù)的進(jìn)步,保持產(chǎn)品的競(jìng)爭(zhēng)優(yōu)勢(shì)。
01 Thesis
1. Midjourney 圖片生成效果驚艷,藝術(shù)風(fēng)格在市場(chǎng)上具有差異化優(yōu)勢(shì)。
Midjourney 的 prompt 簡(jiǎn)短,具有明顯的科幻性,因圖片精美而具有更強(qiáng)的商業(yè)可行性,鎖定基數(shù)大、付費(fèi)意愿強(qiáng)的創(chuàng)意設(shè)計(jì)用戶群,被大量實(shí)踐證明能顯著提高工作效率。相比之下,DALL-E2 偏寫(xiě)實(shí)風(fēng)格,Stable Diffusion 無(wú)風(fēng)格偏向,但需要更長(zhǎng)的 prompt 和更多的嘗試才能獲得好的圖片效果。
2. Midjourney 巧妙地通過(guò) Discord 社區(qū)搭建產(chǎn)品,具有社區(qū)優(yōu)勢(shì)。
社區(qū)共創(chuàng)是藝術(shù)創(chuàng)作中不可缺少的要素,Discord 的交互形式也是吸引、留存用戶的一大要素。目前 Midjourney 已成為 Discord 用戶最多的服務(wù)器,擁有了超 1000 萬(wàn)名社區(qū)成員。
3. Midjourney 已形成數(shù)據(jù)飛輪,有利于建立競(jìng)爭(zhēng)壁壘。
Midjourney 最早開(kāi)放 Openbeta 版本,通過(guò)龐大用戶量積累了獨(dú)有的數(shù)據(jù)集,形成數(shù)據(jù)飛輪,根據(jù)用戶需求針對(duì)性地訓(xùn)練模型并快速迭代產(chǎn)品,長(zhǎng)期來(lái)看更有利于建立競(jìng)爭(zhēng)壁壘。
4. 目前商業(yè)化仍在早期,潛在市場(chǎng)空間巨大。
- 目前采取 SaaS 訂閱制模式,價(jià)格為 10 – 60 美元/月。雖未公布具體付費(fèi)用戶數(shù)量,但根據(jù)客戶訪談可知用戶付費(fèi)意愿較強(qiáng)。以目前用戶數(shù)量保守估計(jì),年?duì)I收能到達(dá)約 1 億美元。
- 付費(fèi)用戶主要為創(chuàng)意設(shè)計(jì)人群和個(gè)人愛(ài)好者,若對(duì)標(biāo) Canva 的用戶群,以 Midjourney 目前訂閱價(jià)格計(jì)算,未來(lái)收入能達(dá)到約 23 億美元。
- 技術(shù)的不斷迭代會(huì)改變目前的產(chǎn)品形態(tài)。如 ControlNet 的發(fā)布增強(qiáng)了生成圖片的可控性,進(jìn)一步深入設(shè)計(jì)工作流;多模態(tài)模型會(huì)改變目前的單點(diǎn)產(chǎn)品現(xiàn)狀。未來(lái) Midjourney 計(jì)劃開(kāi)發(fā)多功能產(chǎn)品,創(chuàng)造更豐富的應(yīng)用場(chǎng)景,進(jìn)一步擴(kuò)大市場(chǎng)想象空間。
5. Midjourney 團(tuán)隊(duì)技術(shù)和產(chǎn)品并重,具有“創(chuàng)業(yè)基因”。
創(chuàng)始人 David Holz 為連續(xù)創(chuàng)業(yè)者,曾是 Leap Motion 創(chuàng)始人之一,團(tuán)隊(duì)成員及顧問(wèn)擁有 AI 技術(shù)及產(chǎn)品創(chuàng)業(yè)的復(fù)合背景;團(tuán)隊(duì)成員僅 11 人,人效極高。由于技術(shù)發(fā)展迅速,Midjourney 必須緊跟技術(shù)發(fā)展,不斷迭代產(chǎn)品。目前來(lái)看,Midjourney 團(tuán)隊(duì)在產(chǎn)品研發(fā)能力、開(kāi)發(fā)速度方面都有較好的表現(xiàn)。
02 文生圖應(yīng)用的爆發(fā)
2015 年,Google 研究員 Alexander Mordvintsev 創(chuàng)建了首個(gè)用于藝術(shù)創(chuàng)作的機(jī)器學(xué)習(xí)應(yīng)用 DeepDream,這一應(yīng)用被谷歌開(kāi)源,首批藝術(shù)家通過(guò)算法生成藝術(shù)圖像。從那時(shí)起,AI 藝術(shù)生成開(kāi)始走進(jìn)大眾的視野中。
2021 到 2022 年, 文生圖應(yīng)用出現(xiàn)了突破性的進(jìn)展,生成的圖像質(zhì)量得到了迅速提高。2022 年初,用 Disco Diffusion 僅可以生成一些很有氛圍感的草圖;2 個(gè)月后,DALL-E2 相比 DALL-E 分辨率提高了 400%,已經(jīng)可以刻畫(huà)細(xì)節(jié),生成準(zhǔn)確的五官;如今,Stable Diffusion 和 Midjourney 創(chuàng)作的圖像更加精致且具有藝術(shù)感,并且將作畫(huà)速度縮短到 30s 。
從技術(shù)視角來(lái)看,這是一場(chǎng)底層模型的飛躍式進(jìn)步:從 GAN 轉(zhuǎn)變至 Diffusion 模型。2022 年前,文生圖的模型以生成性對(duì)抗網(wǎng)絡(luò)(GANs)為主。但因?yàn)樵趯?shí)踐中存在明顯不足,還不如用 Photoshop 等工具直接創(chuàng)作,無(wú)法用于商業(yè)化。
目前文本生成圖像領(lǐng)域的核心方法是 Diffusion 模型,OpenAI 2020 年發(fā)布的 CLIP 使其更為實(shí)用。工作原理為通過(guò)反復(fù)地向訓(xùn)練數(shù)據(jù)添加噪聲來(lái)破壞原有數(shù)據(jù)結(jié)構(gòu),然后通過(guò)“反向擴(kuò)展”來(lái)恢復(fù)被破壞的數(shù)據(jù)。Diffusion 模型交互簡(jiǎn)單、生成速度快,極大的降低了使用門(mén)檻。
伴隨著 Disco Diffusion、Stable Diffusion、DALL-E2、Midjourney 等通用文生圖軟件開(kāi)放公眾測(cè)試,引發(fā)了指數(shù)級(jí)的社交媒體討論及作品展示,成功實(shí)現(xiàn)了文生圖應(yīng)用向 C 端落地。除了Midjourney 等通用型文生圖軟件,垂直類應(yīng)用也層出不窮。
不同行業(yè)對(duì)生成圖片有著不同的要求,需要使用特定數(shù)據(jù)集訓(xùn)練,這給垂類賽道的創(chuàng)業(yè)企業(yè)提供了機(jī)會(huì)。如專注于 Logo 與網(wǎng)站設(shè)計(jì)的 looka,專注二次元形象生成的 NovelAI,專注游戲資產(chǎn)生成的 Scenario,以及專注頭像生成的 Lensa。這些垂類應(yīng)用目前來(lái)看很難成長(zhǎng)為大體量公司,但盈利能力強(qiáng),如 Lensa 在發(fā)售后的短短幾周就賺了 4000 – 5000 萬(wàn)美元。
03 What is Midjourney?
Midjourney 是自籌資金的獨(dú)立研究室,目前開(kāi)發(fā)了同名文生圖模型及應(yīng)用,產(chǎn)品搭載在 Discord 中,用戶通過(guò)與 Midjourney bot 進(jìn)行對(duì)話式交互,提交 Prompt(文本提示詞)來(lái)快速獲得想要的圖片。
Midjourney bot
Midjourney 采取 SaaS 訂閱制模式。最初使用時(shí),用戶可以免費(fèi)生成 25 張照片。之后按照訂閱制收費(fèi)。月付制為 10、30、60 美元,或者使用年付制,價(jià)格為 8、24、48 美元/月。值得注意的是,用戶只有在訂閱之后,才能擁有使用 midjourney 創(chuàng)作的圖片的版權(quán)。
Midjourney CEO David Holz 曾說(shuō)過(guò):“人們?cè)诩埳侠L畫(huà)只需要幾秒,但在電腦前卻需要幾分鐘到幾小時(shí);這不是因?yàn)殡娔X不夠智能,也不是因?yàn)槿藗儾恢雷约合胍裁?,而是因?yàn)?strong>人類和計(jì)算機(jī)之間存在的某些障礙阻止了我們進(jìn)行最基本的交換。” Midjourney 想要加強(qiáng)人類與計(jì)算機(jī)的連接,將 “探索思想的新載體,擴(kuò)展人類想象力” 作為目標(biāo)。
Midjourney 在 AI 公司 Value Chain 上占據(jù)了多個(gè)位置,擁有數(shù)據(jù)層、模型層、應(yīng)用層整個(gè)技術(shù)棧。它參考 CLIP 及 Diffusion 構(gòu)建了自己的閉源模型,抓取公開(kāi)數(shù)據(jù)進(jìn)行訓(xùn)練,并構(gòu)建了 Discord 中的 Midjourney bot 應(yīng)用。作為應(yīng)用層公司,Midjourney 收集用戶反饋數(shù)據(jù),迭加技術(shù)的進(jìn)步,不斷迭代模型。
AI’s next frontier:building and investing in Large Language Models
2022 年 3 月,Midjourney 啟動(dòng)邀請(qǐng)制 Beta 版本。因?yàn)槲纳鷪D本身具有極強(qiáng)的吸引力,且 Midjourney 創(chuàng)作的圖片質(zhì)量很高,所以很快就吸引了大量用戶。
從圖中可以看出,AI 生成藝術(shù)的興趣浪潮由 6 月初的 DALL-E2 引發(fā)。2022 年 7 月,Midjourney 開(kāi)放 Openbeta 版本;2022 年 8 月,使用 Midjourney 創(chuàng)作的畫(huà)作 Théatre D’opéra Spatial(太空歌劇院)獲得了美術(shù)競(jìng)賽數(shù)字藝術(shù)類別的一等獎(jiǎng),人們對(duì)于 Midjourney 的關(guān)注達(dá)到高峰。雖然文生圖領(lǐng)域應(yīng)用層出不窮,但 Midjourney 保持住了在人們心目中的地位,目前仍是使用最廣泛、最受用戶喜愛(ài)的文生圖應(yīng)用。截止 2023 年 2 月 12 日,Discord 頻道的用戶數(shù)達(dá)到 1081 萬(wàn),早已實(shí)現(xiàn)盈利。
04 Who is the Customer?
Midjourney 用戶群體廣闊,主要包括創(chuàng)意設(shè)計(jì)人群、工業(yè)設(shè)計(jì)人群、Web3 & NFT 從業(yè)者以及個(gè)人愛(ài)好者。
創(chuàng)意設(shè)計(jì)人群
創(chuàng)意設(shè)計(jì)從業(yè)者是一個(gè)很大的群體,滲透各行各業(yè)。小 b 端,包括產(chǎn)品設(shè)計(jì)師(如玩具、墻紙等);圖片設(shè)計(jì)師(網(wǎng)站、廣告、PPT、Logo、插圖等);游戲設(shè)計(jì)師(游戲場(chǎng)景、角色、道具)以及自媒體創(chuàng)作者等等。企業(yè)端,Midjourney 可服務(wù)廣告公司、影視公司、品牌的廣告創(chuàng)意部門(mén)等對(duì)于藝術(shù)效果圖有大量需求的客戶。
Midjourney 生成的圖片可以顯著地提高創(chuàng)意設(shè)計(jì)人群的工作效率。目前 Discord 的用戶中專業(yè)設(shè)計(jì)師占比達(dá) 30% – 40%,包括 Nike、Adidas、New Balance 等公司的設(shè)計(jì)師。根據(jù)客戶訪談,Midjourney 主要被應(yīng)用于設(shè)計(jì)工作早期,幫助設(shè)計(jì)師激發(fā)靈感,快速測(cè)試想法,并迭代圖片。用戶表示,設(shè)計(jì)品牌始終在尋找設(shè)計(jì)新方法和新工具以提高工作效率,對(duì)于 Midjourney 的付費(fèi)意愿非常強(qiáng)。Midjourney 的風(fēng)格包括很多科幻元素,擅長(zhǎng)創(chuàng)造環(huán)境圖,同時(shí)針對(duì)人像做了優(yōu)化,風(fēng)格較為細(xì)膩,非常適合游戲、電影、音樂(lè)和出版等創(chuàng)意行業(yè)。
工業(yè)設(shè)計(jì)行業(yè)
Midjourney 也進(jìn)入了工業(yè)設(shè)計(jì)等精細(xì)化要求較高的領(lǐng)域,如建筑設(shè)計(jì)。目前 Instagram 上有許多建筑師分享文生圖作品,有超過(guò) 72,000 個(gè)帖子被標(biāo)記為 #midjourneyarchitecture。
An image of a house for a pianist,designed by Tim Fu using Midjourney.
Source: Tim Fu
Created by Jon Henning
在工作中,建筑師使用 Midjourney 在項(xiàng)目的最初階段創(chuàng)建情緒版 (mood board)。目前 Midjourney 生成的圖像僅能作為草圖,用來(lái)激發(fā)靈感。建筑師將這些草圖翻譯成圖紙,并建模和進(jìn)行結(jié)構(gòu)分析,開(kāi)發(fā)出 3D 模型后,建筑師會(huì)再將圖像反饋給 Midjourney,進(jìn)一步迭代建筑圖紙。不過(guò)近期發(fā)布的 ControlNet 將會(huì)進(jìn)一步深入設(shè)計(jì)工作流。
*情緒版 (mood board) 是指一系列圖像、文字或樣品的拼貼組合物,用來(lái)展現(xiàn)設(shè)計(jì)師對(duì)一個(gè)項(xiàng)目的想法或感覺(jué)。
NFT 從業(yè)者
NFT 無(wú)疑也是文生圖的一大應(yīng)用場(chǎng)景。Midjourney 目前被廣泛應(yīng)用在 NFT 創(chuàng)作上,因此公司發(fā)布規(guī)定,如果在 “與區(qū)塊鏈相關(guān)的事物” 中使用 Midjourney 生成圖像,需要對(duì)每月超過(guò) 20,000 美元的收入部分支付 20% 的版稅。
NFTs Created by Midjourney
個(gè)人愛(ài)好者
Midjourney 用戶群體中不乏個(gè)人愛(ài)好者,如自媒體群體。文生圖大大降低了藝術(shù)創(chuàng)作門(mén)檻,使得普通用戶也可以成為藝術(shù)家和設(shè)計(jì)師,并通過(guò) AI 創(chuàng)作獲取收入。
05 Why Midjourney?
Midjourney 是一款 AI 軟件,也是一個(gè)垂類 SaaS 產(chǎn)品,引用 Point Nine Capital 的創(chuàng)始合伙人 Christoph Janz 的觀點(diǎn),垂直 SaaS 產(chǎn)品的成功離不開(kāi)以下基本原則:對(duì)所在行業(yè)的客戶有更深入的了解;以最好的方式解決他們的具體問(wèn)題;專門(mén)向目標(biāo)的群體進(jìn)行營(yíng)銷/銷售;隨著時(shí)間的推移增加更多的功能層,增加 ACV( 平均客戶價(jià)值)和粘性。我們?cè)?Midjourney 的產(chǎn)品中看到了以上特點(diǎn),也在其未來(lái)發(fā)展規(guī)劃中看到了對(duì)增加 ACV 和用戶粘性的努力。
驚艷的產(chǎn)品效果
Midjourney 產(chǎn)品定位具體,“了解用戶到底需要什么”,商業(yè)可行性強(qiáng),能在更大程度上提高創(chuàng)意設(shè)計(jì)的效率。正如 Discord 中的用戶評(píng)價(jià):“ Midjourney 超過(guò)其競(jìng)爭(zhēng)對(duì)手是因?yàn)樗傻膱D片都是可以商業(yè)化的。” 具體而言,Midjourney 的 prompt 簡(jiǎn)短,具有科幻色彩。相比之下,DALL-E2 更偏寫(xiě)實(shí)風(fēng)格,Stable Diffusion 無(wú)風(fēng)格偏向,但需要更長(zhǎng)的 prompt 和更多的嘗試來(lái)獲得好的圖片效果。
Book covers
Mobile App UIs, created by midjourney
Prompt 包括圖片內(nèi)容描述、藝術(shù)風(fēng)格描述、藝術(shù)媒介&手段、光線描述、圖片細(xì)節(jié)描述等等,使用不同的 prompt 可以實(shí)現(xiàn)圖片的精細(xì)化調(diào)節(jié)。利用 Midjourney 獲得美術(shù)競(jìng)賽數(shù)字藝術(shù)類別一等獎(jiǎng)的 Théatre D’opéra Spatial (太空歌劇院),創(chuàng)作者 Jason Allen 經(jīng)過(guò)了 80 個(gè)小時(shí)的創(chuàng)作、大約 900 次嘗試才完成了這個(gè)作品。
但這也反映了目前的圖片生成無(wú)法控制,也無(wú)法修改。對(duì)于用戶是一個(gè)黑盒,一方面不知道輸入什么樣的 prompt 會(huì)突然產(chǎn)生好的效果,另一方面即使每次都輸入同樣的詞,每次出來(lái)的東西也不一樣。但產(chǎn)品如果要商用化,每一個(gè)步驟都應(yīng)該是有跡可循的。對(duì)于 Midjourney 獨(dú)特的藝術(shù)風(fēng)格,Holz 表示,Midjourney 在優(yōu)化模型的過(guò)程中是期待制作美好的圖片,激發(fā)人類的想象力,而不是復(fù)刻現(xiàn)實(shí)。Midjourney 不會(huì)成為假照片的制造機(jī)器。
同時(shí),Midjourney 在質(zhì)量和速度之間做了“黃金區(qū)域”的選擇。最初有 20 分鐘生成高畫(huà)質(zhì)圖片和 15 秒能生成低畫(huà)質(zhì)的圖片兩種算法。經(jīng)過(guò)測(cè)試發(fā)現(xiàn),相較于質(zhì)量,人們更關(guān)心速度,但太快也不會(huì)帶來(lái)更多體驗(yàn)上的加成。所以最終選擇了 60 秒的版本,比 10 秒生成的質(zhì)量更高,速度也在人們舒適的范圍內(nèi)。
以 Discord 為載體的社區(qū)交互設(shè)計(jì)
Discord 為 Midjourney 的啟動(dòng)提供了絕佳的社交體驗(yàn)平臺(tái),成功將其帶入了大眾市場(chǎng)。
一方面 Discord bot 降低了用戶使用門(mén)檻;另一方面,圖片創(chuàng)作是一個(gè)在討論中不斷迭代的過(guò)程,欣賞其他用戶的作品有也助于激發(fā)靈感。Holz 在訪談中也提到,不直接做一個(gè) iOS App 的原因是因?yàn)槿藗兿矚g藝術(shù)共創(chuàng)。Midjourney 迅速成為 Discord 上用戶最多的服務(wù)器,擁有了超 1000 萬(wàn)名社區(qū)成員。Midjourney 近期擴(kuò)大了產(chǎn)品的可用范圍,任何人都可以將 Midjourney bot 引入自己的 Discord 服務(wù)器,這將進(jìn)一步擴(kuò)大 Midjourney 的使用容量。
Midjourney Discord 社群界面
Midjourney bot
通過(guò)數(shù)據(jù)飛輪和快速迭代建立護(hù)城河
迭代速度對(duì)于文生圖軟件非常重要。SaaS 訂閱制的產(chǎn)品模式使其盈利能力取決于圖片效果及成本。而底層技術(shù)的飛速進(jìn)步,必須不斷地迭代模型以緊跟行業(yè)發(fā)展。其實(shí)數(shù)據(jù)質(zhì)量及數(shù)據(jù)標(biāo)注質(zhì)量的重要性遠(yuǎn)遠(yuǎn)超過(guò)模型本身。Midjourney 以 PLG 的模式獲得龐大用戶量,形成數(shù)據(jù)飛輪,能夠根據(jù)用戶需求針對(duì)性地訓(xùn)練模型并快速迭代產(chǎn)品,長(zhǎng)期來(lái)看更有利于建立競(jìng)爭(zhēng)壁壘。
Midjourney 自發(fā)布以來(lái)迭代速度非???。2022 年 3 月 V1 發(fā)布時(shí)仍參考了很多的開(kāi)源模型;4 月、7 月和 11 月分別發(fā)布了V2、V3 和 V4,迭代出了自己的模型優(yōu)勢(shì)。V4 補(bǔ)充了生物、地點(diǎn)等信息;增強(qiáng)了對(duì)細(xì)節(jié)的識(shí)別能力及多物體/多人物的場(chǎng)景塑造能力。總之,每次迭代都是產(chǎn)品功能的飛躍。
Four generations of Midjourney AI modelsreleased in 2022
Midjourney 也在擴(kuò)展地理版圖。目前已經(jīng)登錄中國(guó)市場(chǎng),使用微信內(nèi)測(cè)群的方式提供服務(wù)。用戶在內(nèi)測(cè)群中艾特 Bot,并輸入關(guān)鍵詞,就可以生成 AI 圖片。
逐漸深入設(shè)計(jì)工作流
Midjourney 替代了 Google Images、Shutterstock、Getty Images、Pinterest、Unsplash 等傳統(tǒng)圖庫(kù)平臺(tái),用戶不再需要花費(fèi)數(shù)小時(shí)搜索他人的作品激發(fā)靈感,而是直接生成,據(jù)稱可以將一個(gè)月的工作量降低至一星期。ToB 端,Midjourney 目前還主要在設(shè)計(jì)工作流初期。因?yàn)樽远x能力有限,無(wú)法調(diào)整樣式;也無(wú)法與其他平臺(tái)集成,要生成滿意的圖片需要反復(fù)的嘗試;所以只能用于靈感激發(fā)和提高工作效率,對(duì)于工作流的滲透并不深入。
近期發(fā)布的 ControlNet 使得 Diffusion 模型更好地受控生成圖片,提高了圖片生成的速度和精準(zhǔn)度,并可以調(diào)整圖片細(xì)節(jié),將會(huì)進(jìn)一步深入工作流,改變專業(yè)設(shè)計(jì)行業(yè)的生產(chǎn)模式。Midjourney 若要進(jìn)一步深入工作流需盡快集成 ControlNet。
Twitter: @RamAnanth29
ToC 端,會(huì)極大的簡(jiǎn)化工作流,比如代替設(shè)計(jì)師或外包商完成公眾號(hào)等自媒體團(tuán)隊(duì)的圖片設(shè)計(jì)等等。不可忽視的是,Midjourney 在發(fā)展過(guò)程中還面臨著潛在風(fēng)險(xiǎn),如版權(quán)問(wèn)題。David Holz 承認(rèn) Midjourney 使用的公開(kāi)數(shù)據(jù)集包含了數(shù)百萬(wàn)張未經(jīng)作者同意的作品;2023 年 1 月,三位藝術(shù)家對(duì) Stability AI、Midjourney 以及 DeviantArt 提起了侵犯版權(quán)的訴訟。AI 生成作品中還存在著種族歧視及成年內(nèi)容。雖然 Midjourney 進(jìn)行了關(guān)鍵詞限制,但仍無(wú)法完全避免相關(guān)內(nèi)容出現(xiàn)。
Prompt 生態(tài)
社區(qū)用戶對(duì)于 Midjourney 的能力探索熱情極高,目前已經(jīng)出現(xiàn)了 prompt 的學(xué)習(xí)交流網(wǎng)站如 promptoMANIA,社群中也流傳著很多 prompt 數(shù)據(jù)集的公開(kāi) Google 文檔及文章教程。
Style groups in midjourney— Image by Lars Nielsen
由于用不同的 prompt 獲得的圖片效果差異很大,甚至出現(xiàn)了 prompt 交易平臺(tái)。PromptBase 就是一個(gè)包含 Midjourney、DALL-E2、GPT-3 等不同平臺(tái) prompt 的交易平臺(tái),產(chǎn)品定價(jià)為 1.99 – 5.99 美元不等,平臺(tái)抽傭 20%。目前為止,PromptBase 已有 1 萬(wàn)多名用戶,最受歡迎的內(nèi)容為 Logo、網(wǎng)站、服裝等商業(yè)化設(shè)計(jì)場(chǎng)景,能夠賣出幾百到幾千次。
Prompt 交易市場(chǎng)之所以能存在,一方面是因?yàn)槿藗儽磉_(dá)能力的不同;另一方面是模型內(nèi)部邏輯的原因,一些看似不合常理的詞語(yǔ)組合卻能獲得意想不到的效果。OpenAI 創(chuàng)始人 Sam Altman 在采訪中表示,未來(lái)的 AI 系統(tǒng)不會(huì)因?yàn)樵鲅a(bǔ)特定詞就產(chǎn)生截然不同的輸出,而是能更好地理解自然語(yǔ)言。所以未來(lái),該平臺(tái)的價(jià)值會(huì)被表達(dá)能力更強(qiáng)的人捕獲。
06 團(tuán)隊(duì)背景
Midjourney 正式團(tuán)隊(duì)成員十分精簡(jiǎn),共 11 人。除了 CEO 之外,有 8 位研究與工程師,2 位財(cái)務(wù)與法務(wù)。除此之外,還有 4 位編外顧問(wèn),以及 60 位兼職 Discord 運(yùn)營(yíng)。CEO David Holz 高中時(shí)便嘗試創(chuàng)意領(lǐng)域的創(chuàng)業(yè),大學(xué)主修數(shù)學(xué)物理學(xué),在攻讀流體力學(xué)博士的同時(shí)為 NASA 和 Max Planck 工作。之后創(chuàng)立了 Leap Motion,獲得來(lái)自 a16z、Founders Fund、Intel Capital 和 JP Morgan 的超 1.2 億美元投資。Leap Motion 的核心技術(shù)是手部追蹤技術(shù),想要成為 Metaverse 中的“鼠標(biāo)和鍵盤(pán)”,但因?yàn)?VR&AR 一直難以突破瓶頸,所以“鼠標(biāo)和鍵盤(pán)”自然也缺乏應(yīng)用場(chǎng)景。
雖然 Holz 離開(kāi)了 Leap Motion,但從未放棄 Metaverse 的藍(lán)圖,他創(chuàng)立了 Midjourney,或許也期待成為 Metaverse 中的生產(chǎn)力和 “大腦”。Midjourney 團(tuán)隊(duì)的多個(gè)核心成員來(lái)自 Leap Motion,如 CFO Nadia Ali 和高級(jí)研發(fā)工程師 Johnathon Selstad。團(tuán)隊(duì)成員及顧問(wèn)擁有 AI 技術(shù)及產(chǎn)品創(chuàng)業(yè)的復(fù)合背景。這使得 Midjourney 不僅擅長(zhǎng)模型優(yōu)化,也能夠理解用戶,打造優(yōu)秀的產(chǎn)品。
David Holz 認(rèn)為 AI 不應(yīng)該被限制,而是人類應(yīng)該去適應(yīng)。他將 AI 比作水,既危險(xiǎn),又是文明的驅(qū)動(dòng)力。懂得如何與水一起生活和工作的人類,將有能力在水中游泳、做船、筑壩發(fā)電,從而更好的生活。同時(shí),他認(rèn)為文生圖的核心并不是藝術(shù)或深度偽造(deepfakes),而是人類想象力的引擎。正是團(tuán)隊(duì)的思維方式使得 Midjourney 的風(fēng)格充滿了科幻色彩,也使其選擇了 Discord,以最開(kāi)放的方式面向用戶。
在 2022 年 8 月的采訪中,Holz 表示 Midjourney 目前不以財(cái)務(wù)回報(bào)為動(dòng)機(jī),也沒(méi)有成為上市公司的計(jì)劃。只是期待未來(lái)十年能夠做對(duì)個(gè)人和世界有意義的事情,并且從中享受樂(lè)趣。
07 競(jìng)爭(zhēng)格局
競(jìng)爭(zhēng)對(duì)手
Midjourney 主要的競(jìng)爭(zhēng)對(duì)手為以下幾家使用了 Diffusion 模型的文生圖軟件公司:
科技大廠也在文生圖領(lǐng)域積極布局,但速度較慢,目前僅僅發(fā)布了理論模型。Apple 若未來(lái)將 Stable Diffusion 嵌入 Iphone 中,可能會(huì)對(duì)行業(yè)格局產(chǎn)生較大影響。
傳統(tǒng)設(shè)計(jì)軟件也積極進(jìn)入該領(lǐng)域,如 Photoshop 推出 Alpaca 插件,集成 Stable Diffusion,在 Twitter 上引發(fā)轟動(dòng),用戶將它描述為“a game changer”,流暢的同工作流結(jié)合。傳統(tǒng)設(shè)計(jì)軟件占據(jù)了用戶熟悉的使用場(chǎng)景,且作為產(chǎn)品功能的一部分擁有組合價(jià)格優(yōu)勢(shì),對(duì) Midjourney 構(gòu)成挑戰(zhàn)。
Midjourney vs. Stable Diffusion
Midjourney 最有力的競(jìng)爭(zhēng)對(duì)手是 Stability.AI,與 Midjourney 的閉源不同,其模型 Stable Diffusion 因開(kāi)源模式受到了廣泛關(guān)注。Stable Diffusion 于 2022 年 8 月推出, 以開(kāi)源底層代碼的形式在 HuggingFace/Github 公開(kāi)發(fā)布。“將 AIGC 交到數(shù)十億人手中,實(shí)現(xiàn)技術(shù)民主化”,用戶可以在其代碼的基礎(chǔ)上運(yùn)行或修改,制作自己的應(yīng)用程序,向終端用戶提供服務(wù)。作為稀缺的開(kāi)源模型,同時(shí)有著良好的性能,公測(cè)后就受到了廣泛的關(guān)注和好評(píng),積累了大量用戶。截止 2022 年 10 月,Stable Diffusion 已經(jīng)有超過(guò) 20 萬(wàn)開(kāi)發(fā)者下載和獲得授權(quán),各渠道累計(jì)日活用戶超過(guò) 1000 萬(wàn)。團(tuán)隊(duì)開(kāi)發(fā)的付費(fèi)在線平臺(tái) DreamStudio 目前獲得了超過(guò) 150 萬(wàn)用戶,生成超過(guò) 1.7 億圖片。
Stable Diffusion 的開(kāi)源優(yōu)勢(shì)在于能夠吸引大量的開(kāi)發(fā)者,最大程度的把模型用起來(lái)。開(kāi)源社區(qū)會(huì)齊心協(xié)力地完善模型文檔,共同推進(jìn) prompt engineering,解決技術(shù)難題。這使得代碼的迭代速度非???,優(yōu)化效率遠(yuǎn)遠(yuǎn)高于閉源系統(tǒng),使得文生圖行業(yè)快速成長(zhǎng)和普及。同時(shí)社區(qū)成員會(huì)創(chuàng)建新的 UI,通過(guò)擴(kuò)展現(xiàn)有的功能創(chuàng)造新的用例,因此 Stable Diffusion 模型上長(zhǎng)出了繁榮的應(yīng)用。缺點(diǎn)在于商業(yè)化不夠直接,可能為別人“做了嫁衣”。
同時(shí),Midjourney 與 Stable Diffusion 因使用的數(shù)據(jù)集及模型微調(diào)方式不同,在產(chǎn)品層面存在較大差異。
(1)產(chǎn)品定位上,Midjourney 是給創(chuàng)意設(shè)計(jì)群體開(kāi)發(fā)的靈感激發(fā)及效率工具。
而 Stable Diffusion 更為開(kāi)放,在風(fēng)格變化的多樣性上具有優(yōu)勢(shì),但獲得想要的圖片效果需要更長(zhǎng)的 prompt 和更多的嘗試,同時(shí)在特定領(lǐng)域都不如該領(lǐng)域的專業(yè)化產(chǎn)品。
(2)商業(yè)化維度,對(duì)比 Midjourney 的閉源與 Stable Diffusion 的開(kāi)源,Midjourney 商業(yè)化層面更為占優(yōu)。
因?yàn)槟P烷]源,并通過(guò)龐大的用戶量積累了獨(dú)有的數(shù)據(jù)集,可以根據(jù)用戶需求不斷地針對(duì)性訓(xùn)練模型,長(zhǎng)期來(lái)看更有利于建立競(jìng)爭(zhēng)壁壘。在與 Stable Diffusion 的競(jìng)爭(zhēng)中,因?yàn)槠淠P偷拈_(kāi)源,Midjourney 可以隨時(shí)集成其模型優(yōu)勢(shì)。
(3)用戶獲取層面,Midjourney 最早開(kāi)放了 Openbeta 版本,短時(shí)間獲得大量用戶。
但 Stable Diffusion 的商業(yè)化版本 DreamStudio 需要等待 Wait list,而開(kāi)源模型的本地部署有較高的門(mén)檻。Midjourney 獲得大量用戶后,養(yǎng)成了用戶使用習(xí)慣,且在開(kāi)啟付費(fèi)訂閱后就進(jìn)一步加強(qiáng)了用戶粘性。
08 收入估算及未來(lái)發(fā)展
收入估算
雖然團(tuán)隊(duì)一直表示不在意財(cái)務(wù)回報(bào),但 Midjourney 具有極強(qiáng)的盈利能力。2022 年 8 月份,創(chuàng)始人 Holz 就聲稱 Midjourney 已經(jīng)實(shí)現(xiàn)盈利。A16Z 也在《Who Owns the Generative AI Platform?》文章中提到 Midjourney 年收入已超過(guò) 1 億美金。因?yàn)闆](méi)有公開(kāi)收入情況,我們?cè)谶@里對(duì)它進(jìn)行一個(gè)簡(jiǎn)單的估算。假設(shè) Discord server 用戶(約 1081 萬(wàn)) 的 5% 是付費(fèi)會(huì)員,共 54.05 萬(wàn)人。若付費(fèi)用戶的 70% (約 37.84 萬(wàn))訂閱每月 10 美元的基本計(jì)劃,25% (約 13.51 萬(wàn))訂閱每月 30 美元的標(biāo)準(zhǔn)計(jì)劃,5% (約 2.7 萬(wàn)) 是每月支付 60 美元左右的公司用戶。則 Midjourney 目前的收入能達(dá)到每月約 945.9 萬(wàn)美元,年收入 1.14 億美元。
*因?yàn)?Midjourney bot 可以在所有 server 中使用,所以 discord server 用戶數(shù)小于總用戶數(shù)。
目前來(lái)看,Midjourney 的毛利率約為 80%。Midjourney 搭建在 Discord 上,Discord 會(huì)收取約 10% 的手續(xù)費(fèi)。雖不清楚 Midjourney 的模型訓(xùn)練成本,但 Stable Diffusion 的訓(xùn)練共使用了 256 張 Nvidia A100,耗時(shí) 15 萬(wàn)小時(shí),成本為 60 萬(wàn)美元。每次生成圖像的推理在云端的 GPU 上完成,生成一張圖片的成本約 0.5 美分一張,且未來(lái)成本會(huì)不斷壓縮。相對(duì)于訂閱收入,生成圖片的成本可以逐漸忽略不計(jì)。
近期市場(chǎng)空間Midjourney 為付費(fèi)訂閱的商業(yè)模式,廣泛滲透各個(gè)視覺(jué)場(chǎng)景。目前付費(fèi)用戶主要為創(chuàng)意設(shè)計(jì)人群和個(gè)人愛(ài)好者兩大類。To smb 端,Midjourney 以 PLG 的模式成為專業(yè)設(shè)計(jì)從業(yè)者的辦公軟件。ToC 端,Midjourney 成為非專業(yè)設(shè)計(jì)師的工具,以及藝術(shù)愛(ài)好者的“玩具”。
我們根據(jù)客單價(jià)和付費(fèi)用戶量建立了以下坐標(biāo)軸,可以看到,Adobe 作為專業(yè)性極強(qiáng)的設(shè)計(jì)軟件擁有最高的客單價(jià)和最多的付費(fèi)用戶,年訂閱收入遠(yuǎn)超其他公司。Midjourney 因剛剛起步,付費(fèi)用戶量少,但憑借著較高的客單價(jià),有可觀的增長(zhǎng)空間。
對(duì)比傳統(tǒng)設(shè)計(jì)工具,Midjourney 在使用門(mén)檻、客單價(jià)和目標(biāo)客戶群的定位上都與 Canva 更為相近,面向更廣泛的 C 端和 smb 用戶。截止 2022 年底,Canva 用戶達(dá)到 1.1 億人,證明了全世界至少有 1.1 億人有設(shè)計(jì)需求。假設(shè)這 1.1 億設(shè)計(jì)人群中有 5% 會(huì)成為 Midjourney 的付費(fèi)用戶,付費(fèi)用戶的 70% 訂閱每月 10 美元的基本計(jì)劃,25% 訂閱每月 30 美元的標(biāo)準(zhǔn)計(jì)劃,5% 是每月支付 60 美元左右的公司用戶。則 Midjourney 的市場(chǎng)空間能達(dá)到 12*11000*0.05(0.7*10+0.25*30+0.05*60)= 11.6 億美元。
所以 ,Midjourney 能看到 10 億美元左右的年?duì)I收,成長(zhǎng)為百億美金的公司。
未來(lái)產(chǎn)品形態(tài)
Midjourney 未來(lái)可能會(huì)有以下幾種發(fā)展前景:
1. Midjourney 將目前的圖庫(kù)功能做到極致。
目前 Midjourney 替代了 Google Images、Shutterstock、Getty Images、Pinterest、Unsplash 等傳統(tǒng)圖庫(kù)平臺(tái),成為新的“視覺(jué)搜索引擎”。Pinterest 擁有超 4.5 億月活用戶,若其中的 1% 能成為 Midjourney 的付費(fèi)用戶,則能達(dá)到約 10 億美元的營(yíng)收;樂(lè)觀來(lái)看,若 5% 能成為付費(fèi)用戶,則能達(dá)到約 47 億美元的營(yíng)收。
2. Midjourney 不再局限于 Discord ,并且作為插件接入其他設(shè)計(jì)產(chǎn)品,仍扮演圖庫(kù)功能。如上文提到的 Canva、Adobe 等等,這將進(jìn)一步增加其分銷渠道,觸達(dá)更多的付費(fèi)用戶群。
3. Midjourney 自己開(kāi)發(fā)了端到端的產(chǎn)品,和設(shè)計(jì)工作流緊密結(jié)合,進(jìn)一步提高客單價(jià)。
功能方面,Midjourney 通過(guò)不斷集成最新的技術(shù),迭代產(chǎn)品功能,打造產(chǎn)品矩陣。如近期可以通過(guò)接入 ControlNet 深入設(shè)計(jì)工作流,Holz 也稱短期內(nèi)會(huì)在現(xiàn)有產(chǎn)品上增加 Text-to-3D,與 VR&AR 相結(jié)合。形態(tài)方面,搭建 Discord、網(wǎng)站、本地應(yīng)用、插件等多維度產(chǎn)品組合,通過(guò)增加產(chǎn)品形態(tài)來(lái)為更廣闊的客戶群提供服務(wù)。
4. 未來(lái)多模態(tài)模型的發(fā)布改變目前的單點(diǎn)產(chǎn)品現(xiàn)狀,Midjourney 作為功能單一的上層應(yīng)用,被技術(shù)的快速進(jìn)步所顛覆。
Apple 計(jì)劃將 Stable Diffusion 嵌入 Mac 和 Iphone 中,作為用戶熟悉的平臺(tái),且使用 Apple 終端推理成本更低、速度更快,也會(huì)對(duì) Midjourney 構(gòu)成挑戰(zhàn)。Midjourney 可能會(huì)被集成,變成多功能產(chǎn)品的一個(gè)環(huán)節(jié),甚至完全被新產(chǎn)品取代。不過(guò) Apple 終端也并非是完美的解決方案,API 的形式將無(wú)法對(duì)垂直領(lǐng)域的模型進(jìn)行特定化訓(xùn)練;將應(yīng)用放在本地也面臨著用戶數(shù)據(jù)收集及進(jìn)一步迭代模型的困難。
雖目前無(wú)法看清該行業(yè)的終局,但作為 ToC 屬性很強(qiáng)的產(chǎn)品,我們認(rèn)為 Midjourney 憑借著獨(dú)特的圖片風(fēng)格及藝術(shù)效果、活躍的 Discord 社群帶來(lái)的絕佳用戶體驗(yàn),在一定時(shí)間內(nèi)能夠保持用戶粘性和較強(qiáng)的盈利能力;團(tuán)隊(duì)的快速迭代能力也讓我們看好其未來(lái)的發(fā)展前景。
Reference
https://digitalnative.substack.com/p/ai-in-2023-the-application-layer
https://stratechery.com/2023/ai-and-the-big-five/
https://www.forbes.com/sites/robsalkowitz/2022/09/16/midjourney-founder-david-holz-on-the-impact-of-ai-on-art-imagination-and-the-creative-economy/?sh=3028d77e2d2b
https://www.forbes.com/sites/kenrickcai/2022/09/07/stability-ai-funding-round-1-billion-valuation-stable-diffusion-text-to-image/?sh=66afb3b424d6
https://www.bloomberg.com/news/features/2023-01-31/architects-embrace-ai-art-generator-midjourney?srnd=premium-europe
https://learn.g2.com/graphic-design-statistics
https://mp.weixin.qq.com/s/6Fh76q0K0AsyqvFFRrY9Dw
作者:haina;編輯:penny;排版:Lydia;公眾號(hào):海外獨(dú)角獸
原文鏈接:https://mp.weixin.qq.com/s/HiRGY1U-NwKF8jNVL-qQOA
本文由 @海外獨(dú)角獸 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!