兩個(gè)土耳其小伙,三年時(shí)間,打造估值15億美金的AI獨(dú)角獸
在 AI 生成內(nèi)容浪潮中,一家專注于圖像、視頻和音頻領(lǐng)域的公司異軍突起。憑借對(duì)技術(shù)痛點(diǎn)的精準(zhǔn)把握、極致的專注和快速執(zhí)行,它在激烈的 AI 基礎(chǔ)設(shè)施賽道中開辟出獨(dú)特路徑,展現(xiàn)出強(qiáng)大的增長(zhǎng)潛力。
你有沒(méi)有想過(guò),為什么大部分人在談?wù)揂I的時(shí)候還在糾結(jié)ChatGPT能寫多少字、回答多少問(wèn)題,而有些人已經(jīng)在用AI創(chuàng)造出讓你分不清真假的視頻內(nèi)容?當(dāng)全世界還在為文本生成AI爭(zhēng)論不休時(shí),一家名為fal的公司卻在悄然重塑整個(gè)內(nèi)容創(chuàng)作的基礎(chǔ)設(shè)施。他們剛剛完成了1.25億美元的C輪融資,估值達(dá)到15億美元,由Meritech領(lǐng)投,Salesforce Ventures、Shopify Ventures和Google AI Futures Fund等重量級(jí)投資者參與。
這不是又一個(gè)AI聊天機(jī)器人的故事,而是關(guān)于兩個(gè)土耳其移民如何洞察到一個(gè)被大多數(shù)人忽視的巨大機(jī)會(huì):當(dāng)所有人都在追逐大語(yǔ)言模型時(shí),他們卻堅(jiān)信真正的AI革命將發(fā)生在圖像、視頻和音頻領(lǐng)域?,F(xiàn)在,Instagram和TikTok上有一半的視頻內(nèi)容都是AI生成的,而fal正是這場(chǎng)變革背后的基礎(chǔ)設(shè)施提供者。從2021年的一個(gè)小想法,到現(xiàn)在服務(wù)超過(guò)100萬(wàn)開發(fā)者和100多家企業(yè)客戶,包括Canva、Shopify、Perplexity等知名公司,fal的增長(zhǎng)軌跡幾乎令人難以置信:在過(guò)去12個(gè)月里,他們的收入增長(zhǎng)了60倍,現(xiàn)在的年化運(yùn)營(yíng)收入達(dá)到9000萬(wàn)美元。
我深入研究了fal的成長(zhǎng)故事后發(fā)現(xiàn),這并不是一個(gè)典型的硅谷創(chuàng)業(yè)神話,而是一個(gè)關(guān)于技術(shù)洞察力、極致專注和移民創(chuàng)業(yè)者獨(dú)特視角的深刻案例。兩位創(chuàng)始人Burkay Gur和Gorkem Yurtseven的經(jīng)歷,以及他們?nèi)绾卧贏I基礎(chǔ)設(shè)施這個(gè)競(jìng)爭(zhēng)激烈的賽道中找到自己的差異化定位,給我?guī)?lái)了很多思考。
01 從”慢到令人抓狂”的技術(shù)痛點(diǎn)開始
很多偉大的公司都是從解決創(chuàng)始人自己遇到的問(wèn)題開始的,fal也不例外。2021年,當(dāng)Burkay和Gorkem剛開始創(chuàng)業(yè)時(shí),他們?cè)镜南敕ㄊ菫镻ython計(jì)算建立基礎(chǔ)設(shè)施平臺(tái)。那時(shí)候他們預(yù)見到推理計(jì)算將成為下一個(gè)大趨勢(shì),但并不知道具體的機(jī)會(huì)在哪里。直到2022年底,DALL-E、Midjourney和Stable Diffusion等圖像生成模型的出現(xiàn)徹底改變了他們的方向。
作為一個(gè)擁有深厚技術(shù)背景的團(tuán)隊(duì),他們對(duì)這些AI圖像生成模型的能力感到震撼,覺(jué)得簡(jiǎn)直就像魔法一樣。但同時(shí),他們也發(fā)現(xiàn)了這些模型的一個(gè)致命缺陷:速度實(shí)在太慢了。Burkay在采訪中回憶道:”我記得Stable Diffusion 1.5生成一張圖片需要19秒,甚至更長(zhǎng)時(shí)間。”對(duì)于習(xí)慣了高效工作的技術(shù)團(tuán)隊(duì)來(lái)說(shuō),這種延遲簡(jiǎn)直無(wú)法忍受。
這就是fal真正的起點(diǎn)。他們開始夜以繼日地優(yōu)化Stable Diffusion的性能,從編譯器和性能工程的第一性原理出發(fā),深入研究GPU利用率、內(nèi)存管理、工作負(fù)載分片等底層技術(shù)問(wèn)題。Gorkem擁有豐富的編譯器和性能工程背景,甚至是Python語(yǔ)言的核心貢獻(xiàn)者之一。他們的方法是把GPU性能優(yōu)化當(dāng)作傳統(tǒng)的程序性能優(yōu)化來(lái)處理:先分析瓶頸在哪里,然后一個(gè)一個(gè)地解決。
這種對(duì)速度的極致追求,后來(lái)成為了fal最重要的差異化優(yōu)勢(shì)。當(dāng)其他公司還在為幾十秒的生成時(shí)間而苦惱時(shí),fal已經(jīng)能夠?qū)⑼瑯拥娜蝿?wù)壓縮到幾秒鐘內(nèi)完成。正如Burkay所說(shuō):”我認(rèn)為延遲會(huì)扼殺創(chuàng)造力,延遲會(huì)扼殺生產(chǎn)力。”這不僅僅是技術(shù)問(wèn)題,更是用戶體驗(yàn)的根本差異。當(dāng)創(chuàng)作者可以立即看到自己的想法變成現(xiàn)實(shí)時(shí),整個(gè)創(chuàng)作過(guò)程就變得完全不同了。
更重要的是,他們意識(shí)到這種優(yōu)化能力可以構(gòu)建成一個(gè)可插拔的系統(tǒng)。當(dāng)新的模型發(fā)布時(shí),他們可以直接應(yīng)用相同的優(yōu)化技術(shù)棧,快速讓新模型也達(dá)到最佳性能。這種前瞻性的架構(gòu)設(shè)計(jì),為后來(lái)fal能夠快速支持各種新模型奠定了基礎(chǔ)?,F(xiàn)在,他們通常能在新模型發(fā)布的第一天就提供優(yōu)化版本的API服務(wù),這在競(jìng)爭(zhēng)激烈的AI模型市場(chǎng)中是一個(gè)巨大的優(yōu)勢(shì)。
02 移民創(chuàng)業(yè)者的獨(dú)特視角和挑戰(zhàn)
Burkay和Gorkem的移民背景為他們的創(chuàng)業(yè)故事增添了特殊的維度。兩人都來(lái)自土耳其,Burkay在2007年來(lái)到美國(guó)讀大學(xué),那時(shí)候Facebook剛剛推出。他在采訪中坦承,作為移民面臨的最大挑戰(zhàn)不是學(xué)術(shù)上的適應(yīng),而是對(duì)美國(guó)就業(yè)市場(chǎng)和職業(yè)發(fā)展路徑的理解。
“在學(xué)業(yè)方面,我覺(jué)得比想象中容易一些,因?yàn)橥炼涞母咧薪逃w系在數(shù)學(xué)和科學(xué)方面相當(dāng)不錯(cuò)。但最大的挑戰(zhàn)是理解就業(yè)市場(chǎng)的運(yùn)作方式,以及人們?nèi)绾我?guī)劃實(shí)習(xí)和職業(yè)發(fā)展。”Burkay回憶道。在美國(guó),學(xué)生從一入學(xué)就開始為暑期實(shí)習(xí)做準(zhǔn)備,并對(duì)整個(gè)職業(yè)道路有詳細(xì)規(guī)劃,而他對(duì)此完全不了解。這種信息不對(duì)稱導(dǎo)致他在前幾年的實(shí)習(xí)安排上走了不少?gòu)澛贰?/p>
更具挑戰(zhàn)性的是移民身份對(duì)職業(yè)選擇的限制。Burkay曾在Oracle工作,并開始了綠卡申請(qǐng)流程。這是美國(guó)移民面臨的典型困境:一旦開始綠卡流程,就可能被”鎖定”在某個(gè)工作崗位上,失去了職業(yè)靈活性。這種約束讓很多有創(chuàng)業(yè)夢(mèng)想的移民不得不推遲自己的計(jì)劃。
轉(zhuǎn)折點(diǎn)出現(xiàn)在2015年左右。深度學(xué)習(xí)開始興起,Burkay對(duì)這個(gè)領(lǐng)域產(chǎn)生了濃厚興趣。當(dāng)時(shí)Coinbase還是一個(gè)只有40-50人的小公司,他的朋友邀請(qǐng)他加入新組建的機(jī)器學(xué)習(xí)團(tuán)隊(duì)。雖然這個(gè)機(jī)會(huì)讓他非常興奮,但更重要的是,他開始認(rèn)真考慮創(chuàng)業(yè)的可能性。
對(duì)于Gorkem來(lái)說(shuō),加入fal的決定更加戲劇性。當(dāng)時(shí)他在波蘭上大學(xué),但在第三周就選擇了退學(xué),準(zhǔn)備回土耳其繼續(xù)從事開發(fā)者工具方面的工作。正是在這個(gè)時(shí)候,Burkay通過(guò)Twitter聯(lián)系了他。Gorkem回憶說(shuō):”看到Burkay,看到你們團(tuán)隊(duì),看到產(chǎn)品周圍的興奮感,我覺(jué)得產(chǎn)品的牽引力剛開始顯現(xiàn),看到我能為團(tuán)隊(duì)帶來(lái)的價(jià)值,我確信這些是我見過(guò)的最好的人,從氛圍來(lái)說(shuō),我想和他們一起工作十年。”
這種移民創(chuàng)業(yè)者的經(jīng)歷給了他們一些獨(dú)特的優(yōu)勢(shì)。首先是對(duì)全球市場(chǎng)的天然敏感性,他們不會(huì)局限于單一地區(qū)的思維模式。其次是對(duì)技術(shù)基礎(chǔ)設(shè)施的深度理解,這來(lái)自于他們必須在資源有限的情況下解決復(fù)雜問(wèn)題的經(jīng)驗(yàn)。最后是對(duì)長(zhǎng)期承諾的重視,因?yàn)樗麄冎涝诋悋?guó)他鄉(xiāng)建立事業(yè)需要更多的堅(jiān)持和專注。
03 在AI基礎(chǔ)設(shè)施戰(zhàn)場(chǎng)中找到細(xì)分機(jī)會(huì)
2023年是AI基礎(chǔ)設(shè)施競(jìng)爭(zhēng)最激烈的一年。ChatGPT的成功引發(fā)了大語(yǔ)言模型的淘金熱,幾乎所有的AI基礎(chǔ)設(shè)施公司都在爭(zhēng)奪LLM推理市場(chǎng)的份額。面對(duì)這種情況,fal面臨一個(gè)關(guān)鍵決策:是追隨大流進(jìn)入LLM市場(chǎng),還是堅(jiān)持專注于圖像和視頻模型?
Burkay清楚地記得那個(gè)決定性的時(shí)刻。當(dāng)時(shí)fal的收入有幾個(gè)月保持平穩(wěn),團(tuán)隊(duì)內(nèi)部出現(xiàn)了分歧。一個(gè)誘人的選擇是同時(shí)支持LLM模型推理,這樣可以立即獲得更大的市場(chǎng)機(jī)會(huì)。但經(jīng)過(guò)深思熟慮,他們決定繼續(xù)專注于圖像和視頻領(lǐng)域。”專注于圖像和視頻將成為一個(gè)重要的差異化因素。我們已經(jīng)在這類模型方面有了技術(shù)優(yōu)勢(shì),因?yàn)槲覀円恢痹谘芯窟@類模型。”
這個(gè)決策的智慧在于,他們認(rèn)識(shí)到專注可以帶來(lái)更深層的競(jìng)爭(zhēng)優(yōu)勢(shì)。如果他們選擇成為一個(gè)通用的AI推理平臺(tái),就必須在各個(gè)方面都做到最好,這對(duì)于一個(gè)資源有限的初創(chuàng)公司來(lái)說(shuō)幾乎是不可能的。相反,通過(guò)專注于生成媒體這個(gè)垂直領(lǐng)域,他們可以建立真正的專業(yè)知識(shí)和技術(shù)護(hù)城河。
更重要的是,他們對(duì)這個(gè)市場(chǎng)的發(fā)展有著獨(dú)特的洞察。正如Burkay所說(shuō):”兩年半前,人們看到大語(yǔ)言模型和ChatGPT,他們基本上描繪了這項(xiàng)技術(shù)的發(fā)展方向,并立即說(shuō)我們正在走向AGI。我們對(duì)圖像模型有類似的感覺(jué)。”他們相信隨著模型性能的提升,圖像和視頻生成的質(zhì)量、分辨率和可控性都會(huì)大幅改善,最終這個(gè)市場(chǎng)會(huì)變得和LLM市場(chǎng)一樣大。
這種專注策略的另一個(gè)好處是能夠與客戶建立更深層的關(guān)系。在早期,fal的所有客戶都在做非常相似的事情,這讓他們能夠深入理解用戶的具體需求和痛點(diǎn)。他們可以針對(duì)特定的使用場(chǎng)景進(jìn)行優(yōu)化,比如產(chǎn)品攝影、虛擬試穿、logo生成等,而不是試圖解決所有可能的AI應(yīng)用問(wèn)題。
市場(chǎng)最終證明了他們判斷的正確性。2024年2月,OpenAI發(fā)布了Sora視頻生成模型的預(yù)告,震撼了整個(gè)科技界。fal團(tuán)隊(duì)感到他們的預(yù)測(cè)得到了驗(yàn)證。Burkay說(shuō):”我們感到非常興奮,有人證明了我們是對(duì)的,我們更加倍加注我們的信息傳遞。”從那時(shí)起,視頻生成模型如雨后春筍般涌現(xiàn),包括Luma、Runway、Kling、Minimax等,競(jìng)爭(zhēng)變得異常激烈。但正是因?yàn)閒al早期的專注和技術(shù)積累,他們能夠快速適應(yīng)這波新的模型浪潮。
04 技術(shù)護(hù)城河:不僅僅是速度優(yōu)化
很多人認(rèn)為fal的核心競(jìng)爭(zhēng)力只是讓AI模型跑得更快,但實(shí)際情況遠(yuǎn)比這復(fù)雜。他們構(gòu)建的是一個(gè)完整的技術(shù)體系,涵蓋了從基礎(chǔ)設(shè)施到應(yīng)用層的各個(gè)環(huán)節(jié)。
首先是他們的多云分布式架構(gòu)。從創(chuàng)業(yè)初期只有8個(gè)GPU的時(shí)候,他們就意識(shí)到作為一個(gè)種子期初創(chuàng)公司,不可能從大型云服務(wù)提供商那里獲得足夠的GPU資源分配。于是他們決定構(gòu)建一個(gè)多云系統(tǒng),自己管理編排層。他們嘗試過(guò)Kubernetes等現(xiàn)有解決方案,但發(fā)現(xiàn)這些工具對(duì)于冷啟動(dòng)來(lái)說(shuō)太慢了。
“當(dāng)我們嘗試進(jìn)行多云Kubernetes部署時(shí),我們看到啟動(dòng)單個(gè)容器需要5秒的延遲。5秒對(duì)于Web工作負(fù)載可能是可以接受的,但對(duì)于我們的情況來(lái)說(shuō)不行,5秒的GPU時(shí)間非常寶貴。”Gorkem解釋道。于是他們開始構(gòu)建自己的編排系統(tǒng)來(lái)實(shí)現(xiàn)多云部署。
更關(guān)鍵的是他們的分布式文件系統(tǒng)。當(dāng)你需要在多個(gè)云環(huán)境中運(yùn)行時(shí),數(shù)據(jù)訪問(wèn)就成為一個(gè)巨大的挑戰(zhàn)。為了提供和單云環(huán)境相同的開發(fā)體驗(yàn),他們構(gòu)建了自己的分布式文件系統(tǒng)和多層緩存策略。這個(gè)系統(tǒng)可以在數(shù)據(jù)中心層面、節(jié)點(diǎn)層面,甚至節(jié)點(diǎn)內(nèi)存層面進(jìn)行緩存,因?yàn)楝F(xiàn)在的GPU節(jié)點(diǎn)通常配備2TB的RAM。
這種分布式緩存系統(tǒng)帶來(lái)的性能提升是巨大的。如果在同一個(gè)數(shù)據(jù)中心加載相同的模型權(quán)重,系統(tǒng)可以從通過(guò)100Gbps連接的對(duì)等節(jié)點(diǎn)讀取數(shù)據(jù);如果在同一個(gè)節(jié)點(diǎn)上使用,則可以從NVMe存儲(chǔ)直接讀取。相比于每次都從Google Cloud Storage或S3獲取模型權(quán)重,這種方法節(jié)省了大量時(shí)間。
在AI模型層面,fal的應(yīng)用機(jī)器學(xué)習(xí)工程團(tuán)隊(duì)是他們的另一個(gè)秘密武器。這個(gè)團(tuán)隊(duì)有10-11個(gè)人,占整個(gè)工程團(tuán)隊(duì)的一半以上。他們的工作不僅僅是把模型部署到生產(chǎn)環(huán)境,更是成為客戶的技術(shù)專家,回答各種問(wèn)題,并針對(duì)特定用例進(jìn)行優(yōu)化。
但是,Burkay也很現(xiàn)實(shí)地看待技術(shù)護(hù)城河的可持續(xù)性:”如果我拿一年前的推理引擎和現(xiàn)在的開源方案相比,它已經(jīng)落后了,因?yàn)殚_源正在追趕。我不認(rèn)為推理工程的速度優(yōu)化是一種持久的護(hù)城河。它需要的是持續(xù)專注和保持領(lǐng)先一步。”這種認(rèn)知讓他們一直保持警惕,不斷投入研發(fā),確保始終處于技術(shù)前沿。
這也解釋了為什么他們非常重視開源社區(qū)的發(fā)展。當(dāng)開源方案有好的想法時(shí),他們會(huì)立即采用并在此基礎(chǔ)上構(gòu)建自己的技術(shù)棧。這不是簡(jiǎn)單的抄襲,而是一種持續(xù)學(xué)習(xí)和改進(jìn)的策略,確保自己始終能夠提供最佳的性能和用戶體驗(yàn)。
05 生成媒體工作流的復(fù)雜性超出想象
很多人以為AI圖像生成就是輸入一個(gè)提示詞,然后輸出一張圖片,但實(shí)際的商業(yè)應(yīng)用遠(yuǎn)比這復(fù)雜。fal的團(tuán)隊(duì)很早就發(fā)現(xiàn),真正的客戶需求往往涉及復(fù)雜的多步驟工作流。
“人們使用圖像和視頻模型更多是作為鏈?zhǔn)焦ぷ髁鳎闾幚韴D像、去除背景、提高分辨率、添加一些調(diào)色板,然后將其轉(zhuǎn)換為可能更加精制的圖像甚至視頻。”Gorkem解釋道。這是一個(gè)相當(dāng)復(fù)雜且定制化的工作流,不僅需要推理引擎本身,還需要在此基礎(chǔ)上構(gòu)建工作流系統(tǒng)。
這種工作流的復(fù)雜性主要源于早期AI模型的局限性。與大語(yǔ)言模型可以通過(guò)零樣本或少樣本學(xué)習(xí)泛化到各種任務(wù)不同,早期的圖像模型質(zhì)量無(wú)法支持一次性生成滿足要求的內(nèi)容。編輯、放大、去背景等功能沒(méi)有很好的泛化能力,它們通常只是文本到圖像的模型。
ComfyUI等工具的出現(xiàn)讓這種鏈?zhǔn)焦ぷ髁髯兊每赡堋H藗冮_始發(fā)現(xiàn)可以將多個(gè)模型連接起來(lái),比如先用文本到圖像模型生成基礎(chǔ)圖片,然后用同樣的模型進(jìn)行圖像到圖像的優(yōu)化,改變圖像內(nèi)容或提高分辨率。這些工作流在消費(fèi)者端運(yùn)行良好,但作為API來(lái)規(guī)?;\(yùn)行時(shí)就面臨各種挑戰(zhàn)。
fal團(tuán)隊(duì)意識(shí)到這個(gè)趨勢(shì)的重要性,開始構(gòu)建自己的工作流產(chǎn)品。”我們看到這些多種不同模型被鏈接在一起,或者同一個(gè)模型以不同方式使用,人們期望輸入一個(gè)提示詞然后得到適合他們用例的結(jié)果。”這種能力讓即使是性能較弱的模型也能產(chǎn)生有創(chuàng)意的用例,這對(duì)整個(gè)生態(tài)系統(tǒng)都是有益的。
另一個(gè)重要的觀察是微調(diào)(fine-tuning)在圖像領(lǐng)域的廣泛應(yīng)用。Burkay估計(jì),圖像領(lǐng)域的微調(diào)數(shù)量可能比語(yǔ)言模型領(lǐng)域多1000倍。這是因?yàn)閷?duì)于早期的圖像模型來(lái)說(shuō),微調(diào)是提供上下文信息的唯一方式。雖然現(xiàn)在已經(jīng)有了更好的上下文模型,但人們?nèi)匀粫?huì)針對(duì)特定任務(wù)進(jìn)行微調(diào),比如虛擬試穿或角色一致性,以獲得最高的一致性。
這種復(fù)雜性也成為了fal的競(jìng)爭(zhēng)優(yōu)勢(shì)。他們不僅提供單個(gè)模型的推理服務(wù),還提供完整的工作流解決方案,包括預(yù)配置的工具和端到端的配置??蛻艨梢栽趲滋靸?nèi)就部署一個(gè)完全功能的生成媒體體驗(yàn),而不需要花費(fèi)數(shù)月時(shí)間來(lái)構(gòu)建基礎(chǔ)設(shè)施。
06 從工程師文化到商業(yè)成功的轉(zhuǎn)變
fal的早期團(tuán)隊(duì)幾乎全部由工程師組成,這在AI基礎(chǔ)設(shè)施公司中并不罕見。但讓他們與眾不同的是,這些工程師都對(duì)商業(yè)成功有著強(qiáng)烈的執(zhí)念。Burkay回憶道:”直到我們大約28個(gè)人時(shí),我們都是工程師,第28個(gè)員工才是第一個(gè)非工程師。”
這種工程師主導(dǎo)的文化帶來(lái)了一些獨(dú)特的優(yōu)勢(shì)。首先是對(duì)技術(shù)問(wèn)題的深度理解和解決能力,這讓他們能夠快速響應(yīng)客戶的技術(shù)需求。其次是對(duì)產(chǎn)品質(zhì)量的極致追求,他們不會(huì)滿足于”差不多能用”的解決方案。但最重要的是,他們對(duì)商業(yè)成功有著清晰的認(rèn)知。
“在fal的文化中,我們是結(jié)果導(dǎo)向的,我們真正以收入為導(dǎo)向。這基本上意味著我們必須在市場(chǎng)推廣方面和工程方面一樣出色。”Burkay說(shuō)道。這種認(rèn)知讓他們很早就開始投入銷售和客戶成功工作,而不是等到產(chǎn)品完全成熟后再考慮商業(yè)化
他們對(duì)銷售工作的態(tài)度轉(zhuǎn)變也很有趣。作為技術(shù)背景的創(chuàng)始人,他們最初對(duì)銷售工作有典型的工程師偏見。但是在接受了專業(yè)的銷售指導(dǎo)后,他們很快就看到了效果,并且深深地投入其中。”我們對(duì)此非常著迷,以至于無(wú)法放手,我們做了很長(zhǎng)時(shí)間的創(chuàng)始人主導(dǎo)銷售。”
更重要的是,他們將這種以客戶為中心的理念融入到了整個(gè)公司文化中。他們可能是Slack Connect使用最多的公司之一,與幾乎所有客戶都建立了Slack連接。這些渠道是開放的,工程師直接參與客戶溝通,每個(gè)渠道平均有三四個(gè)來(lái)自應(yīng)用機(jī)器學(xué)習(xí)團(tuán)隊(duì)、產(chǎn)品團(tuán)隊(duì)的不同工程師。
“我們不希望有人向我們銷售東西。我們希望人們?yōu)槲覀兎?wù),幫助我們,與我們一起成長(zhǎng),與我們合作。這就是我們一直在招聘的人員類型。”這種理念讓他們?cè)谡衅镐N售人員時(shí)也會(huì)選擇那些真正愿意傾聽客戶、為客戶服務(wù)而不是單純銷售產(chǎn)品的人。
這種文化的成效是顯著的。他們不僅在技術(shù)上保持領(lǐng)先,在商業(yè)上也取得了巨大成功。從客戶反饋來(lái)看,很多企業(yè)選擇fal不僅僅是因?yàn)榧夹g(shù)優(yōu)勢(shì),更是因?yàn)樗麄兲峁┑恼w服務(wù)體驗(yàn)??蛻糁纅al的團(tuán)隊(duì)會(huì)真正理解他們的需求,并且會(huì)持續(xù)優(yōu)化以滿足這些需求。
07 AI視頻時(shí)代的到來(lái)和市場(chǎng)爆發(fā)
當(dāng)我深入了解fal的發(fā)展軌跡時(shí),最讓我印象深刻的是他們對(duì)市場(chǎng)時(shí)機(jī)的精準(zhǔn)判斷。早在2024年初,他們就預(yù)測(cè)2025年將是”AI視頻年”,現(xiàn)在看來(lái)這個(gè)預(yù)測(cè)正在成為現(xiàn)實(shí)。
“ChatGPT的視頻時(shí)刻,我認(rèn)為我們還沒(méi)有達(dá)到。我認(rèn)為有很多跡象表明我們正在接近它。比如你看過(guò)V3,它已經(jīng)接近ChatGPT時(shí)刻了。這是一個(gè)非常有能力的模型,但我認(rèn)為我們還沒(méi)有到那里。”Burkay在采訪中說(shuō)道。但有趣的是,他同時(shí)也指出:”如果你現(xiàn)在去看你的Instagram、TikTok信息流,三分之一的視頻都是AI生成的,對(duì)吧?它已經(jīng)在某種程度上發(fā)生了,只是以一種稍微慢動(dòng)作的方式進(jìn)行。”
這種觀察反映了AI視頻發(fā)展的一個(gè)重要特點(diǎn):它不是突然爆發(fā)的,而是在逐漸滲透到各個(gè)應(yīng)用場(chǎng)景中。與ChatGPT那種瞬間刷屏的病毒式傳播不同,AI視頻的采用更多是潤(rùn)物細(xì)無(wú)聲的。人們?cè)谏缃幻襟w上看到越來(lái)越多高質(zhì)量的AI生成內(nèi)容,但往往意識(shí)不到這些內(nèi)容的AI屬性。
視頻模型市場(chǎng)的競(jìng)爭(zhēng)格局也驗(yàn)證了fal的判斷。當(dāng)Sora首次發(fā)布時(shí),即使是fal團(tuán)隊(duì)內(nèi)部也有人擔(dān)心OpenAI會(huì)一家獨(dú)大。但隨后Luma、Runway、Kling、Minimax等公司相繼發(fā)布了自己的視頻模型,形成了激烈的競(jìng)爭(zhēng)局面。”每次發(fā)布,如果你不是最好的,通常就不會(huì)發(fā)布。”這種競(jìng)爭(zhēng)加速了整個(gè)行業(yè)的發(fā)展。
更有趣的是,這種競(jìng)爭(zhēng)的節(jié)奏已經(jīng)達(dá)到了周為單位。”你永遠(yuǎn)不能說(shuō)這就是那個(gè)模型,然后在一個(gè)月內(nèi)都不會(huì)有任何競(jìng)爭(zhēng),對(duì)吧?甚至兩周都不行。”這種快速迭代的環(huán)境對(duì)fal這樣的基礎(chǔ)設(shè)施提供商來(lái)說(shuō)既是挑戰(zhàn)也是機(jī)遇。他們需要快速適應(yīng)新模型,但同時(shí)也因?yàn)槟P偷目焖俑露@得了持續(xù)的增長(zhǎng)動(dòng)力。
fal團(tuán)隊(duì)對(duì)這種競(jìng)爭(zhēng)環(huán)境有著獨(dú)特的應(yīng)對(duì)策略。他們與模型開發(fā)公司建立了深度合作關(guān)系,通常能在模型正式發(fā)布前就獲得訪問(wèn)權(quán)限,這讓他們能夠提前進(jìn)行優(yōu)化和測(cè)試。”我們與這些公司合作,所以我們可以在發(fā)布前就開始試用,這樣我們就能建議我們的客戶。”
從商業(yè)角度看,這種快速變化的模型格局對(duì)fal是有利的。不同的模型在不同的任務(wù)上有各自的優(yōu)勢(shì),比如Imagen 3和Imagen 4在角色一致性方面表現(xiàn)出色,而Flux則在生態(tài)系統(tǒng)工具方面有優(yōu)勢(shì)。這種多樣化讓客戶需要一個(gè)能夠提供多種模型選擇的平臺(tái),而不是綁定在某一個(gè)特定模型上。
展望未來(lái),fal看到的不僅僅是更好的模型,而是全新的用例。”我們對(duì)凈新的用例最感興趣,比如娛樂(lè)性的圖像生成,人們只是為了好玩,現(xiàn)在變成視頻,可能變成簡(jiǎn)短的可玩游戲等等。隨著這些模型變得更強(qiáng)大,這些類型的事情將開始發(fā)生。”這種對(duì)未來(lái)應(yīng)用場(chǎng)景的想象,正是驅(qū)動(dòng)他們繼續(xù)投入和創(chuàng)新的動(dòng)力。
08 盈利模式的創(chuàng)新和市場(chǎng)定位
在AI創(chuàng)業(yè)公司普遍面臨盈利挑戰(zhàn)的背景下,fal的商業(yè)模式顯得特別有趣。他們不僅實(shí)現(xiàn)了快速增長(zhǎng),還建立了可持續(xù)的盈利模式。這主要得益于他們對(duì)市場(chǎng)定位的精準(zhǔn)把握和對(duì)客戶需求的深度理解。
Burkay對(duì)AI市場(chǎng)的盈利特點(diǎn)有著清晰的認(rèn)知:”我認(rèn)為AI市場(chǎng)是令人難以置信的市場(chǎng)。生成媒體是那種可以立即貨幣化的東西。在以前的互聯(lián)網(wǎng)業(yè)務(wù)版本中,人們等待數(shù)年才能將業(yè)務(wù)貨幣化。首先建立用戶基礎(chǔ),然后可能嘗試通過(guò)訂閱或廣告來(lái)貨幣化。但是使用AI,人們?cè)敢饬⒓礊榇烁顿M(fèi)。”
這種即付費(fèi)的特性讓fal可以從第一天就驗(yàn)證產(chǎn)品的市場(chǎng)價(jià)值。”你構(gòu)建的MVP應(yīng)該足夠好,讓人們開始付費(fèi)。很容易獲得信號(hào),收入數(shù)字是否在增長(zhǎng)。貨幣化應(yīng)該從第零天就成為優(yōu)先事項(xiàng),實(shí)際上對(duì)于創(chuàng)始人來(lái)說(shuō),通過(guò)他們從第一天開始賺取的收入來(lái)判斷這是一個(gè)好想法還是好產(chǎn)品是更容易的。”
fal的收入增長(zhǎng)軌跡確實(shí)驗(yàn)證了這一點(diǎn)。他們現(xiàn)在的年化運(yùn)營(yíng)收入達(dá)到9000萬(wàn)美元,在過(guò)去兩個(gè)月中增長(zhǎng)了50%以上,在過(guò)去12個(gè)月中增長(zhǎng)了60倍。這種增長(zhǎng)不僅體現(xiàn)在數(shù)量上,更重要的是客戶質(zhì)量的提升。他們現(xiàn)在服務(wù)超過(guò)100萬(wàn)開發(fā)者和100多家企業(yè)客戶,包括Quora、Canva、Perplexity、Shopify等知名公司。
他們的雙邊市場(chǎng)策略也很成功。一方面,他們?yōu)殚_發(fā)者和企業(yè)客戶提供優(yōu)質(zhì)的AI模型推理服務(wù);另一方面,他們?yōu)槟P烷_發(fā)公司提供分發(fā)和優(yōu)化服務(wù)。這種模式的成功部分源于他們?cè)谔幚黹_源模型方面的優(yōu)異表現(xiàn)。當(dāng)一些神秘的新模型(比如早期的Kling)出現(xiàn)時(shí),fal通常是第一個(gè)能夠?yàn)槭袌?chǎng)提供訪問(wèn)服務(wù)的平臺(tái)。
“我們實(shí)際上幫助將這些模型引入市場(chǎng),這并不一定是有意為之的,只是我們從客戶那里看到了巨大的需求。”這種能力讓他們?cè)谀P烷_發(fā)者和使用者之間建立了獨(dú)特的橋梁作用。模型開發(fā)者希望在fal上發(fā)布他們的模型,因?yàn)檫@里有最多的開發(fā)者和企業(yè)用戶;而開發(fā)者選擇fal,因?yàn)檫@里有最新最好的模型。
除了基礎(chǔ)的API服務(wù),fal還為一些模型公司提供基礎(chǔ)設(shè)施優(yōu)化和發(fā)布支持服務(wù)。他們幫助這些公司優(yōu)化工作負(fù)載,為發(fā)布日做準(zhǔn)備,并提供容量規(guī)劃和負(fù)載均衡等服務(wù)。”我們管理著數(shù)萬(wàn)個(gè)GPU,在某些高峰時(shí)期,要做到這一點(diǎn),我們實(shí)際上是在構(gòu)建一個(gè)分布式超級(jí)計(jì)算機(jī),從不同的供應(yīng)商那里獲取計(jì)算資源塊,確保所有工作負(fù)載都能被編排、擴(kuò)展和縮減,并能訪問(wèn)超快的分布式文件系統(tǒng)來(lái)加載模型權(quán)重。”
這種B2B2C的模式為fal帶來(lái)了多重收入來(lái)源,也增強(qiáng)了他們?cè)谡麄€(gè)生態(tài)系統(tǒng)中的地位。當(dāng)新的模型發(fā)布時(shí),fal不僅僅是一個(gè)服務(wù)提供商,更是一個(gè)能夠幫助模型快速獲得市場(chǎng)采用的合作伙伴。這種定位讓他們?cè)诟?jìng)爭(zhēng)激烈的AI基礎(chǔ)設(shè)施市場(chǎng)中建立了獨(dú)特的競(jìng)爭(zhēng)優(yōu)勢(shì)。
09 對(duì)未來(lái)的思考:生成媒體的無(wú)限可能
當(dāng)Burkay被問(wèn)到如果生成視頻沒(méi)有按預(yù)期發(fā)展會(huì)怎樣時(shí),他的回答很有意思:”我認(rèn)為它不可能不起飛。它已經(jīng)在這里了。它遍布我的信息流。我不知道你的Instagram信息流怎么樣,但這些天我無(wú)法分辨哪些是真的,哪些不是。”這種自信來(lái)自于他們對(duì)市場(chǎng)趨勢(shì)的深度觀察和理解。
但更讓我感興趣的是他們對(duì)新興用例的思考。fal團(tuán)隊(duì)由于他們的業(yè)務(wù)性質(zhì),擁有對(duì)整個(gè)生成媒體生態(tài)系統(tǒng)的”上帝視角”,能夠看到各種有趣的應(yīng)用正在涌現(xiàn)。”我們對(duì)這些全新的用例最感興趣,娛樂(lè)性的圖像生成,人們只是為了好玩,現(xiàn)在變成了視頻,可能會(huì)變成簡(jiǎn)短的可玩游戲或其他什么。隨著這些模型變得更強(qiáng)大,這些類型的事情將開始發(fā)生。”
這種對(duì)”全新用例”的強(qiáng)調(diào)很重要。很多人在討論AI應(yīng)用時(shí),往往局限于替代現(xiàn)有的工作流程,比如用AI生成圖片替代傳統(tǒng)的平面設(shè)計(jì),或者用AI視頻替代傳統(tǒng)的視頻制作。但真正的機(jī)會(huì)可能在于那些之前根本不存在的應(yīng)用場(chǎng)景。
舉個(gè)例子,實(shí)時(shí)生成的個(gè)性化廣告。傳統(tǒng)的廣告制作需要大量的前期投入,一旦制作完成就很難修改。但通過(guò)AI生成技術(shù),廣告可以根據(jù)不同的受眾、不同的時(shí)間、不同的上下文實(shí)時(shí)生成和調(diào)整。這不僅僅是效率的提升,而是廣告行業(yè)商業(yè)模式的根本性改變。
Burkay提到了一個(gè)讓他特別興奮的應(yīng)用:”貓咪奧運(yùn)會(huì)”視頻。這種完全虛構(gòu)但極具娛樂(lè)性的內(nèi)容,在傳統(tǒng)制作流程下幾乎是不可能實(shí)現(xiàn)的,但通過(guò)AI生成卻變得輕而易舉。這類內(nèi)容的成功說(shuō)明,AI生成媒體的價(jià)值不僅在于降低制作成本,更在于開啟了全新的創(chuàng)意可能性。
從技術(shù)發(fā)展的角度看,fal團(tuán)隊(duì)認(rèn)為我們?nèi)匀惶幱谏擅襟w的早期階段?,F(xiàn)在的模型在某些方面已經(jīng)非常強(qiáng)大,比如在喜劇時(shí)機(jī)把握方面,V3模型表現(xiàn)出了令人驚訝的能力。但整體而言,這些模型的潛力還遠(yuǎn)未被充分開發(fā)。
隨著模型能力的持續(xù)提升,fal看到的不僅僅是更好的單一模型,而是整個(gè)創(chuàng)作生態(tài)系統(tǒng)的重新構(gòu)建。”我們希望成為所有這些基礎(chǔ)設(shè)施的托管地,所有使用這項(xiàng)技術(shù)構(gòu)建的開發(fā)者,我們希望他們通過(guò)fal來(lái)實(shí)現(xiàn)。”這種愿景體現(xiàn)了他們對(duì)成為整個(gè)生成媒體基礎(chǔ)設(shè)施層的雄心。
從長(zhǎng)遠(yuǎn)來(lái)看,fal的成功不僅僅是一個(gè)技術(shù)公司的成功,更代表了一種新的創(chuàng)業(yè)模式:在技術(shù)變革的早期階段,通過(guò)專注于特定垂直領(lǐng)域,建立深度的技術(shù)優(yōu)勢(shì)和客戶關(guān)系,然后隨著市場(chǎng)的擴(kuò)大而獲得指數(shù)級(jí)的增長(zhǎng)。這種模式對(duì)于其他AI基礎(chǔ)設(shè)施創(chuàng)業(yè)公司有很大的借鑒意義。
10 給創(chuàng)業(yè)者的啟示:專注、速度和客戶導(dǎo)向
fal的成功故事給我?guī)?lái)了很多思考,特別是對(duì)于那些正在或考慮在AI領(lǐng)域創(chuàng)業(yè)的人。他們的經(jīng)驗(yàn)總結(jié)起來(lái)有幾個(gè)關(guān)鍵要素。
首先是找到快速增長(zhǎng)的細(xì)分市場(chǎng)的重要性。正如Burkay所說(shuō):”找到一個(gè)快速增長(zhǎng)的細(xì)分市場(chǎng)是創(chuàng)業(yè)成功的關(guān)鍵。有很多細(xì)分市場(chǎng)始終保持細(xì)分,從不增長(zhǎng)。但我們很幸運(yùn),我們運(yùn)營(yíng)的市場(chǎng)非常細(xì)分且很小,但也增長(zhǎng)得非???。”這個(gè)觀察很重要,因?yàn)楹芏鄤?chuàng)業(yè)者會(huì)選擇已經(jīng)很大的市場(chǎng),但競(jìng)爭(zhēng)激烈;或者選擇看起來(lái)有潛力但實(shí)際上不會(huì)增長(zhǎng)的小市場(chǎng)。
其次是執(zhí)行速度的極端重要性。fal團(tuán)隊(duì)對(duì)速度有著近乎偏執(zhí)的追求,不僅體現(xiàn)在技術(shù)優(yōu)化上,也體現(xiàn)在業(yè)務(wù)決策和產(chǎn)品迭代上。”我們?cè)谒惺虑樯隙己芸?。我們通常?huì)在第一天就發(fā)布模型。這個(gè)領(lǐng)域發(fā)展得如此之快,我們必須在讓人們使用這些模型、讓使用變得簡(jiǎn)單方面走在前面。”在快速變化的AI領(lǐng)域,速度往往比完美更重要。
第三是技術(shù)深度與商業(yè)敏感度的結(jié)合。很多技術(shù)創(chuàng)業(yè)者要么過(guò)度專注于技術(shù)而忽視商業(yè),要么在商業(yè)壓力下犧牲技術(shù)優(yōu)勢(shì)。fal團(tuán)隊(duì)展示了如何在保持技術(shù)領(lǐng)先的同時(shí)建立強(qiáng)大的商業(yè)能力。他們的工程師直接參與客戶溝通,銷售團(tuán)隊(duì)深度理解技術(shù)產(chǎn)品,這種融合創(chuàng)造了獨(dú)特的競(jìng)爭(zhēng)優(yōu)勢(shì)。
第四是對(duì)長(zhǎng)期趨勢(shì)的堅(jiān)定信念。當(dāng)大部分市場(chǎng)都在追逐LLM時(shí),fal堅(jiān)持專注于生成媒體;當(dāng)視頻生成還處于早期階段時(shí),他們就預(yù)測(cè)2025年將是AI視頻年。這種對(duì)長(zhǎng)期趨勢(shì)的判斷和堅(jiān)持,需要的不僅是技術(shù)洞察力,更是承受短期不確定性的勇氣。
從更廣闊的角度看,fal的故事也反映了當(dāng)前AI創(chuàng)業(yè)生態(tài)的一些重要特征?;A(chǔ)設(shè)施層的創(chuàng)業(yè)機(jī)會(huì)巨大,但需要深厚的技術(shù)積累和對(duì)市場(chǎng)趨勢(shì)的準(zhǔn)確判斷。成功的AI基礎(chǔ)設(shè)施公司不僅要有技術(shù)優(yōu)勢(shì),更要能夠與應(yīng)用層的創(chuàng)新者建立深度的合作關(guān)系。
對(duì)于那些考慮在AI領(lǐng)域創(chuàng)業(yè)的人來(lái)說(shuō),fal的經(jīng)驗(yàn)提供了一個(gè)重要的啟示:不要試圖做所有事情,而是要找到一個(gè)有巨大潛力的垂直領(lǐng)域,然后在這個(gè)領(lǐng)域做到極致。這種專注不是局限,而是為了在合適的時(shí)機(jī)獲得最大的影響力。
最終,fal的成功證明了在技術(shù)快速變革的時(shí)代,那些能夠結(jié)合深度技術(shù)能力、敏銳市場(chǎng)洞察和快速執(zhí)行能力的團(tuán)隊(duì),有機(jī)會(huì)在短時(shí)間內(nèi)建立巨大的商業(yè)價(jià)值。他們的故事不僅是一個(gè)創(chuàng)業(yè)成功案例,更是對(duì)整個(gè)AI基礎(chǔ)設(shè)施行業(yè)發(fā)展方向的一個(gè)重要指引。從8個(gè)GPU開始,到現(xiàn)在管理數(shù)萬(wàn)個(gè)GPU為全球客戶服務(wù),fal用三年時(shí)間證明了專注、速度和客戶導(dǎo)向在AI時(shí)代的巨大力量。?
本文由人人都是產(chǎn)品經(jīng)理作者【深思圈】,微信公眾號(hào):【深思圈】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!