Scale AI:AI 產(chǎn)業(yè)鏈的“隱形軍火商”

0 評論 2585 瀏覽 2 收藏 9 分鐘

在AI大模型的聚光燈之外,有一家公司低調(diào)卻關(guān)鍵地?fù)纹鹆苏麄€產(chǎn)業(yè)鏈的“地基”——它就是 Scale AI。從數(shù)據(jù)標(biāo)注到模型評估,從政府合同到硅谷獨角獸,這家“隱形軍火商”如何在AI競賽中扮演幕后操盤手?

今天的主角是:ScaleAI,網(wǎng)址??https://scale.com/

之前跟大家分享了很多AI應(yīng)用和企業(yè)級AIAgent都集中在應(yīng)用層,今天的主角專注于AI基礎(chǔ)設(shè)施層。

先來解釋下標(biāo)題,為什么說ScaleAI是“隱形軍火商”:2025年6月,ScaleAI被Meta以143億美元收購49%股份,公司估值約290億美元。

290億美元是什么概念呢,截至2025年6月20日,百度市值287.5億美元,理想汽車263.6億美元,科大訊飛160億美元,OpenAI最大競對Anthropic(ClaudeAI的開發(fā)者),2025年估值約300億美元。

把ScaleAI比作AI產(chǎn)業(yè)鏈的“隱形軍火商”,不過分。

01 ScaleAI是什么

簡單來說,ScaleAI是提供數(shù)據(jù)標(biāo)注服務(wù)的,數(shù)據(jù)標(biāo)注(DataLabeling)就是給原始數(shù)據(jù)(圖片、文本、語音等)打標(biāo)簽的過程。

就像教孩子看圖識物時指著貓說“這是貓”,數(shù)據(jù)標(biāo)注員就是在數(shù)字世界里做同樣的事,使AI模型能夠理解這些數(shù)據(jù)的含義。比如:

  • 圖像標(biāo)注:框出圖中的貓、標(biāo)記腫瘤CT區(qū)域;
  • 文本標(biāo)注:標(biāo)注句子情感傾向(正面/負(fù)面/中性);
  • 語音標(biāo)注:轉(zhuǎn)寫并標(biāo)記說話人情緒;
  • 視頻標(biāo)注:追蹤車輛運動軌跡;

需要做數(shù)據(jù)標(biāo)注的場景非常多:

  • 自動駕駛:一輛L4級自動駕駛車需標(biāo)注1億+張圖像;
  • 大模型需求:ChatGPT需人類標(biāo)注員排序答案質(zhì)量
  • 醫(yī)療AI:腫瘤影像標(biāo)注市場年增45%;

根據(jù)麥肯錫預(yù)測,2030年AI數(shù)據(jù)基礎(chǔ)設(shè)施市場(含標(biāo)注、清洗、合成等)將達(dá)到420億美元。而ScaleAI所在的基礎(chǔ)標(biāo)注服務(wù)市場,2023年的市場規(guī)模是22億美元,2030年將達(dá)到102億美元。

02 ScaleAI團隊、估值和市場表現(xiàn)

了解完什么是數(shù)據(jù)標(biāo)注后,我們回到ScaleAI。

ScaleAI成立于2016年,創(chuàng)始人兼CEOAlexandrWang17歲從MIT輟學(xué),是前Quora工程師,23歲時入選并成本福布斯“30under30”最年輕入選者。創(chuàng)始人可以說是技術(shù)極客,深諳AI行業(yè)“數(shù)據(jù)饑渴”的痛點,將枯燥的數(shù)據(jù)標(biāo)注變?yōu)榱税賰|生意。

正如他所說:“沒有高質(zhì)量標(biāo)注,AI就是瞎子聾子——只要AI需要訓(xùn)練,數(shù)據(jù)標(biāo)注就永不消失,但形態(tài)將持續(xù)進化?!?/p>

融資歷程:

  • 2019年B輪融資1億美元,估值10億美元;
  • 2021年D輪融資3.25億美元,估值上漲至73億美元;
  • 2024年后連續(xù)融資,估值高達(dá)138億美元;
  • 2025年6月,被Meta以143億美元收購49%股份,估值約290億美元。

核心客戶和市場表現(xiàn):

客戶涵蓋OpenAI、谷歌、特斯拉、美國國防部等頂級機構(gòu),2024年營收8.7億美元,Google單一客戶的貢獻(xiàn)約1.5億美元,2025年預(yù)計突破20億美元(年增超100%)。

數(shù)據(jù)標(biāo)注這樣的“臟活累活”,ScaleAI的毛利高達(dá)80%,凈利高達(dá)40%,分布在全球100+國家的數(shù)據(jù)標(biāo)注師50萬人。

03 ScaleAI的核心能力

資本市場對ScaleAI的估值反映了數(shù)據(jù)在AI競賽中的戰(zhàn)略地位——當(dāng)算力軍備競賽陷入瓶頸,高質(zhì)量數(shù)據(jù)成為巨頭爭奪的下一個高地。

高質(zhì)量標(biāo)注數(shù)據(jù)是訓(xùn)練大模型的核心瓶頸,Scale通過“人力標(biāo)注+AI質(zhì)檢+合成數(shù)據(jù)”三位一體模式,成為AI產(chǎn)業(yè)鏈的“隱形軍火商”。

相較于競品的“純?nèi)斯?biāo)注的人力服務(wù)商”,Scale已成AI數(shù)據(jù)基礎(chǔ)設(shè)施:

  • Human?in?the?loop模式:AI預(yù)標(biāo)注+人類校對,強化數(shù)據(jù)質(zhì)量與效率;
  • 主動學(xué)習(xí):自動識別模型難例(如模糊交通標(biāo)志)→優(yōu)先標(biāo)注,數(shù)據(jù)價值提升300%;
  • Zero-Shot質(zhì)檢:AI模型檢測標(biāo)注錯誤(如漏標(biāo)行人),人工復(fù)核量減少70%;
  • 多模態(tài)兼容:支持復(fù)雜任務(wù)如醫(yī)學(xué)影像、視頻理解、LLM強化標(biāo)注等;
  • 垂直場景拓展:從自動駕駛擴展至更高價值的數(shù)據(jù)科學(xué)與RLHF(人類反饋強化學(xué)習(xí))應(yīng)用。

一個典型場景,自動駕駛極端天氣數(shù)據(jù)標(biāo)注

客戶:特斯拉(2023年訂單)

需求:標(biāo)注10萬張暴雨夜間行車圖像,識別模糊行人/故障車

Scale解決方案

  • 數(shù)據(jù)增強:ScaleGen生成合成數(shù)據(jù)(如暴雨+霓虹光干擾),補足真實數(shù)據(jù)缺口;
  • AI預(yù)標(biāo):預(yù)標(biāo)注行人/車輛→準(zhǔn)確率75%→人工修正重點;
  • 全球眾包調(diào)度:基礎(chǔ)框選(菲律賓$1.8/時)→3D融合(波蘭$4.5/時)→軍事級質(zhì)檢(美國$22/時);
  • 主動學(xué)習(xí)迭代:發(fā)現(xiàn)模型漏檢“撐傘行人”→新增5萬張專項標(biāo)注;
  • 結(jié)果:標(biāo)注成本:$0.18/張(特斯拉自建團隊成本$1.2/張);模型誤檢率下降37%;

最后,查了下Meta為什么會143億豪賭ScaleAI,媒體是這樣報道的:Meta的Llama4模型表現(xiàn)未達(dá)預(yù)期,急需通過Scale的數(shù)據(jù)能力補強模型性能,同時將創(chuàng)始人,28歲的天才CEOAlexandrWang納入麾下,領(lǐng)導(dǎo)Meta“超級智能”部門。

當(dāng)然,隨著Meta的入股,谷歌、OpenAI等巨頭也馬上宣布了和ScaleAI終止合作。

ScaleAI的290億美元估值,已超越百度、理想汽車等科技巨頭,逼近Anthropic(300億)與寒武紀(jì)(330億),盡管只是一家數(shù)據(jù)標(biāo)注公司,但它已從單純的數(shù)據(jù)標(biāo)注公司轉(zhuǎn)型為能夠深度參與數(shù)據(jù)管理與模型訓(xùn)練流程的數(shù)據(jù)基礎(chǔ)設(shè)施企業(yè)。

作者:張艾拉 公眾號:Fun AI Everyday

本文由 @張艾拉 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自 Pixabay,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!