AI 4Science 圖譜,如何顛覆10年 x 20億美金成本的藥物研發(fā)模式
文章梳理 AI4Science 圖譜,探討如何顛覆傳統(tǒng)藥物研發(fā)模式。通過 “Tech/Bio × Generalist/Specialist” 四象限框架,分析不同玩家在生物醫(yī)藥研發(fā)中的角色與策略,涵蓋基礎(chǔ)模型的范式變化、自動化科研流程、AI 驅(qū)動的創(chuàng)新療法及環(huán)節(jié)優(yōu)化等方面,展望 AI 驅(qū)動科學(xué)發(fā)現(xiàn)的未來。
上世紀(jì) 50 年代信息論和 DNA 雙螺旋的發(fā)現(xiàn),點(diǎn)亮了生命科學(xué)與數(shù)字互聯(lián)網(wǎng)這兩個最關(guān)鍵的科技樹;今天 AI for Science 開始將這兩股洪流匯聚并指數(shù)級加速。 大模型對生物系統(tǒng)這樣復(fù)雜、非線性的系統(tǒng)有著前所未有的理解和生成能力,有望成為加速科學(xué)發(fā)現(xiàn)的關(guān)鍵引擎。
如果說上一代 AI 只是幫助科學(xué)家“更快地做舊事”,新一代 Foundation Model 則開始“做以前做不到的新事”。從 AlphaFold 3 、ESM3 到 Evo 2 等模型,他們把分子-細(xì)胞-系統(tǒng)的設(shè)計空間瞬間打開,自動化 AI Scientist 則把實(shí)驗(yàn)室變成可編排的軟件流水線。這意味著十年、二十億美元成本的藥物研發(fā)流程,正被重新壓縮與重構(gòu)。
本文以「Tech/Bio × Generalist/Specialist」四象限為框架,梳理了以下幾類玩家:
- Biology Foundation Model:深挖單點(diǎn)大模型極限,AlphaFold 3 級別的里程碑是個開始;
- AI Scientist:將多智能體編排成實(shí)驗(yàn)操作系統(tǒng),讓科研流程變成可復(fù)制的 AI Agent;
- AI-Native Therapeutics:基于全棧 AI 平臺押注復(fù)雜療法,爭奪下一個百億美元藥物;
- AI-empowered solution:通過獨(dú)特數(shù)據(jù)與算法解決行業(yè)痛點(diǎn),帶來立竿見影的效率紅利。
?? 目錄 ??
01 Background
02 研究框架
03 Tech × Specialist:Biology foundation model 的范式變化
04 Tech × Biologist:自動化科研(AI Scientist)重塑研發(fā)流程
05 Bio x Generalist:AI-native Therapeutics AI 驅(qū)動創(chuàng)新療法
06 Bio x Specialist:AI 聚焦環(huán)節(jié)優(yōu)化
07 結(jié)語
01.Background
上世紀(jì) 50 年代同時發(fā)生了兩場革命:香農(nóng)和圖靈的信息論開始數(shù)字化革命,為互聯(lián)網(wǎng)打下基礎(chǔ),為今天 AI 智能的快速提升提供了養(yǎng)料;與此同時,沃森和克里克發(fā)現(xiàn)了雙螺旋結(jié)構(gòu),一個基于 0 和 1 數(shù)字編碼和 DNA 遺傳代碼的信息時代由此誕生。兩個學(xué)科的浪潮各自累積著奔騰的勢能,直到 AI for Science 將他們交匯在一起,加速斜率將成倍放大。
過往的歷史中,從煉金術(shù)士的爐火到現(xiàn)代的高通量實(shí)驗(yàn),人類探索科學(xué)發(fā)現(xiàn)的方式始終離不開反復(fù)試錯 Trial-and-Error。這讓每一次科學(xué)發(fā)現(xiàn)都需要長時間、大金額的試錯成本:今天一款創(chuàng)新藥物從靶點(diǎn)發(fā)現(xiàn)到上市,平均要 10 年、20 億美元 的實(shí)驗(yàn)投入。
計算平臺的迭代正在改變這一切,F(xiàn)oundation Model 正在把高成本、慢速的實(shí)驗(yàn)變?yōu)榭捎嬎泸?yàn)證、迭代速度更快的閉環(huán):在多尺度的分子、細(xì)胞、乃至系統(tǒng)層面,模型能篩選出最有潛力的分子結(jié)構(gòu),再把有限的實(shí)驗(yàn)資源精準(zhǔn)投入到高價值驗(yàn)證。也就是說,F(xiàn)oundation Model + AI Agent disrupt 了人類專家 Trial-and-Error 的帶寬和速度。
在這場范式遷移中,生命科學(xué)無疑是最前沿、也是資本與技術(shù)最密集的“主戰(zhàn)場”。本文將聚焦 AI for Life Science 的最新進(jìn)展:從蛋白質(zhì)結(jié)構(gòu)預(yù)測到全流程 AI Scientist 的研究型 Agent。我們將拆解技術(shù)路線、商業(yè)模式與未來機(jī)遇,探討 AI 如何重塑科學(xué)發(fā)現(xiàn)的成本曲線與創(chuàng)新速度。
02.研究框架
我們理解和研究 AI for Life Science 領(lǐng)域時,構(gòu)建了這樣一個 Mapping 象限:
橫軸:Generalist vs. Specialist
這個維度評估的是 startup 在生物醫(yī)藥研發(fā)流程中的廣度和深度。越靠近左側(cè),產(chǎn)品則就越偏單點(diǎn)聚焦;越靠近右側(cè),產(chǎn)品則越偏全流程的技術(shù)平臺。橫軸上的差異有些類似目前制藥產(chǎn)業(yè)中 CXO 與藥企之間的差異,但 AI 擴(kuò)散可能會讓產(chǎn)業(yè)鏈價值重新分配,因此我們特意避開直接用這個分類。
縱軸:Tech vs. Bio
第二個維度分析企業(yè)交付的產(chǎn)品是側(cè)重于平臺技術(shù)能力(Tech),還是直接解決生物/臨床問題(Bio)。越靠近圖的上方,越接近技術(shù)方案本身的交付,并不要求公司自己完整實(shí)現(xiàn)療法;越往下方,則是需要完整開發(fā)一個藥物/療法。
按照以上的分類框架,我們覺得有以下公司和方向尤其值得關(guān)注,在這里先做簡單的介紹,后面詳細(xì)展開每一個領(lǐng)域的 Thesis:
03.Tech × Specialist:Biology foundation model 的范式變化
AlphaFold 3 的里程碑與 Isomorphic Labs 獨(dú)立融資
AF 3 的成功是 AI for science 的標(biāo)志性事件。它解決了困擾生物學(xué)界長達(dá)50年的蛋白質(zhì)三維結(jié)構(gòu)預(yù)測難題,將過去需要數(shù)月甚至數(shù)年冷凍電鏡實(shí)驗(yàn)才能解析的結(jié)構(gòu),縮短到計算機(jī)上的快速預(yù)測。蛋白質(zhì)結(jié)構(gòu)決定功能,AlphaFold的突破意味著我們能更快地理解生命過程、設(shè)計新藥。
? AlphaFold 3 的進(jìn)化: 由Google DeepMind及分拆出的Isomorphic Labs共同研發(fā),不僅延續(xù)了對蛋白質(zhì)結(jié)構(gòu)的精準(zhǔn)預(yù)測,更將能力擴(kuò)展到預(yù)測蛋白質(zhì)與DNA、RNA、小分子、離子等的復(fù)合物結(jié)構(gòu)與相互作用。技術(shù)上,引入Diffusion Model簡化了流程,減少了對多序列比對(MSA)的依賴,并拓寬了輸入分子類型。其訓(xùn)練數(shù)據(jù)源自公開的PDB數(shù)據(jù)庫,并輔以合成數(shù)據(jù)增強(qiáng)泛化能力。越來越多的生物醫(yī)藥的公司正在把 AF3 融入工作流中。
? Isomorphic Labs 的戰(zhàn)略定位與進(jìn)展: 由DeepMind分拆成立,CEO為諾貝爾獎得主、DeepMind創(chuàng)始人Demis Hassabis,團(tuán)隊(duì)核心成員來自原AlphaFold團(tuán)隊(duì),技術(shù)實(shí)力頂尖。據(jù)報道團(tuán)隊(duì)已超70人,已與禮來(Eli Lilly)和諾華(Novartis)簽署重大合作協(xié)議。與禮來的合作涉及4100萬歐元預(yù)付款,總里程碑付款可達(dá)15.5億歐元,專注于小分子藥物發(fā)現(xiàn);與諾華的合作涉及3400萬歐元預(yù)付款,總額可達(dá)11億歐元。這些合作驗(yàn)證了其技術(shù)的商業(yè)價值,并為其提供了真實(shí)的藥物發(fā)現(xiàn)場景和數(shù)據(jù)反饋。Isomorphic Labs定位為技術(shù)平臺提供方(Tech),專注于結(jié)構(gòu)預(yù)測這一核心環(huán)節(jié)(Specialist)。
AlphaFold之外的模型路線:多模態(tài)與基因組
AlphaFold點(diǎn)燃了生物基礎(chǔ)模型的熱潮,后續(xù)模型沿著不同路徑探索:
?EvolutionaryScale 與 ESM3:通用生物多模態(tài)模型
1. 背景: 由前Meta AI蛋白質(zhì)團(tuán)隊(duì)負(fù)責(zé)人Alex Rives創(chuàng)立,2024年6月推出ESM3模型并宣布獲得Nvidia、Amazon等投資的1.42億美元種子輪融資。
2. 技術(shù)路徑: 旨在打造類似GPT的通用生物基礎(chǔ)模型。ESM3基于雙向Transformer,獨(dú)特之處在于整合了序列、結(jié)構(gòu)、功能三個模態(tài)的輸入和輸出。模型在編碼階段融合多模態(tài)信息,解碼時可根據(jù)任意輸入組合預(yù)測其他模態(tài)(如序列預(yù)測結(jié)構(gòu)、結(jié)構(gòu)預(yù)測功能等)。
3. 模型特點(diǎn): 存在1.4B、7B、98B三種尺寸,展現(xiàn)明顯Scaling Law(參數(shù)越大,性能越好)。通過RLHF(類指令微調(diào))顯著提升了在特定任務(wù)(如tertiary coordination)上的性能。
4. 產(chǎn)品與定位: 目前通過網(wǎng)頁端提供模型服務(wù)(內(nèi)測),目標(biāo)是覆蓋藥物發(fā)現(xiàn)的更廣泛任務(wù)(結(jié)構(gòu)預(yù)測、藥物生成、性質(zhì)預(yù)測等)。盡管在單一結(jié)構(gòu)預(yù)測任務(wù)上目前可能落后于專用模型,但其多任務(wù)、多模態(tài)能力代表了重要的發(fā)展方向。
? Chai Discovery 與 Chai-1:快速跟進(jìn)與專注
1. 背景:在AlphaFold方向上復(fù)現(xiàn)速度極快,獲得Thrive Capital和OpenAI領(lǐng)投的3000萬美元種子輪融資,估值1.5億美元。
2. 技術(shù)路徑:采用與AlphaFold 3類似的Diffusion模型進(jìn)行結(jié)構(gòu)預(yù)測,專注于高精度預(yù)測蛋白質(zhì)與復(fù)合物結(jié)構(gòu)。
3. 定位:定位清晰,即成為結(jié)構(gòu)預(yù)測領(lǐng)域的有力競爭者,提供精準(zhǔn)、快速的平臺技術(shù)服務(wù)(Tech x Specialist)。其快速獲得頂級VC和戰(zhàn)略投資方(OpenAI、Thrive)的支持,顯示了市場對該方向的認(rèn)可。
? ARC Institute 與 Evo2:解碼基因組語言 virtual cell foundation model
1. 技術(shù)特點(diǎn): 是一款基因組語言模型(40B參數(shù)),在超9萬億堿基序列上訓(xùn)練,擁有100萬堿基的超長上下文窗口,能捕捉基因組范圍內(nèi)的長程依賴關(guān)系。
2. 核心能力: 1)預(yù)測變異功能:如在BRCA1基因突變良惡性判斷上準(zhǔn)確率超90%。2)設(shè)計生物序列:可設(shè)計新的基因元件、調(diào)控序列(如組織特異性啟動子),甚至“人工生命代碼”。
3. 戰(zhàn)略意義:Evo2代表了序列層面的基礎(chǔ)模型范式,與AlphaFold等結(jié)構(gòu)層面的模型形成互補(bǔ)。它讓我們能在遺傳藍(lán)圖層面理解和干預(yù)生命,為基因療法、合成生物學(xué)帶來新工具。ARC Institute選擇將其開源,加速了整個領(lǐng)域的進(jìn)展。
生物基礎(chǔ)模型正從單一任務(wù)(結(jié)構(gòu)預(yù)測)走向多模態(tài)、通用化(ESM3)和深入基因組(Evo2)。這些模型共同構(gòu)成了生物研究的計算基石,有望實(shí)現(xiàn)跨尺度(基因-蛋白-功能)的智能分析與設(shè)計。
04.Tech × Biologist:自動化科研(AI Scientist)重塑研發(fā)流程
傳統(tǒng)生物科研面臨周期長、成本高、結(jié)果難復(fù)現(xiàn)(年浪費(fèi)$280億)的困境。生物系統(tǒng)的極端復(fù)雜性使得人工試錯效率低下。AI Scientist 旨在通過自動化研究流程來突破這些瓶頸。
AI Scientist 路線的核心理念是 LLM 的推理、規(guī)劃、工具使用能力在科學(xué)研究領(lǐng)域放大,使其能夠像科研助理甚至科學(xué)家一樣工作,整合文獻(xiàn)檢索、實(shí)驗(yàn)設(shè)計、數(shù)據(jù)分析、機(jī)器人控制等環(huán)節(jié)。
在這一自動化科研架構(gòu)中,各類基礎(chǔ)模型將成為可以核心調(diào)用的 tool use:類似機(jī)器人中的 high-level 規(guī)劃(AI scientist 框架)和 low-level 執(zhí)行、調(diào)用工具(biology foundation model)的分工。
LLM 本身提供了強(qiáng)大的推理和知識整合能力,能從文獻(xiàn)中學(xué)習(xí)科學(xué)知識、設(shè)計實(shí)驗(yàn)方案并優(yōu)化決策流程。像 AlphaFold、Evo2 這樣的專業(yè)基礎(chǔ)模型則可以作為AI科研助手的“工具庫”,在需要時被調(diào)用:例如代理在設(shè)計藥物時調(diào)用AlphaFold預(yù)測配體-蛋白結(jié)合構(gòu)型,在研究基因功能時調(diào)用Evo2預(yù)測突變效應(yīng),等等?;A(chǔ)模型成為自動化科研的基礎(chǔ)設(shè)施,使得 AI agent 可以在無需人類介入的情況下完成許多認(rèn)知和分析任務(wù)。
代表公司
? Future House:
FutureHouse 由 Eric Schmidt 資助、沿用 FRO(Focused Research Organization)機(jī)制:不以商業(yè)化為近期目標(biāo),而是用長期耐心資本和開源方式,打造可自主提出問題、規(guī)劃實(shí)驗(yàn)、迭代假設(shè)的 AI 科學(xué)家體系。
他們提出了其四層框架——工具層(基礎(chǔ)模型、設(shè)備接口)→ AI 助手層(特定任務(wù)模型) → AI 科學(xué)家層(核心自主研究智能體) → 人類監(jiān)督層(提出探索任務(wù)、監(jiān)督)?;谶@樣的框架,他們目前發(fā)布了 4個 Agent:
Crow:“一句話讀懂文獻(xiàn)”
1. 定位:通用型檢索 + 推理代理。
2. 能力:接入 PaperQA 派生管線,可在數(shù)秒內(nèi)完成跨學(xué)科檢索、證據(jù)鏈追溯和摘要,對 問題-答案 基準(zhǔn)測試的準(zhǔn)確率超越博士后平均水平。
Falcon:深度系統(tǒng)綜述引擎
1. 定位:面向?qū)<业摹白詣泳C述”助手。
2. 能力:連接 OpenTargets、PubChem 等十余個專業(yè)數(shù)據(jù)庫,可執(zhí)行基因-疾病-化合物的三向交叉檢索,并生成結(jié)構(gòu)化證據(jù)圖譜。
Owl:“Has Anyone Done X?”
1. 定位:前沿監(jiān)測與重復(fù)研究風(fēng)險控制。
2. 能力:高召回式語義搜索,能追蹤異構(gòu)表述與冷門期刊,判斷給定假設(shè)是否真正無人涉足;幫助團(tuán)隊(duì)避免重復(fù)造輪子、定位潛在合作方。
Phoenix:化學(xué)-實(shí)驗(yàn)規(guī)劃師
1. 定位:ChemCrow 家族的合成設(shè)計體。
2. 能力:調(diào)用 RDKit、SafetyGPT 等工具,自動生成反應(yīng)路線、試劑列表與實(shí)驗(yàn) SOP,并對成本與安全性給出評分。未來將擴(kuò)展到生物試劑自動訂購與機(jī)器人實(shí)驗(yàn)室。
FutureHouse 將 Crow + Falcon + Owl + Phoenix(再加數(shù)據(jù)分析體 Finch)編排為多智能體系統(tǒng) Robin。Robin 在 2.5 個月 內(nèi)完成一次端到端科研循環(huán),發(fā)現(xiàn)了治療 干性年齡相關(guān)性黃斑變性(dAMD) 的全新藥物方案:
1. 假設(shè)生成:Crow 審閱 1.7 萬篇視網(wǎng)膜文獻(xiàn),提出“增強(qiáng) RPE 細(xì)胞吞噬作用”假設(shè);Falcon 列出 10 個 ROCK 抑制劑候選。
2. 首輪實(shí)驗(yàn):Phoenix 設(shè)計體外篩選;Finch 解析數(shù)據(jù),確認(rèn) Y-27632 提升 RPE 吞噬率并上調(diào) ABCA1。
3. 機(jī)理-二次篩選:Robin 再次檢索并鎖定 ripasudil(原為日本獲批青光眼藥),體外驗(yàn)證優(yōu)于首輪化合物;建議快速推進(jìn)眼科適應(yīng)癥重定位。
4. 輸出:Robin 自動撰寫預(yù)印本、生成圖表與方法學(xué);人類僅執(zhí)行濕實(shí)驗(yàn)。
AI Scientist有望將單個科學(xué)家的產(chǎn)出效率提升10-100倍?;A(chǔ)模型成為AI Agent調(diào)用的核心工具。這種模式將科研從勞動密集型轉(zhuǎn)變?yōu)橹R和算力密集型,極大加速創(chuàng)新迭代。
? Lila Sciences :
1. 定位: 構(gòu)建“科學(xué)超級智能平臺”,結(jié)合AI引擎和全自動化實(shí)驗(yàn)室,實(shí)現(xiàn)端到端的科學(xué)發(fā)現(xiàn)自動化。
2. 技術(shù)核心: 1)生成式AI科學(xué)引擎:能自主生成假設(shè)、設(shè)計實(shí)驗(yàn)、優(yōu)化參數(shù),并結(jié)合物理定律推理。2)自動化實(shí)驗(yàn)室基礎(chǔ)設(shè)施:整合機(jī)器人、高通量設(shè)備,支持7×24無人化實(shí)驗(yàn)。
3. 披露成果: 他們的專注方向不止在生物領(lǐng)域,而是在材料、能源領(lǐng)域都有單獨(dú)的管線和團(tuán)隊(duì)。已在發(fā)現(xiàn)新抗體/肽、設(shè)計催化劑(綠色氫氣)、開發(fā)碳捕獲材料等方面取得初步進(jìn)展:
1)基因藥物設(shè)計:產(chǎn)生優(yōu)于市場的最優(yōu)基因藥物結(jié)構(gòu)
2)新型治療分子發(fā)現(xiàn):發(fā)現(xiàn)和驗(yàn)證了數(shù)百種針對廣泛治療靶點(diǎn)的新型抗體、肽和結(jié)合物(耗時幾個月)
3)綠色能源技術(shù)創(chuàng)新:開發(fā)出獨(dú)特的非鉑族金屬作為綠色氫生產(chǎn)的催化劑,成本僅為當(dāng)前商業(yè)催化劑的一小部分
4)碳捕獲材料設(shè)計:為工業(yè)規(guī)模的碳捕獲設(shè)計新材料,具有更好的容量、熱穩(wěn)定性和動力學(xué)結(jié)合
4. 商業(yè)模式: 偏向技術(shù)輸出和合作賦能,計劃與生物技術(shù)公司(包括Flagship系)合作,而非自行開發(fā)管線。定位為Tech x Generalist,提供廣泛的科研自動化能力。
05.Bio x Generalist:AI-native Therapeutics AI 驅(qū)動創(chuàng)新療法
這類公司是 AI-native 制藥公司,它們的目標(biāo)是構(gòu)建一個以AI為核心、貫穿藥物發(fā)現(xiàn)到臨床開發(fā)全流程的整合平臺,并利用這個平臺自主研發(fā)和推進(jìn)創(chuàng)新療法管線。AI不僅僅是工具,而是其研發(fā)范式的基礎(chǔ)和引擎。
這類公司的 upside case 是從零到一整體重構(gòu)藥物研發(fā)。它們先訓(xùn)練跨模態(tài)生物大模型,然后把模型輸出結(jié)果做內(nèi)部的高通量實(shí)驗(yàn)、乃至臨床開發(fā)。有幾個關(guān)鍵特點(diǎn):
- 療法類型更復(fù)雜:多聚焦大分子、RNA、細(xì)胞療法等高級形態(tài),監(jiān)管和制造門檻都比小分子高。
- 產(chǎn)能矩陣式擴(kuò)張:模型能同時孵化若干條管線,一條成功即可覆蓋巨額研發(fā)投入。
- 自己own IP 和商業(yè)管線:通過將候選藥物推向臨床并最終實(shí)現(xiàn)商業(yè)化,或在臨床后期/批準(zhǔn)后尋求高價值的授權(quán)或并購。
- 尤其適合復(fù)雜/新型療法: AI驅(qū)動的全流程方法可能特別適用于那些設(shè)計空間巨大、傳統(tǒng)“試錯法”難以駕馭的領(lǐng)域,例如:
1. 復(fù)雜生物藥設(shè)計: 如設(shè)計具有特定結(jié)合位點(diǎn)、多特異性或條件性激活功能的抗體、蛋白質(zhì)藥物。
2. 細(xì)胞療法: 如AI 優(yōu)化細(xì)胞分化 protocol,我們之前 IC 討論過的 Somite AI
3. 基因療法: 如設(shè)計更高效、更特異的遞送載體(如AAV衣殼),或利用AI(如Evo2)設(shè)計調(diào)控元件以實(shí)現(xiàn)精準(zhǔn)表達(dá)。
? AI整合的廣度與深度:
1. AI被系統(tǒng)性地應(yīng)用于多個甚至所有關(guān)鍵階段:從基于多維數(shù)據(jù)和生物學(xué)知識的靶點(diǎn)識別,到利用生成式AI從頭設(shè)計或優(yōu)化具有理想特性的小分子、抗體、肽類甚至更復(fù)雜的生物制劑,再到通過AI預(yù)測藥物的藥代動力學(xué)/藥效學(xué)(PK/PD)特性、毒副作用(ADMET),乃至輔助設(shè)計臨床試驗(yàn)方案、分析試驗(yàn)數(shù)據(jù)、預(yù)測患者響應(yīng)等。
2. 這類公司通常致力于構(gòu)建一個數(shù)據(jù)飛輪:AI預(yù)測指導(dǎo)實(shí)驗(yàn)設(shè)計,實(shí)驗(yàn)數(shù)據(jù)反饋優(yōu)化AI模型,形成一個不斷學(xué)習(xí)和進(jìn)化的閉環(huán)系統(tǒng)。
盡管一旦突破,第一個成功上市產(chǎn)品就可能帶來億美元級峰值銷售,這個賽 upside很高的同時又很risky:極高的風(fēng)險和不確定性,研發(fā)周期長,所需資本投入巨大。不僅需要頂尖的AI能力,還需要強(qiáng)大的生物學(xué)、化學(xué)、臨床開發(fā)能力,對跨學(xué)科團(tuán)隊(duì)的要求極高。平臺能力的驗(yàn)證需要通過管線進(jìn)展來體現(xiàn),早期難以評估。
代表公司
Xaira Therapeutics
Xaira 成立于 2024 年,背后出資方包括 ARCH Venture Partners 和 Foresite Labs。公開資料顯示,公司一次性募集了約 10 億美元的啟動資金,用來搭建一條把“數(shù)據(jù)生成—分子設(shè)計—早期臨床”串在一起的完整研發(fā)鏈條。團(tuán)隊(duì)核心成員既有前基因泰克高管,也有蛋白質(zhì)設(shè)計領(lǐng)域的學(xué)術(shù)領(lǐng)軍人物 David Baker。
? 重點(diǎn)方向
1. 蛋白質(zhì)生成式模型:在 RoseTTAFold、RFdiffusion 等開源路線基礎(chǔ)上深度改造,用于重設(shè)計抗體、配體和新型蛋白遞送載體。
2. 多模態(tài)數(shù)據(jù)工廠:自主建設(shè)高通量篩選和多組學(xué)測序產(chǎn)線,保證模型迭代的數(shù)據(jù)閉環(huán)。就在這周,他們發(fā)布了目前最大的公開可用的 Perturb-seq 數(shù)據(jù)集,名為 X-Atlas/Orion,為虛擬細(xì)胞研究提供支持,該數(shù)據(jù)集可用于 AI 模型訓(xùn)練,并能檢測劑量依賴性遺傳效應(yīng),從而增強(qiáng)藥物發(fā)現(xiàn)的預(yù)測能力。
3. 端到端推進(jìn)管線:首批項(xiàng)目聚焦自身免疫和腫瘤免疫調(diào)節(jié),將快速推進(jìn)到臨床 I 期,驗(yàn)證“模型-實(shí)驗(yàn)-臨床”一體化是否真能壓縮研發(fā)周期。 整體來看,Xaira 押注的是“大投入縱向整合”模式:自己掌握數(shù)據(jù)、算法、實(shí)驗(yàn)和臨床,減少傳統(tǒng)跨公司協(xié)作中的摩擦成本。
Generate Biomedicines
Generate 由 Flagship Pioneering 在 2018 年孵化。公司把自己的方法稱為“生成生物學(xué)”:利用大規(guī)模蛋白語言模型設(shè)計分子,再通過自動化實(shí)驗(yàn)完成驗(yàn)證和迭代。
? 重點(diǎn)方向
1. 多元蛋白療法:從抗體到酶、細(xì)胞因子,再到更復(fù)雜的多特異蛋白,平臺都嘗試“按需生成”。
2. 合作與自研并行:已與安進(jìn)、諾華簽訂潛在里程碑超過 10 億美元的合作協(xié)議,同時保留十余條內(nèi)部管線(免疫、罕見病、感染?。?。
3. 高通量閉環(huán):內(nèi)部建有冷凍電鏡、質(zhì)譜、表型篩選流水線,用來把模型預(yù)測結(jié)果在短周期內(nèi)轉(zhuǎn)化成實(shí)驗(yàn)數(shù)據(jù),反哺下一輪訓(xùn)練。 公開信息顯示,公司累計融資超過 7 億美元,并聲稱可把從命中到臨床前驗(yàn)證的時間壓縮到兩年以內(nèi)。Generate 想驗(yàn)證的核心假設(shè)是:在藥物早期最燒錢、最耗時的階段,用計算手段替代大量試錯。
Somite AI
Somite 創(chuàng)立于 2024 年底,于 2025 年 5 月宣布完成 4700 萬美元 A 輪融資,投資方包括 Khosla Ventures。公司聚焦“可編程細(xì)胞療法”,目標(biāo)是讓干細(xì)胞定向分化變得可預(yù)測、可規(guī)?;?。
? 重點(diǎn)方向
1. DeltaStem 基座模型:將數(shù)以百萬計的單細(xì)胞轉(zhuǎn)錄組和時間序列表型數(shù)據(jù)作為訓(xùn)練集,預(yù)測細(xì)胞命運(yùn)轉(zhuǎn)變路徑。
2. 微膠囊篩選技術(shù):自研高通量培養(yǎng)系統(tǒng),可同時觀察上萬個微型類器官,極大提高數(shù)據(jù)生成速度。
3. 再生醫(yī)學(xué)應(yīng)用:現(xiàn)階段專注于 β 細(xì)胞(糖尿?。?、軟骨和肌肉修復(fù),屬于市場需求清晰且細(xì)胞療法技術(shù)路線已較成熟的領(lǐng)域。 Somite 的商業(yè)邏輯是:通過更準(zhǔn)確的分化預(yù)測,減少細(xì)胞療法開發(fā)過程中的失敗批次,從而降低 COGS,并把上市時間前移。
Moonwalk Bio
Moonwalk 于 2023 年末起步,種子 + A 輪總?cè)谫Y約 5700 萬美元,創(chuàng)始團(tuán)隊(duì)包括 CRISPR 領(lǐng)域的張鋒和前 Illumina CTO Alex Aravanis。公司專注“精準(zhǔn)表觀遺傳編輯”。
? 重點(diǎn)方向
1. EpiRead:單細(xì)胞水平的表觀基因組測序技術(shù),能高分辨率繪制細(xì)胞在疾病狀態(tài)下的染色質(zhì)開放、甲基化等圖譜。
2. EpiWrite:采用非切割的表觀遺傳編輯工具(如 dCas9-TET、CRISPR-off),在不改變 DNA 序列的情況下調(diào)控基因表達(dá)。
3. AI 靶點(diǎn)優(yōu)選:利用深度學(xué)習(xí)模型從圖譜中挖掘“可逆性”強(qiáng)、與疾病因果關(guān)聯(lián)明確的修飾位點(diǎn),優(yōu)先推進(jìn)動物實(shí)驗(yàn)。 Moonwalk 認(rèn)為,相比基因敲除或基因替換,表觀遺傳層面的微調(diào)風(fēng)險更低,而且適用于多基因復(fù)雜疾病。首批項(xiàng)目鎖定代謝疾病和脂肪肝,若能取得動物模型驗(yàn)證數(shù)據(jù),將為其平臺帶來早期可信度。
這四家公司共同代表了“Bio × Generalist”賽道的不同落地方向,但都試圖用 AI 強(qiáng)化分子或細(xì)胞層面的設(shè)計能力,同時把實(shí)驗(yàn)、數(shù)據(jù)與模型打通,縮短研發(fā)時間并降低失敗率。區(qū)別在于:
? Xaira 與 Generate 側(cè)重蛋白質(zhì)等分子層面,路徑更貼近傳統(tǒng)大分子藥物;
? Somite 把目光投向細(xì)胞療法,核心在于可控分化;
? Moonwalk 則嘗試在表觀遺傳這一相對新的干預(yù)層面建立技術(shù)壁壘。
06.Bio x Specialist:AI 聚焦環(huán)節(jié)優(yōu)化
最后這個象限的公司并非重建全流程,而是用 AI 深度優(yōu)化傳統(tǒng)研發(fā)的單一關(guān)鍵環(huán)節(jié),用 AI 提升效率和成功率。他們的假設(shè)是把 AI 投入到最燒錢、最慢、失敗率最高的節(jié)點(diǎn),會比重新組裝一條全棧研發(fā)線更快見效。因此我們看到有這樣幾個關(guān)鍵環(huán)節(jié),會去用 AI 去大幅提效和進(jìn)行優(yōu)化:
數(shù)據(jù)服務(wù)
這類公司批量生成并開源稀缺實(shí)驗(yàn)數(shù)據(jù),可以成為 AI4sci 領(lǐng)域的 Scale AI。他們的定位為上下游模型與藥企提供“訓(xùn)練燃料”,自身不做管線,而充當(dāng)生態(tài)底座。 核心數(shù)據(jù) + 增值 API 或定制實(shí)驗(yàn)是他們常見的商業(yè)模式。這類數(shù)據(jù)集降低了模型訓(xùn)練門檻,同時推動下游個性化的藥敏等屬性預(yù)測。
代表公司:Tahoe Therapeutics
Tahoe Therapeutics 與 Arc Institute 發(fā)布的單細(xì)胞擾動數(shù)據(jù)集,涵蓋 1 億細(xì)胞 / 6 萬次化學(xué)-生物擾動,規(guī)模為公開同類數(shù)據(jù)的 50×。
Tahoe-100M是全球最大規(guī)模的單細(xì)胞擾動轉(zhuǎn)錄組(scRNA-seq)數(shù)據(jù)集,核心是記錄不同藥物擾動下,50種癌細(xì)胞系中每個細(xì)胞的轉(zhuǎn)錄組響應(yīng)(即基因表達(dá)全景變化),覆蓋21個物種、72種組織類型,并包含6萬種藥物-細(xì)胞相互作用記錄。它通過Mosaic平臺實(shí)現(xiàn)多細(xì)胞系混合培養(yǎng)、藥物處理和高通量單細(xì)胞測序。
這種數(shù)據(jù)直接反映藥物如何在細(xì)胞水平上重塑基因表達(dá)網(wǎng)絡(luò),揭示藥物作用機(jī)制、細(xì)胞狀態(tài)轉(zhuǎn)變、耐藥性、異質(zhì)性等核心生物學(xué)問題。與傳統(tǒng)bulk RNA-seq或蛋白組學(xué)相比,單細(xì)胞擾動數(shù)據(jù)能捕捉到細(xì)胞亞群特異的響應(yīng)和罕見狀態(tài),極大豐富了AI模型的訓(xùn)練基礎(chǔ)。這與提到 AI 公司主攻的蛋白質(zhì)結(jié)構(gòu)等方向有明顯互補(bǔ)。
多組學(xué)靶點(diǎn)發(fā)現(xiàn)
比起結(jié)構(gòu)預(yù)測那樣的任務(wù),靶點(diǎn)發(fā)現(xiàn)是更依賴生物專業(yè)能力的方向。也有公司在整合 DNA、蛋白、顯微圖像和臨床表型等千萬級多模態(tài)數(shù)據(jù),訓(xùn)練跨尺度 Foundation Model,直接輸出新靶點(diǎn)與作用機(jī)制假設(shè)。
過去 AI 模型基本無法在靶點(diǎn)發(fā)現(xiàn)上幫倒忙,而 Foundation model 的出現(xiàn)改變了這一點(diǎn):
? 千億 Token 多模態(tài)模型:覆蓋 DNA->蛋白->細(xì)胞->組織四級信息;
? 跨尺度注意力:捕捉遠(yuǎn)程調(diào)控與細(xì)胞間信號,自動生成靶點(diǎn)-通路評分。
代表公司: Bioptimus
由 DeepMind 與 Owkin 科學(xué)家聯(lián)合創(chuàng)辦,累計融資 7600 萬美元;獲 NVIDIA 專屬算力支持,未來的定位是“生物通用基礎(chǔ)模型”供應(yīng)商,目前客戶用例基本集中在前期靶點(diǎn)相關(guān)的單點(diǎn)探索工作。
藥物重定位(Drug Repurposing)
這類公司把已上市或臨床擱淺的藥物,與新的疾病通路、基因表達(dá)簽名快速“拼圖”,篩出可直接進(jìn)入 II 期的適應(yīng)癥。這類方法有一些明顯的優(yōu)勢:
? 成本優(yōu)勢:安全性數(shù)據(jù)現(xiàn)成;可跳過毒理與小規(guī)模 I 期。
? 合作模式:常見“里程碑+下游版稅”,前端資本負(fù)擔(dān)輕。
? 目標(biāo)人群多半是罕見病或兒童病,這些領(lǐng)域的臨床安全容忍度高,對已知分子接受度也更高。
技術(shù)上,這類公司并非做完整的 foundation model,而是更像一個領(lǐng)先的專用模型
? 知識圖譜 + 圖神經(jīng)網(wǎng)絡(luò):將“分子-靶點(diǎn)-表型”三層關(guān)系壓縮到同一向量空間,迅速評估重定位機(jī)會。
? 基因表達(dá)逆轉(zhuǎn)匹配(LINCS/L1000):尋找能夠逆轉(zhuǎn)病理表達(dá)譜的分子,優(yōu)先用于罕見病或兒科疾病。
代表公司
? Healx:跑出稀有病重定位最快案例。2024 年 C 輪融資 4700 萬美元,候選藥 HLX-1502 已進(jìn)入 NF-1 II 期,并獲得 FDA 罕見病三重加速資格。
? Recursion:主營業(yè)務(wù)是做高通量細(xì)胞影像篩選,如今把 50 PB 的表型數(shù)據(jù)開放給大模型,重定位算是其中商業(yè)化比較快的切入點(diǎn)。依托 細(xì)胞影像數(shù)據(jù),REC-994 正在腦血管病(CCM) II 期驗(yàn)證,展示了重定位與表型數(shù)據(jù)結(jié)合的規(guī)模效應(yīng)。
臨床試驗(yàn)加速 & 患者匹配
進(jìn)入臨床階段值得優(yōu)化效率的環(huán)節(jié)也很多,例如 50 % 以上的試驗(yàn)因招募延誤而成本飆升。AI 可以 EHR、基因分型、影像等多模態(tài)數(shù)據(jù),做入組篩查、分層與隨訪預(yù)測。LLM 能更好地理解病癥關(guān)鍵詞和實(shí)驗(yàn)室指標(biāo),再預(yù)測響應(yīng)概率,做更好的患者匹配。過去也有不少公司用 NLP 和數(shù)字孿生(Digital Twin)技術(shù)替代部分對照組,直接減少樣本量。
代表公司
? Paradigm:2023 年獲 2.03 億美元 A 輪,由 ARCH 與 General Catalyst 孵化。主攻“社區(qū)醫(yī)院 + 遠(yuǎn)程分布式試驗(yàn)”
? Unlearn AI:2024 年 C 輪 5000 萬美元,數(shù)字孿生技術(shù)獲 FDA 探索性認(rèn)可,可將招募期縮短 30–50 %,主力客戶包括默沙東與拜耳。
這個領(lǐng)域的收費(fèi)模式多為“每成功入組一個患者支付 X 美元”或與 CRO 按成功率分成,因此運(yùn)營屬性比相對標(biāo)準(zhǔn)化的 AI 產(chǎn)品高很多。
07.結(jié)語
Foundation Model 與自動化 AI Scientist 正把科學(xué)探索推入“算力-數(shù)據(jù)-算法”驅(qū)動的指數(shù)級進(jìn)步時代。 在四象限版圖中:
- Tech × Specialist 在單點(diǎn)突破中構(gòu)筑護(hù)城河,奠定了 AlphaFold 3 這類里程碑;
- Tech × Biologist 用多智能體把實(shí)驗(yàn)室編排成軟件,將科研流程產(chǎn)品化;
- Bio × Generalist 借全棧平臺押注新療法,爭奪下一個百億美元級藥物;
- Bio × Specialist 則用數(shù)據(jù)、算法修補(bǔ)關(guān)鍵瓶頸,為行業(yè)帶來立竿見影的效率紅利。
價值正在從傳統(tǒng) CRO 與藥企的“手工試錯”轉(zhuǎn)移到掌握數(shù)據(jù)、模型飛輪與自動化實(shí)驗(yàn)室的 AI 原生公司手中。對創(chuàng)業(yè)者而言,這意味著必須、布局專有數(shù)據(jù)獲取 + 模型閉環(huán)迭代 + 實(shí)驗(yàn)自動化;對投資人而言,這是一場關(guān)于實(shí)驗(yàn)計算化、跨學(xué)科人才密度與平臺型網(wǎng)絡(luò)效應(yīng)的長期賽跑。誰能率先讓 GPU 與模型源源不斷地產(chǎn)出新分子、創(chuàng)造新療法,誰就將在這場科學(xué)的寒武紀(jì)爆發(fā)中進(jìn)化為新的物種。
作者:Cage
本文由人人都是產(chǎn)品經(jīng)理作者【海外獨(dú)角獸】,微信公眾號:【海外獨(dú)角獸】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!