Agent Infra 圖譜:哪些組件值得為 Agent 重做一遍?

0 評(píng)論 1527 瀏覽 1 收藏 35 分鐘

本文深入剖析了Agent Infra領(lǐng)域,涵蓋Environment、Context、Tools、Agent Security等四大賽道,分析各環(huán)節(jié)價(jià)值與初創(chuàng)公司機(jī)遇,同時(shí)探討了云廠商布局及創(chuàng)業(yè)公司機(jī)會(huì),為讀者呈現(xiàn)Agent Infra領(lǐng)域的全景圖。

2025 年以來,Agent 開發(fā)量和使用量都有明顯提高。Agent 的爆發(fā)帶來了 Agent Infra 需求的爆發(fā)。在過去 1-2 年,Agent 開發(fā)大多依賴開發(fā)者手動(dòng)使用傳統(tǒng) Infra 搭建,開發(fā)工程量大、流程復(fù)雜,但隨著越來越多 Agent-native Infra 涌現(xiàn),Agent 開發(fā)的難度和周期都在縮小,開發(fā)的范式正在重構(gòu)和收斂。

我們之前已經(jīng)研究了 Browserbase、E2B 等公司,本文是我們對(duì)于 Agent Infra 領(lǐng)域圖景更全面的 Mapping。我們劃分出了 Environment、Context、Tools、Agent Security 這四大賽道,逐步分析每個(gè)環(huán)節(jié)的價(jià)值和值得關(guān)注的初創(chuàng)公司:

  • Environment 的作用是給 Agent 執(zhí)行任務(wù)提供容器,是一個(gè) Agent-native computer;
  • Context 層是在 Agent 工作中賦予記憶 Memory 和領(lǐng)域知識(shí)的重要中間層;
  • Tools 由于 MCP 協(xié)議的統(tǒng)一而百花齊放,同時(shí)目前 Tools 的核心用戶還是開發(fā)者,普通用戶的使用門檻太高;
  • Agent Security 是在 Agent 產(chǎn)品范式固定之后會(huì)涌現(xiàn)的大機(jī)會(huì),需要同時(shí)確保避免 Agent 受攻擊和發(fā)起攻擊。

目前 Agent Infra 是模型公司、云廠商、初創(chuàng)公司都在積極拓展的領(lǐng)域,我們認(rèn)為創(chuàng)業(yè)公司的機(jī)會(huì)在于:

1)在已有 Infra 中尋找真正 Agent-native 的需求,使 Agent 開發(fā)者開發(fā)出效果更好的產(chǎn)品,比如 Browserbase 對(duì)傳統(tǒng) headless browser 做了這樣的迭代;

2)抓住 Agent 開發(fā)中的新痛點(diǎn),例如 MCP 領(lǐng)域現(xiàn)在缺乏一個(gè)好的 marketplace 和 selector,幫助 Agent 去選擇對(duì)的工具。

?? 目錄 ??

01 Overview

02 投資主題 1:Environment

03 投資主題 2:Context

04 投資主題 3:Tools

05 投資主題 4:Agent Security

06 附錄:云廠商在 Agent Infra 的布局

01. Overview

Agent Infra 是 Agent 落地的關(guān)鍵,涵蓋了 Agent 從開發(fā)到部署的完整生命周期。我們對(duì)這個(gè)領(lǐng)域進(jìn)行了初步掃描后,按重要性劃分出了四大賽道,分別是 Environment、Context、Tools 和 Security,并進(jìn)一步拆解了我們看好的細(xì)分領(lǐng)域的 thesis 和初創(chuàng)公司。

Environment 指的是 Agent 可操作的容器,相當(dāng)于給了 Agent 一臺(tái)可自行操作的計(jì)算機(jī),Agent 可以在其中端到端地完成任務(wù),這個(gè)賽道包括 Sandbox、Browser Infra、Agent 操作系統(tǒng)等不同的細(xì)分領(lǐng)域,我們看好其中的 Sandbox 和 Browser Infra。

Context 為 Agent 有效運(yùn)行提供所需的信息,這個(gè)信息既包括任務(wù)相關(guān)的背景知識(shí),也包含各類工具的使用方法。有了這些信息,Agent 才能在特定任務(wù)場景中,合理判斷應(yīng)以哪種順序調(diào)用哪些工具,才能更有效地完成任務(wù)。我們將主要分析這個(gè)賽道中的 RAG、MCP 和 Memory。

Tools 相關(guān)的 Infra 使 Agent 能夠便捷調(diào)用各類工具,實(shí)現(xiàn)搜索、UI 設(shè)計(jì)、數(shù)據(jù)訪問、支付等多樣化的任務(wù)。隨著 Agent 交互復(fù)雜度的持續(xù)上升,工具層正迅速擴(kuò)展。搜索(Search & Scraping)、金融(Finance & Payment)、后端工作流(Backend Workflow)這三類工具,尤為值得重點(diǎn)關(guān)注。

Security Infra 以 Agent-native 的方式保障 Agent 的行為與數(shù)據(jù)在執(zhí)行過程中的安全與合規(guī)。隨著 Agent 能力邊界的不斷拓展,市場對(duì) Agent 安全性的要求也在同步提高。然而,這一環(huán)節(jié)的 AI-native Infra 機(jī)會(huì)需要在 Agent 生態(tài)更為完善后才能出現(xiàn)更清晰的格局。

除了上述賽道和公司之外,Agent Infra 領(lǐng)域還在不斷涌現(xiàn)更為成熟的解決方案。Infra 是模型公司、云廠商、初創(chuàng)公司都在積極拓展的領(lǐng)域,我們認(rèn)為創(chuàng)業(yè)公司的機(jī)會(huì)主要有兩類:

1. 在已有 Infra 中尋找有 AI-native 需求的環(huán)節(jié)。這種需求可以是 Agent 開發(fā)對(duì)該環(huán)節(jié)的某些性能提出了更高的要求,例如 Sandbox 需要更快冷啟動(dòng)速度、更強(qiáng)的隔離性;這種需求也可以是需要和 AI workflow 結(jié)合的更好,有更多 AI-native 的功能點(diǎn),例如增加 RAG 功能,或者和某些 AI 開發(fā)者常用的語言或 SDK 有更好的結(jié)合。

2. 抓住 Agent 開發(fā)中的新痛點(diǎn)。Agent 開發(fā)要追求 R&D 和時(shí)間投入的 ROI,對(duì)降低開發(fā)門檻和工程量的 Infra 產(chǎn)品有較大需求,因此一套易用性高且價(jià)格合理的 Infra 就有機(jī)會(huì)被廣泛采用。而且 Agent 生態(tài)是一個(gè)強(qiáng)調(diào)共建的生態(tài)系統(tǒng),而 Infra 的持續(xù)創(chuàng)新,正在大力推動(dòng)這種生態(tài)的構(gòu)建。

02.投資主題1:Environment

Environment 提供 Agent 開發(fā)和行動(dòng)的容器,相當(dāng)于給了 Agent 一臺(tái)可自行操作的計(jì)算機(jī),Agent 可以在虛擬環(huán)境中端到端地完成任務(wù),訓(xùn)練并探索新能力。我們將主要分析這個(gè)賽道中的沙盒(Sandbox)和 Browser Infra。

Sandbox:為 Agent 創(chuàng)造理想的虛擬機(jī)環(huán)境

Sandbox 是一種安全機(jī)制,為執(zhí)行中的程序提供隔離環(huán)境,即為 Agent 提供了一個(gè)可以隔離運(yùn)行的虛擬機(jī)環(huán)境,開發(fā)者可以在這個(gè)環(huán)境中實(shí)現(xiàn) Agent 的開發(fā)、部署、運(yùn)行。但隨著 Agent 的不斷發(fā)展,傳統(tǒng)的虛擬機(jī)并不能很好地滿足 Agent 需求,原因在于:

1. Agent 對(duì)虛擬機(jī)的性能提出了更高的要求,比如需要更高的隔離性、更快的啟動(dòng)速度、更強(qiáng)的穩(wěn)定性;

2. Agent 的虛擬機(jī)還要求具備一定的 AI 性能,例如需要具備代碼解釋器(code interpretor)的功能,或需要整合開發(fā)者常用的 AI 架構(gòu),如 Vercel AI SDK。

因此我們判斷 Sandbox 存在初創(chuàng)公司的機(jī)會(huì),比如 E2B 提供了更 AI-native、更快啟動(dòng)的 microVM ,獲得了 Perplexity、Hugging Face 等頭部 AI 企業(yè)的認(rèn)可;Modal 則提供了更 Cloud-native、更可規(guī)?;奶摂M機(jī),可以更好地滿足 Agent 開發(fā)需求。

注:?? 代表值得重點(diǎn)關(guān)注的公司

Browser Infra:使 Agent 更好地適應(yīng)瀏覽器環(huán)境

在如今的人類社會(huì)中,大部分的信息都存在于互聯(lián)網(wǎng)瀏覽器中,大部分的生產(chǎn)力工作也都能在瀏覽器環(huán)境中完成。因此,我們判斷瀏覽器環(huán)境將是 Agent 最重要的工作環(huán)境之一,瀏覽并操縱網(wǎng)頁的能力也將成為 Agent 的核心能力之一,而 Browser Infra 正賦予了 Agent 這種能力。

具體來看,Browser Infra 大致可以分為兩類:

1. 第一類 Infra 讓 Agent 可以大規(guī)模瀏覽網(wǎng)頁,比如 Agent 能在云端同時(shí)瀏覽不同網(wǎng)頁來獲取所需信息;

2. 第二類 Infra 使得 Agent 可以操縱網(wǎng)頁,比如 Agent 能靈活地進(jìn)行加載、選擇、點(diǎn)擊等網(wǎng)頁端的操作。

對(duì)于第一類 Infra 而言,傳統(tǒng)的解決方案是利用 Puppeteer、Playwright 等 browser 庫進(jìn)行開發(fā),優(yōu)勢是能獲得更高的定制化程度,對(duì)產(chǎn)品的控制力更強(qiáng),價(jià)格也更便宜,但是劣勢在于需要強(qiáng)大的工程團(tuán)隊(duì)和大量開發(fā)時(shí)間,且構(gòu)建出的產(chǎn)品比較臃腫。

因此當(dāng)下的 Agent 開發(fā)正在逐步采用更 AI-native 的 Browser Infra,希望能用易用性更高的產(chǎn)品來實(shí)現(xiàn) Agent 的快速搭建和發(fā)布,這一領(lǐng)域的代表公司是 Browserbase。在訪談中,我們發(fā)現(xiàn)開發(fā)者看重 Browser Infra 的因素包括帶寬、價(jià)格、速度等,而 Browserbase 正是在這幾個(gè)維度達(dá)到了一個(gè)高性能的平衡,因此獲得了開發(fā)者青睞。

第二類 Infra 能夠賦予 Agent 更強(qiáng)的理解瀏覽器內(nèi)容的能力,相比直接簡單調(diào)用 API,Agent 能夠像人一樣更深入的進(jìn)行網(wǎng)頁操作。我們認(rèn)為這是一塊更新興、更 Agent-native 的 Infra 機(jī)會(huì),Browser Use 這家公司尤其值得關(guān)注,這也是 Manus 在使用的 Browser Infra,在 Manus 問世之后進(jìn)一步走紅。

注:?? 代表值得重點(diǎn)關(guān)注的公司

03.投資主題 2:Context

豐富的上下文信息是 Agent 有效規(guī)劃和行動(dòng)的基礎(chǔ)?;谖谋?Context,Agent 可以更好地理解任務(wù)的背景,實(shí)現(xiàn)更具體的特定任務(wù);基于工具 Context,Agent 也能夠更好地理解工具的用法和用途,從而決定使用哪些工具,以哪種順序調(diào)用工具,如何將工具整合在一起來完成任務(wù)。我們將主要分析這個(gè)賽道中的 RAG、MCP 和 Memory。

RAG: 為 Agent 提供具體的 Context

RAG(Retrieval-Augmented Generation),即檢索增強(qiáng)生成,這是一種結(jié)合了信息檢索與生成式 AI 的技術(shù)架構(gòu),廣泛用于提升 LLM 在問答、文檔摘要等任務(wù)中的準(zhǔn)確性與時(shí)效性。如今 Agentic RAG 系統(tǒng)能夠持續(xù)分析 Context 和用戶意圖,自主從多種來源(包括實(shí)時(shí)數(shù)據(jù)流和外部 API)檢索并整合相關(guān)信息,使得 Agent 可以更好完成任務(wù)。

RAG 的提出時(shí)間較早,目前基本已成為一種共識(shí)性的技術(shù),并在各類應(yīng)用場景廣泛使用,相關(guān)的頭部創(chuàng)業(yè)公司也發(fā)展得較成熟,比如專注企業(yè)內(nèi)部數(shù)據(jù) RAG 搜索的 Glean 已經(jīng)獲得了包括 Reddit、Duolingo、Bookings 在內(nèi)的一眾企業(yè)的認(rèn)可,最新估值已接近 70 億美元。

注:?? 代表值得重點(diǎn)關(guān)注的公司

MCP: 提供標(biāo)準(zhǔn)化的工具和數(shù)據(jù)接口

MCP 是 Anthropic 在去年 11 月發(fā)布的一個(gè)開放式協(xié)議,重新定義了 Agent 調(diào)用外部工具、獲取數(shù)據(jù)以及與各類服務(wù)交互的方式。如今 MCP 已成為 Context 的一大標(biāo)準(zhǔn)化解決方案,相關(guān)生態(tài)也在不斷發(fā)展。

目前 MCP 相關(guān)的 Infra 創(chuàng)業(yè)機(jī)會(huì)還處在相對(duì)早期的階段,在一些業(yè)務(wù)邏輯互通的細(xì)分賽道,已有公司在原先業(yè)務(wù)基礎(chǔ)上拓展至 MCP 相關(guān)的產(chǎn)品。例如:

  • Mintlify 可以用客戶已有的 Documentation 或 OpenAPI spec 直接做出 MCP Server,不需要額外的代碼;
  • Stainless 可以在 SDK 生成的基礎(chǔ)上增加了 MCP Server generator,同樣簡化了 MCP server 的構(gòu)建過程;
  • Composio 也在集成主流 Agent 工具的基礎(chǔ)上新增了 MCP connector 產(chǎn)品,托管了 100 多個(gè)的 MCP Server,內(nèi)置身份驗(yàn)證,讓 Agent 可以簡化繁瑣的逐一設(shè)置并連接 MCP 的過程。

此外,還有一類做 MCP marketplace 的公司,集合各細(xì)分領(lǐng)域的 MCP Server 供 Agent 開發(fā)者進(jìn)行選擇和使用。自從 MCP 發(fā)布以來,MCP Server 數(shù)量在快速增長,MCP.so 里的 MCP Server 數(shù)量已經(jīng)高達(dá) 1.3w+。

但是我們認(rèn)為單純做 marketplace 的價(jià)值較薄,最重要的價(jià)值是為 Agent 評(píng)估和編排 MCP server 的使用,這類工作和價(jià)值量可能會(huì)集成在 Agent 開發(fā)端。

注:?? 代表值得重點(diǎn)關(guān)注的公司

Memory:賦予 Agent 特定的記憶力

Memory 是構(gòu)建復(fù)雜 Agent 的關(guān)鍵基礎(chǔ)。如果僅依賴 LLM 自帶的有限上下文窗口作為短期記憶,Agent 將在跨會(huì)話中處于 stateless 的狀態(tài),難以維持連貫性。同時(shí),缺乏長期記憶機(jī)制也限制了 Agent 自主管理和執(zhí)行持續(xù)性任務(wù)的能力。引入額外的 Memory 可以讓 Agent 做到存儲(chǔ)、檢索,并利用歷史交互與經(jīng)驗(yàn),從而實(shí)現(xiàn)更智能和持續(xù)的行為。

Agent 的 Memory 包括短期記憶(STM,存儲(chǔ)單次交互信息)、長期記憶(LTM,可以橫跨多次交互信息以實(shí)現(xiàn)個(gè)性化)和程序記憶(指導(dǎo) Agent 行為的規(guī)則)等。Memory 給 Agent 賦予了特定的記憶力,本質(zhì)一種提升 Agent 智能性的方式,Agent 能憑此有更高的個(gè)性化程度和一致性表現(xiàn),也能在多步驟或長周期的復(fù)雜任務(wù)中提升準(zhǔn)確性。

一些創(chuàng)業(yè)公司通過提供外部數(shù)據(jù)庫的方案為 Agent 構(gòu)建 Memory,例如 Mem0 采用混合數(shù)據(jù)庫系統(tǒng)從交互中提取并存儲(chǔ)關(guān)鍵信息,Zep 則運(yùn)用時(shí)序知識(shí)圖譜追蹤動(dòng)態(tài)變化的用戶數(shù)據(jù)、提升個(gè)性化能力。

與此同時(shí),模型公司也在不斷優(yōu)化模型本身的 Memory layer,比如一些開源模型通過引入額外的、可訓(xùn)練的“記憶槽”,使模型具備一定的記憶存儲(chǔ)能力。相比其他領(lǐng)域,創(chuàng)業(yè)公司在 Memory 的機(jī)會(huì)邊界相對(duì)沒有那么清晰。

注:?? 代表值得重點(diǎn)關(guān)注的公司

Case study – Letta

Letta 成立于 2024 年,專注于構(gòu)建具備長期記憶能力的 stateful AI Agent 平臺(tái),由伯克利實(shí)驗(yàn)室孵化而來,團(tuán)隊(duì)研究背景非常強(qiáng)。Letta 整合了可視化開發(fā)環(huán)境(ADE)、生產(chǎn)級(jí) API 及服務(wù)器運(yùn)行時(shí)系統(tǒng),ADE 可實(shí)時(shí)查看 Agent 記憶生成、管理的軌跡,Letta 還可以通過 context 管理,來實(shí)現(xiàn) Agent 狀態(tài)持久化,使 Agent 具備持續(xù)學(xué)習(xí)進(jìn)化的能力。

近期,Letta 團(tuán)隊(duì)發(fā)布了一個(gè)關(guān)于 “Sleep time compute”的有趣研究,進(jìn)一步說明了 Memory 在提升 Agent 性能上具有重要作用。該研究的主要想法是讓 AI 充分利用不與用戶交互的時(shí)間(即 sleep-time),來預(yù)先處理 Context 信息,并提前完成推理,將 raw context 處理為 learned context,這樣可以在實(shí)際應(yīng)答時(shí),減少即時(shí)推理的計(jì)算負(fù)擔(dān),最終達(dá)到提高推理質(zhì)量的效果。

Agent 有大量的 Sleep-time

AI 可以在 Sleep-time 完成對(duì) Context 預(yù)處理

04.投資主題 3:Tools

在完成搜索、數(shù)據(jù)提取、支付等各種任務(wù)的時(shí)候,Agent 需要調(diào)用各種工具,這個(gè)領(lǐng)域的玩家價(jià)值在于給開發(fā)者提供了可直接調(diào)用、無需自建的 Infra。隨著 Agent 交互復(fù)雜度的不斷提升,工具層正在快速擴(kuò)張,OpenAI 判斷 Agent 可調(diào)用的工具數(shù)量將會(huì)在幾個(gè)月內(nèi)從目前的 10 個(gè)量級(jí) Scale 到 100 個(gè)量級(jí)。我們將主要介紹搜索(Search & Scraping)、金融(Finance & Payment)、后端工作流(Backend Workflow)這三個(gè)方面的工具。

Search & Scraping:賦予 Agent 搜索能力

搜索是 Agent 獲取外部信息的重要途徑,我們認(rèn)為 Agent 搜索領(lǐng)域的機(jī)會(huì)非常大,原因在于:

1. 相比人類,Agent 會(huì)進(jìn)行更頻繁、更復(fù)雜的搜索,Agent 在完成單一任務(wù)的時(shí)候往往就需進(jìn)行數(shù)十次搜索,隨著多步驟任務(wù)的推進(jìn)以及 multi Agent 的發(fā)展,未來 Agent 的搜索量將遠(yuǎn)超人類。

2. 傳統(tǒng)搜索引擎無法滿足 Agent 的搜索需求,Agent 需要更 AI-native 的搜索工具。傳統(tǒng)的搜索引擎基于關(guān)鍵詞進(jìn)行檢索,常返回“SEO 垃圾”,而 Agent 搜索更側(cè)重理解而非匹配,因此 Agent 搜索在 context 的理解、搜索的全面性和準(zhǔn)確性上都提出了更高的要求。

由于 Google 等搜索巨頭不愿完全開放 API,再加上當(dāng)今的搜索引擎構(gòu)建成本已從數(shù)億美元降至數(shù)千萬美元,我們判斷 Agent 搜索領(lǐng)域存在以下三個(gè)創(chuàng)業(yè)公司的機(jī)會(huì):

1. 為海量 Agent 搜索提供足夠快速且廉價(jià)的解決方案,如 Serper 和博查提供了價(jià)格遠(yuǎn)低于 Bing 的搜索 API,獲得了希望自行處理海量原始信息的 Agent 開發(fā)者的青睞;

2. 給 Agent 提供更智能的搜索,如 Exa 實(shí)現(xiàn)了更復(fù)雜的語義搜索,能提供更優(yōu)質(zhì)的檢索結(jié)果;

3. 為 Agent 提供智能的爬蟲架構(gòu),如 Firecrawl 提供了開源的數(shù)據(jù)抓取框架,增強(qiáng)了 Agent 獲取網(wǎng)頁信息的能力。

目前看來,第一類創(chuàng)業(yè)機(jī)會(huì)的價(jià)值點(diǎn)最清晰,許多開發(fā)者非??粗厮阉餍畔⒌娜嫘院?API 價(jià)格,希望自己能夠在 Agent 產(chǎn)品中完成信息篩選,從這個(gè)角度來看 Search API 有 commoditize 的趨勢。

注:?? 代表值得重點(diǎn)關(guān)注的公司

Finance & Payment:讓 Agent 能交易和貨幣化

Agent 在金融領(lǐng)域的應(yīng)用也值得關(guān)注,我們判斷隨著 Agent 能力的發(fā)展,Agent 會(huì)成為金融領(lǐng)域重要的主體,雖然當(dāng)前 timing 還相對(duì)偏早,但這一領(lǐng)域可能會(huì)有 Visa 或 Stripe 級(jí)別的大機(jī)會(huì)。

我們認(rèn)為 Agent 需要專屬支付工具與交易網(wǎng)絡(luò)。在當(dāng)下,完成一個(gè)復(fù)雜任務(wù)通常會(huì)涉及到調(diào)用付費(fèi)內(nèi)容或工具,因此 Agent 需要具備支付能力。而當(dāng) Agent 被調(diào)用并完成任務(wù)時(shí),也應(yīng)當(dāng)能像人一樣“賺取”報(bào)酬。比如 Skyfire 就在利用區(qū)塊鏈技術(shù)為 Agent 提供身份認(rèn)證、交易和變現(xiàn)服務(wù),使得 Agent 能夠真正成為經(jīng)濟(jì)社會(huì)的生產(chǎn)主體。

Skyfire 讓 Agent 具備支付和收款能力

例子:AI Agent 使用 Skyfire 進(jìn)行自動(dòng)化支付

Agent 經(jīng)濟(jì)也會(huì)出現(xiàn)新的商業(yè)模式與變現(xiàn)方式。當(dāng)前大多數(shù) Agent 是按 seat 或是任務(wù)次數(shù)收費(fèi),未充分將 Agent 工作的價(jià)值變現(xiàn)。我們判斷 Agent 的計(jì)費(fèi)方式會(huì)逐步變?yōu)榘凑杖蝿?wù)過程和結(jié)果付費(fèi)。復(fù)雜的 Agent 網(wǎng)絡(luò)也可能共同完成任務(wù),未來可能需要構(gòu)建一套適用于 Agent 的智能合約,為 Agent 自動(dòng)化分配經(jīng)濟(jì)利益。

例如,Sequoia 近期投資的 Paid 這家公司就是根據(jù)每個(gè) Agent 的實(shí)際產(chǎn)出來定價(jià)、最大化 Agent 收益,并能夠管理 Agent 的毛利、為客戶量化 Agent 的 ROI 等,希望重構(gòu)一套 Agent 時(shí)代的貨幣化機(jī)制。

注:?? 代表值得重點(diǎn)關(guān)注的公司

Backend Workflow:簡化 Agent 后端開發(fā)

除了上述工具之外,還有一類工具的作用在于簡化 Agent 后端開發(fā),目的是在數(shù)據(jù)庫搭建、任務(wù)自動(dòng)化、工作流編排等方面降低 Agent 開發(fā)難度。這類解決方案往往是在服務(wù)大企業(yè)開發(fā)場景的基礎(chǔ)上,憑借易用性或 LLM-native 的特性吸引到新一代的 AI 開發(fā)者。例如:

Supabase 提供了 Backend-as-a-service ,被視作“開源版的 Google Firebase 替代方案”。Supabase 將后端工作打包為一站式服務(wù),提供自動(dòng) API、用戶認(rèn)證、對(duì)象存儲(chǔ)、實(shí)時(shí)訂閱、向量數(shù)據(jù)庫等多個(gè)功能模塊,讓開發(fā)者可以像用樂高積木一樣即插即用地快速搭建后端。隨著 vibe coding 爆火,Supabase 已經(jīng)被 Lovable、Bolt.new 等 AI coding 產(chǎn)品設(shè)置為默認(rèn)后端,吸引了 200 多萬開發(fā)者。

Firebase Studio 是 Google 發(fā)表的一個(gè)基于云端的全棧 AI 開發(fā)平臺(tái),目的是幫助開發(fā)者快速構(gòu)建、測試和部署生產(chǎn)級(jí)應(yīng)用,整合了 Gemini 大模型、Project IDX 和 Firebase 全家桶服務(wù),提供從原型設(shè)計(jì)到上線的一站式開發(fā)體驗(yàn)。

Inngest 則提供了工作流編排平臺(tái),提供 “Zero-Infra” 和 AgentKit,將原先時(shí)間長、步驟復(fù)雜的 Agent 開發(fā)與編排進(jìn)行了簡化。

注:?? 代表值得重點(diǎn)關(guān)注的公司

05.投資主題 4:Agent Security

Security 也是我們認(rèn)為較關(guān)鍵的 Infra。隨著 Agent 能力邊界拓展,Agent 安全性上的要求也在同步提升。

當(dāng) Agent 代表用戶進(jìn)行各類行動(dòng)時(shí),我們不僅需要對(duì) Agent 進(jìn)行身份驗(yàn)證,還需保證 Agent 的每個(gè)意圖、每個(gè)行動(dòng)都是安全的。隨著 Agent 智能性增強(qiáng),Agent 的安全框架需要從靜態(tài)的權(quán)限控制轉(zhuǎn)變?yōu)閯?dòng)態(tài)的意圖分析。此外,Agent 每次數(shù)據(jù)交互都需要?jiǎng)討B(tài)校驗(yàn),這也對(duì)數(shù)據(jù)安全提出了更高的要求。

目前,Agent 使用的 Security 相關(guān)的 Infra 產(chǎn)品以相對(duì)老牌的玩家為主。相對(duì)老牌的玩家本身在服務(wù)大企業(yè)的數(shù)據(jù)和運(yùn)行安全時(shí)就已經(jīng)積累了完善的 Infra 能力,能夠較好地將功能外溢并服務(wù)好當(dāng)前的 Agent。例如 Chainguard 為 Agent 在開發(fā)階段提供安全的基礎(chǔ)鏡像,Haize Labs 對(duì) AI system 進(jìn)行壓力測試、增強(qiáng)穩(wěn)健性,Oligo 則為 Agent 提供運(yùn)行實(shí)時(shí)監(jiān)控與異常檢測。

我們認(rèn)為 Security 這一領(lǐng)域遵循“需求驅(qū)動(dòng)”的邏輯,即先有成熟的下游產(chǎn)品設(shè)計(jì),再有對(duì)應(yīng)的安全問題與解決方案。因此,這一環(huán)節(jié)的 AI-native Infra 機(jī)會(huì)需要在 Agent 生態(tài)更為完善后才能出現(xiàn)更清晰的格局,當(dāng)前階段還是偏早。

06.附錄:云廠商在 Agent Infra 的布局

Agent Infra 領(lǐng)域還有一類不容忽視的玩家就是云廠商,云廠商可以提供 Agent 所需的算力資源、部署環(huán)境等。為了更好看清 Agent Infra 領(lǐng)域的玩家格局,我們匯總了 AWS、Azure、GCP 這三大云廠商在該領(lǐng)域的布局。

Environment

三大云廠商都陸續(xù)推出了自己在 Enviroment 上的產(chǎn)品,但我們認(rèn)為,目前沒有出現(xiàn) Agent-native 的產(chǎn)品。

在 Sandbox 上:

1. AWS 在 2014 年推出 Amazon S3 Buckets,提供了存儲(chǔ)桶和訪問控制列表等機(jī)制;2020 年又推出了 Amazon EC2 Nitro Enclaves,可以運(yùn)行敏感代碼,確保數(shù)據(jù)與主系統(tǒng)完全隔離,適用于高安全需求場景。

2. Azure 發(fā)布過一個(gè)開源項(xiàng)目 Azure Sandbox,2022 年推出了 Azure Container Apps Sandbox Mode,可以在 Hyper-V 隔離的沙盒中運(yùn)行不受信任的代碼(如 LLM 生成的代碼),支持動(dòng)態(tài)會(huì)話和代碼解釋器。

3. GCP 早在 2008 年就發(fā)布了 Google Compute Engine,提供高性能的虛擬機(jī)實(shí)例,支持多種操作系統(tǒng)和配置;2017 年推出無服務(wù)器計(jì)算平臺(tái) Google Cloud Functions,用戶可編寫和部署函數(shù)代碼,無需管理服務(wù)器基礎(chǔ)設(shè)施。

在 Browser Infra 上:

1. AWS 在 2014 年發(fā)布了開源框架 Lambda Serverless Chrome,開發(fā)者可以部署無頭瀏覽器,實(shí)現(xiàn)網(wǎng)頁截圖、PDF 生成、自動(dòng)化測試等功能。

2. Azure 在 2019 年推出了一個(gè)無頭瀏覽器控制庫 Azure Playwright ,支持的瀏覽器涵蓋 Chrome、Firefox、Safari、Edge 等。

3. GCP 在 2018 年發(fā)布 Google Puppeteer 庫,也是一個(gè)無頭瀏覽器控制庫,可直接控制無頭 Chrome,支持網(wǎng)頁自動(dòng)化測試、爬蟲等任務(wù)。

Context

2023-2024 年,公有云廠商紛紛推出 RAG 相關(guān)解決方案,推動(dòng)了一波尚未上云的企業(yè)加速上云。2025 年,公有云廠商開始積極擁抱 MCP,他們不僅有數(shù)量龐大的 API 體系,還配備了對(duì)應(yīng)的 CLI 工具,簡化了與 MCP 的集成流程。

在 RAG 上:

1. AWS 先后在 2020 年和 2023 年推出了企業(yè)級(jí)智能搜索 Amazon Kendra 和端到端的 RAG 解決方案 Amazon Bedrock Knowledge Bases。前者為 RAG 應(yīng)用提供文檔檢索能力,能夠處理大量不同格式的文檔,快速找到與用戶問題相關(guān)的準(zhǔn)確答案;后者支持自定義連接器、流式數(shù)據(jù)攝取,增加了結(jié)構(gòu)化數(shù)據(jù)檢索和知識(shí)圖譜的功能。

2. Azure 早在 2014 年就發(fā)布了開源數(shù)據(jù)管道和轉(zhuǎn)換套件 GraphRAG,目的是利用 LLM,從非結(jié)構(gòu)化文本中提取結(jié)構(gòu)化數(shù)據(jù);2018 年又推出了 Azure Cognitive Search,可以智能搜索,并與 Azure AI 集成。

3. GCP 分別于 2023 年和 2025 年推出了 Vertex AI Search 和 Vertex AI RAG Engine。前者是一款完全托管的搜索 ?API,簡化了企業(yè)數(shù)據(jù)源的連接,支持跨數(shù)據(jù)源搜索,適用于對(duì)開箱即用的質(zhì)量、可擴(kuò)展性以及細(xì)粒度訪問控制要求較高的企業(yè)場景;后者則是一項(xiàng)托管的編排服務(wù),簡化了信息檢索、LLM 集成的流程。

在 MCP 上:

1. AWS 推出了 AWS MCP Server,通過一系列模塊化服務(wù)器套件,給開發(fā)人員提供 AWS 文檔、知識(shí)庫等資源直接訪問的能力。

2. Azure 發(fā)布了 Azure MCP Server 和 Playwright-MCP,前者支持訪問多種 Azure 服務(wù),包括 Azure Cosmos DB、Azure Storage 和 Azure Monitor 等,功能包括數(shù)據(jù)庫查詢、存儲(chǔ)管理和日志分析等;后者是一個(gè)開源框架,允許 LLMs 通過結(jié)構(gòu)化數(shù)據(jù),來與網(wǎng)頁交互,實(shí)現(xiàn)自動(dòng)化測試等功能。

3. GCP 推出了開源 Agent 交互標(biāo)準(zhǔn) Agent-to-Agent Protocol 和開發(fā)套件 Agent Development Kit,前者支持不同框架的 Agent 直接協(xié)作,考慮到 MCP 的使用場景是 Agent 與工具交互,A2A 的使用場景是 Agent 之間的通信,A2A 會(huì)與 MCP 形成互補(bǔ)格局;后者支持 MCP 工具集成。

Tools

在 Tools 領(lǐng)域,除了 Azure 和 GCP 各自推出了 Search API 之外,三大云廠商也在 Backend Workflow 賽道早早推出了各自的產(chǎn)品,但我們認(rèn)為,Tools 領(lǐng)域和 Enviroment 領(lǐng)域類似,目前并沒有看見 Agent-native 的產(chǎn)品。

在 Backend Workflow 上:

1. AWS 在 2016 年就推出了 AWS Step Functions,通過可視化方式編排多個(gè) AWS 服務(wù),支持以狀態(tài)機(jī)的形式定義執(zhí)行步驟和狀態(tài)轉(zhuǎn)換,簡化了分布式系統(tǒng)的開發(fā)與運(yùn)維管理。

2. Azure 在 2016 年推出 Azure Logic Apps 和 Azure Functions。前者提供可視化設(shè)計(jì)器和預(yù)構(gòu)建連接器,用于構(gòu)建和管理自動(dòng)化工作流;后者則支持多種編程語言的事件驅(qū)動(dòng)計(jì)算,可與 Azure 生態(tài)中的其他服務(wù)無縫協(xié)作,適合用于構(gòu)建無服務(wù)器架構(gòu)的應(yīng)用程序。

3. GCP 于 2017 年推出了 Google Cloud Functions,這是一個(gè)支持多種編程語言的事件驅(qū)動(dòng)型無服務(wù)器計(jì)算平臺(tái),能夠響應(yīng)包括 HTTP 請求、Pub/Sub 消息、Cloud Storage 變更等多種事件類型;2020 年推出了 Google Cloud Workflows,用于編排各類 Google Cloud 服務(wù)的自動(dòng)執(zhí)行與集成。

本文由人人都是產(chǎn)品經(jīng)理作者【海外獨(dú)角獸】,微信公眾號(hào):【海外獨(dú)角獸】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!