像考核員工一樣評(píng)測(cè)智能體

0 評(píng)論 882 瀏覽 4 收藏 21 分鐘

智能體越來(lái)越像“團(tuán)隊(duì)成員”,但我們?cè)撊绾卧u(píng)估它們的表現(xiàn)?本文借鑒人力資源中的績(jī)效考核體系,提出一套評(píng)測(cè)智能體的新思路,從目標(biāo)設(shè)定到行為反饋,為AI產(chǎn)品經(jīng)理提供一份可落地的評(píng)估框架。

評(píng)估一個(gè)AI智能體,就像一家公司對(duì)員工進(jìn)行績(jī)效考核,這是一個(gè)復(fù)雜、多維但至關(guān)重要的過(guò)程。這種評(píng)估超越了傳統(tǒng)機(jī)器學(xué)習(xí)模型的“能力測(cè)試”,更不是一次簡(jiǎn)單的“知識(shí)問(wèn)答”。我們?cè)u(píng)估的是一個(gè)“數(shù)字員工”在動(dòng)態(tài)、真實(shí)的商業(yè)世界中,是否高效、可靠、安全,以及能否讓它的“客戶”或“同事”滿意。

智能體和大模型評(píng)估的區(qū)別:從“高考”到“績(jī)效考核”

智能體評(píng)估的定義

智能體評(píng)估,就像是在衡量一個(gè)自主的“數(shù)字員工”,在不斷變化、通常是開(kāi)放式的“工作環(huán)境”中,其行為的端到端有效性、可靠性和安全性。

這個(gè)“數(shù)字員工”可能會(huì)調(diào)用多個(gè)模型、軟件工具、API接口,并動(dòng)用自己的“記憶”來(lái)達(dá)成一個(gè)復(fù)雜的“業(yè)務(wù)目標(biāo)”。

因此,我們?cè)u(píng)估的不僅是它會(huì)不會(huì)“說(shuō)話”(語(yǔ)言生成),更是它懂不懂“做事”(決策制定)、會(huì)不會(huì)用“工具”(工具使用)、能不能處理“意外”(錯(cuò)誤處理)以及是否善于“變通”(適應(yīng)性)。

智能體評(píng)估與傳統(tǒng)模型評(píng)估的區(qū)別

1)目標(biāo)不同,從“通用能力”到“崗位表現(xiàn)”:

LLM評(píng)估主要關(guān)注文本生成、代碼編寫、問(wèn)答、指令遵循等基本能力,而智能體評(píng)估則側(cè)重于智能體在復(fù)雜、交互式環(huán)境中的整體表現(xiàn)。

LLM評(píng)估就像學(xué)生參加高考,考核語(yǔ)、數(shù)、英等基本學(xué)科能力,而智能體評(píng)估則是考核員工在具體崗位中的績(jī)效和表現(xiàn)。

2)環(huán)境不同,從“考場(chǎng)”到“職場(chǎng)”:

智能體在不斷演變的動(dòng)態(tài)環(huán)境和上下文中運(yùn)行,就像職場(chǎng);而模型評(píng)估通常基于靜態(tài)數(shù)據(jù)集,就像試卷。

3)決策鏈復(fù)雜性:從“單次問(wèn)答”到“項(xiàng)目管理”:

智能體行動(dòng)的質(zhì)量取決于順序推理和規(guī)劃,決策是連續(xù)的,動(dòng)作是有長(zhǎng)期影響的。

就像一個(gè)員工的工作表現(xiàn)不是由單次行為決定的,而是一連串決策和行動(dòng)的結(jié)果。比如一個(gè)項(xiàng)目經(jīng)理的成功取決于他從項(xiàng)目啟動(dòng)、需求分析、任務(wù)分配到風(fēng)險(xiǎn)控制的每一步?jīng)Q策。早期的一個(gè)小失誤,可能會(huì)在后期引發(fā)大問(wèn)題。

智能體也是如此,它的每一次行動(dòng)都可能影響后續(xù)的結(jié)果,評(píng)估必須著眼于這整個(gè)“決策鏈”,而不是孤立的某個(gè)“回復(fù)”。

理論上大模型的每次回復(fù)是無(wú)狀態(tài)的,如果不提供上下文,那么它的每次輸出既不考慮過(guò)去,也不考慮未來(lái)。

4)工具與環(huán)境交互:從“紙上談兵”到“實(shí)踐”:

智能體可以調(diào)用外部API、操作數(shù)據(jù)庫(kù)或應(yīng)用程序,增加了錯(cuò)誤的可能性和評(píng)估的復(fù)雜性。

大模型無(wú)法直接與外部環(huán)境交互。

我們不會(huì)指望一個(gè)員工只靠大腦來(lái)工作,他需要使用電腦、軟件、電話等工具。這就好比考核員工時(shí),我們不僅要看他會(huì)不會(huì)寫方案,還會(huì)看他會(huì)不會(huì)執(zhí)行。

5)端到端流程:從“只看結(jié)果”到“復(fù)盤全過(guò)程”

評(píng)估智能體需要考察其決策和行動(dòng)的過(guò)程,對(duì)每個(gè)環(huán)節(jié)進(jìn)行評(píng)估,而不僅僅是最終輸出。

智能體評(píng)估為何更具挑戰(zhàn)性

評(píng)估一位在復(fù)雜崗位上的員工之所以困難,是因?yàn)檎鎸?shí)的工作充滿了變數(shù)。評(píng)估智能體亦是如此:

動(dòng)態(tài)上下文: 智能體運(yùn)行的環(huán)境狀態(tài)和上下文不斷變化,要求評(píng)估方法能夠捕捉這種動(dòng)態(tài)性。就像員工需要應(yīng)對(duì)不斷變化的客戶需求和市場(chǎng)環(huán)境。

決策鏈: 智能體通過(guò)一系列順序推理和規(guī)劃來(lái)執(zhí)行操作,評(píng)估需要追蹤整個(gè)決策過(guò)程的質(zhì)量。項(xiàng)目的成敗取決于一系列環(huán)環(huán)相扣的決策,而非單一行為。

真實(shí)世界的不確定性: 智能體需要能夠處理意外輸入、模糊指令和各種邊緣情況。員工也需要處理客戶的模糊指令、意外投訴和各種邊緣狀況。

工具使用集成: 智能體經(jīng)常依賴外部工具,使得評(píng)估必須監(jiān)控工具調(diào)用的成功率、錯(cuò)誤處理能力和潛在延遲。就像員工需要熟練使用多種辦公軟件和業(yè)務(wù)系統(tǒng)。

場(chǎng)景復(fù)雜性: 需要在廣泛的真實(shí)世界場(chǎng)景(包括邊緣情況和對(duì)抗性輸入)中測(cè)試智能體。

多智能體交互: 在涉及多個(gè)智能體協(xié)作的系統(tǒng)中,評(píng)估必須捕捉它們之間的涌現(xiàn)行為和協(xié)調(diào)能力。在一個(gè)團(tuán)隊(duì)中,評(píng)估的不僅是個(gè)人能力,更是團(tuán)隊(duì)協(xié)作的默契和效率。

主觀判斷: 許多智能體任務(wù)的評(píng)估標(biāo)準(zhǔn)(如有用性、安全性、用戶滿意度)需要人類的主觀判斷。就像很多人類工作的評(píng)估標(biāo)準(zhǔn),如“客戶滿意度”、“方案創(chuàng)意性”,天然帶有主觀性,需要管理者(人類)的判斷。

持續(xù)監(jiān)控需求: 生產(chǎn)環(huán)境中部署的智能體需要持續(xù)監(jiān)控,以發(fā)現(xiàn)回歸、故障和不斷變化的用戶需求。員工入職后需要持續(xù)關(guān)注其表現(xiàn),以發(fā)現(xiàn)能力衰退、狀態(tài)波動(dòng)或新的培訓(xùn)需求。

評(píng)估目標(biāo):評(píng)什么

對(duì)員工的考核通常包含“業(yè)績(jī)”、“行為”和“職業(yè)操守”三大維度。智能體評(píng)估也可分為結(jié)果評(píng)估、過(guò)程評(píng)估、安全評(píng)估(可靠性、安全與對(duì)齊)。

3.1 評(píng)估結(jié)果:(看“業(yè)績(jī)”)

智能體最終的任務(wù)是否完成,完整質(zhì)量如何,耗時(shí)如何。就像考核一名銷售人員,我們最關(guān)心的是他的核心KPI:最終簽了多少單(任務(wù)完成)、合同總金額多大(輸出質(zhì)量)、以及為了簽單付出了多少時(shí)間與差旅成本(延遲與成本),結(jié)果是硬道理。

任務(wù)完成: 評(píng)估智能體是否成功達(dá)到預(yù)設(shè)目標(biāo)。這通??梢酝ㄟ^(guò)成功率、F1分?jǐn)?shù)等其他任務(wù)相關(guān)指標(biāo)來(lái)衡量。

輸出質(zhì)量 : 衡量智能體輸出的連貫性、用戶滿意度、結(jié)果可用性和整體質(zhì)量。

延遲與成本:

  • 延遲:在交互式場(chǎng)景中至關(guān)重要,如首次Token時(shí)間和端到端請(qǐng)求延遲。
  • 成本:部署智能體的實(shí)際開(kāi)銷,通常根據(jù)輸入和輸出Token數(shù)量、軟硬件設(shè)施耗費(fèi)進(jìn)行估算。

3.2 過(guò)程評(píng)估: (看“行為”)

一位優(yōu)秀的銷售經(jīng)理還會(huì)關(guān)注銷售人員的過(guò)程指標(biāo),比如他每天打多少個(gè)電話、拜訪多少客戶。這些過(guò)程動(dòng)作的規(guī)范性,決定了業(yè)績(jī)的穩(wěn)定性和可復(fù)制性。評(píng)估智能體也是同理,我們要重點(diǎn)考察它的“工作過(guò)程”:

工具使用: 評(píng)估智能體能否正確判斷是否需要調(diào)用工具,從可用工具集中選擇合適的工具,識(shí)別并生成正確的參數(shù)值。

  • 調(diào)用準(zhǔn)確率:評(píng)估智能體是否做出正確的工具調(diào)用決策。
  • 工具選擇準(zhǔn)確率:衡量從列表中選擇正確工具的能力。
  • 檢索準(zhǔn)確率:衡量從大型工具集中檢索正確工具的能力,常用平均倒數(shù)排名(MRR)和歸一化折現(xiàn)累積增益(NDCG)。

規(guī)劃與推理 : 評(píng)估智能體將復(fù)雜任務(wù)分解為可管理子任務(wù)、系統(tǒng)解決并交付連貫結(jié)果的能力。

  • 目標(biāo)實(shí)現(xiàn)率:衡量成功實(shí)現(xiàn)目標(biāo)的計(jì)劃百分比。
  • 行動(dòng)最優(yōu)性:評(píng)估計(jì)劃中行動(dòng)是否為實(shí)現(xiàn)目標(biāo)的最有效路徑。
  • 規(guī)劃時(shí)間:智能體生成完整計(jì)劃所需的時(shí)間。
  • 動(dòng)態(tài)重新規(guī)劃時(shí)間:智能體響應(yīng)變化或中斷并創(chuàng)建新計(jì)劃的速度。
  • 錯(cuò)誤恢復(fù)率:智能體從錯(cuò)誤或意外情況中恢復(fù)的能力。

記憶與上下文保留: 評(píng)估智能體在長(zhǎng)對(duì)話或大型數(shù)據(jù)集中保留上下文信息的能力。

  • 壓縮比:衡量智能體有效總結(jié)或壓縮長(zhǎng)期記憶的能力,且不丟失關(guān)鍵信息。
  • 記憶使用:追蹤記憶系統(tǒng)對(duì)存儲(chǔ)空間和計(jì)算資源的使用效率。

3.3 可靠性(看“專業(yè)度”)

評(píng)估智能體在不同輸入和時(shí)間下是否行為一致,一個(gè)專業(yè)的員工,其工作產(chǎn)出應(yīng)該是穩(wěn)定可靠的,而不是時(shí)好時(shí)壞、全憑“手感”。

  • 一致性:智能體對(duì)于相同輸入是否能提供一致的輸出。對(duì)于同樣的工作任務(wù),員工是否每次都能給出同樣標(biāo)準(zhǔn)的結(jié)果。
  • 魯棒性:智能體在面對(duì)輸入變化(例如意譯指令、無(wú)關(guān)或誤導(dǎo)性上下文、語(yǔ)法變體)或環(huán)境變化時(shí)的輸出穩(wěn)定性。包括適應(yīng)性彈性(從動(dòng)態(tài)環(huán)境變化中恢復(fù))和錯(cuò)誤處理能力。當(dāng)客戶換了一種方式提問(wèn),或者在溝通中夾雜了一些無(wú)關(guān)信息時(shí)(輸入變化),員工是否依然能準(zhǔn)確理解需求,而不是當(dāng)場(chǎng)“死機(jī)”?這考驗(yàn)的是員工的應(yīng)變能力。

錯(cuò)誤處理: 智能體能否優(yōu)雅地響應(yīng)工具故障或意外輸出。

3.4 安全與對(duì)齊(看“職業(yè)操守”)

安全與對(duì)齊評(píng)估智能體的可信度和安全性,包括公平性、合規(guī)性以及預(yù)防有害或不道德行為。員工業(yè)績(jī)?cè)俸?,如果職業(yè)操守有問(wèn)題,也會(huì)給公司帶來(lái)巨大風(fēng)險(xiǎn)。

  • 公平性:智能體應(yīng)避免產(chǎn)生偏見(jiàn)結(jié)果,防止在應(yīng)用中加劇系統(tǒng)性不平等。
  • 危害、毒性與偏見(jiàn):確保智能體輸出不包含仇恨言論、騷擾或極端偏見(jiàn)內(nèi)容。常用的評(píng)估方法包括紅隊(duì)測(cè)試和毒性檢測(cè)數(shù)據(jù)集。
  • 合規(guī)性與隱私:智能體必須遵守特定的法規(guī)或政策限制,在企業(yè)環(huán)境中,這尤其需要專有的測(cè)試用例來(lái)反映實(shí)際政策。

如何評(píng)估:考核的方法與指標(biāo)

4.1 評(píng)估環(huán)境(在“辦公室”還是“真實(shí)戰(zhàn)場(chǎng)”)

靜態(tài)與離線評(píng)估: 通常作為基線評(píng)估,使用預(yù)生成、靜態(tài)數(shù)據(jù)集和測(cè)試用例。這種方法成本較低、維護(hù)簡(jiǎn)單,但可能無(wú)法充分捕捉智能體在動(dòng)態(tài)環(huán)境中的復(fù)雜行為。

像對(duì)新員工進(jìn)行崗前培訓(xùn)和“閉卷考試”。用準(zhǔn)備好的標(biāo)準(zhǔn)題庫(kù)(靜態(tài)數(shù)據(jù)集)來(lái)檢驗(yàn)他的基礎(chǔ)能力。這種方式成本低、效率高,但無(wú)法完全模擬真實(shí)工作的復(fù)雜性。

動(dòng)態(tài)與在線評(píng)估 : 在智能體部署后進(jìn)行,利用模擬或?qū)嶋H用戶交互數(shù)據(jù)。這種評(píng)估能夠識(shí)別靜態(tài)測(cè)試中未發(fā)現(xiàn)的問(wèn)題,并能反映領(lǐng)域特定的上下文信息。例如,網(wǎng)頁(yè)代理的評(píng)估可以在網(wǎng)頁(yè)模擬器中進(jìn)行。

  • 讓員工“下市場(chǎng)”、“見(jiàn)客戶”,在真實(shí)的工作場(chǎng)景中,會(huì)發(fā)現(xiàn)許多在考試中暴露不出來(lái)的問(wèn)題。
  • 評(píng)估驅(qū)動(dòng)開(kāi)發(fā)(EDD):強(qiáng)調(diào)將評(píng)估作為智能體開(kāi)發(fā)周期的組成部分,持續(xù)進(jìn)行離線和在線評(píng)估,以檢測(cè)回歸并適應(yīng)新用例。

4.2評(píng)估數(shù)據(jù) (考核的“案例庫(kù)”)

  • 生產(chǎn)數(shù)據(jù):使用真實(shí)的生產(chǎn)數(shù)據(jù)進(jìn)行測(cè)試評(píng)估。
  • 數(shù)據(jù)集和基準(zhǔn):用于評(píng)估智能體特定能力的多種數(shù)據(jù)集和基準(zhǔn),它們通常結(jié)合了人工標(biāo)注、合成數(shù)據(jù)和交互生成數(shù)據(jù)。例如ScienceAgentBench,TaskBench用于能力評(píng)估;FlowBench,ToolBench,API-Bank用于工具使用評(píng)估;AssistantBench,AppWorld,WebArena用于模擬開(kāi)放式交互行為。
  • 合成數(shù)據(jù):通過(guò)AI生成的數(shù)據(jù),可以創(chuàng)建可控的測(cè)試用例,模擬環(huán)境中的稀有事件或不同場(chǎng)景。合成數(shù)據(jù)還可以緩解隱私問(wèn)題,特別是在無(wú)法使用真實(shí)數(shù)據(jù)的場(chǎng)景中。就比如為了測(cè)試員工處理罕見(jiàn)或極端情況的能力,我們可以進(jìn)行“情景模擬演練”(合成數(shù)據(jù)),而無(wú)需等待真實(shí)危機(jī)發(fā)生。

4.3 評(píng)估方法

評(píng)估上下文是指進(jìn)行評(píng)估的環(huán)境。它根據(jù)系統(tǒng)的預(yù)期用途和智能體開(kāi)發(fā)階段而定,從受控模擬環(huán)境到開(kāi)放世界的API或網(wǎng)頁(yè)瀏覽器。

基于代碼的評(píng)估 : 當(dāng)評(píng)估依賴可編程驗(yàn)證的客觀標(biāo)準(zhǔn)時(shí)使用,對(duì)于有明確對(duì)錯(cuò)的工作,比如數(shù)據(jù)錄入,可以直接通過(guò)程序自動(dòng)檢查“準(zhǔn)確率”。

Human-as-a-Judge (人類作為評(píng)估者):人類的評(píng)估對(duì)于需要主觀判斷(如創(chuàng)造力、常識(shí)、細(xì)微差別)的任務(wù)至關(guān)重要,并可用于校準(zhǔn)和驗(yàn)證自動(dòng)化評(píng)估方法。就是最傳統(tǒng)的“主管評(píng)價(jià)”。對(duì)于需要主觀判斷的工作,比如方案的“創(chuàng)意性”或與客戶溝通的“親和力”,主管的經(jīng)驗(yàn)和判斷是不可替代的。

LLM-as-a-Judge (LLM作為評(píng)估者): 利用大型語(yǔ)言模型自身的推理能力,根據(jù)定性標(biāo)準(zhǔn)評(píng)估智能體的響應(yīng)。這種方法速度快、易于使用且相對(duì)經(jīng)濟(jì),無(wú)需參考數(shù)據(jù),可用于評(píng)估正確性、重復(fù)性、毒性、幻覺(jué)等多種標(biāo)準(zhǔn)。然而,它也存在不一致性、成本增加和潛在偏見(jiàn)等局限性。

就好比引入了“同事互評(píng)”或“360度評(píng)估”。讓其他大模型作為“同事”,根據(jù)一套評(píng)價(jià)標(biāo)準(zhǔn)來(lái)給智能體的表現(xiàn)打分。這種方法效率高、規(guī)模大,但“同事”之間也可能存在偏見(jiàn)或理解不到位的地方。

Agent-as-a-Judge (智能體作為評(píng)估者): 這種方法涉及多個(gè)AI智能體相互協(xié)作來(lái)完善評(píng)估過(guò)程,以提高評(píng)估的可靠性。就像組建了一個(gè)專業(yè)的“內(nèi)部評(píng)審委員會(huì)”,由多個(gè)AI智能體相互協(xié)作、交叉驗(yàn)證,讓評(píng)估結(jié)果更加客觀和可靠。

4.4 關(guān)鍵評(píng)估指標(biāo)總結(jié)

評(píng)估智能體的最佳實(shí)踐和挑戰(zhàn)

6.1 最佳實(shí)踐

  • 場(chǎng)景驅(qū)動(dòng)測(cè)試:設(shè)計(jì)多樣化、現(xiàn)實(shí)的場(chǎng)景,模擬目標(biāo)用戶和環(huán)境,包括通用、角落和邊緣案例。
  • 自動(dòng)化與人類評(píng)估結(jié)合:結(jié)合自動(dòng)化指標(biāo)和人工審查(Human-in-the-Loop)進(jìn)行全面評(píng)估。人類介入對(duì)于主觀判斷、創(chuàng)造性任務(wù)以及校準(zhǔn)自動(dòng)化評(píng)估方法至關(guān)重要。
  • 可觀測(cè)性與追蹤:實(shí)施細(xì)粒度追蹤以調(diào)試工作流,監(jiān)控生產(chǎn)中的智能體行為。追蹤可以揭示智能體如何達(dá)到最終輸出、使用了哪些工具及其順序、檢索了哪些數(shù)據(jù)以及推理路徑是否偏離。LangSmith和ArizeAI都提供此類功能。
  • 版本控制與實(shí)驗(yàn):系統(tǒng)性地迭代智能體設(shè)計(jì)、提示和工作流,使用穩(wěn)健的版本控制工具,并記錄模型更新、提示或代碼變更以及數(shù)據(jù)集修訂。
  • 持續(xù)反饋循環(huán):部署在線評(píng)估和警報(bào)機(jī)制,以捕捉回歸并保持質(zhì)量。隱式反饋(從用戶行為推斷)和顯式反饋(如點(diǎn)贊/點(diǎn)踩、用戶調(diào)查)都很重要。
  • 與CI/CD集成:將評(píng)估管道嵌入開(kāi)發(fā)工作流,以實(shí)現(xiàn)快速迭代。

6.2企業(yè)級(jí)智能體評(píng)估的特有挑戰(zhàn)

  • 基于角色的訪問(wèn)控制(RBAC):在企業(yè)環(huán)境中,智能體代表用戶行事時(shí)必須遵守其權(quán)限級(jí)別。評(píng)估需要考慮智能體在獲取信息和執(zhí)行操作時(shí)受到的上下文限制。
  • 可解釋性:企業(yè)要求智能體具有可預(yù)測(cè)和可解釋的確定性行為,以符合業(yè)務(wù)流程。由于LLM智能體本質(zhì)上是隨機(jī)的,測(cè)量一致性需要多次執(zhí)行相同任務(wù),這會(huì)帶來(lái)顯著的評(píng)估開(kāi)銷。
  • 合規(guī)性:智能體需要遵守各種法規(guī)和審計(jì)框架,評(píng)估可能需要專有的測(cè)試用例來(lái)反映實(shí)際政策。

7.評(píng)估平臺(tái)推薦

許多平臺(tái)為智能體評(píng)估提供了支持,使得評(píng)估過(guò)程更加高效和可擴(kuò)展:

  • MaximAI:提供端到端平臺(tái),用于智能體模擬、評(píng)估和可觀測(cè)性,包括模擬引擎、評(píng)估套件、可觀測(cè)性和人類介入評(píng)估功能。
  • ArizeAI:提供企業(yè)級(jí)AI工程平臺(tái),具備智能體可觀測(cè)性和追蹤能力,并提供LLM-as-a-Judge模板和代碼評(píng)估方法。
  • LangSmith:作為L(zhǎng)angChain團(tuán)隊(duì)開(kāi)發(fā)的LLM評(píng)估框架,可以追蹤智能體活動(dòng)、創(chuàng)建數(shù)據(jù)集、運(yùn)行實(shí)驗(yàn)和評(píng)估,支持智能體步驟、響應(yīng)和LLM評(píng)估。
  • GoogleVertexAI/GenAIEvaluationService:引入了專門用于智能體評(píng)估的功能,可以評(píng)估智能體的最終輸出和“軌跡”(行動(dòng)序列和工具調(diào)用),并與各種智能體開(kāi)發(fā)工具集成。

行動(dòng)建議

考慮到智能體評(píng)估的復(fù)雜性和多維度性,建議首先識(shí)別當(dāng)前團(tuán)隊(duì)正在開(kāi)發(fā)的智能體的核心業(yè)務(wù)目標(biāo)和關(guān)鍵性能指標(biāo)(KPIs)。明確這些目標(biāo)將有助于選擇最相關(guān)的評(píng)估維度(例如,如果是一個(gè)客戶支持智能體,任務(wù)完成率、響應(yīng)質(zhì)量、延遲和錯(cuò)誤恢復(fù)能力可能最為關(guān)鍵),并指導(dǎo)構(gòu)建初期評(píng)估框架。

本文由 @Mrs.Data 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來(lái)自Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!