網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

AI搶了誰(shuí)的飯碗？Anthropic的研究有五大發(fā)現(xiàn)

2026-03-08 22:59:23　來(lái)源: 紫京講談

北京舉報(bào)

分享至

","style":"margin-left: 8px; margin-right: 8px;"},"namespaceURI":"http://www.w3.org/1999/xhtml"},"node",{"tagName":"span","attributes":{"style":null},"namespaceURI":"http://www.w3.org/1999/xhtml"},"node",{"tagName":"font","attributes":{"face":"宋體","style":null},"namespaceURI":"http://www.w3.org/1999/xhtml"}]' bdsfid="307">新測(cè)算方法與早期證據(jù)》的報(bào)告（Labor market impacts of AI: A new measure and early evidence）。報(bào)告由經(jīng)濟(jì)學(xué)家 Maxim Massenkoff 和 Peter McCrory 撰寫，基于 Claude 的實(shí)際使用數(shù)據(jù)對(duì)這一問題進(jìn)行分析。報(bào)告的主要內(nèi)容如下：

關(guān)鍵發(fā)現(xiàn)

·本文提出一項(xiàng)新的人工智能替代風(fēng)險(xiǎn)測(cè)算指標(biāo)—— 實(shí)際暴露度（observed exposure），該指標(biāo)結(jié)合大語(yǔ)言模型理論能力與現(xiàn)實(shí)使用數(shù)據(jù)，更側(cè)重自動(dòng)化（而非輔助性）及工作場(chǎng)景下的應(yīng)用。

·人工智能遠(yuǎn)未達(dá)到理論能力上限：實(shí)際應(yīng)用覆蓋范圍僅為理論可行范圍的一小部分。

·美國(guó)勞工統(tǒng)計(jì)局（BLS）預(yù)測(cè)，至 2034 年，實(shí)際暴露度越高的職業(yè)，就業(yè)增長(zhǎng)越慢。

·高暴露度職業(yè)的從業(yè)者更可能是年齡偏大、女性、受教育程度更高、收入更高的群體。

·自 2022 年末以來(lái)，高暴露度從業(yè)者的失業(yè)率并未系統(tǒng)性上升；但有初步證據(jù)顯示，高暴露度職業(yè)對(duì)年輕勞動(dòng)者的招聘有所放緩。

引言

人工智能的快速普及催生了大量測(cè)算與預(yù)測(cè)其對(duì)勞動(dòng)力市場(chǎng)影響的研究。但過往研究的表現(xiàn)提醒我們應(yīng)保持審慎。

例如，一項(xiàng)知名的崗位可離岸外包程度研究曾判定美國(guó)約四分之一的崗位面臨風(fēng)險(xiǎn)，而十年后，這些崗位中的大多數(shù)仍保持穩(wěn)健增長(zhǎng)。政府官方的職業(yè)增長(zhǎng)預(yù)測(cè)雖方向正確，但除了對(duì)歷史趨勢(shì)做線性外推外，預(yù)測(cè)價(jià)值有限。即便事后回顧，重大經(jīng)濟(jì)沖擊對(duì)勞動(dòng)力市場(chǎng)的影響往往也不清晰。工業(yè)機(jī)器人對(duì)就業(yè)影響的研究結(jié)論相互矛盾，由對(duì)華貿(mào)易沖擊導(dǎo)致的失業(yè)規(guī)模至今仍存爭(zhēng)議。

本文提出一套理解人工智能對(duì)勞動(dòng)力市場(chǎng)影響的新框架，并利用早期數(shù)據(jù)進(jìn)行檢驗(yàn)，目前僅發(fā)現(xiàn)有限證據(jù)表明人工智能已影響就業(yè)。我們的目標(biāo)是建立一套測(cè)算人工智能如何影響就業(yè)的方法，并定期更新分析。該框架無(wú)法覆蓋人工智能重塑勞動(dòng)力市場(chǎng)的所有渠道，但在顯著影響出現(xiàn)前打下基礎(chǔ)，有望使未來(lái)研究比事后分析更可靠地識(shí)別經(jīng)濟(jì)沖擊。

人工智能的影響未來(lái)有可能變得明確無(wú)疑。本框架在影響尚不清晰時(shí)最具價(jià)值—— 并有助于在替代效應(yīng)顯現(xiàn)前識(shí)別最脆弱的職業(yè)。

反事實(shí)分析（Counterfactuals）

當(dāng)影響巨大且突然時(shí)，因果推斷相對(duì)容易。新冠疫情及相關(guān)政策帶來(lái)的經(jīng)濟(jì)沖擊極為顯著，許多問題無(wú)需復(fù)雜統(tǒng)計(jì)方法即可判斷。例如疫情初期失業(yè)率急劇飆升，幾乎不存在其他解釋空間。

但人工智能的影響可能更接近互聯(lián)網(wǎng)或?qū)θA貿(mào)易，而非新冠疫情。其影響未必能從總體失業(yè)率數(shù)據(jù)中直接看出；貿(mào)易政策、經(jīng)濟(jì)周期等因素可能干擾趨勢(shì)判斷。

一種常用方法是對(duì)比不同人工智能暴露程度的勞動(dòng)者、企業(yè)或行業(yè)，以將人工智能的影響與干擾因素分離。暴露度通常基于任務(wù)層面定義：例如人工智能可以批改作業(yè)，但無(wú)法管理課堂，因此教師的暴露度低于可完全遠(yuǎn)程完成的崗位。

本文沿用這一基于任務(wù)的方法，結(jié)合理論能力與實(shí)際使用數(shù)據(jù)，再匯總至職業(yè)層面。

暴露度測(cè)算

本方法整合三類數(shù)據(jù)：

1.O*NET數(shù)據(jù)庫(kù)：列明美國(guó)約 800 種職業(yè)的具體工作任務(wù)。

2.本團(tuán)隊(duì)實(shí)際使用數(shù)據(jù)（來(lái)自Anthropic Economic Index）。

3.Eloundou 等人（2023）的任務(wù)層面暴露度評(píng)估：衡量大語(yǔ)言模型理論上能否將某項(xiàng)任務(wù)效率提升至少一倍。

Eloundou 等人的指標(biāo) β 采用簡(jiǎn)單評(píng)分：

僅靠大語(yǔ)言模型即可提速一倍：1 分

需基于大語(yǔ)言模型開發(fā)額外工具：0.5 分

無(wú)法提速：0 分

為何實(shí)際使用低于理論能力？部分理論可行的任務(wù)因模型限制、法律約束、軟件要求、人工審核等障礙尚未落地。例如“授權(quán)續(xù)藥并向藥房提供處方信息” 被評(píng)為完全暴露（β=1），但我們尚未觀察到 Claude 執(zhí)行該任務(wù)，盡管理論上確實(shí)可由大語(yǔ)言模型提速。

不過，理論能力與實(shí)際使用高度相關(guān)。如圖 1 所示，前四次經(jīng)濟(jì)指數(shù)報(bào)告中 97% 的觀測(cè)任務(wù)都屬于理論可行類別（β=0.5 或 1.0）。

新的職業(yè)暴露度指標(biāo)：實(shí)際暴露度

本指標(biāo)用于衡量：在大語(yǔ)言模型理論上可提速的任務(wù)中，哪些真正在工作場(chǎng)景中被自動(dòng)化使用。理論能力覆蓋范圍更廣，而實(shí)際暴露度可追蹤二者差距的收窄過程，從而及時(shí)反映經(jīng)濟(jì)變化。

一項(xiàng)職業(yè)暴露度更高，意味著：

·任務(wù)理論上可由人工智能完成

·任務(wù)在 Anthropic 經(jīng)濟(jì)指數(shù)中使用量顯著

·任務(wù)用于工作相關(guān)場(chǎng)景

·自動(dòng)化使用或 API 調(diào)用占比更高

·受人工智能影響的任務(wù)在整體工作中占比更大

具體公式見附錄。我們將滿足理論可行且在 Claude 中存在足夠工作相關(guān)使用量的任務(wù)計(jì)為 “覆蓋”，再根據(jù)使用方式加權(quán)：完全自動(dòng)化計(jì)全權(quán)重，輔助性使用計(jì)半權(quán)重，最后按任務(wù)耗時(shí)占比加權(quán)平均至職業(yè)層面。

圖2 展示了觀測(cè)到的暴露情況（紅色，實(shí)際值）與Eloundou 等研究中的β值（藍(lán)色，理論值）的對(duì)比，該圖說明了我們?cè)谄脚_(tái)上理論使用情況與實(shí)際使用情況之間的差異，這些數(shù)據(jù)是按廣泛的職業(yè)類別進(jìn)行分組的。我們通過以下步驟來(lái)計(jì)算這個(gè)數(shù)據(jù)：首先按照我們的時(shí)間比例衡量方式按職業(yè)級(jí)別進(jìn)行平均，然后按照總就業(yè)人數(shù)按職業(yè)類別進(jìn)行平均。例如，β指標(biāo)顯示，在計(jì)算機(jī)與數(shù)學(xué)（94%）以及辦公室與行政（90%）等大多數(shù)職業(yè)中，LLM 的應(yīng)用范圍是可行的。

紅色區(qū)域展示了根據(jù)Anthropic經(jīng)濟(jì)指數(shù)得出的LLM（大型語(yǔ)言模型）使用情況，它反映了人們?cè)诠ぷ鳝h(huán)境中如何使用Claude。該數(shù)據(jù)涵蓋了人工智能在實(shí)際應(yīng)用中的表現(xiàn)，表明其遠(yuǎn)未達(dá)到理論上的能力水平。例如，目前Claude僅能覆蓋計(jì)算機(jī)與數(shù)學(xué)類別中33%的任務(wù)。

隨著技術(shù)能力的提升、應(yīng)用范圍的擴(kuò)大以及部署的深入，紅色區(qū)域?qū)?huì)逐漸覆蓋藍(lán)色區(qū)域。但仍有大片未被覆蓋的領(lǐng)域；當(dāng)然，還有很多任務(wù)超出了人工智能的處理能力——從諸如修剪樹木和操作農(nóng)業(yè)機(jī)械這樣的實(shí)際農(nóng)業(yè)工作，到在法庭上代表客戶這樣的法律服務(wù)。

圖3 展示了在該措施下受影響最嚴(yán)重的十種職業(yè)。與其他顯示Claude主要用于編碼的數(shù)據(jù)一致，計(jì)算機(jī)程序員位居榜首，覆蓋率達(dá)75%；其次是客服代表（70.1%），其主要工作在第一方 API 流量中出現(xiàn)的頻率越來(lái)越高；數(shù)據(jù)錄入員的覆蓋率為 67%，他們的主要任務(wù)是閱讀原始文件并輸入數(shù)據(jù)，這一任務(wù)的自動(dòng)化程度很高（此外，醫(yī)療記錄專家、市場(chǎng)研究分析師、金融投資分析師也較高）。

在最底層，有30%的員工完全沒有覆蓋（暴露度最低），因?yàn)樗麄兊墓ぷ鲀?nèi)容在我們的數(shù)據(jù)中出現(xiàn)頻率太低，未能達(dá)到最低標(biāo)準(zhǔn)。這一群體包括廚師、摩托車修理工、救生員、調(diào)酒師、洗碗工和更衣室服務(wù)員等。

暴露度與就業(yè)增長(zhǎng)預(yù)測(cè)及勞動(dòng)者特征的關(guān)系

將美國(guó)勞工統(tǒng)計(jì)局（BLS）2025年發(fā)布的最新一期就業(yè)預(yù)測(cè)報(bào)告（涵蓋2024 -2034年每個(gè)職業(yè)的就業(yè)預(yù)期變化情況）與我們的崗位級(jí)別暴露度指標(biāo)進(jìn)行比較，職位層面的回歸分析表明，那些實(shí)際受關(guān)注度較高的職位的增長(zhǎng)預(yù)測(cè)要稍弱一些。暴露度每升高10個(gè)百分點(diǎn)，BLS就業(yè)增長(zhǎng)預(yù)測(cè)就會(huì)下降0.6個(gè)百分點(diǎn)。這在一定程度上證明了我們的衡量標(biāo)準(zhǔn)與獨(dú)立得出的勞動(dòng)力市場(chǎng)分析師的估計(jì)相符，盡管這種關(guān)系較為微弱。但僅使用Eloundou理論指標(biāo)時(shí)，則并不存在這樣的相關(guān)性。

圖5 展示了在ChatGPT發(fā)布前的2022年8至10月期間，處于最高暴露組的工人以及零暴露工人（占比30%）的特征，所使用的數(shù)據(jù)來(lái)自“當(dāng)期人口調(diào)查”（Current Population Survey，以下簡(jiǎn)稱CPS）報(bào)告。這兩組人群差異顯著。暴露程度較高的群體中女性的比例高出16個(gè)百分點(diǎn)，白人的比例高出11個(gè)百分點(diǎn)，前者的亞裔占比幾乎是后者的兩倍。前者的收入平均高出47%，受教育程度也更高。例如，擁有研究生學(xué)歷的人在未暴露組中所占比例為 4.5%，而在暴露度最高的群體中則占17.4%。

核心觀測(cè)指標(biāo)

有了這些監(jiān)測(cè)措施，接下來(lái)的問題就是需要關(guān)注哪些方面。研究人員采取了不同的方法。例如，Gimbel 等人（2025年）使用當(dāng)前人口調(diào)查數(shù)據(jù)來(lái)追蹤職業(yè)構(gòu)成的變化。他們的觀點(diǎn)是，任何由人工智能引發(fā)的經(jīng)濟(jì)重大結(jié)構(gòu)調(diào)整都會(huì)體現(xiàn)在工作崗位的分布變化上（他們發(fā)現(xiàn)，到目前為止，這些變化并不引人注目）；Brynjolfsson等人（2025年）則根據(jù)年齡組對(duì)就業(yè)水平進(jìn)行分析，使用的是來(lái)自薪資處理公司 ADP 的數(shù)據(jù)；而阿西莫格魯?shù)热耍?022 年）以及Hampole等人（2025年）則分別使用了來(lái)自Burning Glass（現(xiàn)為L(zhǎng)ightcast）和 Revelio 的招聘帖子數(shù)據(jù)。

我們將失業(yè)問題作為首要關(guān)注事項(xiàng)，是因?yàn)樗钪苯拥胤从沉私?jīng)濟(jì)可能受到的損害——失業(yè)的工人渴望找到工作，但尚未找到。在這種情況下，招聘帖子和就業(yè)情況不一定意味著需要采取政策應(yīng)對(duì)措施；例如，某個(gè)高暴露度職位的招聘發(fā)布量下降，可能會(huì)被與之相關(guān)的職位增加所抵消。人工智能對(duì)勞動(dòng)力市場(chǎng)造成的不利影響，多數(shù)情況似乎都應(yīng)包括一段時(shí)期的失業(yè)率上升，因?yàn)槭I(yè)的工人會(huì)尋找其他選擇。“當(dāng)期人口調(diào)查”非常適合用于追蹤這一情況，因?yàn)槭I(yè)的受訪者會(huì)報(bào)告他們之前的職位和行業(yè)。

初步結(jié)果

本文將職業(yè)暴露度與當(dāng)期人口調(diào)查（CPS）匹配，分析失業(yè)率趨勢(shì)。

在解讀我們的覆蓋度指標(biāo)時(shí)，一個(gè)關(guān)鍵問題是：哪些勞動(dòng)者應(yīng)被視為受 AI 影響的群體？?jī)H僅10%的任務(wù)被AI覆蓋，就應(yīng)該預(yù)期就業(yè)會(huì)發(fā)生變化嗎？

Gans and Goldfarb（2025）的研究表明，如果用O環(huán)模型（Oring model）來(lái)描述工作崗位最為貼切，那么只有當(dāng)所有任務(wù)都在一定程度上被 AI 滲透后，才可能觀察到對(duì)就業(yè)的影響。

Hampole 等人（2025）則認(rèn)為，平均暴露度的上升會(huì)降低勞動(dòng)力需求，但如果 AI 影響僅集中在部分任務(wù)上，則可能抵消這一效應(yīng)。此外，Autor and Thompson（2025）強(qiáng)調(diào)了崗位中未被 AI 替代的任務(wù)所需的專業(yè)技能水平的重要性。

為了保持簡(jiǎn)潔，并考慮到我們最關(guān)注的是大規(guī)模影響，我們的分析圍繞一個(gè)核心思路展開：受沖擊最明顯的，應(yīng)該是平均暴露度最高的群體。我們將按時(shí)間加權(quán)的任務(wù)覆蓋度排名前 1/4 的勞動(dòng)者與排名墊底的勞動(dòng)者進(jìn)行對(duì)比。

如果人工智能能力快速提升，那么即使是排名百分位較低的群體，其任務(wù)覆蓋度也可能處于較高水平，這時(shí)使用絕對(duì)閾值會(huì)更有幫助。但我們依然采用如下假設(shè)：沖擊會(huì)最先影響暴露度最高的勞動(dòng)者，并在結(jié)果中展示了不同“受影響組” 劃分閾值下的穩(wěn)健性檢驗(yàn)。

圖 6 的上圖顯示了 2016 年以來(lái)暴露度前 1/4 勞動(dòng)者與零暴露組的失業(yè)率原始趨勢(shì)。在新冠疫情期間，AI 暴露度更低的勞動(dòng)者（更可能從事線下工作）失業(yè)率上升幅度要大得多。自那以后，兩組的趨勢(shì)大體保持一致。

圖 6 的下圖在雙重差分（DID）框架下衡量了高暴露組與低暴露組之間的差距大小，結(jié)果與原始數(shù)據(jù)一致。自ChatGPT發(fā)布以來(lái)，兩組失業(yè)率差距的平均變化微小且不顯著，這表明：高暴露組的失業(yè)率雖略有上升，但效應(yīng)幾乎可以忽略不計(jì)。

這套分析框架能夠識(shí)別出什么樣的情景？根據(jù)合并估計(jì)值的置信區(qū)間，約1個(gè)百分點(diǎn)的失業(yè)率差異增幅是可以被檢測(cè)出來(lái)的（隨著新數(shù)據(jù)的加入，這一數(shù)值會(huì)發(fā)生變化，因此僅為大致估算）。如果暴露度最高的10%勞動(dòng)者全部被裁員，將導(dǎo)致前" bdsfid="1396">1/4 高暴露群體的失業(yè)率從3%上升至43%，并使整體失業(yè)率從4%上升至13%。

另一種規(guī)模較小但仍值得擔(dān)憂的影響，是出現(xiàn)類似“白領(lǐng)大衰退”（Great Recession for white-collar workers）的情景。在2007–2009年金融危機(jī)期間，美國(guó)失業(yè)率從5%翻倍至10%。如果高暴露前" bdsfid="1468">1/4 群體的失業(yè)率也出現(xiàn)類似翻倍，將從3%上升至6%——這在我們的分析中同樣應(yīng)該能被清晰觀測(cè)到。

需要注意的是，我們的核心估計(jì)是基于高暴露組與低暴露組之間失業(yè)率的相對(duì)差異變化。如果所有勞動(dòng)者的失業(yè)率同步上升，我們不會(huì)將其歸因于人工智能技術(shù)的進(jìn)步，因?yàn)槿杂写罅抗ぷ魅蝿?wù)并未受到AI 影響。

有一類群體尤其值得關(guān)注，那就是年輕勞動(dòng)者。Brynjolfsson等人的研究顯示，在22至25 歲的勞動(dòng)者中，高AI暴露度職業(yè)的就業(yè)率下降6%-16%。他們認(rèn)為，這一下降主要源于招聘放緩，而非裁員增加。

我們發(fā)現(xiàn)，高暴露度職業(yè)中年輕勞動(dòng)者的失業(yè)率并未上升（見附錄）。但招聘放緩不一定會(huì)表現(xiàn)為失業(yè)率上升，因?yàn)樵S多年輕勞動(dòng)者是首次進(jìn)入勞動(dòng)力市場(chǎng)，在CPS數(shù)據(jù)中沒有登記過職業(yè)，他們更可能退出勞動(dòng)力市場(chǎng)，而非被統(tǒng)計(jì)為失業(yè)人口。

為了直接衡量招聘情況，我們利用CPS的追蹤數(shù)據(jù)，統(tǒng)計(jì)不同時(shí)期在高暴露度與低暴露度職業(yè)中開始新工作的年輕勞動(dòng)者（22-25歲）占比。

圖 7 展示了年輕勞動(dòng)者的月度入職率（即受訪者報(bào)告找到一份上月沒有的工作），并按其入職的是高暴露度職業(yè)還是低暴露度職業(yè)進(jìn)行劃分。

除了2020-2021年期間出現(xiàn)的一些大幅波動(dòng)外，這些數(shù)據(jù)序列在2024 年出現(xiàn)明顯分化：年輕人被高AI暴露度職業(yè)錄用的概率相對(duì)降低。

低暴露度職業(yè)的月度入職率穩(wěn)定在2%，而高暴露度職業(yè)的入職率則下降了約0.5 個(gè)百分點(diǎn)。ChatGPT推出之后，高暴露度職業(yè)的入職率相較 2022 年平均下降了14%，盡管這一結(jié)果僅勉強(qiáng)具備統(tǒng)計(jì)顯著性（25 歲以上勞動(dòng)者未出現(xiàn)此類下降）。

這或許能為AI對(duì)就業(yè)的早期影響提供一些信號(hào)，也與Brynjolfsson等人的研究結(jié)論相吻合。不過，這一現(xiàn)象還存在其他幾種解釋：未被錄用的年輕人可能繼續(xù)留在原有崗位、轉(zhuǎn)向其他工作，或是重返校園，并且，工作轉(zhuǎn)換在調(diào)查中更容易出現(xiàn)統(tǒng)計(jì)誤差。*

— THE END —

紫京講談

財(cái)經(jīng)領(lǐng)域創(chuàng)作者

3481篇原創(chuàng)

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.