","style":"margin-left: 8px; margin-right: 8px;"},"namespaceURI":"http://www.w3.org/1999/xhtml"},"node",{"tagName":"span","attributes":{"style":null},"namespaceURI":"http://www.w3.org/1999/xhtml"},"node",{"tagName":"font","attributes":{"face":"宋體","style":null},"namespaceURI":"http://www.w3.org/1999/xhtml"}]' bdsfid="307">新測(cè)算方法與早期證據(jù)》的報(bào)告(Labor market impacts of AI: A new measure and early evidence)。報(bào)告由經(jīng)濟(jì)學(xué)家 Maxim Massenkoff 和 Peter McCrory 撰寫,基于 Claude 的實(shí)際使用數(shù)據(jù)對(duì)這一問題進(jìn)行分析。報(bào)告的主要內(nèi)容如下:
![]()
關(guān)鍵發(fā)現(xiàn)
·本文提出一項(xiàng)新的人工智能替代風(fēng)險(xiǎn)測(cè)算指標(biāo)—— 實(shí)際暴露度(observed exposure),該指標(biāo)結(jié)合大語(yǔ)言模型理論能力與現(xiàn)實(shí)使用數(shù)據(jù),更側(cè)重自動(dòng)化(而非輔助性)及工作場(chǎng)景下的應(yīng)用。
·人工智能遠(yuǎn)未達(dá)到理論能力上限:實(shí)際應(yīng)用覆蓋范圍僅為理論可行范圍的一小部分。
·美國(guó)勞工統(tǒng)計(jì)局(BLS)預(yù)測(cè),至 2034 年,實(shí)際暴露度越高的職業(yè),就業(yè)增長(zhǎng)越慢。
·高暴露度職業(yè)的從業(yè)者更可能是年齡偏大、女性、受教育程度更高、收入更高的群體。
·自 2022 年末以來(lái),高暴露度從業(yè)者的失業(yè)率并未系統(tǒng)性上升;但有初步證據(jù)顯示,高暴露度職業(yè)對(duì)年輕勞動(dòng)者的招聘有所放緩。
引言
人工智能的快速普及催生了大量測(cè)算與預(yù)測(cè)其對(duì)勞動(dòng)力市場(chǎng)影響的研究。但過往研究的表現(xiàn)提醒我們應(yīng)保持審慎。
例如,一項(xiàng)知名的崗位可離岸外包程度研究曾判定美國(guó)約四分之一的崗位面臨風(fēng)險(xiǎn),而十年后,這些崗位中的大多數(shù)仍保持穩(wěn)健增長(zhǎng)。政府官方的職業(yè)增長(zhǎng)預(yù)測(cè)雖方向正確,但除了對(duì)歷史趨勢(shì)做線性外推外,預(yù)測(cè)價(jià)值有限。即便事后回顧,重大經(jīng)濟(jì)沖擊對(duì)勞動(dòng)力市場(chǎng)的影響往往也不清晰。工業(yè)機(jī)器人對(duì)就業(yè)影響的研究結(jié)論相互矛盾,由對(duì)華貿(mào)易沖擊導(dǎo)致的失業(yè)規(guī)模至今仍存爭(zhēng)議。
本文提出一套理解人工智能對(duì)勞動(dòng)力市場(chǎng)影響的新框架,并利用早期數(shù)據(jù)進(jìn)行檢驗(yàn),目前僅發(fā)現(xiàn)有限證據(jù)表明人工智能已影響就業(yè)。我們的目標(biāo)是建立一套測(cè)算人工智能如何影響就業(yè)的方法,并定期更新分析。該框架無(wú)法覆蓋人工智能重塑勞動(dòng)力市場(chǎng)的所有渠道,但在顯著影響出現(xiàn)前打下基礎(chǔ),有望使未來(lái)研究比事后分析更可靠地識(shí)別經(jīng)濟(jì)沖擊。
人工智能的影響未來(lái)有可能變得明確無(wú)疑。本框架在影響尚不清晰時(shí)最具價(jià)值—— 并有助于在替代效應(yīng)顯現(xiàn)前識(shí)別最脆弱的職業(yè)。
反事實(shí)分析(Counterfactuals)
當(dāng)影響巨大且突然時(shí),因果推斷相對(duì)容易。新冠疫情及相關(guān)政策帶來(lái)的經(jīng)濟(jì)沖擊極為顯著,許多問題無(wú)需復(fù)雜統(tǒng)計(jì)方法即可判斷。例如疫情初期失業(yè)率急劇飆升,幾乎不存在其他解釋空間。
但人工智能的影響可能更接近互聯(lián)網(wǎng)或?qū)θA貿(mào)易,而非新冠疫情。其影響未必能從總體失業(yè)率數(shù)據(jù)中直接看出;貿(mào)易政策、經(jīng)濟(jì)周期等因素可能干擾趨勢(shì)判斷。
一種常用方法是對(duì)比不同人工智能暴露程度的勞動(dòng)者、企業(yè)或行業(yè),以將人工智能的影響與干擾因素分離。暴露度通常基于任務(wù)層面定義:例如人工智能可以批改作業(yè),但無(wú)法管理課堂,因此教師的暴露度低于可完全遠(yuǎn)程完成的崗位。
本文沿用這一基于任務(wù)的方法,結(jié)合理論能力與實(shí)際使用數(shù)據(jù),再匯總至職業(yè)層面。
暴露度測(cè)算
本方法整合三類數(shù)據(jù):
1.O*NET數(shù)據(jù)庫(kù):列明美國(guó)約 800 種職業(yè)的具體工作任務(wù)。
2.本團(tuán)隊(duì)實(shí)際使用數(shù)據(jù)(來(lái)自Anthropic Economic Index)。
3.Eloundou 等人(2023)的任務(wù)層面暴露度評(píng)估:衡量大語(yǔ)言模型理論上能否將某項(xiàng)任務(wù)效率提升至少一倍。
Eloundou 等人的指標(biāo) β 采用簡(jiǎn)單評(píng)分:
僅靠大語(yǔ)言模型即可提速一倍:1 分
需基于大語(yǔ)言模型開發(fā)額外工具:0.5 分
無(wú)法提速:0 分
為何實(shí)際使用低于理論能力?部分理論可行的任務(wù)因模型限制、法律約束、軟件要求、人工審核等障礙尚未落地。例如“授權(quán)續(xù)藥并向藥房提供處方信息” 被評(píng)為完全暴露(β=1),但我們尚未觀察到 Claude 執(zhí)行該任務(wù),盡管理論上確實(shí)可由大語(yǔ)言模型提速。
不過,理論能力與實(shí)際使用高度相關(guān)。如圖 1 所示,前四次經(jīng)濟(jì)指數(shù)報(bào)告中 97% 的觀測(cè)任務(wù)都屬于理論可行類別(β=0.5 或 1.0)。
![]()
新的職業(yè)暴露度指標(biāo):實(shí)際暴露度
本指標(biāo)用于衡量:在大語(yǔ)言模型理論上可提速的任務(wù)中,哪些真正在工作場(chǎng)景中被自動(dòng)化使用。理論能力覆蓋范圍更廣,而實(shí)際暴露度可追蹤二者差距的收窄過程,從而及時(shí)反映經(jīng)濟(jì)變化。
一項(xiàng)職業(yè)暴露度更高,意味著:
·任務(wù)理論上可由人工智能完成
·任務(wù)在 Anthropic 經(jīng)濟(jì)指數(shù)中使用量顯著
·任務(wù)用于工作相關(guān)場(chǎng)景
·自動(dòng)化使用或 API 調(diào)用占比更高
·受人工智能影響的任務(wù)在整體工作中占比更大
具體公式見附錄。我們將滿足理論可行且在 Claude 中存在足夠工作相關(guān)使用量的任務(wù)計(jì)為 “覆蓋”,再根據(jù)使用方式加權(quán):完全自動(dòng)化計(jì)全權(quán)重,輔助性使用計(jì)半權(quán)重,最后按任務(wù)耗時(shí)占比加權(quán)平均至職業(yè)層面。
圖2 展示了觀測(cè)到的暴露情況(紅色,實(shí)際值)與Eloundou 等研究中的β值(藍(lán)色,理論值)的對(duì)比,該圖說明了我們?cè)谄脚_(tái)上理論使用情況與實(shí)際使用情況之間的差異,這些數(shù)據(jù)是按廣泛的職業(yè)類別進(jìn)行分組的。我們通過以下步驟來(lái)計(jì)算這個(gè)數(shù)據(jù):首先按照我們的時(shí)間比例衡量方式按職業(yè)級(jí)別進(jìn)行平均,然后按照總就業(yè)人數(shù)按職業(yè)類別進(jìn)行平均。例如,β指標(biāo)顯示,在計(jì)算機(jī)與數(shù)學(xué)(94%)以及辦公室與行政(90%)等大多數(shù)職業(yè)中,LLM 的應(yīng)用范圍是可行的。
![]()
紅色區(qū)域展示了根據(jù)Anthropic經(jīng)濟(jì)指數(shù)得出的LLM(大型語(yǔ)言模型)使用情況,它反映了人們?cè)诠ぷ鳝h(huán)境中如何使用Claude。該數(shù)據(jù)涵蓋了人工智能在實(shí)際應(yīng)用中的表現(xiàn),表明其遠(yuǎn)未達(dá)到理論上的能力水平。例如,目前Claude僅能覆蓋計(jì)算機(jī)與數(shù)學(xué)類別中33%的任務(wù)。
隨著技術(shù)能力的提升、應(yīng)用范圍的擴(kuò)大以及部署的深入,紅色區(qū)域?qū)?huì)逐漸覆蓋藍(lán)色區(qū)域。但仍有大片未被覆蓋的領(lǐng)域;當(dāng)然,還有很多任務(wù)超出了人工智能的處理能力——從諸如修剪樹木和操作農(nóng)業(yè)機(jī)械這樣的實(shí)際農(nóng)業(yè)工作,到在法庭上代表客戶這樣的法律服務(wù)。
圖3 展示了在該措施下受影響最嚴(yán)重的十種職業(yè)。與其他顯示Claude主要用于編碼的數(shù)據(jù)一致,計(jì)算機(jī)程序員位居榜首,覆蓋率達(dá)75%;其次是客服代表(70.1%),其主要工作在第一方 API 流量中出現(xiàn)的頻率越來(lái)越高;數(shù)據(jù)錄入員的覆蓋率為 67%,他們的主要任務(wù)是閱讀原始文件并輸入數(shù)據(jù),這一任務(wù)的自動(dòng)化程度很高(此外,醫(yī)療記錄專家、市場(chǎng)研究分析師、金融投資分析師也較高)。
![]()
在最底層,有30%的員工完全沒有覆蓋(暴露度最低),因?yàn)樗麄兊墓ぷ鲀?nèi)容在我們的數(shù)據(jù)中出現(xiàn)頻率太低,未能達(dá)到最低標(biāo)準(zhǔn)。這一群體包括廚師、摩托車修理工、救生員、調(diào)酒師、洗碗工和更衣室服務(wù)員等。
暴露度與就業(yè)增長(zhǎng)預(yù)測(cè)及勞動(dòng)者特征的關(guān)系
將美國(guó)勞工統(tǒng)計(jì)局(BLS)2025年發(fā)布的最新一期就業(yè)預(yù)測(cè)報(bào)告(涵蓋2024 -2034年每個(gè)職業(yè)的就業(yè)預(yù)期變化情況)與我們的崗位級(jí)別暴露度指標(biāo)進(jìn)行比較,職位層面的回歸分析表明,那些實(shí)際受關(guān)注度較高的職位的增長(zhǎng)預(yù)測(cè)要稍弱一些。暴露度每升高10個(gè)百分點(diǎn),BLS就業(yè)增長(zhǎng)預(yù)測(cè)就會(huì)下降0.6個(gè)百分點(diǎn)。這在一定程度上證明了我們的衡量標(biāo)準(zhǔn)與獨(dú)立得出的勞動(dòng)力市場(chǎng)分析師的估計(jì)相符,盡管這種關(guān)系較為微弱。但僅使用Eloundou理論指標(biāo)時(shí),則并不存在這樣的相關(guān)性。
![]()
圖5 展示了在ChatGPT發(fā)布前的2022年8至10月期間,處于最高暴露組的工人以及零暴露工人(占比30%)的特征,所使用的數(shù)據(jù)來(lái)自“當(dāng)期人口調(diào)查”(Current Population Survey,以下簡(jiǎn)稱CPS)報(bào)告。這兩組人群差異顯著。暴露程度較高的群體中女性的比例高出16個(gè)百分點(diǎn),白人的比例高出11個(gè)百分點(diǎn),前者的亞裔占比幾乎是后者的兩倍。前者的收入平均高出47%,受教育程度也更高。例如,擁有研究生學(xué)歷的人在未暴露組中所占比例為 4.5%,而在暴露度最高的群體中則占17.4%。
![]()
核心觀測(cè)指標(biāo)
有了這些監(jiān)測(cè)措施,接下來(lái)的問題就是需要關(guān)注哪些方面。研究人員采取了不同的方法。例如,Gimbel 等人(2025年)使用當(dāng)前人口調(diào)查數(shù)據(jù)來(lái)追蹤職業(yè)構(gòu)成的變化。他們的觀點(diǎn)是,任何由人工智能引發(fā)的經(jīng)濟(jì)重大結(jié)構(gòu)調(diào)整都會(huì)體現(xiàn)在工作崗位的分布變化上(他們發(fā)現(xiàn),到目前為止,這些變化并不引人注目);Brynjolfsson等人(2025年)則根據(jù)年齡組對(duì)就業(yè)水平進(jìn)行分析,使用的是來(lái)自薪資處理公司 ADP 的數(shù)據(jù);而阿西莫格魯?shù)热耍?022 年)以及Hampole等人(2025年)則分別使用了來(lái)自Burning Glass(現(xiàn)為L(zhǎng)ightcast)和 Revelio 的招聘帖子數(shù)據(jù)。
我們將失業(yè)問題作為首要關(guān)注事項(xiàng),是因?yàn)樗钪苯拥胤从沉私?jīng)濟(jì)可能受到的損害——失業(yè)的工人渴望找到工作,但尚未找到。在這種情況下,招聘帖子和就業(yè)情況不一定意味著需要采取政策應(yīng)對(duì)措施;例如,某個(gè)高暴露度職位的招聘發(fā)布量下降,可能會(huì)被與之相關(guān)的職位增加所抵消。人工智能對(duì)勞動(dòng)力市場(chǎng)造成的不利影響,多數(shù)情況似乎都應(yīng)包括一段時(shí)期的失業(yè)率上升,因?yàn)槭I(yè)的工人會(huì)尋找其他選擇。“當(dāng)期人口調(diào)查”非常適合用于追蹤這一情況,因?yàn)槭I(yè)的受訪者會(huì)報(bào)告他們之前的職位和行業(yè)。
初步結(jié)果
本文將職業(yè)暴露度與當(dāng)期人口調(diào)查(CPS)匹配,分析失業(yè)率趨勢(shì)。
在解讀我們的覆蓋度指標(biāo)時(shí),一個(gè)關(guān)鍵問題是:哪些勞動(dòng)者應(yīng)被視為受 AI 影響的群體??jī)H僅10%的任務(wù)被AI覆蓋,就應(yīng)該預(yù)期就業(yè)會(huì)發(fā)生變化嗎?
Gans and Goldfarb(2025)的研究表明,如果用O環(huán)模型(Oring model)來(lái)描述工作崗位最為貼切,那么只有當(dāng)所有任務(wù)都在一定程度上被 AI 滲透后,才可能觀察到對(duì)就業(yè)的影響。
Hampole 等人(2025)則認(rèn)為,平均暴露度的上升會(huì)降低勞動(dòng)力需求,但如果 AI 影響僅集中在部分任務(wù)上,則可能抵消這一效應(yīng)。此外,Autor and Thompson(2025)強(qiáng)調(diào)了崗位中未被 AI 替代的任務(wù)所需的專業(yè)技能水平的重要性。
為了保持簡(jiǎn)潔,并考慮到我們最關(guān)注的是大規(guī)模影響,我們的分析圍繞一個(gè)核心思路展開:受沖擊最明顯的,應(yīng)該是平均暴露度最高的群體。我們將按時(shí)間加權(quán)的任務(wù)覆蓋度排名前 1/4 的勞動(dòng)者與排名墊底的勞動(dòng)者進(jìn)行對(duì)比。
如果人工智能能力快速提升,那么即使是排名百分位較低的群體,其任務(wù)覆蓋度也可能處于較高水平,這時(shí)使用絕對(duì)閾值會(huì)更有幫助。但我們依然采用如下假設(shè):沖擊會(huì)最先影響暴露度最高的勞動(dòng)者,并在結(jié)果中展示了不同“受影響組” 劃分閾值下的穩(wěn)健性檢驗(yàn)。
圖 6 的上圖顯示了 2016 年以來(lái)暴露度前 1/4 勞動(dòng)者與零暴露組的失業(yè)率原始趨勢(shì)。在新冠疫情期間,AI 暴露度更低的勞動(dòng)者(更可能從事線下工作)失業(yè)率上升幅度要大得多。自那以后,兩組的趨勢(shì)大體保持一致。
![]()
圖 6 的下圖在雙重差分(DID)框架下衡量了高暴露組與低暴露組之間的差距大小,結(jié)果與原始數(shù)據(jù)一致。自ChatGPT發(fā)布以來(lái),兩組失業(yè)率差距的平均變化微小且不顯著,這表明:高暴露組的失業(yè)率雖略有上升,但效應(yīng)幾乎可以忽略不計(jì)。
這套分析框架能夠識(shí)別出什么樣的情景?根據(jù)合并估計(jì)值的置信區(qū)間,約1個(gè)百分點(diǎn)的失業(yè)率差異增幅是可以被檢測(cè)出來(lái)的(隨著新數(shù)據(jù)的加入,這一數(shù)值會(huì)發(fā)生變化,因此僅為大致估算)。如果暴露度最高的10%勞動(dòng)者全部被裁員,將導(dǎo)致前" bdsfid="1396">1/4 高暴露群體的失業(yè)率從3%上升至43%,并使整體失業(yè)率從4%上升至13%。
另一種規(guī)模較小但仍值得擔(dān)憂的影響,是出現(xiàn)類似“白領(lǐng)大衰退”(Great Recession for white-collar workers)的情景。在2007–2009年金融危機(jī)期間,美國(guó)失業(yè)率從5%翻倍至10%。如果高暴露前" bdsfid="1468">1/4 群體的失業(yè)率也出現(xiàn)類似翻倍,將從3%上升至6%——這在我們的分析中同樣應(yīng)該能被清晰觀測(cè)到。
需要注意的是,我們的核心估計(jì)是基于高暴露組與低暴露組之間失業(yè)率的相對(duì)差異變化。如果所有勞動(dòng)者的失業(yè)率同步上升,我們不會(huì)將其歸因于人工智能技術(shù)的進(jìn)步,因?yàn)槿杂写罅抗ぷ魅蝿?wù)并未受到AI 影響。
有一類群體尤其值得關(guān)注,那就是年輕勞動(dòng)者。Brynjolfsson等人的研究顯示,在22至25 歲的勞動(dòng)者中,高AI暴露度職業(yè)的就業(yè)率下降6%-16%。他們認(rèn)為,這一下降主要源于招聘放緩,而非裁員增加。
我們發(fā)現(xiàn),高暴露度職業(yè)中年輕勞動(dòng)者的失業(yè)率并未上升(見附錄)。但招聘放緩不一定會(huì)表現(xiàn)為失業(yè)率上升,因?yàn)樵S多年輕勞動(dòng)者是首次進(jìn)入勞動(dòng)力市場(chǎng),在CPS數(shù)據(jù)中沒有登記過職業(yè),他們更可能退出勞動(dòng)力市場(chǎng),而非被統(tǒng)計(jì)為失業(yè)人口。
為了直接衡量招聘情況,我們利用CPS的追蹤數(shù)據(jù),統(tǒng)計(jì)不同時(shí)期在高暴露度與低暴露度職業(yè)中開始新工作的年輕勞動(dòng)者(22-25歲)占比。
圖 7 展示了年輕勞動(dòng)者的月度入職率(即受訪者報(bào)告找到一份上月沒有的工作),并按其入職的是高暴露度職業(yè)還是低暴露度職業(yè)進(jìn)行劃分。
![]()
除了2020-2021年期間出現(xiàn)的一些大幅波動(dòng)外,這些數(shù)據(jù)序列在2024 年出現(xiàn)明顯分化:年輕人被高AI暴露度職業(yè)錄用的概率相對(duì)降低。
低暴露度職業(yè)的月度入職率穩(wěn)定在2%,而高暴露度職業(yè)的入職率則下降了約0.5 個(gè)百分點(diǎn)。ChatGPT推出之后,高暴露度職業(yè)的入職率相較 2022 年平均下降了14%,盡管這一結(jié)果僅勉強(qiáng)具備統(tǒng)計(jì)顯著性(25 歲以上勞動(dòng)者未出現(xiàn)此類下降)。
這或許能為AI對(duì)就業(yè)的早期影響提供一些信號(hào),也與Brynjolfsson等人的研究結(jié)論相吻合。不過,這一現(xiàn)象還存在其他幾種解釋:未被錄用的年輕人可能繼續(xù)留在原有崗位、轉(zhuǎn)向其他工作,或是重返校園,并且,工作轉(zhuǎn)換在調(diào)查中更容易出現(xiàn)統(tǒng)計(jì)誤差。*
— THE END —
紫京講談
財(cái)經(jīng)領(lǐng)域創(chuàng)作者
3481篇原創(chuàng)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.