網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

大廠AI內(nèi)卷新姿勢(shì)：Token變成新“PPT”

2026-05-25 11:47:11　來源: 鈦媒體APP

北京舉報(bào)

分享至

文 | 強(qiáng)調(diào)Next

企業(yè)降本增效省下來的錢可能正在被無效的Token燒掉。

據(jù)報(bào)道，微軟開始收縮Claude Code的內(nèi)部授權(quán)。The Verge披露，微軟Experiences + Devices團(tuán)隊(duì)將于6月底關(guān)停大部分第三方Claude Code授權(quán)席位，全面切換至自家GitHub Copilot CLI，核心訴求之一就是緩解AI成本壓力。Uber的情況更為嚴(yán)峻，其CTO Praveen Neppalli Naga公開坦言，公司2026年全年的AI預(yù)算，僅用四個(gè)月就已基本透支。

Meta走的是另一條路，而且方向完全相反。Meta內(nèi)部上線Token消耗排行榜，對(duì)高用量員工授予“Token傳奇”“緩存魔法師”等榮譽(yù)，甚至將用量與考核掛鉤、實(shí)行末位淘汰。這套機(jī)制落地僅30天，Meta全員Token總消耗量從6萬億暴漲至73.7萬億，增幅超12倍，AI消耗徹底失控。

有的公司在踩剎車，有的在踩油門，但面臨的問題是一樣的。行業(yè)至今沒有一套成熟、穩(wěn)定、可落地的AI價(jià)值衡量標(biāo)準(zhǔn)，于是簡單易統(tǒng)計(jì)的Token消耗量，就成了唯一硬性指標(biāo)。

百度CEO李彥宏就在兩周前的大會(huì)上指出，Token好統(tǒng)計(jì)，但不等于實(shí)際產(chǎn)出。

一個(gè)員工跑了更多Agent、塞進(jìn)更長上下文、讓模型反復(fù)試錯(cuò)，賬單會(huì)快速變大，業(yè)務(wù)結(jié)果卻未必同步改善。

01.Token KPI：一場制造浪費(fèi)的考核實(shí)驗(yàn)

以最大化Token消耗為目標(biāo)的工作方式（“Tokenmaxxing”），自去年底開始在硅谷蔓延，現(xiàn)在已傳導(dǎo)至國內(nèi)。阿里、騰訊、字節(jié)等大廠技術(shù)團(tuán)隊(duì)，不同程度地將 Token使用量納入轉(zhuǎn)正和晉升參考。

當(dāng)考核與Token用量深度綁定，職場形式主義迅速向AI工作場景蔓延。據(jù)《財(cái)經(jīng)》報(bào)道，不少員工為達(dá)標(biāo)，刻意讓AI Agent批量讀取上萬行代碼、堆砌數(shù)萬字文獻(xiàn)數(shù)據(jù)，單純靠“堆工作量”刷高Token消耗，并無實(shí)際工作產(chǎn)出。這并非個(gè)例，公開數(shù)據(jù)顯示，全球企業(yè)級(jí)AI應(yīng)用中，近半數(shù)Token消耗都屬于無效浪費(fèi)。

Meta的73.7萬億Token，究竟有多少真正轉(zhuǎn)化成了有效產(chǎn)出？這恰恰是所有 Token KPI制度的核心漏洞。

與硅谷企業(yè)的成本焦慮不同，國內(nèi)頭部大廠正通過高額Token補(bǔ)貼，全力降低員工AI使用門檻。

從不同渠道披露的信息來看，各家企業(yè)福利政策各有側(cè)重：騰訊為核心研發(fā)配了年度22.8萬元的Token專屬套餐，另加每月1000美元外部工具報(bào)銷；字節(jié)對(duì)內(nèi)開放AI工具不限量使用，員工業(yè)余體驗(yàn)AI可報(bào)銷50%，技術(shù)崗上限1000美元/年；百度給技術(shù)崗配文心一言無限量使用權(quán)，外加最高800美元/年的外部Token補(bǔ)貼；360干脆直接給全員充了1億Token。

AI工具已經(jīng)不是一個(gè)辦公軟件插件，而是在變成新的生產(chǎn)資料。過去企業(yè)給員工配電腦、軟件賬號(hào)、云盤和報(bào)銷額度；現(xiàn)在，研發(fā)、設(shè)計(jì)、產(chǎn)品、運(yùn)營都可能需要模型調(diào)用額度。尤其在代碼生成、Agent工作流、視頻生成、知識(shí)檢索這些場景里，Token就是干活的燃料。

問題在于，燃料發(fā)出去了，油耗怎么算，很多公司還沒想清楚。

02.吞金的Agent，算不清的變量賬

Uber的內(nèi)部數(shù)據(jù)，精準(zhǔn)暴露了企業(yè)AI成本失控的核心機(jī)制漏洞。目前其95%的工程師常態(tài)化使用AI編碼工具，單人每月AI調(diào)用成本達(dá)500至2000美元，70%的代碼提交由AI生成，AI Agent每周可完成1800次代碼變更，相關(guān)工作量占比從不足1%攀升至8%。

從業(yè)務(wù)落地視角看，這是AI滲透率的大幅提升，但對(duì)企業(yè)財(cái)務(wù)部門而言，這意味著剛性可控的IT成本體系徹底被打破。

成本失控的根源，在于AI Agent的高消耗特性。Gartner指出，完成同等任務(wù)量，Agent的Token消耗是傳統(tǒng)聊天機(jī)器人的5至30倍。高盛更是預(yù)測，到2030年，全球Token消耗量將達(dá)到每月約120 quadrillion（約12億億），是2026年水平的24倍，驅(qū)動(dòng)力正是企業(yè)端Agent的規(guī)模化部署。

傳統(tǒng)SaaS按席位計(jì)費(fèi)，IT部門可以在采購時(shí)鎖定全年支出上限。

AI工具的成本結(jié)構(gòu)與此根本不兼容。Token賬單隨使用行為動(dòng)態(tài)增長，而財(cái)務(wù)部門缺乏歷史數(shù)據(jù)建立基準(zhǔn)，IT部門沒有成熟工具進(jìn)行實(shí)時(shí)追蹤與成本分?jǐn)偅瑯I(yè)務(wù)部門推廣使用時(shí)也沒有同步建立成本歸因機(jī)制。

不是AI沒用，而是企業(yè)FinOps體系完全沒跟上AI的消費(fèi)速度。于是微軟和Uber緊急踩下剎車。

03.員工在薅羊毛，業(yè)務(wù)在畫餅

國內(nèi)公司的現(xiàn)狀，和硅谷略有不同。硅谷的焦慮在于用量跑得太快、賬單超支；而國內(nèi)大廠更現(xiàn)實(shí)的尷尬是：錢花出去了，員工用得卻不夠深，實(shí)際業(yè)務(wù)價(jià)值看不清。

從C端數(shù)據(jù)來看，國內(nèi)AI應(yīng)用熱度空前高漲。量子位智庫2026年行業(yè)報(bào)告顯示，今年4月國內(nèi)AI應(yīng)用Web端月訪問量突破9億次，APP端月下載量超2.4億、日活達(dá)6.7億，同比增幅223%。QuestMobile數(shù)據(jù)同步印證，截至2026年3月，國內(nèi)AI原生APP月活達(dá)4.4億，豆包、千問、DeepSeek穩(wěn)居行業(yè)前三。

火熱的C端數(shù)據(jù)，并未同步轉(zhuǎn)化為企業(yè)端的生產(chǎn)力增量。

埃森哲《2025中國企業(yè)數(shù)字化轉(zhuǎn)型指數(shù)》數(shù)據(jù)顯示，國內(nèi)46%的企業(yè)已啟動(dòng)AI適配與落地，但僅9%的企業(yè)實(shí)現(xiàn)了顯著的業(yè)務(wù)價(jià)值突破。絕大多數(shù)企業(yè)的AI落地，仍停留在淺層試用、盲目推廣、摸索場景的初級(jí)階段。

內(nèi)容創(chuàng)作、客服問答、代碼輔助等淺層場景，AI落地門檻低、見效快；但在核心研發(fā)、供應(yīng)鏈管理、財(cái)務(wù)風(fēng)控、組織協(xié)同等關(guān)鍵業(yè)務(wù)環(huán)節(jié)，AI落地的適配難度、合規(guī)門檻和落地成本都大幅提升。

大廠全員發(fā)放Token補(bǔ)貼的目的是靠資金讓利降低AI試錯(cuò)成本，強(qiáng)行推動(dòng)全員融入AI工作流。這套打法有一定的合理性：只有足夠的使用密度，才能倒逼企業(yè)篩選出適配業(yè)務(wù)的真實(shí)場景，同時(shí)培養(yǎng)員工的AI使用習(xí)慣。

但問題是，只鼓勵(lì)使用不建立價(jià)值度量，福利就會(huì)變成賬單壓力，同時(shí)衍生出卷“PPT”、卷“文檔”式的偽AI工作方式。

AI對(duì)職場的滲透速度，遠(yuǎn)超預(yù)期。據(jù)Cognizant 2026年報(bào)告測算，美國93%的崗位都將不同程度受到AI沖擊，這一行業(yè)預(yù)判比此前預(yù)估提前了整整6年。

主要崗位AI滲透正在呈現(xiàn)全面爆發(fā)態(tài)勢(shì)。數(shù)據(jù)顯示，2023年管理、金融運(yùn)營、行政支持類崗位的AI暴露度僅14%-21%，如今已飆升至60%-68%；律師崗位AI暴露度從9%躍升至63%，就連CEO崗位的AI理論暴露度也突破60%。報(bào)告同時(shí)強(qiáng)調(diào)，理論滲透不代表實(shí)際替代，責(zé)任問責(zé)、行業(yè)監(jiān)管、人類主觀判斷，仍是制約AI全面落地的核心壁壘。

這意味著，AI會(huì)繼續(xù)進(jìn)入更多崗位，Token消耗也會(huì)從研發(fā)部門擴(kuò)散到更廣的組織層面。企業(yè)真正要面對(duì)的是如何判斷一筆Token花得值不值。

04.擠掉Token泡沫：從“用量崇拜”轉(zhuǎn)向“效率度量”

Token本身不是問題，企業(yè)想要搭建成熟的AI生產(chǎn)力體系，必然需要充足的Token投入作為支撐。行業(yè)亂象的核心癥結(jié)，從來不是“Token用太多”，而是“把Token用量當(dāng)成唯一目標(biāo)”。

Meta的Token排行榜機(jī)制，看似激活了全員AI使用熱情，一定程度上推動(dòng)了員工嘗試新型AI工具，但無法規(guī)避核心漏洞：Token消耗總量，與員工的業(yè)務(wù)產(chǎn)出毫無直接關(guān)聯(lián)。

而微軟、Uber的成本危機(jī)也印證，單純一刀切縮減Token額度，只是治標(biāo)不治本，反而可能誤傷真正高效的AI辦公場景。

李彥宏嘗試給出答案，他提出了DAA的概念：Daily Active Agent，他主張用每日活躍Agent數(shù)量來衡量AI的實(shí)際滲透程度，而不是Token消耗總量。這個(gè)方向不能說沒道理，但具體計(jì)算方式也有待完善，畢竟一個(gè)活躍的Agent也未必真正跑通業(yè)務(wù)流程。

企業(yè)的核心轉(zhuǎn)型方向，是摒棄Token崇拜、建立AI效率思維。

考核研發(fā)AI工作質(zhì)量，重點(diǎn)要看AI代碼的合并通過率、缺陷率、返工率和項(xiàng)目交付周期，而非調(diào)用頻次；

考核客服場景，核心關(guān)注問題一次解決率、人工接管率與用戶滿意度；

營銷內(nèi)容場景，側(cè)重產(chǎn)出效率、轉(zhuǎn)化效果與合規(guī)風(fēng)險(xiǎn)把控；

針對(duì)AI Agent工作流，則需要重點(diǎn)排查無效重試、冗余上下文、不合理模型調(diào)用等浪費(fèi)行為。

這套精細(xì)化的成本與價(jià)值管理體系，核心邏輯是要精準(zhǔn)區(qū)分有效AI調(diào)用與無效資源消耗，斬?cái)嗉兌蚜康睦速M(fèi)行為。

隨著AI深度落地，Token將成為與電費(fèi)、云服務(wù)、人力成本并列的核心生產(chǎn)開支。硅谷企業(yè)正在為盲目擴(kuò)量補(bǔ)課，國內(nèi)企業(yè)正在靠補(bǔ)貼普及AI使用。

從Token到DAA，是從“燒了多少”走向“跑了多少”，算是往前邁了一步。但“值多少”這個(gè)問題，還沒人真正給出答案。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.