文 | 強(qiáng)調(diào)Next
企業(yè)降本增效省下來的錢可能正在被無效的Token燒掉。
據(jù)報(bào)道,微軟開始收縮Claude Code的內(nèi)部授權(quán)。The Verge披露,微軟Experiences + Devices團(tuán)隊(duì)將于6月底關(guān)停大部分第三方Claude Code授權(quán)席位,全面切換至自家GitHub Copilot CLI,核心訴求之一就是緩解AI成本壓力。Uber的情況更為嚴(yán)峻,其CTO Praveen Neppalli Naga公開坦言,公司2026年全年的AI預(yù)算,僅用四個(gè)月就已基本透支。
Meta走的是另一條路,而且方向完全相反。Meta內(nèi)部上線Token消耗排行榜,對(duì)高用量員工授予“Token傳奇”“緩存魔法師”等榮譽(yù),甚至將用量與考核掛鉤、實(shí)行末位淘汰。這套機(jī)制落地僅30天,Meta全員Token總消耗量從6萬億暴漲至73.7萬億,增幅超12倍,AI消耗徹底失控。
![]()
有的公司在踩剎車,有的在踩油門,但面臨的問題是一樣的。行業(yè)至今沒有一套成熟、穩(wěn)定、可落地的AI價(jià)值衡量標(biāo)準(zhǔn),于是簡單易統(tǒng)計(jì)的Token消耗量,就成了唯一硬性指標(biāo)。
百度CEO李彥宏就在兩周前的大會(huì)上指出,Token好統(tǒng)計(jì),但不等于實(shí)際產(chǎn)出。
一個(gè)員工跑了更多Agent、塞進(jìn)更長上下文、讓模型反復(fù)試錯(cuò),賬單會(huì)快速變大,業(yè)務(wù)結(jié)果卻未必同步改善。
01.Token KPI:一場制造浪費(fèi)的考核實(shí)驗(yàn)
以最大化Token消耗為目標(biāo)的工作方式(“Tokenmaxxing”),自去年底開始在硅谷蔓延,現(xiàn)在已傳導(dǎo)至國內(nèi)。阿里、騰訊、字節(jié)等大廠技術(shù)團(tuán)隊(duì),不同程度地將 Token使用量納入轉(zhuǎn)正和晉升參考。
當(dāng)考核與Token用量深度綁定,職場形式主義迅速向AI工作場景蔓延。據(jù)《財(cái)經(jīng)》報(bào)道,不少員工為達(dá)標(biāo),刻意讓AI Agent批量讀取上萬行代碼、堆砌數(shù)萬字文獻(xiàn)數(shù)據(jù),單純靠“堆工作量”刷高Token消耗,并無實(shí)際工作產(chǎn)出。這并非個(gè)例,公開數(shù)據(jù)顯示,全球企業(yè)級(jí)AI應(yīng)用中,近半數(shù)Token消耗都屬于無效浪費(fèi)。
Meta的73.7萬億Token,究竟有多少真正轉(zhuǎn)化成了有效產(chǎn)出?這恰恰是所有 Token KPI制度的核心漏洞。
與硅谷企業(yè)的成本焦慮不同,國內(nèi)頭部大廠正通過高額Token補(bǔ)貼,全力降低員工AI使用門檻。
從不同渠道披露的信息來看,各家企業(yè)福利政策各有側(cè)重:騰訊為核心研發(fā)配了年度22.8萬元的Token專屬套餐,另加每月1000美元外部工具報(bào)銷;字節(jié)對(duì)內(nèi)開放AI工具不限量使用,員工業(yè)余體驗(yàn)AI可報(bào)銷50%,技術(shù)崗上限1000美元/年;百度給技術(shù)崗配文心一言無限量使用權(quán),外加最高800美元/年的外部Token補(bǔ)貼;360干脆直接給全員充了1億Token。
![]()
AI工具已經(jīng)不是一個(gè)辦公軟件插件,而是在變成新的生產(chǎn)資料。過去企業(yè)給員工配電腦、軟件賬號(hào)、云盤和報(bào)銷額度;現(xiàn)在,研發(fā)、設(shè)計(jì)、產(chǎn)品、運(yùn)營都可能需要模型調(diào)用額度。尤其在代碼生成、Agent工作流、視頻生成、知識(shí)檢索這些場景里,Token就是干活的燃料。
問題在于,燃料發(fā)出去了,油耗怎么算,很多公司還沒想清楚。
02.吞金的Agent,算不清的變量賬
Uber的內(nèi)部數(shù)據(jù),精準(zhǔn)暴露了企業(yè)AI成本失控的核心機(jī)制漏洞。目前其95%的工程師常態(tài)化使用AI編碼工具,單人每月AI調(diào)用成本達(dá)500至2000美元,70%的代碼提交由AI生成,AI Agent每周可完成1800次代碼變更,相關(guān)工作量占比從不足1%攀升至8%。
從業(yè)務(wù)落地視角看,這是AI滲透率的大幅提升,但對(duì)企業(yè)財(cái)務(wù)部門而言,這意味著剛性可控的IT成本體系徹底被打破。
成本失控的根源,在于AI Agent的高消耗特性。Gartner指出,完成同等任務(wù)量,Agent的Token消耗是傳統(tǒng)聊天機(jī)器人的5至30倍。高盛更是預(yù)測,到2030年,全球Token消耗量將達(dá)到每月約120 quadrillion(約12億億),是2026年水平的24倍,驅(qū)動(dòng)力正是企業(yè)端Agent的規(guī)模化部署。
![]()
傳統(tǒng)SaaS按席位計(jì)費(fèi),IT部門可以在采購時(shí)鎖定全年支出上限。
AI工具的成本結(jié)構(gòu)與此根本不兼容。Token賬單隨使用行為動(dòng)態(tài)增長,而財(cái)務(wù)部門缺乏歷史數(shù)據(jù)建立基準(zhǔn),IT部門沒有成熟工具進(jìn)行實(shí)時(shí)追蹤與成本分?jǐn)偅瑯I(yè)務(wù)部門推廣使用時(shí)也沒有同步建立成本歸因機(jī)制。
不是AI沒用,而是企業(yè)FinOps體系完全沒跟上AI的消費(fèi)速度。于是微軟和Uber緊急踩下剎車。
03.員工在薅羊毛,業(yè)務(wù)在畫餅
國內(nèi)公司的現(xiàn)狀,和硅谷略有不同。硅谷的焦慮在于用量跑得太快、賬單超支;而國內(nèi)大廠更現(xiàn)實(shí)的尷尬是:錢花出去了,員工用得卻不夠深,實(shí)際業(yè)務(wù)價(jià)值看不清。
從C端數(shù)據(jù)來看,國內(nèi)AI應(yīng)用熱度空前高漲。量子位智庫2026年行業(yè)報(bào)告顯示,今年4月國內(nèi)AI應(yīng)用Web端月訪問量突破9億次,APP端月下載量超2.4億、日活達(dá)6.7億,同比增幅223%。QuestMobile數(shù)據(jù)同步印證,截至2026年3月,國內(nèi)AI原生APP月活達(dá)4.4億,豆包、千問、DeepSeek穩(wěn)居行業(yè)前三。
火熱的C端數(shù)據(jù),并未同步轉(zhuǎn)化為企業(yè)端的生產(chǎn)力增量。
埃森哲《2025中國企業(yè)數(shù)字化轉(zhuǎn)型指數(shù)》數(shù)據(jù)顯示,國內(nèi)46%的企業(yè)已啟動(dòng)AI適配與落地,但僅9%的企業(yè)實(shí)現(xiàn)了顯著的業(yè)務(wù)價(jià)值突破。絕大多數(shù)企業(yè)的AI落地,仍停留在淺層試用、盲目推廣、摸索場景的初級(jí)階段。
內(nèi)容創(chuàng)作、客服問答、代碼輔助等淺層場景,AI落地門檻低、見效快;但在核心研發(fā)、供應(yīng)鏈管理、財(cái)務(wù)風(fēng)控、組織協(xié)同等關(guān)鍵業(yè)務(wù)環(huán)節(jié),AI落地的適配難度、合規(guī)門檻和落地成本都大幅提升。
大廠全員發(fā)放Token補(bǔ)貼的目的是靠資金讓利降低AI試錯(cuò)成本,強(qiáng)行推動(dòng)全員融入AI工作流。這套打法有一定的合理性:只有足夠的使用密度,才能倒逼企業(yè)篩選出適配業(yè)務(wù)的真實(shí)場景,同時(shí)培養(yǎng)員工的AI使用習(xí)慣。
但問題是,只鼓勵(lì)使用不建立價(jià)值度量,福利就會(huì)變成賬單壓力,同時(shí)衍生出卷“PPT”、卷“文檔”式的偽AI工作方式。
AI對(duì)職場的滲透速度,遠(yuǎn)超預(yù)期。據(jù)Cognizant 2026年報(bào)告測算,美國93%的崗位都將不同程度受到AI沖擊,這一行業(yè)預(yù)判比此前預(yù)估提前了整整6年。
主要崗位AI滲透正在呈現(xiàn)全面爆發(fā)態(tài)勢(shì)。數(shù)據(jù)顯示,2023年管理、金融運(yùn)營、行政支持類崗位的AI暴露度僅14%-21%,如今已飆升至60%-68%;律師崗位AI暴露度從9%躍升至63%,就連CEO崗位的AI理論暴露度也突破60%。報(bào)告同時(shí)強(qiáng)調(diào),理論滲透不代表實(shí)際替代,責(zé)任問責(zé)、行業(yè)監(jiān)管、人類主觀判斷,仍是制約AI全面落地的核心壁壘。
![]()
這意味著,AI會(huì)繼續(xù)進(jìn)入更多崗位,Token消耗也會(huì)從研發(fā)部門擴(kuò)散到更廣的組織層面。企業(yè)真正要面對(duì)的是如何判斷一筆Token花得值不值。
04.擠掉Token泡沫:從“用量崇拜”轉(zhuǎn)向“效率度量”
Token本身不是問題,企業(yè)想要搭建成熟的AI生產(chǎn)力體系,必然需要充足的Token投入作為支撐。行業(yè)亂象的核心癥結(jié),從來不是“Token用太多”,而是“把Token用量當(dāng)成唯一目標(biāo)”。
Meta的Token排行榜機(jī)制,看似激活了全員AI使用熱情,一定程度上推動(dòng)了員工嘗試新型AI工具,但無法規(guī)避核心漏洞:Token消耗總量,與員工的業(yè)務(wù)產(chǎn)出毫無直接關(guān)聯(lián)。
而微軟、Uber的成本危機(jī)也印證,單純一刀切縮減Token額度,只是治標(biāo)不治本,反而可能誤傷真正高效的AI辦公場景。
李彥宏嘗試給出答案,他提出了DAA的概念:Daily Active Agent,他主張用每日活躍Agent數(shù)量來衡量AI的實(shí)際滲透程度,而不是Token消耗總量。這個(gè)方向不能說沒道理,但具體計(jì)算方式也有待完善,畢竟一個(gè)活躍的Agent也未必真正跑通業(yè)務(wù)流程。
企業(yè)的核心轉(zhuǎn)型方向,是摒棄Token崇拜、建立AI效率思維。
考核研發(fā)AI工作質(zhì)量,重點(diǎn)要看AI代碼的合并通過率、缺陷率、返工率和項(xiàng)目交付周期,而非調(diào)用頻次;
考核客服場景,核心關(guān)注問題一次解決率、人工接管率與用戶滿意度;
營銷內(nèi)容場景,側(cè)重產(chǎn)出效率、轉(zhuǎn)化效果與合規(guī)風(fēng)險(xiǎn)把控;
針對(duì)AI Agent工作流,則需要重點(diǎn)排查無效重試、冗余上下文、不合理模型調(diào)用等浪費(fèi)行為。
這套精細(xì)化的成本與價(jià)值管理體系,核心邏輯是要精準(zhǔn)區(qū)分有效AI調(diào)用與無效資源消耗,斬?cái)嗉兌蚜康睦速M(fèi)行為。
隨著AI深度落地,Token將成為與電費(fèi)、云服務(wù)、人力成本并列的核心生產(chǎn)開支。硅谷企業(yè)正在為盲目擴(kuò)量補(bǔ)課,國內(nèi)企業(yè)正在靠補(bǔ)貼普及AI使用。
從Token到DAA,是從“燒了多少”走向“跑了多少”,算是往前邁了一步。但“值多少”這個(gè)問題,還沒人真正給出答案。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.