拉斯維加斯Google Cloud Next大會(huì),谷歌高級(jí)副總裁Amin Vahdat從口袋里掏出兩枚芯片——TPU 8t與TPU 8i。這是谷歌TPU家族史上第一次明確"分家"。
一枚專攻訓(xùn)練,一枚專注推理。這個(gè)動(dòng)作為什么重要?因?yàn)楣雀杪氏柔尫帕艘粋€(gè)信號(hào):AI算力正在從"萬(wàn)能芯片"的草莽時(shí)代,進(jìn)入流水線式的精細(xì)化分工時(shí)代。
![]()
為什么非要"分家"?
訓(xùn)練和推理,看似都是AI算力的活兒,本質(zhì)完全不同。
訓(xùn)練像學(xué)霸埋頭啃完整個(gè)人類圖書(shū)館,追求"大力出奇跡",核心是把模型能力"錘煉"出來(lái)。推理則像學(xué)霸畢業(yè)后去大廠當(dāng)客服,重點(diǎn)不再是誰(shuí)懂得最多,而是誰(shuí)回得夠快、成本夠低、性價(jià)比夠高。
過(guò)去業(yè)界默認(rèn)一顆芯片兼顧兩者,是因?yàn)锳I處在算力早期:模型沒(méi)那么大,場(chǎng)景沒(méi)那么多,統(tǒng)一架構(gòu)至少可以攤薄研發(fā)成本。但到了Agentic AI時(shí)代,這套邏輯開(kāi)始失效。訓(xùn)練和推理的訴求,已經(jīng)變得幾乎不可調(diào)和。
過(guò)去兩年,硅谷風(fēng)向從"大模型狂熱"轉(zhuǎn)向"智能體熱"。AI不再只是陪你聊天的對(duì)話框,而是會(huì)接任務(wù)、會(huì)調(diào)工具、會(huì)連續(xù)干活的"數(shù)字員工"。Agent帶來(lái)的推理事務(wù)量,往往是普通聊天機(jī)器人的20到50倍。
企業(yè)的成本焦慮,迅速?gòu)?訓(xùn)練太貴"轉(zhuǎn)向"推理更貴"。
算筆經(jīng)濟(jì)賬。訓(xùn)練芯片為了追求"大力出奇跡",必須配備極其昂貴的HBM(高帶寬內(nèi)存)。HBM成本約占整塊芯片成本的40%-50%,且十分稀缺。拿這種高成本訓(xùn)練芯片,去跑Agent每天幾十萬(wàn)次的高頻推理請(qǐng)求,相當(dāng)于用洲際導(dǎo)彈送外賣。
「關(guān)鍵在于如何以最低的每筆交易成本實(shí)現(xiàn)最低的響應(yīng)延遲。交易量正在大幅攀升,而每筆交易的成本必須大幅下降,才能實(shí)現(xiàn)規(guī)模化。」谷歌云人工智能與計(jì)算基礎(chǔ)架構(gòu)副總裁Mark Lohmeyer如此說(shuō)道。
TPU 8i的"偷家"戰(zhàn)術(shù)
這場(chǎng)"分家"的核心焦點(diǎn),正是那枚為"奔跑"而生的TPU 8i。
先看訓(xùn)練用的TPU 8t。單個(gè)超級(jí)模塊集成9600顆芯片,提供121 exaflops算力和2PB共享內(nèi)存,計(jì)算性能較前代提升近3倍;新的Virgo橫向擴(kuò)展架構(gòu),讓單個(gè)集群可調(diào)度超過(guò)100萬(wàn)顆TPU芯片,能把前沿大模型的訓(xùn)練周期從"數(shù)月"壓縮到"數(shù)周"。在電力成為數(shù)據(jù)中心核心瓶頸的今天,它能在同等價(jià)格下性能提升2.8倍,每瓦性能提升124%。
但真正的變量是TPU 8i。谷歌給它換了個(gè)完全不同的"大腦"結(jié)構(gòu),精準(zhǔn)解決Agent時(shí)代高頻交互的痛點(diǎn)。
第一步,給芯片的"短期記憶"史詩(shī)級(jí)加強(qiáng)。片上SRAM直接擴(kuò)容3倍,讓芯片隨手就能抓到關(guān)鍵數(shù)據(jù),不用每走一步都去"翻內(nèi)存字典",極大減少數(shù)據(jù)搬運(yùn)損耗。這3倍SRAM空間,配合288GB的HBM內(nèi)存,從根源上解決AI思考時(shí)的"腦卡頓"。
更硬核的是省電。TPU 8i的能效比較上一代提升117%。這意味著谷歌云可以用同樣的一張電費(fèi)賬單,支撐起近乎兩倍的推理服務(wù)。
TPU 8i為谷歌拿下Agent時(shí)代的"商業(yè)化入場(chǎng)券"。
據(jù)Gartner預(yù)測(cè),到2026年底,40%的企業(yè)應(yīng)用將嵌入特定任務(wù)的AI Agent。麥肯錫估算,到2030年,由Agentic AI帶來(lái)的商業(yè)機(jī)會(huì)高達(dá)3萬(wàn)億至5萬(wàn)億美元。
技術(shù)再牛,模型再聰明,如果跑一次推理的成本高到客戶掏不起錢(qián),就是空中樓閣。谷歌把芯片一分為二,向整個(gè)行業(yè)宣告:AI的下半場(chǎng),誰(shuí)能把"勞務(wù)費(fèi)"打下來(lái),誰(shuí)才能笑到最后。
Meta、Anthropic"入伙",英偉達(dá)慌了嗎?
谷歌關(guān)于"算力分工"的預(yù)判,正被市場(chǎng)用真金白銀證實(shí)。Meta和Anthropic這兩家AI巨頭率先"入伙",成為T(mén)PU v8的首批用戶。
Anthropic掌門(mén)人Dario Amodei雖未到現(xiàn)場(chǎng),但特意錄視頻站臺(tái),確認(rèn)其下一代模型的早期開(kāi)發(fā),已在谷歌TPU 8t集群上跑了數(shù)月。Anthropic更與谷歌強(qiáng)綁定,計(jì)劃在2027年前向AWS和谷歌云簽下數(shù)吉瓦級(jí)TPU算力協(xié)議,提前鎖定支撐客戶需求爆發(fā)所必需的算力資源。
在Agentic AI時(shí)代,芯片與軟件的邊界正在消融。谷歌與Anthropic的關(guān)系,早已超越單純的貨架買賣,進(jìn)化為深度共生的"軟件—硅反饋循環(huán)"。雙方共同研發(fā),讓TPU的光學(xué)互聯(lián)元件與MoE(混合專家)架構(gòu)實(shí)現(xiàn)底層原生的基因咬合。這種"軟硬一體"調(diào)優(yōu),直接擊穿單次推理的Token成本。
對(duì)Anthropic而言,這轉(zhuǎn)化成Claude在商業(yè)戰(zhàn)場(chǎng)上的成本定價(jià)權(quán)。對(duì)谷歌而言,Anthropic是最頂級(jí)的"實(shí)戰(zhàn)壓力測(cè)試場(chǎng)",支撐它在不交"英偉達(dá)稅"的道路上,擁有一個(gè)全球領(lǐng)先的盟友和陪練。
幾乎同時(shí),Meta也被曝與谷歌簽署價(jià)值數(shù)十億美元、為期多年的TPU使用協(xié)議。消息披露當(dāng)天,英偉達(dá)股價(jià)應(yīng)聲下跌4%。
這是否意味著"反英偉達(dá)"的新聯(lián)盟已經(jīng)形成?
正方:谷歌正在改寫(xiě)游戲規(guī)則
支持這一判斷的人指出,谷歌TPU的攻勢(shì)具有結(jié)構(gòu)性優(yōu)勢(shì)。
首先,垂直整合。TPU不單獨(dú)出售,只通過(guò)Google Cloud提供服務(wù)。客戶使用TPU,往往會(huì)自然進(jìn)入谷歌的全棧AI云生態(tài):從數(shù)據(jù)處理、模型訓(xùn)練到推理部署,乃至與Workspace等應(yīng)用集成。谷歌爭(zhēng)奪的是AI時(shí)代的云入口和定價(jià)權(quán)。當(dāng)一家大模型公司將核心訓(xùn)練和推理負(fù)載遷至谷歌云,它購(gòu)買的不僅是算力時(shí)間,更是將未來(lái)業(yè)務(wù)的一部分根基埋在了谷歌的土壤里。
其次,成本杠桿。摩根士丹利分析師Brian Nowak指出,谷歌TPU年產(chǎn)量預(yù)計(jì)在2027年達(dá)到500萬(wàn)顆,2028年進(jìn)一步增長(zhǎng)至700萬(wàn)顆。估算每對(duì)外銷售50萬(wàn)顆TPU,就可能為谷歌帶來(lái)約130億美元的新增收入。規(guī)模效應(yīng)下,谷歌有空間持續(xù)壓低價(jià)格,形成對(duì)英偉達(dá)GPU的"降維打擊"。
第三,生態(tài)鎖定。Anthropic明確表示采用多平臺(tái)策略,同時(shí)在AWS Trainium、Google TPU和NVIDIA GPU上運(yùn)行Claude。但這種"分散風(fēng)險(xiǎn)"策略,恰恰說(shuō)明谷歌TPU已成為不可忽視的"第二選擇"。一旦客戶在TPU上完成核心模型適配,遷移成本將隨時(shí)間遞增。
反方:英偉達(dá)的護(hù)城河沒(méi)那么淺
質(zhì)疑者則認(rèn)為,市場(chǎng)反應(yīng)過(guò)度,英偉達(dá)的地位遠(yuǎn)未被撼動(dòng)。
第一,客戶動(dòng)機(jī)是"務(wù)實(shí)結(jié)盟"而非"桃園結(jié)義"。對(duì)于Anthropic和Meta這樣的算力"吞金獸",當(dāng)前最害怕的兩件事是:拿不到足夠的算力,或者算力成本壓垮商業(yè)模式。英偉達(dá)GPU雖是行業(yè)黃金標(biāo)準(zhǔn),但其價(jià)格、供貨周期和潛在供應(yīng)鏈風(fēng)險(xiǎn),迫使頂級(jí)客戶必須尋找"Plan B"以分散風(fēng)險(xiǎn)、增強(qiáng)議價(jià)能力。谷歌TPU是這個(gè)"Plan B",而非"A計(jì)劃"。
第二,軟件生態(tài)的差距。CUDA(英偉達(dá)推出的并行計(jì)算平臺(tái)和編程模型)經(jīng)過(guò)二十年積累,已成為AI開(kāi)發(fā)的"通用語(yǔ)言"。TPU雖有JAX等框架支持,但開(kāi)發(fā)者遷移成本、工具鏈成熟度、第三方庫(kù)兼容性,仍與CUDA存在代際差距。硬件性能再?gòu)?qiáng),軟件生態(tài)的慣性足以拖慢 adoption(采用)速度。
第三,谷歌自身的矛盾。谷歌既是芯片供應(yīng)商,又是模型競(jìng)爭(zhēng)者。Gemini與Claude、Llama存在直接競(jìng)爭(zhēng)關(guān)系。客戶將核心負(fù)載交給谷歌云,等于把訓(xùn)練數(shù)據(jù)、模型架構(gòu)、迭代節(jié)奏等敏感信息暴露給競(jìng)爭(zhēng)對(duì)手。這種"供應(yīng)商—競(jìng)爭(zhēng)者"雙重身份,是谷歌TPU擴(kuò)張的天然天花板。
第四,歷史教訓(xùn)。知名分析師Patrick Moorhead在X上調(diào)侃過(guò)一段往事:2016年谷歌發(fā)布第一代TPU時(shí),他曾放言英偉達(dá)要完蛋。結(jié)果呢?今天英偉達(dá)市值接近5萬(wàn)億美元。
我的判斷:一場(chǎng)"不對(duì)稱戰(zhàn)爭(zhēng)"的開(kāi)始
谷歌TPU 8i的真正威脅,不在于取代英偉達(dá),而在于重新定義競(jìng)爭(zhēng)維度。
英偉達(dá)的強(qiáng)項(xiàng)是"通用性"——一顆芯片打天下,從訓(xùn)練到推理,從數(shù)據(jù)中心到邊緣設(shè)備,從AI到圖形渲染。這種通用性構(gòu)建了巨大的規(guī)模經(jīng)濟(jì)和生態(tài)護(hù)城河,但也意味著它在任何單一場(chǎng)景都不是"最優(yōu)解"。
谷歌的打法是"場(chǎng)景穿透"——不為通用而設(shè)計(jì),只為推理而生。TPU 8i的3倍SRAM、117%能效提升、軟硬一體的MoE優(yōu)化,都是針對(duì)Agent高頻交互的"特化武器"。這種"以專克泛"的策略,在Agentic AI爆發(fā)的前夜,恰好擊中市場(chǎng)痛點(diǎn)。
更關(guān)鍵的是商業(yè)模式差異。英偉達(dá)賣的是"芯片",谷歌賣的是"算力時(shí)間+云生態(tài)"。前者是一次性交易,后者是持續(xù)訂閱。當(dāng)推理成本成為AI商業(yè)化的生死線,谷歌有動(dòng)力、也有能力將TPU 8i的性價(jià)比優(yōu)勢(shì)轉(zhuǎn)化為云市場(chǎng)份額的擴(kuò)張。
Meta和Anthropic的"入伙",不是對(duì)英偉達(dá)的背叛,而是對(duì)"單一供應(yīng)商風(fēng)險(xiǎn)"的對(duì)沖。但這種對(duì)沖本身,就在削弱英偉達(dá)的定價(jià)權(quán)。當(dāng)頂級(jí)客戶開(kāi)始認(rèn)真比較"英偉達(dá)稅"和"谷歌方案",英偉達(dá)就必須在利潤(rùn)率和市場(chǎng)份額之間做更艱難的權(quán)衡。
這場(chǎng)戰(zhàn)爭(zhēng)的終局,可能不是"誰(shuí)干掉誰(shuí)",而是"分層共存":英偉達(dá)守住通用算力的基本盤(pán),谷歌TPU在推理場(chǎng)景切走最大的一塊蛋糕,AWS Trainium、微軟Maia等玩家各據(jù)一方。但無(wú)論如何,"萬(wàn)能芯片"的時(shí)代正在落幕,"算力分工"的時(shí)代已經(jīng)開(kāi)啟。
谷歌在拉斯維加斯掏出的那兩枚芯片,一枚指向訓(xùn)練的效率極限,一枚指向推理的成本底線。而Agentic AI的浪潮,正把后者推向舞臺(tái)中央。
當(dāng)每一家AI公司都在為"數(shù)字員工"的電費(fèi)賬單發(fā)愁時(shí),誰(shuí)能把單次推理的成本打到最低,誰(shuí)就能在下一個(gè)十年定義AI的商業(yè)規(guī)則。谷歌押注的是:在這個(gè)問(wèn)題上,專用芯片將擊敗通用芯片——不是因?yàn)樗鼜?qiáng),而是因?yàn)樗?對(duì)"。
問(wèn)題是,當(dāng)亞馬遜、微軟、甚至蘋(píng)果都推出自己的"推理專用芯片"時(shí),谷歌的"先發(fā)優(yōu)勢(shì)"能維持多久?而英偉達(dá),又會(huì)在什么時(shí)候亮出它的反擊武器?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.