![]()
幾天前,硅谷傳出消息:谷歌宣布,未來五年要提供給 Anthropic 的算力,規(guī)模高達(dá) 5GW。緊接著,5 月 6 日,這筆交易的價(jià)格被揭開——Anthropic 承諾未來五年向谷歌云支付約 2000 億美元,用于采購 5GW 的 TPU 算力和云服務(wù)。
同一天,Anthropic 還宣布租下 SpaceX 的 Colossus 1 超級(jí)計(jì)算機(jī),接入超過 22 萬顆英偉達(dá) GPU 用于推理。
5GW 在數(shù)據(jù)中心行業(yè)是什么概念?它大概相當(dāng)于 5 座大型核電站滿負(fù)荷運(yùn)轉(zhuǎn)的耗電量。這意味著谷歌幾乎是為了 Anthropic 新建好幾座超大規(guī)模數(shù)據(jù)中心,里面塞滿幾十萬塊谷歌自己設(shè)計(jì)的 TPU 芯片。而 Anthropic 為此付出的承諾采購額高達(dá) 2000 億美元,占到了谷歌云積壓訂單的 40% 以上。
更有意思的是這筆交易的結(jié)構(gòu):谷歌先向 Anthropic 投入 100 億美元現(xiàn)金(按 3500 億估值),若達(dá)成里程碑再追加至 400 億;同時(shí) Anthropic 承諾 2000 億美元的云服務(wù)和 TPU 采購支出。投資是投資,采購是采購,但兩者捆綁在一起,構(gòu)成了極強(qiáng)的鎖定效應(yīng)——芯片被指定為谷歌自研的 TPU。
面對(duì)這樣一份帶有排他意味的超級(jí)大單,Anthropic 也順勢(shì)調(diào)整了自己的算力版圖:在訓(xùn)練側(cè)大幅向谷歌 TPU 和亞馬遜 Trainium 傾斜,同時(shí)仍保留英偉達(dá) GPU 在推理等場(chǎng)景中的角色。5 月 6 日租下 SpaceX 的 22 萬顆 GPU,就是 Anthropic 在 GPU 推理側(cè)的最新動(dòng)作。
對(duì)于行業(yè)來說,或許,它標(biāo)志著 AI 產(chǎn)業(yè)從“參數(shù)軍備競(jìng)賽”正式轉(zhuǎn)向“算力效率競(jìng)賽”的拐點(diǎn),也標(biāo)志著技術(shù)路線正在加速分化。這次切換,正在無聲而有力地改變 AI 芯片的權(quán)力格局,重新定義了大模型和底層硬件之間的關(guān)系。
01 被英偉達(dá)“卡脖子”的痛
要理解 Anthropic 這次的算力布局為什么重要,得先看懂過去兩年 AI 算力市場(chǎng)有多殘酷。
自從 ChatGPT 橫空出世,大模型就變成了一個(gè)“燒錢無底洞”。行業(yè)里心照不宣的潛規(guī)則是:不管你融了多少錢,最后都得變成一張張采購英偉達(dá) H100 或 B200 的訂單。英偉達(dá)靠著 CUDA 生態(tài)的絕對(duì)壟斷,不光拿走了行業(yè)里絕大部分利潤(rùn),還捏著模型廠商的命脈——黃仁勛給你發(fā)多少貨,你就能訓(xùn)練多大的模型。
在這種格局下,大模型廠商的大部分利潤(rùn)最終流向了英偉達(dá)。
但局中人也不是沒有反抗的心思,尤其是那些手里有錢的云巨頭:
? 谷歌心里很憋屈:TPU 研發(fā)了十多年,一直在內(nèi)部訓(xùn)練 Gemini,性能其實(shí)不差,但缺少外部頂級(jí)大模型的“背書”,總被市場(chǎng)當(dāng)成非主流。
? 亞馬遜也很焦慮:作為全球最大的云廠商,AWS 每年要給英偉達(dá)交天價(jià)保護(hù)費(fèi)。它砸了大錢研發(fā)自研芯片 Trainium,急需一個(gè)標(biāo)桿客戶來證明“不用英偉達(dá)也能跑頂級(jí)模型”。
? Anthropic 有點(diǎn)特殊:由 Dario Amodei 等前 OpenAI 核心成員獨(dú)立創(chuàng)立,主打安全可控。它同時(shí)拿著谷歌、亞馬遜和微軟的錢——谷歌 400 億美元投資、亞馬遜累計(jì) 330 億美元投資,加上 2025 年 11 月簽下的 300 億美元微軟 Azure 算力合同,處在一個(gè)微妙的三角平衡中。面對(duì)高昂的算力成本,它比誰都渴望撕開一個(gè)口子,找找算力的“平替”。
英偉達(dá)太貴、太慢、太強(qiáng)勢(shì);谷歌有芯片但缺生態(tài),亞馬遜有錢想要獨(dú)立,Anthropic 想活下去還要盈利。四方的訴求,在這一刻正好咬合在了一起。一場(chǎng)針對(duì)英偉達(dá)定價(jià)權(quán)的多邊博弈已經(jīng)展開。
02 “用腳投票”:Anthropic 的算力豪賭
Anthropic 的選擇,撕開了高昂算力成本的一角。它的本質(zhì),是用硬件的確定性,來換取模型迭代的絕對(duì)速度和成本護(hù)城河。
谷歌分階段向 Anthropic 兌現(xiàn)算力承諾,規(guī)模預(yù)計(jì)達(dá)到 5GW 級(jí)別的 TPU 集群(從 2027 年起逐步上線)。與此同時(shí),谷歌對(duì) Anthropic 的總投資額至多達(dá) 400 億美元,Anthropic 對(duì)谷歌云的采購承諾則高達(dá) 2000 億美元。如此體量的算力集群,足以讓 Claude 的訓(xùn)練效率大幅躍升,或者讓 Anthropic 同時(shí)并行推進(jìn)多個(gè)行業(yè)大模型的定制。
這些承諾背后,是 TPU 在特定任務(wù)上對(duì) GPU 的真實(shí)優(yōu)勢(shì):
? 性價(jià)比領(lǐng)先:根據(jù) Google 官方數(shù)據(jù),在大型 Transformer 模型訓(xùn)練場(chǎng)景下,TPU v6e 的性價(jià)比(性能/美元)約為同代英偉達(dá) GPU 的 3 到 4 倍。
? 能效提升:Google 數(shù)據(jù)中心 PUE 約為 1.1,遠(yuǎn)低于行業(yè)平均 1.58,綜合運(yùn)營(yíng)成本優(yōu)勢(shì)明顯。SemiAnalysis 的研究報(bào)告也指出,Anthropic 的推理基礎(chǔ)設(shè)施毛利率已從 38% 提升至 70% 以上,定制芯片路線的降本效應(yīng)可見一斑。
從技術(shù)底層來看,Anthropic 早就開始謀求“去單一硬件依賴”。2026 年 3 月,Anthropic 宣布已部署百萬顆 Google TPU,下一財(cái)年 TPU 算力將達(dá) 1GW;在訓(xùn)練側(cè),TPU 和亞馬遜 Trainium 已成為核心算力來源;而在推理側(cè),英偉達(dá) GPU 仍然扮演重要角色——5 月 6 日租下 SpaceX Colossus 1 的超 22 萬顆 GPU 就是最新例證。再加上用 JAX 框架對(duì) TPU 集群做底層調(diào)優(yōu),Anthropic 已經(jīng)形成了一個(gè) TPU 訓(xùn)練主力 + Trainium 備份訓(xùn)練 + GPU 推理補(bǔ)位的多元算力架構(gòu)。
可以理解為,這是訓(xùn)練到推理的全棧算力重構(gòu)。Anthropic 已經(jīng)用行動(dòng)證明:大模型廠商不再只是硬件廠商的“提款機(jī)”,而是可以成為算力架構(gòu)的“設(shè)計(jì)師”。
03 四大陣營(yíng)貼身肉搏,與一個(gè)"務(wù)實(shí)"的混合算力方案
Anthropic 的轉(zhuǎn)向,像一條鯰魚,直接引爆了全球 AI 芯片四大陣營(yíng)的正面對(duì)決。現(xiàn)在的算力江湖,已經(jīng)不是英偉達(dá)一家獨(dú)大了。
1. 谷歌–Anthropic:垂直閉環(huán)的領(lǐng)跑者
“TPU–JAX–Claude”這條全棧協(xié)同的路線,正在結(jié)出果實(shí)。根據(jù)摩根士丹利預(yù)測(cè),2027 年 TPU 對(duì)外銷售有望拿下全球 AI 加速芯片市場(chǎng) 20% 的份額。更可觀的是成本競(jìng)爭(zhēng)力:Claude 系列在同等性能段內(nèi)的 API 定價(jià),相比部分頭部競(jìng)品更具優(yōu)勢(shì),谷歌通過硬件降本直接幫 Anthropic 打出了性價(jià)比牌。
2. OpenAI:算力堆得猛,兼容性拖后腿
相比之下,OpenAI 正在構(gòu)建龐大的算力矩陣,已鎖定 30.5GW 的長(zhǎng)期算力合約。2025 年 10 月,OpenAI 與 AMD 簽署多年期協(xié)議,部署總計(jì) 6GW 的 AMD Instinct GPU 算力(首期 1GW MI450,2026 年下半年部署),與英偉達(dá) GPU 并行組成大規(guī)模算力集群。
但這種“大雜燴”架構(gòu)付出了不小的代價(jià):多芯片、多廠商導(dǎo)致算力利用率偏低,規(guī)模化的紅利被沉重的兼容性成本吃掉了。
3. 英偉達(dá):死守基本盤,高端腹地正在被侵蝕
老大哥英偉達(dá)依然握著 AI 加速器市場(chǎng) 80% 以上的份額,CUDA 生態(tài)還是它堅(jiān)不可摧的護(hù)城河。但 TPU 在大模型核心訓(xùn)練場(chǎng)景里持續(xù)滲透,已經(jīng)讓黃仁勛感到了壓力。2025 年 7 月,英偉達(dá)宣布 CUDA 全面支持 RISC-V 架構(gòu)——這在以前幾乎不可想象,生態(tài)壁壘正被“定制化需求”從內(nèi)部撬開。
4. 中國陣營(yíng):開源適配,換道超車
囿于外部環(huán)境,國產(chǎn) AI 芯片整體市占率逆勢(shì)提升。根據(jù) IDC 數(shù)據(jù),2025 年中國 AI 加速卡市場(chǎng)總出貨量約 400 萬張,本土廠商合計(jì)出貨約 165 萬張,市場(chǎng)份額首次突破四成,達(dá)到約 41%(中國境內(nèi)市場(chǎng))。例如 DeepSeek-V4(2026 年 4 月發(fā)布)已于官方技術(shù)報(bào)告中寫入華為昇騰 NPU 支持,華為昇騰、摩爾線程等多家國產(chǎn)廠商均完成 Day 0 適配。中國廠商不拼單點(diǎn)極限算力,而是走“芯片 + 模型 + 場(chǎng)景”的快速落地路線。
格局已經(jīng)變了:AI 競(jìng)爭(zhēng)不再是比誰買的卡多,而是“算力效率 × 場(chǎng)景適配”的綜合暗戰(zhàn)。
而 Anthropic 精心設(shè)計(jì)的這套混合算力方案,恰恰指明了下一代 AI 基礎(chǔ)設(shè)施的主流方向——分工明確、冗余可控、拒絕被單一廠商綁架。這套方案非常精明:
? 5GW 的 TPU 作為訓(xùn)練絕對(duì)主力,扛起核心大模型的高強(qiáng)度訓(xùn)練; ? GPU 作為"萬金油",補(bǔ)位推理和多模態(tài)數(shù)據(jù)處理等任務(wù)(SpaceX Colossus 1 的 22 萬顆 GPU 就是最新落子); ? 亞馬遜 Trainium 作為戰(zhàn)略備份訓(xùn)練算力池,壓低整體邊際成本。
這套組合拳帶來了幾個(gè)立竿見影的商業(yè)好處:供應(yīng)鏈風(fēng)險(xiǎn)大幅降低(不怕被單一供應(yīng)商卡脖子);Anthropic 于 2025 年 6 月公開的多智能體系統(tǒng)數(shù)據(jù)顯示,以 Claude Sonnet 為主導(dǎo)智能體、多個(gè) Claude Haiku 為子智能體的架構(gòu),相比單智能體 Claude Opus,任務(wù)性能提升約 90%;更重要的是,硬件級(jí)加密結(jié)合 Anthropic 引以為傲的倫理框架,讓金融、醫(yī)療等高敏感行業(yè)的客戶敢于真正下單。
04 戴上“金手銬”的 Anthropic
當(dāng)然,商業(yè)世界里沒有免費(fèi)的午餐。Anthropic 這次向 TPU 深度傾斜,在換來極致訓(xùn)練效率和短期成本優(yōu)勢(shì)的同時(shí),也給自己悄悄地戴上了一副“金手銬”——表面金光閃閃,實(shí)則勒得越來越緊。
首先,最直接的風(fēng)險(xiǎn)是底層架構(gòu)的話語權(quán)正在旁落。深度綁定谷歌 TPU,意味著 Anthropic 未來的模型優(yōu)化、算子開發(fā)、甚至推理框架的選型,都會(huì)被 TPU 的硬件迭代節(jié)奏牽著走。谷歌的 TPU 團(tuán)隊(duì)每推出一代新芯片,Anthropic 就得跟著重新適配甚至重寫部分底層代碼。短期看,這是“聯(lián)合優(yōu)化”;長(zhǎng)期看,這就變成了“單向依賴”。一旦谷歌調(diào)整 TPU 的產(chǎn)品路線圖——比如某個(gè)指令集不再支持,或者某個(gè)硬件特性被放棄——Anthropic 的適配成本和遷移風(fēng)險(xiǎn)將顯著上升。
其次,多云協(xié)同很容易變成“多云約束”。Anthropic 目前同時(shí)踩著谷歌云、AWS 和微軟 Azure 三條船,聽上去很靈活:TPU 主力訓(xùn)練,Trainium 備份訓(xùn)練,GPU 推理。但在實(shí)際操作中,這種跨云架構(gòu)的維護(hù)成本遠(yuǎn)超想象。
數(shù)據(jù)要在三個(gè)云之間同步、任務(wù)調(diào)度要兼顧三套芯片的差異、災(zāi)難恢復(fù)方案要寫三份——更別提三家云廠商各懷心思,未來會(huì)不會(huì)在價(jià)格、帶寬、優(yōu)先級(jí)上互相掣肘?據(jù)知情人士轉(zhuǎn)述,Anthropic 內(nèi)部對(duì)多云架構(gòu)的運(yùn)維復(fù)雜度早有感受。一旦某天谷歌和亞馬遜的關(guān)系微妙變化,Anthropic 就會(huì)淪為夾在中間的那個(gè)。
更隱蔽但更致命的,是技術(shù)獨(dú)立性的慢性流失。Claude 的每一次模型迭代,理論上應(yīng)該是為了更好的智能和安全性。但未來,如果某個(gè)架構(gòu)改動(dòng)在 TPU 上跑得飛快、在 GPU 或 Trainium 上卻表現(xiàn)平平,產(chǎn)品經(jīng)理會(huì)怎么選?大概率會(huì)“為了上線”而優(yōu)先適配 TPU。
久而久之,Claude 的優(yōu)化方向?qū)⒃絹碓绞?TPU 硬件特性的牽引,而不是一個(gè)跨平臺(tái)、可移植的通用大模型。這就好比一個(gè)作家,本來可以用任何紙筆寫作,后來被贊助商要求只能用某一種特制鋼筆——寫出來的東西也許更流暢,但那支鋼筆的任何缺陷,都會(huì)直接寫進(jìn)他的作品里。
拉長(zhǎng)視野看,Anthropic 的處境其實(shí)很微妙。對(duì)比一下:
OpenAI 走的是多供應(yīng)商、多芯片的“大雜燴”路線。雖然效率低下、兼容成本高,但好處是——沒有哪家芯片廠商能真正卡住它的脖子。微軟、英偉達(dá)、AMD 之間互相牽制,OpenAI 反而拿到了議價(jià)空間。
國產(chǎn)廠商如 DeepSeek 走的是開源適配路線。昇騰、寒武紀(jì)、海光……誰家芯片能在主流模型上跑出好效果,就用誰。生態(tài)是碎片化的,但也是自由的。
而谷歌–Anthropic 的閉環(huán),在訓(xùn)練效率上無疑是最鋒利的刀,但握住刀柄的那個(gè)人,是谷歌。Anthropic 的核心訓(xùn)練算力、迭代速度、甚至一部分技術(shù)路線,都被鎖在了谷歌的生態(tài)圍墻之內(nèi)。不過也要承認(rèn),Anthropic 同時(shí)握有 AWS Trainium、微軟 Azure 和 SpaceX GPU 等多條后路,這副金手銬目前還沒有完全焊死。
更讓人擔(dān)心的是,這副金手銬還有一個(gè)時(shí)間軸上的陷阱。五年期的 2000 億美元采購承諾,聽起來是天堂,但合同到期后呢?到那時(shí),Anthropic 的整個(gè)技術(shù)棧、代碼庫、運(yùn)維體系、人才習(xí)慣,都會(huì)深度綁定 TPU。想要再換回 GPU 或遷移到其他芯片,成本高到幾乎不可能。屆時(shí)谷歌續(xù)簽合同的條件,Anthropic 還能說“不”嗎?一位不具名的風(fēng)投合伙人說得比較直白:“Anthropic 不是在租谷歌的算力,而是在用未來數(shù)年的自主權(quán),換今天的一張船票。”
當(dāng)然,不是說 Anthropic 做錯(cuò)了。在 AI 這個(gè)燒錢如燒紙的行業(yè),首先要活下來,其次是跑得快。只是在商業(yè)世界里,沒有完美架構(gòu),只有階段性最優(yōu)解。Anthropic 目前拿到的是訓(xùn)練速度和成本的最優(yōu)解,代價(jià)是——它把一部分未來的選擇權(quán),提前交了出去。
05 芯片沒有靈魂,但定義芯片的模型有
回看計(jì)算機(jī)這半個(gè)多世紀(jì)的歷史,Anthropic 的轉(zhuǎn)向,其實(shí)是科技界一個(gè)經(jīng)典的“宿命輪回”。
三十年前,GPU 作為專攻圖形渲染的特定芯片,靠異構(gòu)計(jì)算打破了通用 CPU 的壟斷;三十年后,當(dāng) GPU 自己也變成了橫在 AI 產(chǎn)業(yè)面前的“通用霸權(quán)”時(shí),TPU、Trainium 這些更專門化的 ASIC 芯片,正用同樣的邏輯發(fā)起反攻。
這意味著,AI 底層基礎(chǔ)設(shè)施的邏輯,正在從“暴力堆砌”轉(zhuǎn)向“精耕細(xì)作”。大模型不再是可以在任意一張顯卡上隨便跑通的“上層軟件”,它正在變成必須與特定硅片深度耦合的“重工業(yè)實(shí)體”。
所以,Anthropic 投向定制芯片,絕不意味著 GPU 會(huì)消亡,而是標(biāo)志著“通用算力大一統(tǒng)”時(shí)代的終結(jié)。未來的版圖注定走向分裂:英偉達(dá) GPU 依然會(huì)長(zhǎng)久統(tǒng)治通用計(jì)算和推理,但在超大規(guī)模模型訓(xùn)練的最核心地帶,定制芯片將接管陣地。
英偉達(dá)的護(hù)城河依然深不見底,但水面之下,暗流已經(jīng)不可逆轉(zhuǎn)。當(dāng)“買卡就能做模型”的草莽時(shí)代結(jié)束,未來的競(jìng)爭(zhēng)焦點(diǎn),將從“對(duì)算力資源的粗暴囤積”,徹底升級(jí)為“對(duì)異構(gòu)算力的精細(xì)調(diào)度權(quán)”和“對(duì)底層硅片架構(gòu)的定義權(quán)”。
在這場(chǎng)沒有硝煙的底座重構(gòu)中,誰掌握了定義硬件的權(quán)力,誰就拿到了下一輪競(jìng)爭(zhēng)的關(guān)鍵籌碼。
(本文首發(fā)鈦媒體APP,作者 | 硅谷Tech news,編輯 | 趙虹宇)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.