網易首頁 > 網易號 > 正文申請入駐

谷歌發布第八代TPU：雙芯分立專攻AI訓練與推理，正面挑戰英偉達

2026-04-23 09:53:28　來源: 極客網

上海舉報

分享至

當地時間4月22日，谷歌正式對外發布第八代張量處理單元（TPU）。此次發布最大的突破的是，谷歌打破了此前TPU“一芯通吃”的設計傳統，將AI模型訓練與推理這兩項核心任務，拆分為兩顆獨立的專用芯片，分別命名為TPU 8t（訓練專用）與TPU 8i（推理專用）。兩款芯片預計于今年晚些時候正式面向市場推出，這也成為谷歌在AI硬件領域正面挑戰英偉達主導地位的重要舉措。

谷歌高級副總裁、AI與基礎設施首席技術專家阿明·瓦赫達特在博客中解釋了這一轉變的原因，他表示，隨著AI智能體的快速崛起，業界對芯片的需求呈現出明顯分化，訓練與服務場景對硬件的要求各有側重，只有為這兩類場景分別打造專用芯片，才能實現效率最大化，更好地滿足行業需求。在此之前，谷歌自2015年開始自研AI芯片以來，所有TPU產品均采用單一芯片設計，同時承擔訓練與推理任務，2018年起，谷歌開始將自研TPU出租給云服務客戶，逐步在AI芯片領域布局。

此次發布的兩款專用芯片各有側重，性能均實現大幅提升。其中，TPU 8t專注于AI模型的訓練任務，在同價位下，其性能較去年11月發布的第七代Ironwood TPU提升了2.8倍，能夠更好地適配超大模型的預訓練與微調需求，兼顧算力密度與可擴展性；TPU 8i則聚焦于推理任務，性能較上一代提升80%，最突出的亮點是單芯片集成了384MB的靜態隨機存取存儲器（SRAM），容量達到上一代的三倍，這一設計能夠大幅降低長上下文場景與多智能體并發運行時的延遲。

谷歌母公司阿爾phabet的CEO皮查伊也在博客中強調，這款新架構的核心目標，是在保證成本效益的前提下，提供同時運行數百萬AI智能體所需的高吞吐與低延遲能力。值得關注的是，英偉達即將推出的Groq 3 LPU芯片，同樣主打大容量SRAM設計，這也意味著谷歌與英偉達在AI推理芯片的技術路線上，形成了直接對標。

谷歌的這一舉措，也契合了當前全球頭部科技公司自研AI芯片的行業趨勢。如今，全球頂尖科技企業紛紛布局定制化半導體研發，目的是最大化AI運行效率，適配自身的專業化場景需求：亞馬遜AWS早在2018年就推出了推理專用的Inferentia芯片，2020年又發布了訓練專用的Trainium芯片，同樣采用雙芯分立路線；微軟在今年1月發布了第二代Azure Maia AI芯片；Meta則在上周宣布與博通合作，推進多款AI處理器的研發；而蘋果多年來一直在自研iPhone芯片中融入神經網絡引擎，深耕終端AI硬件領域。

盡管目前英偉達在AI芯片市場仍占據主導地位，但谷歌并未選擇直接對標單芯片性能，而是聚焦于云原生集群效率與整體擁有成本（TCO），依托自身Google Cloud生態，打造差異化競爭優勢。從生態落地情況來看，谷歌新一代TPU已經獲得了不少頭部客戶的認可，對沖基金巨頭Citadel Securities基于TPU構建了量化研究系統，美國能源部的全部17個國家實驗室都在使用基于TPU開發的AI科研助手，AI獨角獸Anthropic更是承諾將使用數吉瓦級的谷歌TPU算力資源，這些都為谷歌TPU的市場推廣奠定了基礎。

分析認為，此次谷歌TPU從“一芯通吃”轉向訓練與推理雙芯分立，不僅是谷歌自身AI硬件布局的重要升級，更標志著全球AI芯片行業正式進入分工專業化的新階段。從實際情況看，訓練芯片比拼的是規模與帶寬，推理芯片比拼的則是延遲與片上存儲。作為云廠商自研AI芯片的代表，谷歌此次推出的雙芯組合，為全球AI基礎設施提供了英偉達之外的重要替代方案，未來也將深刻影響大模型與AI智能體的部署成本和應用形態，推動整個AI產業的高效發展。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.