當地時間4月22日,谷歌正式對外發布第八代張量處理單元(TPU)。此次發布最大的突破的是,谷歌打破了此前TPU“一芯通吃”的設計傳統,將AI模型訓練與推理這兩項核心任務,拆分為兩顆獨立的專用芯片,分別命名為TPU 8t(訓練專用)與TPU 8i(推理專用)。兩款芯片預計于今年晚些時候正式面向市場推出,這也成為谷歌在AI硬件領域正面挑戰英偉達主導地位的重要舉措。
![]()
谷歌高級副總裁、AI與基礎設施首席技術專家阿明·瓦赫達特在博客中解釋了這一轉變的原因,他表示,隨著AI智能體的快速崛起,業界對芯片的需求呈現出明顯分化,訓練與服務場景對硬件的要求各有側重,只有為這兩類場景分別打造專用芯片,才能實現效率最大化,更好地滿足行業需求。在此之前,谷歌自2015年開始自研AI芯片以來,所有TPU產品均采用單一芯片設計,同時承擔訓練與推理任務,2018年起,谷歌開始將自研TPU出租給云服務客戶,逐步在AI芯片領域布局。
此次發布的兩款專用芯片各有側重,性能均實現大幅提升。其中,TPU 8t專注于AI模型的訓練任務,在同價位下,其性能較去年11月發布的第七代Ironwood TPU提升了2.8倍,能夠更好地適配超大模型的預訓練與微調需求,兼顧算力密度與可擴展性;TPU 8i則聚焦于推理任務,性能較上一代提升80%,最突出的亮點是單芯片集成了384MB的靜態隨機存取存儲器(SRAM),容量達到上一代的三倍,這一設計能夠大幅降低長上下文場景與多智能體并發運行時的延遲。
谷歌母公司阿爾phabet的CEO皮查伊也在博客中強調,這款新架構的核心目標,是在保證成本效益的前提下,提供同時運行數百萬AI智能體所需的高吞吐與低延遲能力。值得關注的是,英偉達即將推出的Groq 3 LPU芯片,同樣主打大容量SRAM設計,這也意味著谷歌與英偉達在AI推理芯片的技術路線上,形成了直接對標。
谷歌的這一舉措,也契合了當前全球頭部科技公司自研AI芯片的行業趨勢。如今,全球頂尖科技企業紛紛布局定制化半導體研發,目的是最大化AI運行效率,適配自身的專業化場景需求:亞馬遜AWS早在2018年就推出了推理專用的Inferentia芯片,2020年又發布了訓練專用的Trainium芯片,同樣采用雙芯分立路線;微軟在今年1月發布了第二代Azure Maia AI芯片;Meta則在上周宣布與博通合作,推進多款AI處理器的研發;而蘋果多年來一直在自研iPhone芯片中融入神經網絡引擎,深耕終端AI硬件領域。
盡管目前英偉達在AI芯片市場仍占據主導地位,但谷歌并未選擇直接對標單芯片性能,而是聚焦于云原生集群效率與整體擁有成本(TCO),依托自身Google Cloud生態,打造差異化競爭優勢。從生態落地情況來看,谷歌新一代TPU已經獲得了不少頭部客戶的認可,對沖基金巨頭Citadel Securities基于TPU構建了量化研究系統,美國能源部的全部17個國家實驗室都在使用基于TPU開發的AI科研助手,AI獨角獸Anthropic更是承諾將使用數吉瓦級的谷歌TPU算力資源,這些都為谷歌TPU的市場推廣奠定了基礎。
分析認為,此次谷歌TPU從“一芯通吃”轉向訓練與推理雙芯分立,不僅是谷歌自身AI硬件布局的重要升級,更標志著全球AI芯片行業正式進入分工專業化的新階段。從實際情況看,訓練芯片比拼的是規模與帶寬,推理芯片比拼的則是延遲與片上存儲。作為云廠商自研AI芯片的代表,谷歌此次推出的雙芯組合,為全球AI基礎設施提供了英偉達之外的重要替代方案,未來也將深刻影響大模型與AI智能體的部署成本和應用形態,推動整個AI產業的高效發展。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.