作者 | 萬連山
數據支持 | 勾股 大數 據(www.gogudata.com)
谷歌正在押下史上規模最大的賭注之一:計劃今年投入1750億-1850億美元搞基建。
其中,60%用于剛剛在拉斯維加斯舉辦的Google Cloud Next大會上亮相的第八代TPU,史無前例地拆分成了兩款:專攻模型訓練的TPU 8t,專攻推理的TPU 8i。
40%用于搭建支持智能體運行的數據中心和網絡架構。
這一切,都是為了迎接即將到來的“智能體時代”。
![]()
01
“前智能體時代”的交互模式是,用戶寫一堆復雜的提示詞,AI生成內容。
然后呢?
具體用這些內容做什么、怎么用,都由用戶自己執行。
AI只負責動嘴,真正干活的還是人。
人→AI→人,這是三個環節。
進入智能體時代后,AI就不再是單純的被動應答聊天工具,而是具備了感知、推理、調用工具并采取行動的實用工具。
簡單來說,它擁有執行能力,乃至執行權。
環節只剩人→AI,極大提升了生產效率。
兩者本質上是“被動工具”與“主動生產力”的區別。
所以,為什么要斥巨資研發這玩意?
因為智能體是目前唯一能帶來非線性人效提升的方案。
![]()
前沿模型智能體目前能以80%的可靠性自主完成的任務長度,來源:METR
僅看本次展示的其中幾個行業:
1.金融。
高盛CTO分享了基于Gemini Enterprise和TPU 8i算力集群打造的內部智能體“GS-Alpha”。
它每天實時監控全球45000個新聞源、1200場上市公司的財報電話會議(直接聽音頻,文本轉錄有延遲)。
一旦某家公司CEO在電話會里的語氣出現異常的停頓或猶豫(語音情感分析),GS-Alpha會在0.2秒內完成多步邏輯推理,自動生成一份風險預警報告,并直接通過API向交易系統下達對沖指令。
據高盛披露的數據,這套系統上線后,其投研部門的數據處理通量提升了1400%,研報的平均生成時間從48小時壓縮到了3分鐘。
2.醫療。
梅奧診所展示了最新的“Med-Agent”工作流。
當一個疑難雜癥患者入院時,Med-Agent會自動調取患者過去15年的電子病歷,同時調用醫學影像分析模型,結合最新的醫學期刊數據庫自動拉起一個“專家智能體會診”。
內科智能體、外科智能體、病理科智能體在系統內進行相互辯論,最終給提供三個帶有明確置信度和文獻引用的治療方案。
根據《柳葉刀》2月針對40家大型醫院的研究數據,采用Med-Agent輔助的科室,誤診率降低了31%,醫生每天花在“寫病歷和查資料”上的行政時間減少了65%。
3.跨境電商。
歐美知名家居電商Wayfair通過接入Vertex AI,打造了一個龐大的數字孿生供應鏈智能體。
它連接了全球3000多個供應商、80個海運港口和150個倉儲中心的實時API。
比如在1月底,智能體通過抓取當地新聞和社交媒體情感分析,第一時間檢測到孟加拉國即將發生大規模罷工。
為了避免全棉床單斷貨,它不需要等待企業人工審批……直接向越南的備用工廠發送了緊急加單郵件;并自動調用馬士基的物流API,修改三個集裝箱的航線;同時自動登錄亞馬遜和自家官網后臺,將現有全棉床單的售價上調12%,以平滑庫存消耗。
根據Deloitte發布的《全球供應鏈數字化轉型報告》,全面采用這類自主智能體的零售企業,其庫存周轉率平均提升了45%,因供應鏈斷裂導致的缺貨損失降低了73%。。
顯然,對企業而言,智能體不止是“降本增效”這么簡單,更能解決曾經無解的痛點。
它能做到人做不到的事。
根據Gartner在3月最新發布的《企業級AI智能體落地與ROI追蹤白皮書》:
截至2026年第一季度,全球500強企業中,已有82%在核心業務流程中部署了至少一個具備“自主執行能力”的智能體,而這個數字在2024年底僅為11%;部署基于多智能體系統的企業,平均投資回報期從2025年的14個月,斷崖式下降到4.5個月。
截至2025年末,谷歌專門針對企業客戶的Gemini Enterprise,僅僅推出幾個月,就賣出了超過800萬個付費席位。
2026年Q1,其Gemini API的日均調用量達到了1200億次。其中,包含“工具調用”和“多步推理”的復雜智能體請求占比,從去年的不到15%飆升至68%。
這方面的需求,是毋庸置疑的,而且其爆發期才剛剛開始。
但是,困境也很明顯。
![]()
IDC預測2031年中國將存在3.5億個活躍智能體,來源:開源證券
02
智能體系統引入了多步推理、外部API工具調用、記憶機制。
要支撐大量智能體同時并發工作、且不能有明顯的延遲卡頓,企業內部系統的API請求量必然呈指數級爆發。
Gartner的報告指出,2025年有40%的企業級AI項目失敗,并不是因為模型不夠聰明,而是因為“算力塞車”導致智能體超時崩潰。
如果沒有底層硬件的突破,智能體的大規模落地根本就是空中樓閣。
谷歌的底層算力架構必須要升級。
首先是硬件方面。
第八代TPU被史無前例地拆分成了兩款截然不同的芯片:專攻模型訓練的TPU 8t,專攻推理的TPU 8i。
前者還是經典的大力出奇跡產品,采用了“雙計算芯粒 + 單I/O芯粒”的設計,單個超級計算節點可以集成9600塊芯片,計算性能達到121 Exaflops(百億億次浮點運算)。相比去年發布的第七代,同等價格下的性能提升了2.8倍,每瓦性能提升了124%。
后者的作用,則是應付海量智能體并發時的極端低延遲要求。
在AI推理中,算力往往不是瓶頸,把數據從內存搬到處理器的過程才是最耗時、最耗能源的,俗稱內存墻。
為了突破這堵墻,TPU 8i上內置了高達384MB的SRAM,容量是上一代的三倍,同時還外掛了288GB的HBM顯存。
這意味著模型在運行時的活躍工作集可以完全塞進芯片內部,幾乎不需要去外部要數據,處理器空閑等待時間銳減。
其次是軟件生態。
這次Next大會上,谷歌推出了統一的AI技術堆棧,升級了Vertex AI平臺,甚至拋出了Google Antigravity平臺這個大殺器。
Antigravity是一個專門為開發者打造的構建自主智能體的全棧工具鏈。
以前開發一個Agent,開發者需要自己寫代碼去接各種API、設計長短期記憶庫、規劃執行邏輯。
現在,谷歌把這些全打包成了基礎設施,開發者可以像搭樂高一樣,輕松構建具備任務規劃、工具調用能力的AI應用。
不過,這也引發了一個問題。
還是對SaaS行業的擔憂。
![]()
SaaS基本面惡化,來源:浙商證券
如果AI Agent能自己拉數據、寫報表、發郵件,那企業干嘛還要給員工買Salesforce、Workday或者Excel的訂閱席位?
沒有了這些,SaaS公司還有什么存在的必要?
皮查伊拋出了一個數據安撫市場:“頭部95%的SaaS公司,已經在采用Gemini來重構業務。”
未來的SaaS公司將不再單純出售軟件系統,而是將其轉化為底層的數據API,直接賣給谷歌或客戶的AI智能體。
這就催生了一個龐大的新興業務:數據現代化改造。
智能體再怎么聰明,首先它得有數據。
企業買單的前提是,智能體能讀取企業內部的私有數據。但很多大型企業的ERP、CRM系統老舊不堪,根本就沒有標準的API接口。
也就是說,谷歌不僅在賣智能體服務,還在利用這波機會,強迫企業把所有底層數據全部搬到Google Cloud的BigQuery數據庫里。
據預測,每在AI上花費1美元,將帶動至少3美元的底層數據清洗和云存儲需求。
這是真正的“連環收割”盈利路線。
03
當TPU 8t在日以繼夜地訓練更聰明的大腦,當TPU 8i在數據中心里以光速處理海量的推理請求時,世界的規則已經被悄然改寫。
隨著智能體大量投入應用,AI再也不是為人賦能的工具,而是真正成為可以替代人的執行者。
在這種情況下,絕大部分企業其實沒有選擇。
你不用,你的對手用怎么辦?
最原始的生存法則一定會使得智能體在企業端的需求得到完全釋放。
最終,必然會造成兩個顯而易見的后果。
首先,市場格局進一步兩極分化。
智能體的研發和部署,都需要海量的資金、技術和人才,少數巨頭通過加大投入掌控智能體的核心技術和基礎設施,將進一步擴大自己的優勢;而中小企業,只能在前者構建的生態中,從事一些細分領域的工作,很難再形成競爭力。
其次,誰來買單?
不難想象,隨著智能體深度應用,每一個消費者都能得到極致的專屬智能服務,享受更舒適便捷的生活。
但是,為這些服務買單的財富,從哪里來?(全文完)
格隆匯聲明:文中觀點均來自原作者,不代表格隆匯觀點及立場。特別提醒,投資決策需建立在獨立思考之上,本文內容僅供參考,不作為任何實際操作建議,交易風險自擔。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.