<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      劈柴哥把谷歌AI 芯片「劈」成兩半,要硬剛英偉達了

      0
      分享至

      強如谷歌,算力也不夠了。

      在昨天拉斯維加斯的谷歌 Cloud Next 大會上, CEO 劈柴哥 (Sundar Pichai) 透露了令人震撼的數字:

      Gemini API 上個季度每分鐘處理 100 億 token——僅僅過去一個季度,就漲了足足60%,現在每分鐘處理超過 160 億 token。


      增量很大程度上來自 agent 使用場景。一個任務被拆成十幾步,每一步都是上下文讀取,都是 API 請求,都在輸入和輸出 token。如果說簡單的 chat 模式就是一來一回,那 agent 的到來讓一切都變了,變成了一臺「大電腦」帶著一群「小電腦」在給你干活。

      推理成本曲線也顯著攀升了……

      為了解決這個問題,谷歌開發出了新的一代 TPU(Tensor Processing Unit 張量計算單元):

      第 8 代 TPU 首次被拆成兩顆芯片,專門用來訓練的 8t,以及專門用來推理的 8i。


      圖片來自 Pichai 個人推特

      這是 TPU 項目十年來,第一次在產品定義上做出這種分野,也是谷歌在自研芯片上第一次,在規格上正面站到競爭對手英偉達 Rubin 的對面。

      但首先我們要回答這個問題:

      為什么要拆開?

      TPU 過去有過分檔。2023 年 12 月的 v5p 是訓練旗艦,更早的 v5e 是推理性價比款,兩顆芯片同架構、不同裁剪。但是到了 2024 年的 Trillium(v6),和 2025 年 Ironwood(v7),TPU 又回到「一顆打天下」的產品先。

      第 8 代直接把訓練和推理拆成兩顆獨立設計的 die,背后的判斷是:agent 時代的訓練和推理,已經長成了兩種截然不同工作負載。

      訓練任務的算力負載,可以理解為「大洪水」:不經常來,但一來就是排山倒海的流量。一次前沿模型訓練持續數周,橫跨萬卡規模,對單芯片峰值和故障域規模很敏感。

      推理的算力負載,雖然更加「細水長流」,但正如文章一開頭提到的,也因為 agent 的普及發生了巨變。

      這里英偉達在 GTC 2026 大會上給過數據參考:從 ChatGPT 出現到 Claude Code 流行起來的兩年里,推理算力需求漲了一萬倍,token 需求自 2024 年 12 月以來也增長了 28 倍。當推理開始以這個量級增長,agent 之間的交互又把 MoE 架構的路由工作,和長思維鏈推向極致。

      一顆芯片同時服務兩種負載就開始吃虧。


      訓練芯片要的是單位面積里更多的算力密度,和更大的規模化。推理芯片的訴求完全不同:片上存儲要大到塞得下越來越大、越來越多的 KV cache,延遲要低到用戶可以接受。

      正如 Pichai 在這次大會上演講里所說的:「問題已經從『能不能造一個 agent』,變成『怎么管好幾千個』。」


      8t:一顆不追求單卡冠軍的訓練芯片

      先看硬指標。8t 單顆芯片能跑出 12.6 PFLOPS 的 FP4 算力,配 216 GB HBM3e 顯存、6.5 TB/s 帶寬。這個水平在今天的 AI 芯片里并不算頂,換個口徑看甚至偏保守。NVIDIA 今年要上的 Rubin,單卡 FP4 算力大約 50 PFLOPS,顯存 288 GB、帶寬沖到 22 TB/s——單卡性能將近 8t 的四倍。

      但是,谷歌在這里并沒有要跟英偉達拼單卡,而是把押注 TPU 8t 的規模化維度。簡而言之:TPU 8t 的單個「superpod」集群可以塞進 9600 枚 8t,且共享 2PB 內存,聚合算力高達 121 Exaflops。而英偉達的 Rubin NVL72 只有 72 顆 GPU,預計 2027 年底的 Ultra NVL576 機架只有 576 顆。

      換句話說,在同一個「訓練作業可以平鋪多大」的維度上,谷歌領先 NVIDIA 超過一個數量級。


      這件事對訓練的意義是什么?訓練一個前沿大模型要跑數周,每天都在重復同一件事:幾千上萬顆芯片一起算一步、然后把結果對齊,再算下一步。每次對齊都是一次「大家停下來等最慢的那個」。

      而芯片越多、拓撲越平攤,整個集群就能越穩地往前推,少掉單卡峰值高不高反而沒那么重要。谷歌給出的對比數據也是這個方向:相比上一代 Ironwood,8t 整 pod 算力接近 3 倍,同樣花一美元能買到 2.7 倍的訓練性能,每瓦性能最多 2 倍。存儲這一端靠 TPUDirect 讓顯存直通硬盤,數據讀取比上代快 10 倍。整個集群 97% 以上的時間都能花在真正的有效訓練上,這在萬卡級別已經很夸張。

      換個角度理解這條路線的分歧:NVIDIA 像在造超級跑車,每一代都追求單車速度極限;谷歌更像在修一條八車道高速,單輛車不一定快,但總吞吐量可以拉到對手難以企及的規模。

      SemiAnalysis 此前對上一代 Ironwood 的判斷是,單芯片已經在顯存、帶寬、算力上追平 Blackwell,只落后大約一年。8t 沒打算在單卡這邊追平,它直接去搶一個 NVIDIA 當下還夠不到的維度。

      8i:把 KV Cache 整個塞進芯片在推理芯片 8i 上,它的 288 GB HBM 顯存配 8.6 TB/s 帶寬,顯存比 8t 還多 72 GB、帶寬還高三成。它還配備了 384 MB 的片上 SRAM,是上一代 Ironwood 的 3 倍。

      8i 的單卡 FP4 算力 10.1 PFLOPS,比 8t 略低,低在谷歌認為推理不需要那么多算力峰值。


      SRAM 是芯片上最快、也最貴的那塊內存。過去這種「寸土寸金」的內存只有幾十 MB,主要拿來緩存中間結果。8i 把它做到 384 MB,目的就是把大模型推理時最關鍵的 KV cache 能夠整塊塞進芯片。

      如果你不知道 KV cache 是什么,可以簡單將它理解為模型讀長上下文時累積下來的「臨時記憶」,過去它存在 HBM 顯存里,吞吐的時候都要讀取讀一遍,推理速度相當一部分卡在這個搬運上。

      而塞進 SRAM 之后,讀寫距離從「幾米遠的倉庫」縮到「桌上的筆記本」,長上下文推理的效率直接上一個臺階。

      再看 8i 真正的大招:它放棄了 3D Torus,也就是 TPU 從第二代用到現在的那個「每顆芯片只跟鄰居說話」的網絡拓撲。

      3D Torus 擅長的是規律通信,適合訓練任務(所有芯片一起做同一件事)。然而推理的需求是反過來的:一個 MoE(混合專家網絡)模型的工作過程中,每次吞吐可能都要激活不同的專家網絡,讓任意兩顆芯片之間突然要通話。放在 3D Torus 上,這意味著消息要一跳一跳傳過去,跳數多的路徑,會拖慢整條推理鏈。

      8i 換上的新拓撲叫做 Boardfly。簡單說,4 顆芯片組成一個小單元,8 塊板拼成一個組,36 個組再通過光開關連起來,按照 1024 枚芯片的最高集群數量來計算,兩顆最遠芯片之間的跳數可以從 3D Torus 的 16 跳壓到 Boardfly 的 7 跳,網絡直徑減少 56%,通信延遲最多降一半。

      在同等成本下,8i 在低延遲、大 MoE 場景下,每美元推理性能比 Ironwood 提升 80%。用谷歌自己的話說,「客戶花同樣的錢,可以服務接近兩倍的流量」。


      拿這套東西跟 NVIDIA 對比起來,畫面大概是這樣的:

      NVIDIA 的推理旗艦是 NVL72 機架,72 顆 Blackwell/Rubin 芯片通過 NVLink 連接,它的思路是「每顆都很強,擠在一起更強」。8i 反過來:單卡算力克制,但一個 pod 集群直接內嵌上千顆芯片,再把跳數/對話延遲壓到極低。

      對于當今 agent 時代的典型推理負載,也即「成千上萬個 agent 同時在后臺互相傳話」,8i 的設計聽上去比英偉達當前的方案更加合理。

      畢竟,推理專用芯片真正要解決的,說是讓每個 token 變便宜。至于比上一代快多少,反而沒那么重要——至少谷歌是這么認為的。

      TPU + NVIDIA = Virgo

      谷歌還發布了一個全新的數據中心網絡結構技術 (fabric),叫做 Virgo。

      你可以把它理解為一條巨型數據中心的「高速公路」,專門跑在 AI 芯片之間。一張 Virgo 能掛 13.4 萬顆 8t,對分帶寬 47 Pbps。再加上谷歌自家的 Pathways 和 JAX 軟件層,多個 Virgo 可以拼成一個 100 萬顆 TPU 的單一訓練集群。

      Anthropic 去年跟谷歌簽下的那份最多 100 萬顆 TPU、超過 1 GW 電力的大單,就是建立在這個數字之上。今年 4 月,Anthropic 又和谷歌、博通 一起把這份合約擴到了 3.5 GW。

      更有意思的是,同一套 fabric 也能掛英偉達的 Rubin 顯卡,最高支持 96 萬顆 GPU。也就是說,谷歌非常清楚大家對英偉達的算力還是有需求的。客戶在 Google Cloud 上照樣買得到 Rubin 實例,TPU 8t 和 8i 只是算力菜單上新加的兩道菜,而 Virgo 能夠同時給用戶提供「best of both worlds」。


      知名分析師 Ben Thompson 今年寫過一篇分析,指出 TPU 的硬件和軟件棧都比英偉達更加「專用」,英偉達更加靈活。

      2025 Q4,谷歌云營收 177 億美元,同比增長 48%;手里的待履行合同高達 2400 億美元,同比翻倍。管理層在財報會上直說 2026 年的算力還是不夠用。客戶要的算力已經溢出任何一家芯片廠商的產能,誰的卡都不嫌多。

      這種時候,把所有能插電的算力都接進同一張網,比站隊更加實在。

      TSMC 2nm 大規模量產的窗口在 2027 年底,谷歌說 8t 和 8i 會在「今年內」正式上線,但這個「今年內」大概率是小批量可以通,真正的大規模出貨要等到 2027。

      至少對于谷歌最大客戶之一的 Anthropic 來說,目前的主力算力來源仍然是英偉達的 GPU,以及上一代 TPU。

      TPU,你嘛時候能決戰英偉達呢?

      英偉達的護城河仍然存在。CUDA 生態已經積攢了十幾年的人氣,幾乎所有開源模型、推理框架、依賴庫都繞不開它;而在 TPU 這邊,谷歌通過 JAX、Pathways、XLA 等技術,提供了替代方案,但也只是把路趟出來了。

      要讓習慣于 CUDA 的開發者,以及他們背后的巨頭公司們轉投 TPU,仍然有很大的坎。

      有趣的是,業界巨頭們已經開始對 TPU 提高興趣了:據 SemiAnalysis 的報告,OpenAI 在跟英偉達購置算力談條件的時候,提過 TPU 這檔子事;而英偉達為了讓 OpenAI 不從谷歌那邊采購 TPU 算力,硬生生讓出了 30% 左右的合同價格。

      這么看,TPU 雖然暫時沒賺到 OpenAI 的錢,至少把對手的利潤率壓下去不少……

      英偉達的思路還是「核彈」的思路:把單卡,把連通性 (networking) 做到極致。而谷歌在這些方面也已經后來趕上。但今時今日,最大的問題可能不是性能本身,而是 token 經濟學里面的更關鍵要素:電費、時延等等。

      就連谷歌自己的高管也說:在今天的數據中心里,真正卡脖子的不只是芯片,還有電。

      所以 TPU 什么時候能真刀真槍地決戰英偉達?恐怕今年還不行,明年也懸,但它已經在另一條戰場上開始扳動一些東西了。

      真正被挑戰的,可能也不只是英偉達,還有過去幾年整個行業默認的真理:算力能解決所有問題。


      文|杜晨

      我們正在招募伙伴

      簡歷投遞郵箱hr@ifanr.com

      ?? 郵件標題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      一夫一妻制即將消失?3種新型婚戀模式席卷全國,或取代傳統婚姻

      一夫一妻制即將消失?3種新型婚戀模式席卷全國,或取代傳統婚姻

      瓦倫西亞月亮
      2026-05-01 09:38:21
      東莞驚天洗錢大案:閣樓藏千萬現金,腌菜缸塞滿百元鈔票

      東莞驚天洗錢大案:閣樓藏千萬現金,腌菜缸塞滿百元鈔票

      阿萊美食匯
      2026-05-06 01:46:51
      隨著葡萄牙體育5-1,葡超最新積分榜出爐:穆帥率隊跌出歐冠區

      隨著葡萄牙體育5-1,葡超最新積分榜出爐:穆帥率隊跌出歐冠區

      側身凌空斬
      2026-05-05 08:27:06
      印度高種姓為何盛產美女?看看她們被混血多少次就知道了

      印度高種姓為何盛產美女?看看她們被混血多少次就知道了

      老謝談史
      2026-05-06 02:50:58
      四川廣安華鎣市瑪琉巖探險公園,女游客蕩秋千墜崖:景區閉園

      四川廣安華鎣市瑪琉巖探險公園,女游客蕩秋千墜崖:景區閉園

      阿昌走遍中國
      2026-05-06 00:27:22
      美專家曾一語驚人:美軍一旦把核彈扔向京滬,中國并不會還手

      美專家曾一語驚人:美軍一旦把核彈扔向京滬,中國并不會還手

      無月可歸辛
      2026-05-06 06:29:28
      蔡少芬曬五一聚會照,三姐妹吃腸粉喝下午茶,完全沒有明星包袱

      蔡少芬曬五一聚會照,三姐妹吃腸粉喝下午茶,完全沒有明星包袱

      小妹講史
      2026-05-05 20:43:07
      汪峰又陷感情風波!森林北刪光恩愛動態,章子怡徹底贏麻了!

      汪峰又陷感情風波!森林北刪光恩愛動態,章子怡徹底贏麻了!

      手工制作阿殲
      2026-05-04 18:13:23
      20多年前陳紅在陳凱歌家拍照,她躺在沙發上的樣子,堪稱人間尤物!

      20多年前陳紅在陳凱歌家拍照,她躺在沙發上的樣子,堪稱人間尤物!

      感覺會火
      2026-04-28 21:18:46
      國米有望連續第二年財政盈利 重要成本降低展示新東家之長板

      國米有望連續第二年財政盈利 重要成本降低展示新東家之長板

      國際足球冷雪
      2026-05-06 06:43:05
      上海火車站揪心一幕!老人在自動扶梯上摔倒,下一秒他們都出手了…

      上海火車站揪心一幕!老人在自動扶梯上摔倒,下一秒他們都出手了…

      上海法治聲音
      2026-05-03 23:20:17
      痞幼自曝因網紅身份不敢吵架,“怕被拍被人說沒有以身作則”

      痞幼自曝因網紅身份不敢吵架,“怕被拍被人說沒有以身作則”

      韓小娛
      2026-05-05 10:05:16
      他是黑道教父,在港一手遮天,55歲返回內地時被數百名警察逮捕

      他是黑道教父,在港一手遮天,55歲返回內地時被數百名警察逮捕

      近史談
      2026-05-04 16:01:29
      摸景甜胸側,抱李雪琴胳膊,31歲的他綜藝翻車,為何如此沒分寸感

      摸景甜胸側,抱李雪琴胳膊,31歲的他綜藝翻車,為何如此沒分寸感

      草莓解說體育
      2026-04-15 04:23:51
      “富人才不會把女兒養這么胖”,家長曬女兒喝60元礦泉水,被群嘲

      “富人才不會把女兒養這么胖”,家長曬女兒喝60元礦泉水,被群嘲

      番外行
      2026-04-22 14:51:19
      Met紅毯發現真空上陣,僅遮凸點引討論

      Met紅毯發現真空上陣,僅遮凸點引討論

      尺素a
      2026-05-05 20:19:01
      尷尬了,時間過了4個月,6大造車新勢力目標完成率,差的很

      尷尬了,時間過了4個月,6大造車新勢力目標完成率,差的很

      互聯網.亂侃秀
      2026-05-04 12:00:17
      連滾帶爬!賴清德連夜返回臺島,斯威士蘭國王把事做絕了

      連滾帶爬!賴清德連夜返回臺島,斯威士蘭國王把事做絕了

      比利
      2026-05-05 12:53:42
      大陸表態后、鄭麗文一鳴驚人!賴清德終成笑話,國民黨3人丟盡臉

      大陸表態后、鄭麗文一鳴驚人!賴清德終成笑話,國民黨3人丟盡臉

      娛樂圈的筆娛君
      2026-05-05 12:45:29
      溥儀從小有個“壞習慣”,奶娘羞于啟齒,宮女太監也不得不回避

      溥儀從小有個“壞習慣”,奶娘羞于啟齒,宮女太監也不得不回避

      芳芳歷史燴
      2026-03-23 18:34:43
      2026-05-06 07:28:49
      AppSo incentive-icons
      AppSo
      讓智能手機更好用的秘密
      6342文章數 26831關注度
      往期回顧 全部

      科技要聞

      傳蘋果考慮讓英特爾、三星代工設備處理器

      頭條要聞

      媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

      頭條要聞

      媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

      體育要聞

      全世界都等著看他笑話,他帶國米拿下冠軍

      娛樂要聞

      內娛真情誼!楊紫為謝娜演唱會送花籃

      財經要聞

      瀏陽煙花往事

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態度原創

      房產
      手機
      本地
      公開課
      軍事航空

      房產要聞

      五一樓市徹底明牌!塔尖人群都在重倉凱旋新世界

      手機要聞

      iPhone 20周年機型或配備固態按鈕,iPhone 18再次確認工藝降級!

      本地新聞

      用青花瓷的方式,打開西溪濕地

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普威脅伊朗不要向美國船開火

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 女人张开腿让男人桶爽| 亚洲精品理论电影在线观看| 天堂tv亚洲tv日本tv欧洲| 欧美三级不卡在线观看视频| 久久精品视频在线看| 国产成人欧美一区二区三区在线| 国自产偷精品不卡在线| 99久久久国产精品免费无卡顿| av色综合网站| 欧美777| 亚洲AV无码码潮喷在线观看| 国产激情з∠视频一区二区| 最新国产精品好看的精品| 五月天导航| 5D肉蒲团之性战奶水欧美| 热99re久久精品国产首页免费| 在线亚洲高清揄拍自拍一品区| 午夜无码片在线观看影院A| 精品人无码一区二区三区| 在线观看av的网站| 色老大久久综合网天天| 久久精品超碰AV无码| 国产精品久久久影视青草| 国产成人精品午夜视频'| 久久丁香五月天综合网| 免费看无码网站成人A片| 亚洲日韩av一区二区三区四区| 精品日产卡一卡二卡麻豆| 99久久精品视香蕉蕉| 性奴sm虐辱暴力视频网站| 国产精品免费无遮挡无码永久视频| 国产视频一区二区| 在线观看亚洲专区5555下载| 99在线精品一区二区三区| 久久亚洲精品人成综合网| 国产精品A片| 大地资源中文在线观看西瓜| 亚洲国产成人字幕久久| 亚洲av成人黄色电影| 国产欧美视频一区二区三区| 一本大道大臿蕉视频无码|