<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      馬斯克的GPU也在摸魚?狂囤幾十萬張顯卡,只有11%在干活

      0
      分享至


      新智元報道

      編輯:元宇

      【新智元導讀】馬斯克囤了幾十萬張卡,結果只跑了11%?據媒體報道,xAI的MFU只有約11%,xAI總裁Michael Nicolls在內部備忘錄中稱這一數字「低得尷尬」。AI競賽的KPI正從囤卡切換為把卡跑滿。

      馬斯克囤了幾十萬張卡,結果只跑了11%?

      這個數字最先被The Information曝出,后又被Business Insider根據一份xAI內部備忘錄實錘。

      這份備忘錄出自xAI總裁Michael Nicolls之手。

      面對這個數字,他甩出四個字:低得尷尬

      The Information報道,xAI手里約有50萬張英偉達GPU,雖然xAI官方至今未公開確認,但其官網已寫明:Colossus集群已擴展到20萬張GPU,目標是100萬張。

      無論按哪個數字,xAI都坐擁公開披露中規模最大的AI算力集群之一。

      但根據Nicolls備忘錄,這幾十萬張GPU實際只跑出了約11%的有效訓練算力。

      Nicolls給團隊定的目標,未來幾個月內要把這個數字拉到50%。

      從11%到50%,差的不是幾臺機器,而是一整套訓練棧。


      xAI在孟菲斯建成的Colossus集群內部,目前已擴至20萬張GPU,目標是100萬張,是公開披露中最大的AI超算之一。

      11%不等于89%的GPU在睡覺

      很多人第一次看到「11%」這個數字,會下意識理解成「89%的GPU在睡覺」,這也是它最容易被誤讀的地方。

      11%對應一個行業指標MFU(Model FLOPs Utilization,模型浮點運算利用率)。

      AI算力公司Lambda在白皮書里給它的定義是:MFU等于實際觀測到的FLOPS,除以GPU理論峰值FLOPS。

      換句話說,它衡量的是你買的這塊卡,在訓練這一刻,把多少理論算力真正轉化成了有效的訓練吞吐。

      它不是任務管理器里那個「GPU占用率」。GPU可以100%忙著等數據、忙著同步、忙著重新計算,但有效輸出寥寥。MFU衡量的正是那點真正干活的部分。

      這11%意味著,理論上能產生100份訓練吞吐的硬件,實際只跑了11份。剩下的89%不是閑著,是在做無用功,或者在等待。

      從燒錢的角度看,低MFU意味著大量電力和硬件時間消耗在通信、等待、數據搬運、重計算等環節,而沒有轉化為理想狀態下的有效訓練吞吐。

      那11%在工程現實里到底差到什么程度?這就要看歷史對照表。

      Lambda在白皮書里提到:生產級LLM訓練的MFU通常落在35%到45%之間。這是正常水平。

      還有一組更犀利的對比數據來自谷歌PaLM論文。


      https://arxiv.org/pdf/2204.02311

      這篇論文有一張被廣為引用的MFU對比表:


      英偉達自己維護的訓練框架Megatron-LM,其GitHub頁面上寫明:在H100集群上訓2B到462B參數模型,MFU最高可以到47%。強擴展到4608張H100時,因為通信開銷暴露,MFU會從47%降到42%。

      把xAI的11%放進這張表里,它低于GPT-3那個被嘲笑過效率低的古早年代,也低于Gopher、MT-NLG、PaLM、Megatron-LM。

      幾乎是低于所有公開前沿訓練系統的下沿。

      至于低MFU的原因,Lambda也總結過。

      顯存壓力、單卡batch太小、過度的激活重計算(activation checkpointing)、把權重切得過碎的張量并行帶來的跨GPU通信開銷,任何一個都會拖累MFU。

      一位同行研究員的描述更形象:HBM顯存比加速器慢得多,芯片大量時間在等數據進來;網絡拓撲里任何一處瓶頸,都會拖垮幾千張卡的同步。

      業內管這個叫「記憶墻(memory wall)」。

      11%不是單點故障,是系統級問題。

      這不止是xAI一家的問題

      不過,把xAI單拎出來說事,也未必公平。

      The Information報道里還提到了一位同行匿名研究員的一句評價:「跑過40%對xAI的大多數競爭對手來說也很難」。

      這是一個刺破全行業體面的問題。

      報道里提到,一些研究員為了讓自己的MFU數字「好看一點」,會反復重跑訓練實驗,人為抬高利用率。

      原因有兩個:一是怕被老板罵;二是怕GPU被調走分給別的團隊。

      這些研究員的邏輯是,我的卡現在確實在閑著,但我只是「在分析上一輪訓練結果,馬上就要再跑」,不能讓它被收走。

      在AI大廠里,跑分這件事不只發生在公開榜單上,也發生在內部GPU調度系統里。

      xAI并不是一個硬件部署上的反面教材。The Information提到,xAI在業內以「按英偉達推薦方式部署GPU」著稱,是模范生。

      模范生只跑了11%,說明問題不在硬件、網絡拓撲標準,而在更上層的訓練棧、并行策略和模型工程。

      11%這個數字,也捅破了行業心照不宣的那層窗戶紙:買卡和用卡是兩回事。

      Colossus開始把卡租出去了

      也幾乎在同一時間,xAI開始把卡租出去了。


      xAI CEO馬斯克(左)與Cursor CEO Michael Truell(右)。Cursor計劃用數萬張xAI的GPU訓練Composer 2.5。

      據Business Insider報道,編程創業公司Cursor將使用「數萬張xAI的GPU」來訓練它的最新編程模型Composer 2.5。

      Cursor此前估值約290億美元,近期又被曝正洽談約500億美元估值。

      如果把兩件事放在同一時間線上看,至少可以說明:在自訓效率尚未完全釋放時,把部分算力外部化,可能成為xAI攤薄基礎設施成本的一種選擇。

      更微妙的是xAI基礎設施團隊近期的人事地震。

      原基礎設施負責人Heinrich Küttler離職,Jake Palmer接管了物理基礎設施,SpaceX的Daniel Dueri被調來負責算力基礎設施。

      與此同時,Cursor原產品工程負責人Andrew Milich和Jason Ginsburg跳槽到xAI,直接向馬斯克和Nicolls匯報。

      把這些信號串起來,能看到一個正在變形的Colossus:

      它在官方敘事里是「世界最大超算」、是xAI打敗OpenAI的算力底牌;但在業務層,它正在一點點變成一座「半成品云廠商」。

      AWS、Azure、GCP靠著出租算力賺到的利潤是天文數字;CoreWeave、Lambda這種新玩家干脆圍繞租GPU建生意。

      xAI如今走的是同一條路,只不過一邊租一邊自己也得訓模型。

      自己跑不滿,就讓別人來跑,這是當代GPU資本的標準動作。

      xAI官方至今沒有正面回應過11%這個數字,官網首頁仍然掛著122天建成、92天翻倍到20萬張GPU、路線圖通往100萬張GPU的官方敘事。


      xAI Colossus 122天建成,從10萬張GPU擴到20萬張只用了92天,路線圖通往100萬張。但越快擴張,訓練棧和并行策略的復雜度也越大。

      但速度有速度的代價。

      Megatron-LM公開的數據已經給出了警告:當你把H100集群強擴展到4608張時,僅僅是通信開銷,就足以把MFU從47%拖到42%。

      這是英偉達自己的旗艦訓練框架,跑在標準化最強的硬件上。

      xAI要把卡數從20萬推到100萬,意味著通信、調度、容錯、并行策略的復雜度還可能要再漲一個數量級。

      122天建成是工程奇跡,但每一天的奇跡背后,都有一筆運維債在悄悄記賬。

      AI競賽的KPI正在切換

      過去比的是倉庫:誰先囤到H100、誰先建成超算、誰能從英偉達手里搶到下一批GB200。

      這個游戲花錢就能玩,所以馬斯克、奧特曼、扎克伯格、黃仁勛都下場了。

      現在比的是工程師:誰的訓練棧調得最好、誰能把每一美元GPU CapEx轉化成最多的有效token。

      這個游戲花錢解決不了,只能靠時間、人才和工程文化。

      GPU是入場券,但MFU才是真正的考驗。

      xAI雖然拿到了最大的那張入場券,但它能不能把這張券兌現,還要看那個「低得尷尬」的數字,能不能真的拉到Nicolls所說的50%。

      參考資料:

      https://www.theinformation.com/newsletters/ai-agenda/xai-shows-hard-use-lot-gpus?rc=epv9gi

      https://arxiv.org/pdf/2204.02311

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      特朗普稱撤軍規模遠超5000人,德國方面稱撤軍決定“意料之中”

      特朗普稱撤軍規模遠超5000人,德國方面稱撤軍決定“意料之中”

      澎湃新聞
      2026-05-03 11:24:28
      香奈兒發布無底綁帶鞋,網友:太抽象了!

      香奈兒發布無底綁帶鞋,網友:太抽象了!

      都市快報橙柿互動
      2026-04-29 15:43:37
      研究表明:男性嫖娼率6.4%,女性出軌率15%,且越有錢越開放!

      研究表明:男性嫖娼率6.4%,女性出軌率15%,且越有錢越開放!

      黯泉
      2026-04-01 17:28:39
      749局人員自述:人死后不會消失,靈魂會從三維世界進入四維世界

      749局人員自述:人死后不會消失,靈魂會從三維世界進入四維世界

      神奇的錘子
      2024-08-27 13:15:19
      已接近4萬人次的日最大承載量,晉祠博物館發布錯峰提示

      已接近4萬人次的日最大承載量,晉祠博物館發布錯峰提示

      黃河新聞網呂梁
      2026-05-03 08:59:59
      高市早苗挾天皇叫板,48小時遭美致命背刺,中國甩出44.4噸钚絕殺

      高市早苗挾天皇叫板,48小時遭美致命背刺,中國甩出44.4噸钚絕殺

      王姐懶人家常菜
      2026-05-02 20:05:57
      Manus未解之謎:退回20億美金

      Manus未解之謎:退回20億美金

      人人都是產品經理社區
      2026-05-02 10:12:11
      善惡終有報!不顧央視警告,與劉濤傳出緋聞的楊爍,終究難逃惡果

      善惡終有報!不顧央視警告,與劉濤傳出緋聞的楊爍,終究難逃惡果

      無處不風景love
      2026-03-22 18:01:05
      伊朗給全球上了一課,世界軍事排名,將更新!

      伊朗給全球上了一課,世界軍事排名,將更新!

      深度報
      2026-04-30 22:47:56
      電影市場,徹底涼涼

      電影市場,徹底涼涼

      葉秋臣
      2026-05-02 23:07:55
      從武大碩士到商場導購:誣告學弟性騷擾的楊景媛,終于付出了代價

      從武大碩士到商場導購:誣告學弟性騷擾的楊景媛,終于付出了代價

      地理三體說
      2026-04-25 22:06:06
      英冠大結局:考文垂、伊鎮升級,圣徒附加賽,萊斯特城降級

      英冠大結局:考文垂、伊鎮升級,圣徒附加賽,萊斯特城降級

      懂球帝
      2026-05-02 22:04:19
      帕爾默新女友太絕了!浴室自拍曲線封神!球迷破防:帕爾默沒救了

      帕爾默新女友太絕了!浴室自拍曲線封神!球迷破防:帕爾默沒救了

      聽我說球
      2026-05-03 10:11:19
      別再吹天生美貌!朱珠真實原生臉曝光,整容前后差距一目了然

      別再吹天生美貌!朱珠真實原生臉曝光,整容前后差距一目了然

      小娛樂悠悠
      2026-04-27 09:21:13
      “大儒”竟是老流氓!人大教授亂情十多女:還要女生倒貼20萬

      “大儒”竟是老流氓!人大教授亂情十多女:還要女生倒貼20萬

      大江看潮
      2026-05-01 23:33:35
      旺盛是“性癮”嗎?性癮患者自述:比煙癮、酒癮可怕多了!

      旺盛是“性癮”嗎?性癮患者自述:比煙癮、酒癮可怕多了!

      觀星賞月
      2026-05-03 11:44:41
      3億美元!央視疑似不買世界杯的轉播權,球迷一邊倒的支持

      3億美元!央視疑似不買世界杯的轉播權,球迷一邊倒的支持

      魔都姐姐雜談
      2026-05-02 08:44:52
      劉曉慶被指“架子大”?和“王婆”互動態度冷淡,但別漏了這些細節......

      劉曉慶被指“架子大”?和“王婆”互動態度冷淡,但別漏了這些細節......

      新民周刊
      2026-05-02 15:48:23
      最不懂技術的人做了決定:凌晨7點,70米高空,73個人瞬間墜落,

      最不懂技術的人做了決定:凌晨7點,70米高空,73個人瞬間墜落,

      林子說事
      2026-05-03 00:17:04
      39歲上海科技大學教授王晨輝因營救至親溺水遇險,不幸去世

      39歲上海科技大學教授王晨輝因營救至親溺水遇險,不幸去世

      澎湃新聞
      2026-05-03 12:14:26
      2026-05-03 13:24:49
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      15120文章數 66828關注度
      往期回顧 全部

      數碼要聞

      自費測評aigoGS11耳機:一篇可能得罪廠商,但必須發出來的真實體驗

      頭條要聞

      上海科技大學王晨輝教授因營救至親不幸去世 年僅39歲

      頭條要聞

      上海科技大學王晨輝教授因營救至親不幸去世 年僅39歲

      體育要聞

      裁判準備下班,結果吳宜澤進了決賽

      娛樂要聞

      蔡卓妍婚后首現身 戴結婚戒指笑容不斷

      財經要聞

      后巴菲特時代,首場股東會透露了啥

      科技要聞

      庫克罕見"拒答"!蘋果正被AI供應鏈卡脖子

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態度原創

      親子
      數碼
      藝術
      旅游
      家居

      親子要聞

      勞動小能手節日快樂

      數碼要聞

      Perplexity稱贊Mac mini是其Personal Computer的最佳本地部署平臺

      藝術要聞

      Dale terbush:當代美國風景畫家

      旅游要聞

      夯!上海人的朋友圈被刷屏!上萬人的震撼場面

      家居要聞

      靈動實用 生活藝術場

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产精品高潮无码毛片| 岛国无码av| 2022色婷婷综合久久久| 日本视频高清一道一区| 亚洲精品一级片a| 无码人妻精品一二三区免费| 亚洲自拍偷拍一区| 日本无遮挡吸乳呻吟视频| 久久一本人碰碰人碰| 南平市| 无码专区无码专区视频网址 | 99国内精品久久久久久久| 超级碰免费视频91| 日本人成网站18禁止久久影院| 亚洲 欧美 唯美 国产 伦 综合| 狠狠狠色丁香婷婷综合久久俺| 思思99re6国产在线播放| 久久精品久久精品久久精品| 国产成人av| 噜噜涩99| 免费无码一区无码东京热| 国产另类ts人妖一区二区| 一区二区自拍| 人妻无码vs中文字幕久久av爆| AV狠狠色| 中文毛片无遮挡播放免费| 国产成人亚洲日韩欧美| 国产日产久久高清欧美一区| 国产精品一卡二卡三卡| 久操精品| 久久久久国精品产熟女久色| 孕妇bbwbbwbbwbbw超清| 99久久这里只精品麻豆| 国产在线尤物在线不卡网站| av亚洲在线一区二区| 国产精品一区二区香蕉| 久久久久亚洲精品无码网址色欲| 精久国产av一区二区三区孕妇| 色欲天天天综合网| 99自拍视频| 日本一区二区在线免费观看|