<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      橫跨大西洋11小時,中國開發者用Mac跑Llama 70 B?評論區吵翻了

      0
      分享至


      新智元報道

      編輯:Aeneas

      【新智元導讀】一位中國開發者,在橫跨大西洋的航程中,在飛機上用 MacBook 本地跑 Llama 70B,整整 11 小時沒有網絡,帖子瞬間在X上爆火!但是隨后,越來越多網友發現,這故事不太對啊?

      一位中國開發者,在橫跨大西洋的 11 小時航程中,拒絕了 25 美元的機上網絡,卻在萬米高空完成了一整套復雜的客戶項目交付?

      沒有 Cloud API,沒有 Anthropic,沒有 OpenAI,甚至沒有一格信號。

      只有一臺 MacBook Pro M4、一段自己寫的編排腳本,以及Llama 70B這個本地AI模型,然后就把項目跑通了?

      舷窗外是白云與藍天,沒有 WiFi;小桌板上是一臺 MacBook,終端開著兩個窗口,本地運行著一個推理服務器

      因為太過炸裂,這個帖子一經發出,就在技術社區傳開了。

      本地推理的時代,真的來了?


      在萬米高空,

      用MacBook跑Llama 70B

      據說,故事的主角是一位中國開發者。

      在飛往大洋彼岸的靠窗座位上,他打開64GB內存的MacBook Pro,面對的是堆積如山的客戶任務隊列。

      接下來整整11個小時,都沒有網絡。

      換做普通人,此刻已經乖乖掏出信用卡,支付那昂貴且延遲極高的 25 美元機上 Wi-Fi。

      但他選擇了另一條路:本地推理。

      他啟動了通過llama.cpp運行的Llama 3.3 70B

      生成速度 71 tokens/秒,上下文約 60,000 tokens,內存占用 48.6 GiB / 64 GiB,起飛時電池剩余 3 小時 21 分鐘。


      為了讓這個龐然大物在64GB內存的機器上跑起來,他甚至為自己編寫了一個「離線編排器」腳本。

      最令人拍案叫絕的,是他給AI下達的系統提示詞。

      你是一個運行在單臺 MacBook 上的離線編排器。沒有網絡。你唯一的資源是 /Users/dev/work 下的本地文件、localhost:8080 的 Llama 70B 推理服務,以及 3 小時 21 分鐘的電池預算。

      處理 /Users/dev/work/queue.jsonl 中的任務隊列(每行一個客戶任務)。對每個任務:起草 → 運行本地評估 → 保存產物到 /Users/dev/work/done/。每 12 個任務保存一次上下文檢查點,以便更換電池后恢復。僅在隊列為空或電池低于 5% 時停止。

      因此,這個系統完全清楚自己所處的困境。

      它知道自己未來 11 小時與世隔絕,知道內存和電池是有限的奢侈品,甚至知道在飛機降落前,它必須獨自處理所有的邏輯。

      系統在一個循環中運行:從任務隊列中取出一個任務,進行推理處理,保存生成結果,寫入檢查點。一個接一個,就這樣持續執行。


      只有當電量低于 5% 時,調度器才會自動暫停,等待筆記本切換到備用移動電源,然后從上一次的檢查點繼續運行。

      飛行過程中,系統日志里寫下了這樣的內容:

      「已保存上下文檢查點 8 / 12(pos_min = 488,pos_max = 50118,大小 = 62.813 MiB)」

      「已恢復上下文檢查點(pos_min = 488,pos_max = 50118)」

      「提示處理進度:n_tokens = 50 / 60,818」

      「任務 37016 完成 | 處理速度 = 71 tokens/s → 輸出至 /Users/dev/work/done/proposal_westside.md」

      有人驚呼:這是我過去一年里見過的最干凈利落的離線 AI 工作流程!

      11 小時航程,WiFi 花費為 0,當飛機輪子觸碰跑道的那一刻,他合上電腦,所有的客戶提案已經整整齊齊地躺在done/文件夾里。

      系統不再是一個只會復讀的復讀機,而是一個具備資源意識的管理者

      這正是「Self-aware Computing」最迷人的地方。

      網友打假:

      技術神話,還是「賽博爽文」?

      不過,文章在社區瘋傳后,很快引來了技術極客們的質疑。

      資深開發者們紛紛掏出計算器,開始瘋狂「對線」。

      第一刀:內存與權重的「不可能三角」

      Llama 3.3 70B 如果以 BF16(半精度)運行,光模型權重就需要約140GB內存。要在 64GB 的 MacBook 上跑起來,簡直就像把大象塞進冰箱。

      64GB 內存大概率只能跑 4-bit 量化版本,算上 60k 的上下文 KV Cache,內存占用至少也要 40GB+,BF16 絕無可能。

      非要說的話,要在64GB上跑70B,只有一條路——量化。4-bit量化后模型約35GB,加上KV緩存和系統開銷,勉強能塞進去。


      但量化版本和BF16是兩回事,精度、推理質量都會打折扣。

      帖子里寫的是「bf16」。看起來,這個細節要么是不懂,要么是故意的。





      第二刀:71 tokens/s 的「神仙速度」

      帖子聲稱生成速度71 tokens/s。

      根據 M4 芯片的實際表現,本地運行 70B 規模的模型,生成速度通常在 5-12 tokens/s 之間。

      71 tokens/s 是什么概念?這幾乎是頂級 H100 集群的響應速度。

      「這個速度可能是 8B 模型或者是某種極致的投機采樣,70B 跑出這個速度,MacBook 怕是要起火。」

      評論區一位用戶直接亮出自己的實測數據:M5 Max 128GB(注意,128GB,是帖子里設備內存的兩倍),跑同款模型量化版llama.cpp,實測12.8 tokens/s。



      更高端的硬件,跑更輕的量化版本,速度反而只有帖子聲稱的五分之一,因此,原帖中說的速度幾乎不可能實現。

      第三刀:11小時續航

      帖子中提到的「更換電池」引發了老用戶的集體懷舊:現代 MacBook Pro 都是一體化設計,所謂的「換電池」,大概率是切換到了大功率的備用充電寶(如百瓦快充移動電源)。

      MacBook Pro M4 Max官方標稱續航約18小時,那是輕度使用。持續滿載跑70B推理,GPU和內存全程拉滿,實際續航會大幅縮水。

      雖然帖子里提到「切換到備用充電寶后恢復」——但跨大西洋航班經濟艙的USB口功率通常只有7.5W到18W,而M4 Max滿載功耗超過40W。

      因此,續航11小時這個說法幾乎站不住腳。


      故事是假的,但范式轉向是真的

      面對質疑,我們需要剝開數據的水份,看清這件事背后真正令科技圈高潮的原因。

      長期以來,我們已經習慣了「云端成癮」。

      沒有 GPT-4 的 API,很多開發者甚至不知道該如何寫代碼;沒有網絡,AI 就變成了一個啞巴。

      現在,本地推理,確實在發生一場靜悄悄的革命。

      2024年,在筆記本上跑7B模型還需要各種技巧。

      2026年,M4 Mac上跑70B量化版已經是日常操作。雖然速度不快,大概10來個tokens/s,但已經能用。

      真實的使用場景不是「飛機上交付完整項目」這種聽起來很爽的敘事,而是一些更樸素的東西,比如離線環境下的文檔問答,隱私敏感場景下不想把數據傳上云等等。

      這些場景不性感,但實用。

      現在,llama.cpp的mlx后端已經針對Apple Silicon做了深度優化,Ollama也把部署門檻壓到了一條命令。

      即便 71 tokens/s 的速度存疑,BF16 的精度可能有夸張,但這種「在孤島上建立文明」的技術浪漫主義,才是最牛的。

      未來,最頂尖的開發者或許不再是那個最會調優云端 Prompt 的人,而是那個能在資源枯竭、完全離線的極端環境下,手搓出一個「自感知、自循環」AI 系統的人。

      下一次坐飛機,你準備好帶上你的「數字大腦」了嗎?

      參考資料:

      https://x.com/servasyy_ai/status/2050098091789828376

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      航拍湖南瀏陽煙花廠爆炸事故現場:專業人員進入核心區域救援

      航拍湖南瀏陽煙花廠爆炸事故現場:專業人員進入核心區域救援

      新京報
      2026-05-05 09:46:42
      徐正源攜助教抵達桃仙機場,遼寧鐵人球迷送上圍巾

      徐正源攜助教抵達桃仙機場,遼寧鐵人球迷送上圍巾

      懂球帝
      2026-05-05 15:15:05
      夏季t恤品牌排行榜,2026適合日常長期穿著的T恤衫品牌推薦

      夏季t恤品牌排行榜,2026適合日常長期穿著的T恤衫品牌推薦

      土豆絲卷餅
      2026-05-01 19:16:04
      帕金斯怒撕亞歷山大:他的風格就是在侮辱籃球,每次進攻都在假摔

      帕金斯怒撕亞歷山大:他的風格就是在侮辱籃球,每次進攻都在假摔

      小徐講八卦
      2026-05-05 16:04:24
      無懸念!無爭議!就是第一!就是無敵!

      無懸念!無爭議!就是第一!就是無敵!

      左右為籃
      2026-05-05 17:04:56
      一群專業演員愣演不過一個說相聲的《低智商犯罪》爛不是沒理由的

      一群專業演員愣演不過一個說相聲的《低智商犯罪》爛不是沒理由的

      金風說
      2026-05-05 17:40:33
      季后賽場均14+6!博伊爾斯這個新秀值得期待!而他的女友同樣搶鏡!

      季后賽場均14+6!博伊爾斯這個新秀值得期待!而他的女友同樣搶鏡!

      籃球大圖
      2026-05-05 11:26:52
      凌晨3點 歐冠生死戰!誰贏誰進決賽:阿森納沖擊20年紀錄

      凌晨3點 歐冠生死戰!誰贏誰進決賽:阿森納沖擊20年紀錄

      葉青足球世界
      2026-05-05 16:43:25
      他是吳宜澤當下最關鍵的對手,拿下13個冠軍,選老婆的眼光也不錯

      他是吳宜澤當下最關鍵的對手,拿下13個冠軍,選老婆的眼光也不錯

      白面書誏
      2026-05-04 17:50:08
      李淵跪求放過10個孫子,李世民點頭應允,轉身后為何怒斬十孫?

      李淵跪求放過10個孫子,李世民點頭應允,轉身后為何怒斬十孫?

      千秋文化
      2026-01-20 20:41:08
      賴寧的雕像拆了,但有些東西不該拆

      賴寧的雕像拆了,但有些東西不該拆

      梳子姐
      2026-05-04 16:31:53
      吳宜澤18-17奪冠!賽后聽聽對手 同行和媒體怎么說:中國時代到來

      吳宜澤18-17奪冠!賽后聽聽對手 同行和媒體怎么說:中國時代到來

      侃球熊弟
      2026-05-05 06:49:38
      “00后”吳宜澤奪冠:商業代言以臺球圈為主,金利來提前押寶成功

      “00后”吳宜澤奪冠:商業代言以臺球圈為主,金利來提前押寶成功

      藍鯨新聞
      2026-05-05 16:01:10
      突發!美籍女子來港旅游從29樓墜落死亡,七人慘遭橫禍被砸成重傷

      突發!美籍女子來港旅游從29樓墜落死亡,七人慘遭橫禍被砸成重傷

      云隱南山
      2026-05-05 15:37:29
      分錢了!斯諾克世錦賽中國11人,分別拿到多少獎金?吳宜澤夠買房

      分錢了!斯諾克世錦賽中國11人,分別拿到多少獎金?吳宜澤夠買房

      體育大學僧
      2026-05-05 09:09:17
      絕殺墨菲奪冠!吳宜澤封王,中國斯諾克歷史十大球手怎么排?

      絕殺墨菲奪冠!吳宜澤封王,中國斯諾克歷史十大球手怎么排?

      仰臥撐FTUer
      2026-05-05 09:36:46
      關心打工人!深圳官方:因周四為工作日,比賽調整為20點跳球

      關心打工人!深圳官方:因周四為工作日,比賽調整為20點跳球

      懂球帝
      2026-05-05 15:15:05
      NBA強強對決 騎士VS活塞

      NBA強強對決 騎士VS活塞

      慢歌輕步謠
      2026-05-05 16:56:16
      夫妻花千元入住帳篷民宿,睡得迷迷糊糊時帳篷突然被陌生男子拉開,民宿最新回應

      夫妻花千元入住帳篷民宿,睡得迷迷糊糊時帳篷突然被陌生男子拉開,民宿最新回應

      深圳晚報
      2026-05-05 13:10:55
      馬克龍提前"謝幕"!梅朗雄宣布競選法國總統,對華態度已曝光

      馬克龍提前"謝幕"!梅朗雄宣布競選法國總統,對華態度已曝光

      瞻史
      2026-05-05 10:15:07
      2026-05-05 18:16:49
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      15135文章數 66835關注度
      往期回顧 全部

      科技要聞

      傳蘋果考慮讓英特爾、三星代工設備處理器

      頭條要聞

      四川一企業盜采河水作飲用水售賣十年 當地回應

      頭條要聞

      四川一企業盜采河水作飲用水售賣十年 當地回應

      體育要聞

      全世界都等著看他笑話,他帶國米拿下冠軍

      娛樂要聞

      英皇25周年演唱會 張敬軒被救護車拉走

      財經要聞

      瀏陽煙花往事

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態度原創

      房產
      藝術
      手機
      教育
      公開課

      房產要聞

      五一樓市徹底明牌!塔尖人群都在重倉凱旋新世界

      藝術要聞

      有多少人知道,它曾是亞洲第一高樓?

      手機要聞

      十年來第一次!蘋果討論漲價:iPhone 18漲幅或超600元

      教育要聞

      新傳考研名詞解釋:數據投毒

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产看黄网站又黄又爽又色| igao国产精品| 四虎国产精品成人免费久久| 色婷婷天天综合在线| 亚欧欧美人成视频在线| 久久香蕉国产线看观看怡红院妓院| 香蕉福利| 亚洲av网站| 久久中文字幕av第二页| 色综合久久网女同蕾丝边| 女人18毛片久久| 奇米影视第四色首页| 日韩欧美aⅴ| 性欧美丰满熟妇xxxx性久久久| 日本无码第九页| 天海翼视频一区在线观看| 国产视频大全| 国产蜜臀精品一区二区三区| 伊人久久免费视频| 人妻久久久一区二区三区| 亚洲美腿丝袜福利一区| 国内揄拍国内精品对白86| 图片区小说区视频区综合| 成人在线观看一区| 久久久橹橹橹久久久久高清| 小草av| 亚洲AV综合色区无码另类小说| 亚洲av第一区第二区| 精品久久无码中文字幕| 欧美亚洲综合免费精品高清在线观看| 亚洲精品一区二三区不卡| 在线看国产精品自拍内射| 亚洲av午夜福利大精品| 国外啪啪呦女网站呦齿| 亚洲国产精品日本无码网站| 亚洲欧美日韩高清中文在线| 又黄又爽又高潮免费毛片| 亚洲欧美日韩三区| 奇米777四色成人影视| 亚洲中文字幕无码一区日日添| 亚洲人成黄网站69影院|