Redis創始人Antirez又搞了個大新聞。
這次不是數據庫,而是一個叫ds4的開源項目——專門為DeepSeek V4 Flash寫的原生推理引擎,只有幾千行C代碼。
它做到了一件很多人覺得不可能的事:把擁有1M上下文窗口、能跑完整coding agent循環的準前沿模型,完整跑在一臺普通的128GB MacBook Pro上。
YC CEO Garry Tan看完直接轉發:"正在下載… 1M上下文+可用的coding agent能力,全在一臺128GB MacBook上,這太瘋狂了"
![]()
Antirez用了三個黑客級操作:
1. 不對稱2-bit量化
只對MoE里占90%體積的專家部分做2-bit壓縮,關鍵路徑保持全精度。質量損失極小,coding agent工作良好。
2. KV Cache扔到SSD
1M上下文會炸掉128GB內存?他直接把KV Cache搬到蘋果高速SSD上,用磁盤當擴展內存。
3. 純Metal原生優化
沒有任何多余封裝,沒有通用框架開銷,所有代碼只為Apple Silicon寫,只為DeepSeek V4 Flash寫。
實測性能:M3 Max 128GB上穩定27 tok/s。不算快,但對本地跑agent循環完全夠用。
這意味著什么?你不用給OpenAI付API費,不用擔心數據泄露,不用忍受網絡延遲。所有AI能力,完全在你自己的電腦里。
大廠燒幾十億訓練出來的模型,權重一開源,全世界的黑客就會用你想象不到的方式,把它優化到每一個能跑的設備上。
今天是MacBook,明天是手機,后天是手表。
2026年5月9日,AI終于從云端的神壇,落到了每個人的筆記本里。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.