Google DeepMind剛扔下一枚炸彈。Gemma 4全家桶開源,Apache 2.0協議,最狠的是那個31B的密集模型——跑分直接碾壓比自己大20倍的對手。
這事的核心矛盾很尖銳:云端的AI越來越強,但本地部署一直是個笑話。現在Google說,不用選了,筆記本和手機就能跑前沿模型。這不是技術迭代,是游戲規則重寫。
![]()
先看清牌面。Gemma 4不是單卡出牌,是四張牌覆蓋全場景:
E2B(20億有效參數):總參數量5.1B,壓縮后內存不到1.5GB,128K上下文,帶音頻編碼器。手機、IoT設備塞進去無壓力。
E4B(45億有效參數):總參數量8B,同樣128K上下文。旗艦手機和MacBook的甜點區,開發者首選。
26B A4B(混合專家架構):總參數量25.2B,但每次只激活約4B。128個小專家里選8個路由專家加1個共享專家,用12%的算力干出密集31B模型97%的質量。256K上下文,企業級成本敏感場景的王牌。
31B Dense(密集模型):純血31B參數,256K上下文,需要18-24GB內存。推理能力的極限選項。
數字說話最硬。Gemma 4 31B在Artificial Analysis Intelligence Index拿39分,比Gemma 3 27B的10分暴漲29分。具體拆解:
數學推理(AIME 2026):20.8% → 89.2%,4倍提升。
代碼能力(LiveCodeBench):29.1% → 80.0%,接近3倍。
研究生級科學(GPQA Diamond):直接翻倍到84.3%。
智能體工作流(T2-Bench):6.6% → 86.4%,13倍躍遷。
最刺耳的對比:31B模型在多項基準上擊敗Qwen3.5-397B和DeepSeek v3.2-671B。參數差一個數量級,結果倒過來。本地部署的算力賬,從此要重新算。
Google押注的是一條清晰的路徑——把前沿AI從服務器機房搬到邊緣設備,不閹割能力。Apache 2.0協議意味著沒有商用限制,沒有API按token計費的黑箱。私有、可控、主權化的AI,從口號變成可執行方案。
問題已經變了。不再是"本地能不能跑大模型",而是"你要造什么"。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.