<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      谷歌重磅開源Gemma 4!手機離線跑 Agent、還降內存,Qwen 被拉進正面對決

      0
      分享至


      整理 | 褚杏娟

      剛剛,谷歌正式發布 Gemma 4,稱“這是其迄今為止最智能的開放模型系列”。該系列面向復雜推理與智能體工作流設計,采用商業許可的 Apache 2.0 許可證開源。

      Gemma 4 提供四種規格:Effective 2B(E2B)、Effective 4B(E4B)、26B 混合專家模型(MoE)和 31B 稠密模型(Dense)。

      在端側,E2B 和 E4B 模型針對移動和物聯網設備優化,推理時分別激活約 20 億和 40 億參數,以降低內存和電量消耗。據介紹,這兩個模型已與谷歌 Pixel 團隊、高通和聯發科等硬件廠商合作,可在手機、Raspberry Pi、NVIDIA Jetson Nano 等設備上離線運行,延遲接近零。

      與此同時,研究人員表示,26B MoE 模型有一個巧妙之處:在推理任務中,它只會激活 38 億參數,因此既能保持較高運行速度,又不會犧牲大模型所具備的深厚知識儲備。

      26B 和 31B 模型提供面向 IDE、編程助手和 Agent 工作流的高級推理能力。模型針對消費級 GPU 進行了優化,讓學生、研究人員和開發者能夠把自己的工作站變成以本地優先為核心的 AI 服務器。

      谷歌 DeepMind 研究人員 Clement Farabet 和 Olivier Lacombe 表示,在 Gemma 4 上,他們設法進一步壓榨出了更多“單位參數智能”,讓這些模型能夠顯著實現“越級發揮”。例如,31B Dense 版本目前在行業標準榜單的開源模型中排名第三。

      Gemma 4 建立在與 Gemini 3 相同的架構基礎之上,旨在處理復雜推理任務,并支持在工作站、智能手機等低功耗設備上本地運行的自主 AI Agent。這次關鍵提升包括:

      • 推理能力更強:該系列所有模型都面向復雜推理任務進行了優化,并提供可配置的“思考”模式;

      • 多模態能力進一步擴展:所有模型都支持文本和圖像輸入,其中圖像支持可變寬高比和不同分辨率;E2B 和 E4B 還原生支持視頻與音頻輸入;

      • 上下文窗口更大:端側模型為 128K,較大模型(26B/31B)最高 256K;

      • 編碼與智能體能力增強:模型在代碼能力基準測試中有明顯提升,同時內置函數調用支持,能夠更好地驅動自主 Agent 執行任務;

      • 原生支持系統提示詞:Gemma 4 內置了 system role 支持,讓對話結構更清晰,也更容易控制模型行為。


      Farabet 和 Lacombe 解釋稱,每個 Gemma 4 模型都更適合用于運行 AI Agent。此前幾代 Gemma 模型往往需要開發者額外調整設計,才能與其他軟件工具交互;而 Gemma 4 已原生支持函數調用和結構化 JSON 輸出、原生系統指令以及超過 140 種語言。這意味著,開發者可以用它們來驅動自主 Agent,與第三方工具交互,并執行多步驟任務規劃。


      根據 Arena AI 文本排行榜(截至 2026 年 2 月 1 日),31B 模型排名全球開放模型第 3 位,26B MoE 模型排名第 6 位。


      谷歌表示,Gemma 4 在部分基準測試中表現優于參數大 20 倍的模型。


      不過,有網友自己測算結果 Qwen3.5-27B 要略優于 Gemma 4 31B。


      還有網友評價道,“最讓人眼前一亮的部分在于:一共四種尺寸,全部都為 Agent 場景做好了準備,而且全都可以在本地運行。我們一直都在呼吁,需要那種不用每次‘思考’都把數據傳回云端的模型?,F在他們終于聽進去了,而且給出的東西甚至比預期還多?!?/p>

      開源 + 本地,谷歌擴大優勢

      此次,Gemma 4 繼續采用 Apache 2.0 許可證,允許商業使用、自由修改和部署。谷歌稱,這一選擇旨在給予開發者對數據、基礎設施和模型的完全控制權,支持本地或云端環境的安全部署。這消除了其他一些 AI 模型在商業使用上的諸多限制,或會成為企業應用開發者的理想選擇。

      此外,谷歌還詳細列出了使用各種大小的 Gemma 4 模型版本運行推理所需的大致 GPU 或 TPU 內存。


      Gemma 4 在架構設計上進一步兼顧了效率與部署現實。E2B 和 E4B 中的 “E” 指的是“有效參數”,這兩款小模型采用了 PLE(每層嵌入)技術,以提升端側部署時的參數利用效率。需要注意的是,PLE 雖然不會增加模型層數,但會為每層解碼器中的每個 token 配置獨立的小型嵌入,因此模型實際加載到內存中的靜態權重,往往會高于“有效參數規?!北砻嫔蠈恼加?。

      26B 版本采用了混合專家(MoE)架構,雖然生成時每個 token 實際只會激活約 40 億參數,但為了保證路由和推理速度,全部 260 億參數仍需提前載入內存,所以它的實際顯存需求更接近稠密 26B 模型,而不是 4B 模型。

      此外,官方給出的內存估算通常只覆蓋靜態模型權重本身,并不包含運行框架、上下文窗口和 KV Cache 帶來的額外顯存開銷;如果進一步進行微調,顯存需求還會明顯高于推理階段,具體占用則取決于開發框架、批量大小,以及采用全參數微調還是 LoRA 等參數高效微調方案。

      這次發布再次凸顯了谷歌想要主導“本地 AI”產業的雄心。Constellation Research 分析師 Holger Mueller 表示,即便是較大規模的 Gemma 4,也小到足以在單張圖形處理器上運行,因此它們非常適合邊緣場景以及那些對低延遲和數字主權有較高要求的應用。

      他認為,“谷歌正在擴大自己在 AI 領域的領先優勢,不只是依靠 Gemini,也包括通過 Gemma 4 家族這樣的開放模型。這些模型對于構建 AI 開發者生態非常重要,也將幫助公司切入不同設備形態下的功能型和垂直行業應用場景。谷歌在此前發布 Gemma 3 時已經樹立了很高的門檻,因此這次發布也承載了很多期待?!?/p>

      現在,開發者可以通過谷歌云直接訪問這些模型,也可以在 Hugging Face、Kaggle 和 Ollama 上獲取模型及其開放權重。Android 開發者可在 AICore Developer Preview 中試用智能體工作流原型。

      此外,谷歌提供了多種推理和微調路徑,包括:Hugging Face、LiteRT-LM、vLLM、llama.cpp、MLX、Ollama、NVIDIA NIM 和 NeMo、LM Studio、Unsloth、SGLang、Cactus、Docker、MaxText、Tunix、Keras。云上部署支持 Vertex AI、Cloud Run、GKE、Sovereign Cloud 及 TPU 加速服務。

      Gemma 4 開箱支持 NVIDIA(從 Jetson Nano 到 Blackwell GPU)、AMD GPU(通過開源 ROCm? 棧)以及 Google Cloud TPU。谷歌方面稱,新模型采用與谷歌專有模型相同等級的基礎設施安全協議,適用于企業和主權機構的高標準安全與可靠性要求。

      https://deepmind.google/models/gemma/gemma-4/-and-e4b

      聲明:本文為 AI 前線整理,不代表平臺觀點,未經許可禁止轉載。

      會議推薦

      QCon 全球軟件開發大會·2026 北京站將于 4 月 16 日 -18 日正式舉辦。本屆大會以“Agentic AI 時代的軟件工程重塑”為主題,聚焦 100+ 重磅議題,匯聚來自阿里、騰訊、字節跳動、小米、百度等一線科技企業與創新團隊的技術專家,圍繞 AI 工程化、系統架構與研發模式演進展開深入探討。更多詳情可掃碼或聯系票務經理 18514549229 進行咨詢。

      今日薦文

      你也「在看」嗎?

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      1936年親手活捉蔣介石的孫銘九:建國后,上級部門破例為他謀工作

      1936年親手活捉蔣介石的孫銘九:建國后,上級部門破例為他謀工作

      磊子講史
      2026-01-22 10:13:17
      彭加木失蹤確為神秘事件!知情人:他同事被調到安全廳,待遇很高

      彭加木失蹤確為神秘事件!知情人:他同事被調到安全廳,待遇很高

      興趣知識
      2026-05-07 00:51:25
      47年,一農民給解放軍帶路,問到家人時:我哥參軍18年,叫陳錫聯

      47年,一農民給解放軍帶路,問到家人時:我哥參軍18年,叫陳錫聯

      歷史龍元閣
      2026-05-06 12:20:15
      月租30萬美金全免單!C羅沙特生活曝光:包2層17間房

      月租30萬美金全免單!C羅沙特生活曝光:包2層17間房

      小僫搞笑解說
      2026-05-07 08:02:10
      兩性關系:55-65歲這十年,惜命最好的方式,不是鍛煉,而是這6點

      兩性關系:55-65歲這十年,惜命最好的方式,不是鍛煉,而是這6點

      周哥一影視
      2026-04-17 06:45:59
      一把椅子綁42個氣球,美國男子飛到4900米高空,下降時掛電線上

      一把椅子綁42個氣球,美國男子飛到4900米高空,下降時掛電線上

      怪羅
      2026-05-06 17:22:39
      《低智商犯罪》被觀眾要求下架!理由:主演招人煩、演技尷尬

      《低智商犯罪》被觀眾要求下架!理由:主演招人煩、演技尷尬

      林輕吟
      2026-05-06 19:40:05
      今天油價|5月7日最新油價,原油大降超7%,明晚汽柴油恢復下跌?

      今天油價|5月7日最新油價,原油大降超7%,明晚汽柴油恢復下跌?

      豬友巴巴
      2026-05-07 16:45:03
      任何一個男人到了六十歲后,只要還對異性懷有欣賞與追求,往往因為這兩件事

      任何一個男人到了六十歲后,只要還對異性懷有欣賞與追求,往往因為這兩件事

      心理觀察局
      2026-05-04 08:51:11
      薪水最高的12人!現在只剩下三個!

      薪水最高的12人!現在只剩下三個!

      籃球大圖
      2026-05-07 17:58:43
      張萌在上海時裝周上一個雙手托胸的動作,照片炸了全網。

      張萌在上海時裝周上一個雙手托胸的動作,照片炸了全網。

      阿廢冷眼觀察所
      2026-05-06 02:00:26
      “他又不是三歲!”家長給高中兒子準備生日禮,卻因太幼稚被群嘲

      “他又不是三歲!”家長給高中兒子準備生日禮,卻因太幼稚被群嘲

      妍妍教育日記
      2026-05-07 11:40:07
      陪玩陪睡根本不夠!認干爹、舔手指,背地里的陰暗面完全藏不住了

      陪玩陪睡根本不夠!認干爹、舔手指,背地里的陰暗面完全藏不住了

      杰絲聊古今
      2026-05-03 13:35:27
      歐冠決賽巴黎優勢拉滿,阿森納靠什么贏?

      歐冠決賽巴黎優勢拉滿,阿森納靠什么贏?

      體壇周報
      2026-05-07 12:41:16
      巴基斯坦戰略專家:這三場戰爭已表明,中國才是世界最強超級大國

      巴基斯坦戰略專家:這三場戰爭已表明,中國才是世界最強超級大國

      農夫史記
      2026-05-05 20:42:36
      1949年,解放軍沒收馬鴻逵的財產,發現最值錢的竟是1286公斤羊毛

      1949年,解放軍沒收馬鴻逵的財產,發現最值錢的竟是1286公斤羊毛

      史之銘
      2026-05-07 19:40:49
      上海成為2028年奧運會資格系列賽舉辦城市

      上海成為2028年奧運會資格系列賽舉辦城市

      澎湃新聞
      2026-05-07 22:50:05
      范丞丞和媽媽一起拍照,范丞丞媽媽71歲狀態,漂亮又有氣質

      范丞丞和媽媽一起拍照,范丞丞媽媽71歲狀態,漂亮又有氣質

      陳意小可愛
      2026-05-04 22:41:17
      還剩48小時,俄通知各國撤僑,烏國要打莫斯科,中方劃下禁止區域

      還剩48小時,俄通知各國撤僑,烏國要打莫斯科,中方劃下禁止區域

      近史談
      2026-05-07 23:02:00
      老婆出軌后,對方的妻子上門找到我:你媳婦跟我老公好上了

      老婆出軌后,對方的妻子上門找到我:你媳婦跟我老公好上了

      千秋文化
      2026-05-04 18:38:07
      2026-05-08 00:15:00
      AI前線 incentive-icons
      AI前線
      面向AI愛好者、開發者和科學家,提供AI領域技術資訊。
      1477文章數 149關注度
      往期回顧 全部

      科技要聞

      月之暗面完成20億美元融資,估值突破200億

      頭條要聞

      日媒詢問中國是否希望恢復中日之間人員往來 中方回應

      頭條要聞

      日媒詢問中國是否希望恢復中日之間人員往來 中方回應

      體育要聞

      巴黎再進歐冠決賽,最尷尬的情況還是發生了

      娛樂要聞

      Lisa主持!寧藝卓觀看脫衣秀風波升級

      財經要聞

      人均年薪406萬,這家ST公司驚呆市場!

      汽車要聞

      雷克薩斯全新純電三排SUV 全新TZ全球首發

      態度原創

      親子
      健康
      家居
      旅游
      公開課

      親子要聞

      最新回復!東湖學府幼兒園開園有變,延至明年春

      干細胞治燒燙傷面臨這些“瓶頸”

      家居要聞

      破繭成蝶 土味精裝房爆改

      旅游要聞

      巴西對中國免簽!引爆旅游熱,南美之旅說走就走

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 最新精品国偷自产在线| 久久semm亚洲国产| 午夜一区二区三区| 国产精品AV在线| 极品美女扒开粉嫩小泬| 不卡国产一区二区三区| 日韩老无码| 国产成人97人妻对碰碰97| 久久精品国产av大片| 精品人妻av区乱码| 微拍福利导航| 中国精学生妹品射精久久| 日韩精品av一区二区| 免费观看的AV毛片的网站| 亚洲色a| www.狠狠干| 日韩av激情在线观看| a免费毛片在线播放| 老熟妇性色老熟妇性| 无码人妻丰满熟妇片毛片| 国产精品不卡永久免费| 黑人玩弄人妻1区二区| 久久99精品久久久久久噜噜| 在线天堂最新版资源| 日木AV无码专区亚洲AV毛片| 亚洲乱码日产精品bd在线看| 97精品人人a片免费看| 玖玖国产| 麻豆传媒视频在线| 阳江市| 无码人妻一区二区三区四区AV| 国产精品国产高清国产av| 久久综合成人精品亚洲另类欧美 | 国产乱人伦av麻豆网| 丰满熟女人妻一区二区三| 99re在线视频观看| 久久久无码精品亚洲日韩蜜臀浪潮| 国产超碰人人模人人爽人人喊| 污网站在线观看视频| 中文字幕日本丰满人妻| 亚洲国产精品不卡av在线|