<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      同一天兩件大事!小模型直接掀翻千億參數,走向效率為王

      0
      分享至


      大模型技術從“云端”向“終端”轉移的過程中,實用主義終將戰勝性能堆砌。

      作者丨陳嘉欣

      編輯丨馬曉寧

      5月13日,AI圈同時炸了兩件事。

      第一件事是頂級CV學者何愷明帶著MIT團隊,發布了人生第一個語言模型ELF。

      105M參數,不走GPT自回歸的老路,全程在連續embedding空間里做擴散,最后一步才離散化回文字。發布僅幾小時,X上的討論就炸了——"Kaiming出品,必屬精品"。


      第二件事是清華系團隊面壁智能開源了新一代「小鋼炮」MiniCPM-V 4.6。

      這款模型在Artificial Analysis的智能指數上拿了13分,比Qwen3.5-0.8B高出整整3個點,卻只有它1/19的推理token消耗量。而且它僅1.3B,一張4090就能“爆改”。


      同一天發生的兩件事都在指向一個問題:AI行業正在經歷一個微妙的轉折,從"堆算力"轉向"省算力"。

      2026上半年,當DeepSeek V4、Qwen3.5、Gemma 4這些大廠還在卷千億參數時,端側小模型的已經迎來了新一輪浪潮,如今社區最大的聲音已經不是"誰家模型最大",而是"誰家模型最小、最快、最省硬件"。

      01


      算力降維:從"堆H100"到"一張4090就夠了"

      面壁智能這次開源的MiniCPM-V 4.6,最炸裂的不是參數規模本身,而是效率。

      先看一組數據:在Artificial Analysis的智能指數測試中,MiniCPM-V 4.6以5.4M output token完成全部測試,同期測試的Qwen3.5-0.8B非推理版用了101M,推理版用了233M。前者是后者的1/19和1/43。


      1/43是什么概念?別人做43次推理的算力,它能做43次。

      再看吞吐量:在256并發、1000張圖像的高壓測試下,MiniCPM-V 4.6單張RTX 4090的吞吐量比Qwen3.5-0.8B高出1.6倍。


      清華系的1.3B"小鋼炮",同樣把硬件門檻拉到了極致,一張消費者級別的RTX 4090就能跑。不需要H100,不需要A100。一臺游戲顯卡就能部署AI模型做二次開發。放在一年前,這是不敢想的。

      這些數據放在一起,指向同一個結論:AI的參數競賽正在讓位于效率競賽。

      一位曾經在Meta和momenta任職,目前現在做具身創業的研究者向雷峰網表示,小模型在端側的優勢不是理論上的,是實打實的商業選擇。"大多數用戶不需要一個能寫論文的模型,他們需要的是一個能隨時響應、不掉線的模型"。

      另一位高通的負責人也向雷峰網表示了類似觀點:“參數越少,越容易在本地做微調、越容易適配每個人的使用習慣。個人AI時代,模型不需要記住全人類的知識,只需要記住你一個人的就夠了"。

      沿著這條思路往下看,你會發現小模型干的遠遠不只是"省算力"這么簡單。

      02


      架構換道:從"預測下一個詞"到"連續空間擴散"

      何愷明的ELF,走了一條和GPT完全不同的路。

      先搞清楚一個背景。兩年多來,AI對話模型的根基幾乎都是"預測下一個詞",把一句話拆成一個個token,依次猜下一個該是什么。這條路GPT證明了有效,但也有一條為人熟知的軟肋:生成速度慢、且沒法回頭修改已經生成的詞。

      擴散模型在圖像領域早就證明了"不按順序也能生成高質量內容",Stable Diffusion從一團噪聲逐步恢復為一張圖像,比自回歸生成靈活得多。但在語言領域,這條路一直走得磕磕絆絆。

      問題出在哪?現有的大多數擴散語言模型(DLM)雖然在"做擴散",但操作的對象仍然是離散token,本質上還是在有限的離散空間里"洗牌",沒有真正發揮擴散的連續優勢。

      何愷明團隊的解法干凈利落:全程留在連續embedding空間里去噪,只在最后一步離散化成文字。


      這就像以前做雕塑,是一塊塊往上堆泥巴(順序生成每個token);現在是把一整塊石頭里的多余部分全部磨掉(在連續空間逐次去噪),最后一步才刻上細節。效率更高,而且能全局統籌。

      這種解法起手就和之前完全不一樣。所以ELF 105M參數、45B訓練token、32步采樣,就跑贏了現有的DLM方案,不需要額外蒸餾。

      沿著架構創新的方向再看MiniCPM-V 4.6。它采用LLaVA-UHD v4架構,視覺編碼器的計算量降低了約50%。這意味著,處理一張3136×3136的高分辨率圖像,在RTX 4090上只需要75.7ms。以前這是云端的活,現在端側芯片就能干。

      從"預測下一個詞"到"連續空間中去噪",從"云端算力"到"端側芯片",這兩條看似獨立的創新線,正在指向同一個方向:AI模型的底層架構,正在從"一個超大的黑箱"變成"一個精巧的、分工明確的小系統"。

      架構變了,生態也會變。小,正在成為新的"大"。

      03


      拉開AI輕量化浪潮的序幕

      根據AI科技評論的觀察,目前市場上關于AI輕量化的三個變化正在發生。

      變化一:端側AI從概念到標配。MiniCPM-V 4.6已經能在手機上跑,不需要聯網,不需要云。2026年下半年,你會看到更多手機廠商把端側模型作為賣點,直接打出"本地跑模型"的旗號。

      變化二:架構創新正在打破Scaling Law的壟斷。ELF證明了語言模型不一定非要自回歸。MiniCPM證明了1.3B也能打。Scaling Law說"越大越好",但ELF和MiniCPM說"夠用就好,夠快更好"。當架構創新成為新的競爭力源頭,"堆參數"的軍備競賽模式正在失效。

      變化三:商業模式與落地場景由“算力競賽”轉向“成本優化”。企業端不再盲目追大,多數 B 端場景如智能客服、文檔輔助等開始傾向于定制化的輕量級模型,因為其推理成本僅為超大模型的數十分之一,更符合商業閉環。

      何愷明下場做語言模型,面壁開源第五代端側模型,高通押注個人AI。站在2026年5月回頭看,這些不是孤立的新聞。它們拼出了同一個信號:AI輕量化浪潮的序幕已經拉開。

      AI 的未來不再是“越大越好”,而是“在足夠的聰明度下,越輕越貴”。如何做更好的小模型,這或許才是2026年AI行業最值得關注的方向。

      未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!

      公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      孫儷女兒拉丁舞奪冠,身披國旗領獎氣質酷似鄧超

      孫儷女兒拉丁舞奪冠,身披國旗領獎氣質酷似鄧超

      天馬幸福的人生
      2026-05-15 10:28:09
      《主角》爆后才知張藝謀要捧誰?不是翻紅王麗坤也不是當紅劉浩存

      《主角》爆后才知張藝謀要捧誰?不是翻紅王麗坤也不是當紅劉浩存

      八斗小先生
      2026-05-14 11:54:01
      NBA第一人!因為扣籃而斷送生涯,他若不傷,火箭能奪冠?

      NBA第一人!因為扣籃而斷送生涯,他若不傷,火箭能奪冠?

      體壇熱評
      2026-05-15 08:49:29
      中印沖突再度升級!冰冷現實刺眼:中國越克制,印度越步步緊逼!

      中印沖突再度升級!冰冷現實刺眼:中國越克制,印度越步步緊逼!

      小樾說歷史
      2026-05-14 12:20:38
      里程碑!北京隊長翟曉川634場追平王仕鵬 歷史第十+現役第四

      里程碑!北京隊長翟曉川634場追平王仕鵬 歷史第十+現役第四

      醉臥浮生
      2026-05-15 20:05:18
      全程表情僵硬,打戲全用替身,央八新劇棄劇一片,老戲骨都帶不動

      全程表情僵硬,打戲全用替身,央八新劇棄劇一片,老戲骨都帶不動

      一娛三分地
      2026-05-15 16:08:47
      領先20分差點被翻盤!上海贏得驚險,北京輸得悲壯,周琦空砍13+9

      領先20分差點被翻盤!上海贏得驚險,北京輸得悲壯,周琦空砍13+9

      萌蘭聊個球
      2026-05-15 21:34:58
      百億富家女留學英國,倒貼軟飯男被打致死,前雨潤總裁之女被殺案

      百億富家女留學英國,倒貼軟飯男被打致死,前雨潤總裁之女被殺案

      漢史趣聞
      2026-03-17 10:00:51
      成人片女星許諾薩福諾夫奪歐冠將共度良宵,球員妻子爆粗回應

      成人片女星許諾薩福諾夫奪歐冠將共度良宵,球員妻子爆粗回應

      懂球帝
      2026-05-14 15:58:14
      根據馬云對未來房價預測:300萬的房子,到2030年還能值多少錢?

      根據馬云對未來房價預測:300萬的房子,到2030年還能值多少錢?

      專業聊房君
      2026-05-14 07:30:29
      黃先生,捐贈1億元

      黃先生,捐贈1億元

      都市快報橙柿互動
      2026-05-13 10:23:21
      今日最慘股,10個一字跌停還有430萬封單,滿倉抄底已虧110萬!

      今日最慘股,10個一字跌停還有430萬封單,滿倉抄底已虧110萬!

      八斗小先生
      2026-05-15 14:42:25
      大反轉!日本要被氣吐血,在東京舉辦博覽會,結果現場被中企席卷

      大反轉!日本要被氣吐血,在東京舉辦博覽會,結果現場被中企席卷

      泠泠說史
      2026-05-15 21:09:54
      47歲高圓圓在公園被抓拍,麒麟臂、涼拖鞋,活脫脫一個買菜大姐

      47歲高圓圓在公園被抓拍,麒麟臂、涼拖鞋,活脫脫一個買菜大姐

      胖松松與瘦二毛
      2026-05-06 12:40:53
      小寶與王某雷,誰探訪花的數量更多?

      小寶與王某雷,誰探訪花的數量更多?

      挪威森林
      2026-01-31 12:15:26
      7年敗光2億!鄒市明冉瑩穎共同發文:二人最終還是邁出了這一步!

      7年敗光2億!鄒市明冉瑩穎共同發文:二人最終還是邁出了這一步!

      拳擊時空
      2026-04-16 06:04:48
      程維高并非被一擼到底,下臺后享受副省級待遇,活了78歲

      程維高并非被一擼到底,下臺后享受副省級待遇,活了78歲

      史不語
      2026-05-13 08:10:10
      世乒賽結束僅5天,劉詩雯傳來一大喜訊,讓乒壇和王勵勤沉默了

      世乒賽結束僅5天,劉詩雯傳來一大喜訊,讓乒壇和王勵勤沉默了

      八斗小先生
      2026-05-15 18:19:06
      堪稱足壇最強“躺贏”!18歲小將4天拿下雙冠,西甲法甲皆通吃!

      堪稱足壇最強“躺贏”!18歲小將4天拿下雙冠,西甲法甲皆通吃!

      田先生籃球
      2026-05-14 22:30:34
      果然小看了印度!特朗普訪華前:印度傳來雜音,要斷掉中國命脈?

      果然小看了印度!特朗普訪華前:印度傳來雜音,要斷掉中國命脈?

      誰將笑到最后
      2026-05-15 21:21:05
      2026-05-15 21:56:49
      AI科技評論 incentive-icons
      AI科技評論
      點評學術,服務AI
      7280文章數 20751關注度
      往期回顧 全部

      科技要聞

      直降千元起步!蘋果華為率先開啟618讓利

      頭條要聞

      生產成本疑不足40元 "童鞋界愛馬仕"泰蘭尼斯廣告翻車

      頭條要聞

      生產成本疑不足40元 "童鞋界愛馬仕"泰蘭尼斯廣告翻車

      體育要聞

      德約科維奇買的球隊,從第6級聯賽升入法甲

      娛樂要聞

      方媛為何要來《桃花塢6》沒苦硬吃?

      財經要聞

      騰訊掉隊,馬化騰戳破真相

      汽車要聞

      高爾夫GTI刷新紐北紀錄 ID. Polo GTI迎全球首秀

      態度原創

      手機
      游戲
      本地
      旅游
      教育

      手機要聞

      PGYTECH推出GO Ultra趣拍套裝,可組合實現拍立得照片打印功能

      PS5獨占神作銷量太慘了!首周僅4614份 第二周消失

      本地新聞

      用蘇繡的方式,打開江西婺源

      旅游要聞

      瓣瓣一線|門票優惠、公益講解!河南三門峽送出“5·19”游玩大禮包 ?

      教育要聞

      綿陽涪城區發布2026年義務教育招生公告(附劃片范圍、招生計劃)

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 最近中文字幕日韩有码| 青青热久免费精品视频6| 午夜诱惑痒痒网| 成人黄色在线| 天天综合网在线观看视频| 国产一性一交一伦一a片| 日韩欧美亚洲国产精品字幕久久久| 99久久精品国产综合婷婷| 久久亚洲精品国产精品777777| 成 人 免 费 黄 色| 野花社区www高清视频| 亚洲国产精品成人久久综合影院| 无码乱人伦一区二区亚洲| 操碰网| 久久精品超碰av无码| 欧美成人精品欧美一级乱黄| 亚洲精品国男人在线视频| 18禁超污无遮挡无码网址| 日本亚洲一区二区三区| 日韩黄色AV| 熟女肥臀白浆大屁股一区二区 | 人妻系列中文字幕久久| 久久综合老鸭窝色综合久久| 四房播色综合久久婷婷| 加勒比综合网| 国产不卡久久精品影院| 久久精品国产99麻豆蜜月| 爱3P| 欧美另类图片视频无弹跳第一页 | 亚洲午夜免费福利视频| 免费A级毛片樱桃视频| 日逼AV| 亚洲欧美综合| 人人妻人人澡人人爽久久av| 国产小受被做到哭咬床单GV| 国产AV大全| 精品无码秘?人妻一区二| 狼友视频国产精品首页| 亚洲a级片在线观看| 亚洲AV无码一区东京热久久| 亚洲欧洲av无码专区|