<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      大模型越做越大,面壁智能反手做了個小100倍還能看圖的

      0
      分享至

      面壁好軸啊,

      大家做模型都在比誰更大。

      參數更大,上下文窗口更大,反正什么都往天花板往上頂,

      問題是,Agent如果真的要進入現實世界,它還得變成一種更像水電煤的東西。

      便宜,穩定,到處能跑。

      說實話,要是沒有Coding Plan和五小時額度刷新,10塊百萬token我都嫌貴。

      畢竟,如果像Hermes或者OpenClaw這種重型開發任務只能跑一兩個對話,如果是多個Skill混合使用的話,也只能跑20-50個回合。

      所以我看到面壁這次發MiniCPM-V4.6的時候,第一反應其實是又撈著了。

      1.3B,

      能看圖,

      還能跑得很快,


      huggingface.co/openbmb/MiniCPM-V-4.6

      隔壁隨便找一個都是500B往上甚至1T的。

      面壁的MiniCPM-V一直是一個很有代表性的端側模型系列。從2024年4月發布以來,

      它打的就不是巨無霸路線,而是小尺寸,高效率,端側可用。

      這次V4.6小到什么程度呢,你可以把它理解成一個能理解圖文,還能被消費級顯卡隨便拿去再訓練成適用于各種垂直限時任務的腳手架模型。

      在公開評測里,MiniCPM-V 4.6的多模態綜合能力超過了Qwen3.5-0.8B和Gemma4-E2B-it。


      在AA評測里的token消耗非常低,1.3B非推理版本運行只消耗5.4Mtoken,只有Qwen3.5-0.8B非推理版101M的1/19,也只有Qwen3.5-0.8B推理版本233M的1/43。


      如果只是跑一次demo,

      模型慢點貴點都還能忍。

      但真實業務里延遲就是體驗,吞吐就是成本,

      顯存就是預算,功耗就是影響落地。

      手機不會因為模型很聰明就多出一塊GPU。

      一個線上系統也不會因為你榜單分數好看,就允許每個請求都燒掉一大把算力。

      所以MiniCPM-V 4.6要講的不是,端側模型也能做多模態。

      而是大模型多模態能力終于開始變得更像一個可以四通八達到處有用的熱插拔基礎組件了。

      說到這里,干脆來看看它背后的技術創新吧。


      技術文檔我打包好了也,回復面壁就好

      多模態模型看圖,最麻煩的一步是它要先把圖片拆成一堆視覺token。

      圖片越大,越清楚,里面的信息越多,視覺token就越多。

      視覺token一多,后面的成本就上去了。

      你可以把它想成搬家。

      如果一開始把所有東西都原封不動搬上車,后面再說我要節省空間就沒啥空隙了,

      很多多模態模型的做法,就是在ViT(Vision Transformer 視覺模型)之后再壓縮token。

      這樣確實可以減輕后面語言模型的負擔,但前面的視覺編碼器已經吃過一遍大圖的計算開銷了。

      MiniCPM-V 4.6背后的LLaVA-UHD v4優化的點,是把視覺token壓縮提前到ViT內部。

      更早壓,更省空間。


      讓后面大部分ViT層一開始就少處理很多token。視覺編碼階段的FLOPs(浮點運算次數)降低55.8%。

      當然,做起來沒那么容易。

      因為不能粗暴地把視覺token砍掉,砍猛了,圖像表征就壞了,模型可能省了算力,但也看不清了。

      LLaVA-UHD v4里面用了早期ViT內壓縮模塊,配合窗口注意力,讓鄰近token先做上下文交互,再通過復用相鄰預訓練ViT層參數,盡量減少對原有視覺表征的擾動。

      翻譯成人話就是,它不是一口氣把所有部分都壓縮。


      它是在盡量不傷筋動骨的情況下,把最費算力的部分提前瘦掉。

      這就是MiniCPM-V 4.6能又小又快的關鍵之一。

      順著這個再聊,就到了另一個很重要的點,4倍和16倍混合視覺token壓縮。

      我覺得這個點挺適合拿普通相機來理解。

      4倍壓縮更像高清模式,保留更多細節,適合追求識別精度的時候用。

      16倍壓縮更像高速省電模式,畫面信息壓得更狠,但推理速度會更快,成本也更低。

      過去很多模型的技術路線是二選一,要么偏精度,要么偏速度。

      到了MiniCPM-V 4.6,

      它開始把兩種壓縮率混在一起用,能切換兩類完全不同的場景。


      MiniCPM-V 4.6已經可以在手機上用了

      一類是端側,

      手機,電腦,車機,智能家具,這些設備對算力功耗很敏感,我不指望它們像云端機房一樣隨便燒。

      另一類是云端高并發。

      很多業務不是一個人問模型一次,而是幾萬個請求同時涌進來。

      每個請求還要求對很多候選結果做理解,打分,召回,排序。

      MiniCPM-V 4.6要解決的是兩個問題。

      普通設備怎么運行AI

      以及高并發怎么省錢。

      隔壁快手OneRec推薦大模型在處理視頻輸入里的字幕,標簽,ASR(語音識別),OCR(字符識別),封面圖這些多模態表征時,就用到了MiniCPM-V-8B,OneRec承接了短視頻推薦主場景25%的請求。


      在這種地方,模型不能像GPT 5.5一樣想個5分鐘,然后憋一句穩穩接住你。

      它只需要提供一點點更好的信號。

      比如這個封面圖到底是什么內容。

      這段視頻更像美食教程還是探店吐槽。

      這個字幕里有沒有關鍵品牌名。

      這個用戶當下更可能想看什么。

      單看每一次判斷,好像都不復雜。

      但它會被放大到幾千萬,幾億次請求里。

      所以這種模型要的不是單次表演有多好。

      它要的是夠快,夠輕,夠穩,夠便宜。

      光是能讓整體系統效果往上抬一點點,

      它就已經很值錢了。

      這也是我這三年越來越強烈的一個感受。

      很多人聊AI,還是喜歡盯著最強模型。

      誰超過了GPT,誰逼近了Claude,

      這些當然重要。

      但真正能讓AI滲入現實世界的,

      往往不是一兩個最強大腦,而是一堆穩定不需要煩惱token數的端側模型。

      它們不一定會都被用戶看見。

      但它們會讓一個系統變得更聰明一點,更快一點,更省錢一點。

      這就是小模型最容易被低估的地方。

      這次面壁還做整套從微調到部署的工具鏈。

      微調端支持ms-swift和LLaMA-Factory,部署端適配vLLM、SGLang、llama.cpp、Ollama。

      甚至消費級顯卡,RTX4090,也可以跑通微調流程。

      尺寸模型的生命力,本來就在于被改造。

      我們不需要把MiniCPM-V 4.6當成一個萬能助手。

      它更適合去做一個垂直文檔解析模型,一個OCR整理模型,一個本地相冊理解模型,一個攝像頭畫面異常識別模塊。

      它在這些場景里,不需要什么都會。

      它只要把一件事做得夠穩快便宜就好了。

      從這個角度看,

      MiniCPM-V 4.6最值得看的地方,

      確實不是它又刷了哪個榜。

      而是它把多模態往基礎設施的方向,

      又推進了一小步。

      @ 作者 / 卡爾

      最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點贊|在看|轉發|評論

      如果想要第一時間收到推送,不妨給我個星標

      如果你有更有趣的玩法,歡迎在評論區聊聊

      更多的內容正在不斷填坑中……


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      心臟決定壽命?勸告中老年別太節儉,多吃這3樣,心臟越吃越年輕

      心臟決定壽命?勸告中老年別太節儉,多吃這3樣,心臟越吃越年輕

      芹姐說生活
      2026-05-11 13:29:00
      金價、銀價大跌才剛開始

      金價、銀價大跌才剛開始

      東方豪俠
      2026-05-16 17:30:58
      2-4無緣西決!華子把話挑明,他真敢拒絕2年1.216億美金頂薪

      2-4無緣西決!華子把話挑明,他真敢拒絕2年1.216億美金頂薪

      世界體育圈
      2026-05-16 16:58:53
      莊則棟臨終前放心不下日本妻子,眼噙淚水:你沒有醫保,沒有工資

      莊則棟臨終前放心不下日本妻子,眼噙淚水:你沒有醫保,沒有工資

      抽象派大師
      2026-05-12 20:36:26
      一個人被鎖死在底層的原因:羞恥心太重

      一個人被鎖死在底層的原因:羞恥心太重

      洞見
      2026-05-15 10:19:10
      濮陽17歲小伙找到!遺體在河里漂8天,知情人發聲,自殺恐是必然

      濮陽17歲小伙找到!遺體在河里漂8天,知情人發聲,自殺恐是必然

      奇思妙想草葉君
      2026-05-15 11:09:57
      中美峰會,盧秀燕表態,鄭麗文發聲,島內支持統一民調人數驚人

      中美峰會,盧秀燕表態,鄭麗文發聲,島內支持統一民調人數驚人

      DS北風
      2026-05-15 17:55:21
      兩月蒸發378億,盧比自由落體:當年韓國那場噩夢,離印度不遠了

      兩月蒸發378億,盧比自由落體:當年韓國那場噩夢,離印度不遠了

      鍋鍋愛歷史
      2026-05-16 06:43:22
      俄羅斯圍城1500天仍未拿下!馬拉托克馬奇卡保衛戰破紀錄

      俄羅斯圍城1500天仍未拿下!馬拉托克馬奇卡保衛戰破紀錄

      項鵬飛
      2026-05-14 17:29:57
      慘烈,25萬投資者抄底被套,8個一字跌停,連續3天放量依然不開板

      慘烈,25萬投資者抄底被套,8個一字跌停,連續3天放量依然不開板

      丁丁鯉史紀
      2026-05-16 17:27:38
      只有造假,才能“杰青”

      只有造假,才能“杰青”

      必記本
      2026-05-16 09:42:33
      馬斯克收心了?官宣了39歲印度裔伴侶:相貌普通為他生了4個孩子

      馬斯克收心了?官宣了39歲印度裔伴侶:相貌普通為他生了4個孩子

      豐譚筆錄
      2025-12-12 11:16:23
      黑化的法國隊!世界杯26人名單:21人有非洲血統,姆巴佩都顯白了

      黑化的法國隊!世界杯26人名單:21人有非洲血統,姆巴佩都顯白了

      阿晞體育
      2026-05-15 14:39:29
      5月16日俄烏:俄羅斯不得不修改計劃了

      5月16日俄烏:俄羅斯不得不修改計劃了

      山河路口
      2026-05-16 18:39:14
      森林狼出局后,NBA奪冠概率更新!騎士僅1.4%墊底馬刺飆升至22.8%

      森林狼出局后,NBA奪冠概率更新!騎士僅1.4%墊底馬刺飆升至22.8%

      鍋子籃球
      2026-05-16 14:23:00
      中方換人出席,金磚會議大吵一架,當著10國面,阿拉格奇斬釘截鐵

      中方換人出席,金磚會議大吵一架,當著10國面,阿拉格奇斬釘截鐵

      史行途
      2026-05-16 00:31:03
      《紐約時報》直擊靈魂:中等國家,更害怕中美和解!

      《紐約時報》直擊靈魂:中等國家,更害怕中美和解!

      故事終將光明磊落
      2026-05-16 16:06:41
      空軍一號剛進中國領空,美軍末日飛機突然掉頭,直奔日本降落

      空軍一號剛進中國領空,美軍末日飛機突然掉頭,直奔日本降落

      趣文說娛
      2026-05-15 21:26:12
      阿韋洛亞開始告別,盛贊穆里尼奧:“他是世界第一,是我們中的一員”

      阿韋洛亞開始告別,盛贊穆里尼奧:“他是世界第一,是我們中的一員”

      綠茵情報局
      2026-05-16 18:37:44
      夫妻本是同林鳥!但抱歉,這一次郭富城也救不了“作妖”的方媛

      夫妻本是同林鳥!但抱歉,這一次郭富城也救不了“作妖”的方媛

      攬星河的筆記
      2026-05-15 20:11:07
      2026-05-16 20:23:00
      卡爾的AI沃茨 incentive-icons
      卡爾的AI沃茨
      前大廠算法工程師,3家科技公司技術總監|致力打造最系統的Al學習體系,讓1萬人通過Al提高生產力
      263文章數 135關注度
      往期回顧 全部

      科技要聞

      漲的是車價,要的是老命

      頭條要聞

      7人蒙面當街搶走幼童主謀竟是孩子生父 母親奔波尋子

      頭條要聞

      7人蒙面當街搶走幼童主謀竟是孩子生父 母親奔波尋子

      體育要聞

      馬刺2號,少年老成,這集看過?

      娛樂要聞

      謝霆鋒北京街頭騎行被偶遇,側顏帥炸

      財經要聞

      造詞狂魔賈躍亭

      汽車要聞

      高爾夫GTI刷新紐北紀錄 ID. Polo GTI迎全球首秀

      態度原創

      家居
      房產
      旅游
      游戲
      教育

      家居要聞

      110㎡淡而有致的生活表達

      房產要聞

      老黃埔熱銷之下,珠江春,為何去化僅3成?

      旅游要聞

      “舌尖上”的特色——沈陽冰淇淋博物館

      《老頭環》人物關系持續引發討論!留白式敘事再出圈

      教育要聞

      一圖講透提前批!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 15p少妇| 久久久久久夜| 久久青青草原亚洲AV无码麻豆| 亚洲av片在线免费观看| 久久无码人妻精品一区二区三区| 中文字幕日韩亚洲| 伊人久久久| 国产另类乱子伦精品免费女| 都市激情第一页| 国产精品久久久久久久影院| 亚洲中少妇久久中文字幕| 精品制服丝袜亚洲专区| 国产精品极品美女自在线看免费一区二区 | 亚洲一区二区美女| 激情内射亚洲一区二区三区| 日韩狠狠入| 国内精品久久久久久影院中文字幕 | 中文字幕人妻熟女人妻a片| 人人狠狠综合久久亚洲88| 久精品视在线观看视频99| 国产欧美日韩a片免费软件| 国产午夜福利视频合集| 一区二区三区av波多野结衣| 国产精品国产三级国产专区53| 三上悠亚ssⅰn939无码播放| 五月停停开心中文字幕| 免费久久人人爽人人爽AV| 亚洲一卡2卡3卡4卡 精品| 久久av一区二区三区| A片精品| 亚洲内射无码| 久久精品2021国产| 99久久久国产精品免费无卡顿| 综合五月激情二区视频| 精品亚洲综合一区二区三区| 成人日本有码在线| 久久精品国产99久久六动漫| 日韩精品欧美国产在线| 午夜成人视频| av老司机亚洲精品天堂| 久爱www人成免费网站|