<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      消費級顯卡可以快速上手跑!面壁智能MiniCPM-o 4.5發技術報告

      0
      分享至

      面壁智能 投稿
      量子位 | 公眾號 QbitAI

      面壁智能公開了自己在全雙工全模態交互領域的核心技術——

      Omni-Flow 流式全模態框架。



      今天,面壁智能聯合OpenBMB開源社區、清華大學THUNLP實驗室和THUMAI實驗室,正式發布MiniCPM-o 4.5技術報告。

      過往大模型均為半雙工交互模式,類似對講機式輪次對話。

      用戶與AI無法并行交流,AI無法實時感知環境、不能被打斷插話,存在交互時空割裂,用戶體驗差,嚴重制約多模態AI落地應用。

      MiniCPM-o 4.5是面壁智能今年2月發布的全雙工全模態模型,也是業界首個端到端全雙工全模態大模型。

      該模型參數規模約9B,支持視頻、音頻、文本流輸入及文本與語音的連續輸出。

      利用MiniCPM-o 4.5,不用聯網、僅用一張消費級顯卡,你就能在個人電腦上擁有一個“邊看、邊聽、邊說、還能主動提醒”的類人AI助手。

      目前,MiniCPM-o 4.5已基于llama.cpp完成模型量化和推理性能優化,實測最低12GB顯存的RTX 5070即可流暢運行全雙工模式(RTF0.4),極大降低了個人端側部署的準入門檻。M1-M5 Max(包含M5 Pro)的MAC設備亦可使用,建議內存超過16G。

      下面這支視頻展示了MiniCPM-o 4.5在個人筆記本上的完整部署與運行過程,包括全雙工語音對話、實時視覺理解、主動提醒等能力演示。

      模型發布至今,抱抱臉下載量已突破25萬+。

      技術報告發布之外,MiniCPM-o 4.5還同步推出在線體驗Demo、全模態全雙工API、端側安裝包Comni和Demo倉庫。

      核心依托Omni-Flow流式全模態框架

      MiniCPM-o 4.5極致流暢的全雙工交互體驗,核心依托于面壁智能與清華大學聯合研發的Omni-Flow流式全模態框架

      這也是本次技術報告公開的核心底層技術。

      該框架打破傳統模型孤立的回合式交互邏輯,搭建起毫秒級統一時間軸。

      通過時分復用機制,Omni-Flow流式全模態框架將視覺、音頻、文本等多模態并行信息流,精準對齊、拆分重組為周期性時序信息組。

      模型以每秒一次的高頻次持續刷新環境認知,實時更新對場景和用戶意圖的理解,全程無需依賴外部VAD語音活動檢測工具,原生支持持續感知、即時響應、自由打斷。

      在模型架構上,MiniCPM-o 4.5采用輕量化端到端全模態設計,整體僅9B參數,由四大核心模塊高效協同構成:

      • 0.4B參數SigLIP-ViT視覺編碼器負責環境視覺感知;
      • 0.3B參數Whisper-Medium音頻編碼器完成聲音信息采集;
      • 8B參數Qwen3-8B LLM基座承擔核心思考與語義理解;
      • 搭配0.3B參數輕量級語音Token解碼器實現語音生成。



      模塊化分工設計各司其職、高效聯動,既保留了大模型強大的理解推理能力,又規避了復雜聲學任務對核心算力的損耗。

      同時搭配自研TAIL時間對齊交錯語音生成方案,精準匹配文本與語音輸出節奏。

      在保證語音流暢自然、情感飽滿的前提下,最大限度降低交互延遲,徹底解決流式對話卡頓、滯后、銜接生硬的行業難題。

      參數不大,但實力不容小覷。

      在多項權威評測基準中實現越級對標,MiniCPM-o 4.5綜合性能比肩甚至超越多款行業前沿大模型。



      在視覺能力上,模型OpenCompass綜合得分77.6、MMBench英文得分87.6,整體表現對標Gemini 2.5 Flash,圖像理解、數學推理、文檔解析能力表現優異。

      在全模態動態交互、視頻場景理解領域,MiniCPM-o 4.5的優勢更為突出。

      Daily-Omni、Video-Holmes等多項評測數據顯示,MiniCPM-o 4.5優于Gemini 2.5 Flash等大模型的表現;在LiveSports-3K-CC全雙工視頻基準測試中,勝率達到54.4%,領先各類專用流式視頻模型。

      同時模型推理效率優勢顯著

      INT4量化版本顯存占用大幅降低,僅需12GB顯存即可運行,解碼速度可達212 tokens/s,相較同類模型提速40%以上,響應延遲更低,性價比與落地優勢拉滿。



      除此之外,模型搭載多項實用特色功能,適配多元化使用場景

      MiniCPM-o 4.5全面支持中英雙語實時語音對話,語音生成質量行業領先,中文CER、英文WER錯誤率低于CosyVoice2等主流模型,情感表現力更強。

      支持簡易參考音頻即可完成聲音克隆與角色扮演,音色自然逼真。

      延續MiniCPM-V系列優勢,擁有前沿的OCR文檔解析能力,支持高清圖像、高幀率視頻處理,多語言解析能力覆蓋30余種語言。

      同時,模型原生兼容傳統輪次對話、Omni-Flow全雙工流式交互兩種模式,無縫切換,兼顧精準問答與實時流式交互需求,適配各類使用場景。

      兼顧普通用戶體驗與開發者二次開發需求

      為讓技術真正落地普惠,MiniCPM-o 4.5打造了全渠道、全人群的開放落地體系,兼顧普通用戶體驗與開發者二次開發需求。

      面向普通用戶,官方開放無需注冊、無需下載的在線體驗Demo,同時推出適配Windows、macOS系統的桌面端Comni一鍵安裝包,簡化部署流程,普通用戶可快速上手體驗全雙工AI交互能力。

      面向廣大開發者,平臺免費開放全雙工實時WebSocket API,提供完整規范的接口文檔,支持快速接入各類應用;同時完整開源Demo前后端代碼,開放Linux部署方案,支持開發者自由二次開發、自定義調試,助力各類全模態AI應用快速落地。

      依托原生全雙工、持續感知、主動交互的核心能力,MiniCPM-o 4.5突破了傳統AI單次問答的場景局限,解鎖了大量全新流式交互應用場景。

      在生活服務領域,有望作為沉浸式智能陪伴助手,在用戶運動、烹飪、日常勞作時實時答疑、主動提醒、全程指導。

      在無障礙公益領域,可為視障人群提供實時環境感知服務,主動播報路況、設備狀態、環境變化,成為可靠的“視覺輔助助手”。

      在智能車載領域,可以持續監測路況與駕駛員狀態,主動預警風險、提示可用車位、輔助泊車,提升駕駛安全性。

      在具身智能領域,可作為機器人核心大腦,持續感知動態環境、自主決策交互時機,適配智能機器人、智能家居等智能化場景,覆蓋生活化、公益化、工業級多維度需求。

      可以說,MiniCPM-o 4.5把“主動式AI”從概念變成了可以在你電腦上跑起來的東西。

      當然,團隊也在技術報告中坦誠指出了當前不足:

      長時間交互的穩定性、主動行為的豐富性、對復雜場景的魯棒性,都還有提升空間。

      但這不妨礙它已經立起了一個新的起點——全雙工全模態、端側可部署、全棧開源,這條路線跑通了。

      目前,MiniCPM-o 4.5在線體驗、API、端側安裝包、Demo代碼倉庫,所有入口都已在GitHub和面壁官網上線。

      感興趣的小伙伴可以直接上手體驗~

      期待大家在評論區反饋。

      技術報告PDF:

      https://github.com/OpenBMB/MiniCPM-o/blob/main/docs/MiniCPM_o_45_technical_report.pdf

      在線體驗:

      https://minicpmo45.modelbest.cn/

      在線體驗(手機端推薦):

      https://minicpmo45.modelbest.cn/mobile/

      GitHub Demo(含本地安裝包):

      https://github.com/OpenBMB/MiniCPM-o-Demo

      抱抱臉:

      https://huggingface.co/openbmb/MiniCPM-o-4_5

      魔搭:

      https://www.modelscope.cn/models/OpenBMB/MiniCPM-o-4_5

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      0-1!2-1!瘋狂一夜,維拉爆冷落敗,布拉加補時絕殺,水晶宮獲勝

      0-1!2-1!瘋狂一夜,維拉爆冷落敗,布拉加補時絕殺,水晶宮獲勝

      足球狗說
      2026-05-01 05:14:38
      4月新勢力銷量出爐:零跑7萬臺斷層領先,深藍、極氪等5家破3萬臺,新能源滲透率超60%

      4月新勢力銷量出爐:零跑7萬臺斷層領先,深藍、極氪等5家破3萬臺,新能源滲透率超60%

      紅星資本局
      2026-05-01 18:40:10
      孫楊他媽是嫌孫楊“涼”得還不夠徹底嗎?

      孫楊他媽是嫌孫楊“涼”得還不夠徹底嗎?

      蔥哥說
      2026-04-30 21:24:28
      中方表示遺憾,不得不投棄權票

      中方表示遺憾,不得不投棄權票

      極目新聞
      2026-05-01 13:03:40
      山西農婦慘死田間,鄰居不吃不喝躲藏6天,被抓后笑談行兇過程

      山西農婦慘死田間,鄰居不吃不喝躲藏6天,被抓后笑談行兇過程

      莫地方
      2026-04-28 01:10:03
      太可怕了!繼注射藥物、熱巴事件后,王陽再揭娛樂圈最臟的一面

      太可怕了!繼注射藥物、熱巴事件后,王陽再揭娛樂圈最臟的一面

      橙星文娛
      2026-04-17 13:19:56
      143頁!人大知名教授被舉報:名人之后、9個愛人,聊天內容流出

      143頁!人大知名教授被舉報:名人之后、9個愛人,聊天內容流出

      溫柔看世界
      2026-04-30 11:32:33
      中國花2000萬買個航母空殼?烏專家曾言:光4個發動機就超2000萬

      中國花2000萬買個航母空殼?烏專家曾言:光4個發動機就超2000萬

      素衣讀史
      2026-04-29 21:55:54
      暴雨大暴雨,要來了!

      暴雨大暴雨,要來了!

      中國日報
      2026-05-01 14:11:05
      轉走儲戶千萬的銀行員工已被采取措施,銀行不愿兜底想等司法結論

      轉走儲戶千萬的銀行員工已被采取措施,銀行不愿兜底想等司法結論

      映射生活的身影
      2026-05-01 15:23:04
      施瓦辛格私生子首奪健美冠軍!保姆所生,長得像爹,肌肉更是復刻

      施瓦辛格私生子首奪健美冠軍!保姆所生,長得像爹,肌肉更是復刻

      照見古今
      2026-04-12 19:26:48
      放大招?!長沙地鐵計劃近期新建280公里!

      放大招?!長沙地鐵計劃近期新建280公里!

      星耀長沙
      2026-05-01 13:58:00
      冠軍相!成都蓉城新賽季中超已領先7分:有望創中國足球新紀錄

      冠軍相!成都蓉城新賽季中超已領先7分:有望創中國足球新紀錄

      邱澤云
      2026-05-01 23:44:50
      他是水貨探花?季后賽得分全隊第1,籃板第1,比錫安莫蘭特強多了

      他是水貨探花?季后賽得分全隊第1,籃板第1,比錫安莫蘭特強多了

      球毛鬼胎
      2026-05-01 21:10:06
      她和孩子沒有遇害,活得很好!

      她和孩子沒有遇害,活得很好!

      劉娜
      2026-04-29 20:49:02
      零跑7.1萬臺,理想3.4萬臺,小米超3萬臺!多家車企公布4月銷量!

      零跑7.1萬臺,理想3.4萬臺,小米超3萬臺!多家車企公布4月銷量!

      小南看車
      2026-05-01 15:12:55
      一場0-1!利好熱刺保級:維拉歐聯杯爆冷聯賽或留力,西漢姆難了

      一場0-1!利好熱刺保級:維拉歐聯杯爆冷聯賽或留力,西漢姆難了

      體育知多少
      2026-05-01 07:04:03
      目前的中國股市,如果想賺錢,就買這兩種股票,賺到盆滿缽滿!

      目前的中國股市,如果想賺錢,就買這兩種股票,賺到盆滿缽滿!

      股經縱橫談
      2026-05-01 20:39:27
      鐵路員工站臺抽煙,真實原因曝光,難怪舉報女子遭網暴

      鐵路員工站臺抽煙,真實原因曝光,難怪舉報女子遭網暴

      奇思妙想草葉君
      2026-04-30 17:36:43
      英超專家小組認定加布頂牛哈蘭德屬于暴力行為,本應吃到紅牌

      英超專家小組認定加布頂牛哈蘭德屬于暴力行為,本應吃到紅牌

      懂球帝
      2026-05-01 21:10:11
      2026-05-02 00:16:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12567文章數 176458關注度
      往期回顧 全部

      數碼要聞

      惠普HyperX宣布新款手柄Clutch Talon:多個組件均支持定制

      頭條要聞

      美國也搞起"人肉代購" "去墨西哥買中國車"教程瘋傳

      頭條要聞

      美國也搞起"人肉代購" "去墨西哥買中國車"教程瘋傳

      體育要聞

      無奈!約基奇:這要在塞爾維亞 全隊早被炒了

      娛樂要聞

      馬筱梅產后身材恢復超好 現身戶外直播

      財經要聞

      GPU神話松動,AI真正的戰場變了

      科技要聞

      DeepSeek發布多模態論文又連夜刪除

      汽車要聞

      限時9.67萬起 吉利星越L/星瑞i-HEV智擎混動上市

      態度原創

      數碼
      游戲
      藝術
      旅游
      軍事航空

      數碼要聞

      華碩官宣洛天依“出席”天選2026新品發布會,將有聯名新品

      索尼新作又搞同性戀被噴!玩家盤點“女同角色”吐槽

      藝術要聞

      歐洲首座女子足球場方案公布,2030年見!

      旅游要聞

      玩法升級!鞏義雙槐樹遺址假期首日激發體驗熱潮

      軍事要聞

      伊朗:持續推進海上封鎖的行為不可容忍

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 竹山县| 亚洲自拍偷拍一区二区三区| 日韩老无码| 亚洲一区在线视频| 激情综合一区二区迷情校园| 日韩人妻无码精品久久久不卡| 免费无码鲁丝片一区二区| 自拍偷拍日韩| 国产精品久久久久久福利| 99精品视频在线播放免费| bt天堂新版中文在线地址| 国产欧美一区二区三区免费视频| 97欧美精品系列一区二区| 综合av一区| 四川丰满妇女毛片四川话| 国产高潮流白浆喷水免费a片| 久久久无码精品一区二区三区蜜桃| 成人无码午夜在线观看| 六月婷婷国产精品综合| 91高清国产| 亚洲综合激情小说| 日韩人妻OL丝袜AV一二区| 深夜国产成人福利在线观看女同| 欧美无遮挡国产欧美另类| 中文字幕久久久久人妻| 91黄色视频在线观看| 超碰aⅴ人人做人人爽欧美| 国产精一二三| 91精品久久久久含羞草| 九色九九九老阿姨| 国产精品视频中文字幕| 久久99国产精品尤物| www.com黄色| 九九国产在线观看| 国产亚洲精品97在线观看| 亚洲成A人A∨久在线观看| 少妇人妻互换不带套| 国产精品午夜福利资源| 色欲色香天天天综合vvv| 91综合色| 亚洲欧洲自偷自拍图片|