<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      超越DeepSeek-V4!羅福莉交出小米最強(qiáng)開源模型,首日適配5家國(guó)產(chǎn)芯片

      0
      分享至


      智東西
      作者 李水青
      編輯 云鵬

      智東西4月28日?qǐng)?bào)道,剛剛,小米開源羅福莉帶隊(duì)研發(fā)的MiMo-V2.5系列模型,采用MIT協(xié)議,允許商用推理部署與二次訓(xùn)練,無(wú)需額外授權(quán)。


      ▲MiMo-V2.5-Pro在Hugging Face的開源頁(yè)面截圖

      此前,該系列模型于4月23日開啟公測(cè),包括MiMo-V2.5-Pro、MiMo-V2.5兩款模型。模型具備更強(qiáng)Agent能力,支持100萬(wàn)上下文,且Token效率大幅提升。

      MiMo-V2.5-Pro的完整基準(zhǔn)測(cè)試結(jié)果今日公布,小米稱其在GDPVal-AA(Elo)、Claw-Eval(pass^3)等多項(xiàng)測(cè)評(píng)中超過(guò)了最新開源的DeepSeek-V4-Pro模型,也超過(guò)了發(fā)布不久的Kimi K2.6等主流閉源模型,實(shí)現(xiàn)總體最佳。


      ▲MiMo-V2.5-Pro的最新測(cè)評(píng)成績(jī)

      開源首日,MiMo-V2.5-Pro宣布已完成與阿里平頭哥、亞馬遜云科技、AMD、百度昆侖芯、燧原科技、沐曦、天數(shù)智芯多個(gè)芯片廠商的接入適配。MiMo-V2.5系列模型同步完成SGLang和vLLM主流推理框架的Day 0適配。

      與此同時(shí),小米還推出百萬(wàn)億Token創(chuàng)造者激勵(lì)計(jì)劃,計(jì)劃30天內(nèi)免費(fèi)發(fā)放總計(jì)100萬(wàn)億Token權(quán)益;推出Agent生態(tài)共建計(jì)劃,目前已與OpenCode、Hermes Agent、KiloCode等Agent框架廠商展開合作。

      模型權(quán)重合集:
      https://huggingface.co/collections/XiaomiMiMo/mimo-v25
      更多細(xì)節(jié)參考模型Blog:
      https://mimo.xiaomi.com/index#blog
      百萬(wàn)億Token計(jì)劃申請(qǐng)網(wǎng)址:
      https://100t.xiaomimimo.com/

      一、模型技術(shù)細(xì)節(jié)公布,測(cè)評(píng)超越DeepSeek-V4

      由小米最新公開的模型卡可知,小米迄今為止最強(qiáng)模型MiMo-V2.5-Pro是一款擁有1.02萬(wàn)億(1.02T)個(gè)參數(shù)的混合專家模型,其中420億(42B)個(gè)激活參數(shù),基于混合注意力架構(gòu),相比前代模型在通用智能能力、復(fù)雜軟件工程和長(zhǎng)時(shí)域任務(wù)處理方面均實(shí)現(xiàn)了顯著提升。

      MiMo-V2.5-Pro繼承了MiMo-V2-Flash的混合注意力機(jī)制和多標(biāo)記預(yù)測(cè)(MTP)設(shè)計(jì)。局部滑動(dòng)窗口注意力(SWA)和全局注意力(GA)以6:1的比例交錯(cuò)使用,窗口大小為128個(gè)Token,在長(zhǎng)上下文情況下,通過(guò)可學(xué)習(xí)的注意力池偏置,將鍵值緩存存儲(chǔ)空間減少了近7倍,同時(shí)保持了性能。一個(gè)輕量級(jí)的MTP模塊,采用密集前饋神經(jīng)網(wǎng)絡(luò)(FFN),原生集成用于訓(xùn)練和推理,輸出吞吐量大約提升了三倍,并加速了強(qiáng)化學(xué)習(xí)(RL)的部署。


      ▲MiMo-V2.5-Pro的模型架構(gòu)及訓(xùn)練過(guò)程

      該模型預(yù)訓(xùn)練使用27萬(wàn)億(27T)個(gè)Token,采用FP8混合精度,原生序列長(zhǎng)度為32K,上下文擴(kuò)展至1M個(gè)Token。后訓(xùn)練遵循MiMo-V2-Flash中引入的三階段范式:1、監(jiān)督式微調(diào),在精心挑選的數(shù)據(jù)對(duì)上建立基礎(chǔ)的指令跟蹤;2、領(lǐng)域?qū)>?xùn)練,其中不同的教師模型分別通過(guò)針對(duì)特定領(lǐng)域的強(qiáng)化學(xué)習(xí)進(jìn)行優(yōu)化,涵蓋數(shù)學(xué)、安全、智能工具使用等領(lǐng)域;3、多教師策略蒸餾(MOPD),其中單個(gè)學(xué)生模型在每位專精教師的Token級(jí)指導(dǎo)下,從自身的展開中學(xué)習(xí)策略,并將所有教師的能力融合到一個(gè)統(tǒng)一的模型中。

      再來(lái)看看MiMo-V2.5,這是一個(gè)3100億(310B)參數(shù)的稀疏MoE模型,擁有150億(15B)激活參數(shù),在48萬(wàn)億(48T)個(gè)Token上進(jìn)行訓(xùn)練。它的語(yǔ)言主干框架繼承了MiMo-V2-Flash的混合滑動(dòng)窗口注意力機(jī)制,并搭載自研預(yù)訓(xùn)練視覺、音頻編碼器,兩類編碼器通過(guò)輕量化投影模塊完成跨模塊融合。


      ▲MiMo-V2.5架構(gòu)

      訓(xùn)練過(guò)程分為五個(gè)階段:1、基于多樣化語(yǔ)料開展文本預(yù)訓(xùn)練,搭建大語(yǔ)言模型主干網(wǎng)絡(luò);2、進(jìn)行投影層預(yù)熱訓(xùn)練,實(shí)現(xiàn)音視頻、視覺投影器與語(yǔ)言模型的對(duì)齊融合;3、依托高質(zhì)量跨模態(tài)數(shù)據(jù)集,開展大規(guī)模多模態(tài)預(yù)訓(xùn)練;4、執(zhí)行監(jiān)督微調(diào)與智能體后訓(xùn)練,在此過(guò)程中將上下文窗口從32K逐步擴(kuò)容至256K,最終達(dá)到100萬(wàn)Token;5、最后是通過(guò)強(qiáng)化學(xué)習(xí)(RL)與多目標(biāo)偏好蒸餾(MOPD),進(jìn)一步強(qiáng)化模型的感知、邏輯推理與智能體執(zhí)行能力。

      從小米最新公布的測(cè)評(píng)結(jié)果來(lái)看,MiMo-V2.5在Claw-Eval Text、Terminal-Bench 2.0、SWE-Bench Pro等多項(xiàng)測(cè)評(píng)中大幅超越了DeepSeek最新發(fā)布的DeepSeek-V4-Flash。


      ▲MiMo-V2.5最新測(cè)評(píng)情況

      二、開源首日,完成阿里平頭哥沐曦等7家芯片廠商適配

      小米還公布了芯片生態(tài)與推理框架最新適配情況,MiMo-V2.5-Pro開源首日完成多個(gè)芯片廠商的接入適配:

      阿里平頭哥:基于真武810E及全棧自研AI軟件棧實(shí)現(xiàn)深度適配。

      亞馬遜云科技:基于Trainium2芯片與Neuron SDK + vLLM推理框架完成深度適配,實(shí)現(xiàn)開源即全球可用的首日適配。下一代3nm制程Trainium3將進(jìn)一步釋放模型性能。

      AMD:依托ROCm開源軟件棧提供Day-0適配及全面優(yōu)化支持。

      百度昆侖芯:通過(guò)底層算子優(yōu)化與軟硬件協(xié)同加速,保障模型穩(wěn)定高效運(yùn)行。

      燧原科技:基于自研馭算TopsRider軟件棧深度優(yōu)化,在燧原L600上完成全量適配。

      沐曦:基于曦云C系列及全棧自研MXMACA軟件棧,實(shí)現(xiàn)Triton語(yǔ)法到沐曦GPU指令集的端到端原生支持。

      天數(shù)智芯:實(shí)現(xiàn)Day 0級(jí)深度適配。

      此外,MiMo-V2.5系列模型同步完成SGLang和vLLM主流推理框架的Day 0適配。

      三、免費(fèi)發(fā)放100萬(wàn)億Token,已與Hermes Agent等合作

      與此同時(shí),小米還同步推出MiMo Orbit計(jì)劃,包含兩部分:“百萬(wàn)億Token創(chuàng)造者激勵(lì)計(jì)劃”,與面向Agent框架團(tuán)隊(duì)的“Agent生態(tài)共建計(jì)劃”。

      在百萬(wàn)億Token創(chuàng)造者激勵(lì)計(jì)劃方面,小米面向全球AI用戶免費(fèi)發(fā)放Token,30天內(nèi)發(fā)放總計(jì)100萬(wàn)億Token權(quán)益,贈(zèng)完即止。

      該計(jì)劃采取申請(qǐng)制,通過(guò)者最高獲得Max檔位Token Plan,包含16億Credits,價(jià)值659元。活動(dòng)時(shí)間:北京時(shí)間2026年4月28日00:00至5月28日00:00。

      Agent生態(tài)共建計(jì)劃方面,小米面向全球Agent框架團(tuán)隊(duì)提供專項(xiàng)支持,為框架提供MiMo Token限免支持,同時(shí)參與和贊助框架平臺(tái)的AI Hackathon等共創(chuàng)活動(dòng)。

      其目前已與OpenCode、Hermes Agent、KiloCode等Agent框架廠商展開深度合作。

      結(jié)語(yǔ):多款國(guó)產(chǎn)開源模型“亮劍”交鋒

      近期,大模型行業(yè)開源力度持續(xù)加碼,模型與國(guó)產(chǎn)及國(guó)際芯片的“Day 0”適配已從亮點(diǎn)變?yōu)閯傂瑁评硇屎筒渴鸪杀境蔀橄乱浑A段競(jìng)爭(zhēng)的核心。同時(shí),百億級(jí)Token免費(fèi)激勵(lì)與Agent框架生態(tài)共建,反映出行業(yè)正從“拼參數(shù)”轉(zhuǎn)向“拼應(yīng)用”。

      值得關(guān)注的是,小米MiMo-V2.5-Pro在多項(xiàng)基準(zhǔn)評(píng)測(cè)中直接超越DeepSeek最新開源的DeepSeek-V4-Pro模型,可謂與DeepSeek在開源賽道發(fā)起“亮劍”交鋒,有望倒逼行業(yè)更快降低推理成本、提升Agent真實(shí)任務(wù)完成率。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      爺爺過(guò)世請(qǐng)假奔喪被公司開除,法院判了

      爺爺過(guò)世請(qǐng)假奔喪被公司開除,法院判了

      極目新聞
      2026-05-01 17:05:11
      微軟官方定調(diào):32GB內(nèi)存才是Win11無(wú)憂標(biāo)配 16GB僅算底線

      微軟官方定調(diào):32GB內(nèi)存才是Win11無(wú)憂標(biāo)配 16GB僅算底線

      快科技
      2026-05-01 14:15:05
      阿司匹林和他汀,什么時(shí)間吃最合適?早知道,早受益!

      阿司匹林和他汀,什么時(shí)間吃最合適?早知道,早受益!

      健康之光
      2026-04-08 17:32:59
      當(dāng)年為什么查辦褚時(shí)健?

      當(dāng)年為什么查辦褚時(shí)健?

      百曉生談歷史
      2025-08-20 21:55:53
      一張“初三女孩體測(cè)”照片,讓家長(zhǎng)被數(shù)萬(wàn)網(wǎng)友指責(zé):太不用心了!

      一張“初三女孩體測(cè)”照片,讓家長(zhǎng)被數(shù)萬(wàn)網(wǎng)友指責(zé):太不用心了!

      川渝視覺
      2026-04-25 20:19:24
      實(shí)力說(shuō)話!澤連斯基態(tài)度突變非常強(qiáng)勢(shì)

      實(shí)力說(shuō)話!澤連斯基態(tài)度突變非常強(qiáng)勢(shì)

      名人茍或
      2026-04-30 22:35:43
      掘金最該送走他!1.2億場(chǎng)均8+3,約基奇體系的產(chǎn)物,都不如肯納德

      掘金最該送走他!1.2億場(chǎng)均8+3,約基奇體系的產(chǎn)物,都不如肯納德

      你的籃球頻道
      2026-05-01 14:36:23
      員工離職后遵守競(jìng)業(yè)協(xié)議兩年未工作,公司不支付補(bǔ)償被判賠

      員工離職后遵守競(jìng)業(yè)協(xié)議兩年未工作,公司不支付補(bǔ)償被判賠

      新京報(bào)
      2026-04-30 22:00:23
      五一檔電影:10間敢死隊(duì)全差評(píng),寒戰(zhàn)1994拉胯,沒(méi)想到這部爆冷

      五一檔電影:10間敢死隊(duì)全差評(píng),寒戰(zhàn)1994拉胯,沒(méi)想到這部爆冷

      往史過(guò)眼云煙
      2026-05-01 19:28:30
      300663,立案!影響6萬(wàn)股民

      300663,立案!影響6萬(wàn)股民

      中國(guó)基金報(bào)
      2026-05-01 19:55:51
      1978年起陳云地位迅速上升,跨越多級(jí)“臺(tái)階”,背后原因何在

      1978年起陳云地位迅速上升,跨越多級(jí)“臺(tái)階”,背后原因何在

      鶴羽說(shuō)個(gè)事
      2026-04-30 22:47:23
      網(wǎng)友妹子因?yàn)榧依锏呢埨鲜瞧茐亩嗳鉀Q定棄養(yǎng)了,網(wǎng)友剛想開罵,看完送養(yǎng)信息后直接笑出了聲哈哈哈!

      網(wǎng)友妹子因?yàn)榧依锏呢埨鲜瞧茐亩嗳鉀Q定棄養(yǎng)了,網(wǎng)友剛想開罵,看完送養(yǎng)信息后直接笑出了聲哈哈哈!

      拜見喵主子
      2026-05-01 19:39:30
      爛泥扶不上墻!曝王思聰除了閃閃還有一私生子,人在英國(guó)已十幾歲

      爛泥扶不上墻!曝王思聰除了閃閃還有一私生子,人在英國(guó)已十幾歲

      小娛樂(lè)悠悠
      2026-04-30 09:14:30
      血本無(wú)歸!14年伙伴怒揭真相:許家印不瞎搞,本可全身而退

      血本無(wú)歸!14年伙伴怒揭真相:許家印不瞎搞,本可全身而退

      石辰搞笑日常
      2026-04-30 15:03:38
      女朋友很性感身材很棒是啥體驗(yàn)?網(wǎng)友:確實(shí),一個(gè)月就差不多膩了

      女朋友很性感身材很棒是啥體驗(yàn)?網(wǎng)友:確實(shí),一個(gè)月就差不多膩了

      帶你感受人間冷暖
      2026-03-13 00:13:17
      2006年,北京挖出龍袍干尸,留明朝發(fā)髻卻穿大清龍袍,他是誰(shuí)?

      2006年,北京挖出龍袍干尸,留明朝發(fā)髻卻穿大清龍袍,他是誰(shuí)?

      墨策史
      2026-04-29 11:56:13
      車載馬桶,屎無(wú)前例的創(chuàng)新

      車載馬桶,屎無(wú)前例的創(chuàng)新

      難得君
      2026-05-01 18:05:01
      直降1400元!iPhone 17 Pro Max 降價(jià),上市以來(lái)新低

      直降1400元!iPhone 17 Pro Max 降價(jià),上市以來(lái)新低

      科技堡壘
      2026-04-30 09:34:03
      江蘇正式進(jìn)入汛期!5月2日雨水登場(chǎng),局部中到大雨

      江蘇正式進(jìn)入汛期!5月2日雨水登場(chǎng),局部中到大雨

      揚(yáng)子晚報(bào)
      2026-05-01 20:56:12
      殺瘋了!2026款豐田凱美瑞,從17萬(wàn)多降到11萬(wàn)多,還要啥大眾速騰?

      殺瘋了!2026款豐田凱美瑞,從17萬(wàn)多降到11萬(wàn)多,還要啥大眾速騰?

      隔壁說(shuō)車?yán)贤?/span>
      2026-05-01 06:29:12
      2026-05-02 00:52:49
      智東西 incentive-icons
      智東西
      智東西,AI產(chǎn)業(yè)新媒體,專注報(bào)道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來(lái)的千行百業(yè)產(chǎn)業(yè)變革。
      11742文章數(shù) 117060關(guān)注度
      往期回顧 全部

      科技要聞

      DeepSeek發(fā)布多模態(tài)論文又連夜刪除

      頭條要聞

      美國(guó)也搞起"人肉代購(gòu)" "去墨西哥買中國(guó)車"教程瘋傳

      頭條要聞

      美國(guó)也搞起"人肉代購(gòu)" "去墨西哥買中國(guó)車"教程瘋傳

      體育要聞

      無(wú)奈!約基奇:這要在塞爾維亞 全隊(duì)早被炒了

      娛樂(lè)要聞

      馬筱梅產(chǎn)后身材恢復(fù)超好 現(xiàn)身戶外直播

      財(cái)經(jīng)要聞

      GPU神話松動(dòng),AI真正的戰(zhàn)場(chǎng)變了

      汽車要聞

      限時(shí)9.67萬(wàn)起 吉利星越L/星瑞i-HEV智擎混動(dòng)上市

      態(tài)度原創(chuàng)

      時(shí)尚
      游戲
      藝術(shù)
      親子
      健康

      這個(gè)夏天,彩色褲子又火了!

      索尼新作又搞同性戀被噴!玩家盤點(diǎn)“女同角色”吐槽

      藝術(shù)要聞

      畫畫的你絕不能錯(cuò)過(guò)!色塊與筆觸的激情之旅!

      親子要聞

      教孩子預(yù)防侵犯,分辨危險(xiǎn)身體觸碰并且拒絕!

      干細(xì)胞治燒燙傷面臨這些“瓶頸”

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 久久久99无码一区| 国产一区亚洲欧美成人| 精品夜恋影院亚洲欧洲| 色在线 | 国产| 三男一女吃奶添下面视频 | 开心五月激情综合婷婷色| 一边摸一边叫床一边爽视频| 男女猛烈xx00免费视频试看| 日韩av无码中文字幕| 久久精品国产亚洲一区二区| 欧洲亚洲国产成人综合色婷婷| 四虎成人永久在线精品免费| 亚洲欧洲成人精品香蕉网| 国产精品久久久久aaaa| 成**人毛片www免费版| 午夜国产亚洲精品一区| 色999欧美日韩| 亚洲黄色中文字幕| 一边添奶一边添p好爽视频| 好看精品日本一区二区| 午夜短无码| jizzjizz亚洲成熟少妇| 躁躁躁日日躁| 日韩在线视频第一页| 国产午夜成人av在线播放| 日日碰狠狠躁久久躁96avv | 久久久亚洲综合久久久久87| www国产亚洲精品久久网站| 小雪好紧好滑好湿好爽视频| 亚洲成精品动漫久久精久| 欧美黑人巨大VIDEOS极品| 人妻少妇精品系列| 亚洲V天堂V手机在线 | 国产精品密蕾丝视频| 国内少妇偷人精品免费| 成人日本有码在线| 国内外精品成人免费视频| 91精品久久久久久久99蜜桃| 久久香蕉国产线| 私人vps一夜爽毛片免费| 亚洲性爱在线|