<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      MiniMax-M2.7 開源了,本地部署指南

      0
      分享至

      MiniMax-M2.7 上月推出,時隔半個多月,剛剛開源了

      這次開源,可以發(fā)現(xiàn)很多更細(xì)節(jié)的內(nèi)容,不過我就不過多介紹了

      因為我簡單測試之后,沒達到我的預(yù)期,主要介紹一下本地部署相關(guān)的內(nèi)容吧

      我是用的 Nvidia 提供的線上測試,用例依然是閱讀理解+svg 代碼生成 + 審美

      結(jié)果是比較跌眼睛的,甚至感覺有 Qwen3 的水平

      與 GLM-5.1 半斤八兩

      它倆都遠(yuǎn)不及 Qwen3.6 Plus(僅代表本人觀點,僅此測試用例感受)


      簡介

      M2.7 的核心亮點:

      • 模型自我進化 :M2.7 能自主更新記憶、構(gòu)建技能、改進學(xué)習(xí)流程,經(jīng)過 100+ 輪自主優(yōu)化,性能提升 30%

      • 專業(yè)軟件工程 :SWE-Pro 達到 56.22%,與 GPT-5.3-Codex 持平,生產(chǎn)環(huán)境事故恢復(fù)時間壓縮到 3 分鐘以內(nèi)

      • 專業(yè)辦公能力 :GDPval-AA ELO 1495,開源模型最高,Word/Excel/PPT 高保真多輪編輯

      • 原生 Agent Teams :支持多智能體協(xié)作,角色穩(wěn)定、自主決策

      M2.7 模型技術(shù)規(guī)格藍(lán)圖

      代碼能力號稱媲美 GPT-5.3-Codex


      M2.7 基準(zhǔn)性能全景 部署方式:生態(tài)全面開花 M2.7 部署生態(tài)全景

      成本是 230GB 起步,我覺得 2 張 H200 可能都勉強,官方建議至少 4 張 H200


      目前量化版本應(yīng)該都在加急中,截止此刻,還都只創(chuàng)建好了文件夾而已

      按照以往 unSloth 的戰(zhàn)績,壓縮到幾十 GB 不是難事


      MLE Bench Lite 自我進化性能 Ollama

      Ollama 最新版 已經(jīng)有 minimax-m2.7:cloud 可以免費使用了



      M2.7 已登錄 Ollama 云端,商業(yè)許可可用

      # 與 OpenClaw 一起使用
      ollama launch openclaw --model minimax-m2.7:cloud


      # 直接聊天
      ollama run minimax-m2.7:cloud
      Ollama 支持 MiniMax M2.7

      這里要注意,目前 Ollama 上的 M2.7 走的是云端推理(:cloud 標(biāo)簽),原因是 230B 參數(shù)的 MoE 模型本地跑起來需要的顯存實在太大

      等后續(xù)量化版出來,應(yīng)該會有本地可跑的版本

      vLLM

      vLLM 提供了 Day-0 支持,是目前最成熟的部署方案之一

      # 基礎(chǔ)部署(4 卡 H200/H100/A100)
      vllm serve MiniMaxAI/MiniMax-M2.7 \
      --tensor-parallel-size 4 \
      --tool-call-parser minimax_m2 \
      --reasoning-parser minimax_m2 \
      --compilation-config '{"mode":3,"pass_config":{"fuse_minimax_qk_norm":true}}' \
      --enable-auto-tool-choice \
      --trust-remote-code


      # 8 卡部署(DP+EP 模式)
      vllm serve MiniMaxAI/MiniMax-M2.7 \
      --data-parallel-size 8 \
      --enable-expert-parallel \
      --tool-call-parser minimax_m2 \
      --reasoning-parser minimax_m2 \
      --enable-auto-tool-choice

      Docker 一鍵啟動

      docker run --gpus all \
      -p 8000:8000 \
      --ipc=host \
      -v ~/.cache/huggingface:/root/.cache/huggingface \
      vllm/vllm-openai:minimax27 MiniMaxAI/MiniMax-M2.7 \
      --tensor-parallel-size 4 \
      --tool-call-parser minimax_m2 \
      --reasoning-parser minimax_m2 \
      --enable-auto-tool-choice \
      --trust-remote-code

      vLLM 支持 NVIDIA 和 AMD 兩大平臺:

      • NVIDIA :4×H200/H100/A100 張量并行,或 8 卡 DP+EP/TP+EP 模式

      • AMD :2× 或 4× MI300X/MI325X/MI350X/MI355X,支持 AITER 加速

      系統(tǒng)需求:權(quán)重需要約 220GB 顯存,每 100 萬上下文 token 額外需要 240GB。

      SGLang

      SGLang 同樣提供了 Day-0 支持

      sglang serve \
      --model-path MiniMaxAI/MiniMax-M2.7 \
      --tp 4 \
      --tool-call-parser minimax-m2 \
      --reasoning-parser minimax-append-think \
      --trust-remote-code \
      --mem-fraction-static 0.85

      SGLang 的一個特點是支持 Thinking 模式,通過 minimax-append-think 解析器,可以把思考過程和最終內(nèi)容分開展示。

      快速測試部署是否成功:

      curl http://localhost:30000/v1/chat/completions \
      -H "Content-Type: application/json" \
      -d '{
      "model": "MiniMaxAI/MiniMax-M2.7",
      "messages": [
      {"role": "system", "content": [{"type": "text", "text": "You are a helpful assistant."}]},
      {"role": "user", "content": [{"type": "text", "text": "Who won the world series in 2020?"}]}
      ]
      }'

      M2.7 在 SGLang 上的推薦推理參數(shù):temperature=1.0top_p=0.95top_k=40

      NVIDIA 加持

      NVIDIA 這次給了 MiniMax 很大的支持力度


      NVIDIA 支持 MiniMax M2.7

      GPU 加速端點:在 build.nvidia.com/minimaxai/minimax-m2.7 可以免費試用 M2.7

      推理優(yōu)化:NVIDIA 和開源社區(qū)合作,為 vLLM 和 SGLang 做了兩個關(guān)鍵優(yōu)化:

      1. QK RMS Norm Kernel :將計算和通信操作融合到單個內(nèi)核中,減少了內(nèi)核啟動和顯存讀寫開銷

      2. FP8 MoE :集成了 TensorRT-LLM 的 FP8 MoE 模塊化內(nèi)核,專門針對 MoE 模型優(yōu)化

      結(jié)果非常驚人——在 NVIDIA Blackwell Ultra GPU 上:

      • vLLM 吞吐量提升 2.5 倍 (一個月內(nèi)實現(xiàn))

      • SGLang 吞吐量提升 2.7 倍 (一個月內(nèi)實現(xiàn))

      NemoClaw:NVIDIA 提供了開源參考棧 NemoClaw,一鍵部署 OpenClaw 持續(xù)運行助手

      微調(diào)支持:通過 NeMo AutoModel 庫進行后訓(xùn)練,支持 EP + PP 訓(xùn)練方案。NeMo RL 庫還提供了 GRPO 強化學(xué)習(xí)的樣例配方(8K 和 16K 序列長度)

      微調(diào)配方:

      # NeMo AutoModel 微調(diào)配方
      https://github.com/NVIDIA-NeMo/Automodel/blob/main/examples/llm_finetune/minimax_m2/minimax_m2.7_hellaswag_pp.yaml


      # 分布式訓(xùn)練文檔
      https://github.com/NVIDIA-NeMo/Automodel/discussions/1786
      Transformers

      也可以用 HuggingFace Transformers 直接加載模型,參考 Transformers 部署指南 (huggingface.co/MiniMaxAI/MiniMax-M2.7/blob/main/docs/transformers_deploy_guide.md)

      ModelScope

      國內(nèi)用戶也可以從 ModelScope(modelscope.cn/models/MiniMax/MiniMax-M2.7) 下載模型權(quán)重

      Tool Calling 和 Thinking 模式

      M2.7 同時支持工具調(diào)用和思考模式,這讓它在 Agent 場景下更加靈活。

      工具調(diào)用示例(以 SGLang 為例):

      from openai import OpenAI

      client = OpenAI(
      base_url="http://localhost:30000/v1",
      api_key="EMPTY"
      )

      tools = [
      {
      "type": "function",
      "function": {
      "name": "get_weather",
      "description": "Get the current weather for a location",
      "parameters": {
      "type": "object",
      "properties": {
      "location": {
      "type": "string",
      "description": "The city name"
      }
      },
      "required": ["location"]
      }
      }
      }
      ]

      response = client.chat.completions.create(
      model="MiniMaxAI/MiniMax-M2.7",
      messages=[
      {"role": "user", "content": "What's the weather in Beijing?"}
      ],
      tools=tools
      )

      message = response.choices[0].message
      if message.tool_calls:
      for tool_call in message.tool_calls:
      print(f"Tool Call: {tool_call.function.name}")
      print(f" Arguments: {tool_call.function.arguments}")

      Thinking 模式:通過 ... 標(biāo)簽把思考過程包裹在內(nèi)容中。在流式輸出場景下,可以實時解析這些標(biāo)簽,把思考和最終回答分開展示。

      快速上手

      如果你想快速體驗 M2.7,最簡單的方式:

      方式一:API 調(diào)用

      訪問 platform.minimax.io 注冊開發(fā)者賬號,通過 API 調(diào)用。

      方式二:MiniMax Agent

      訪問 agent.minimax.io 直接在線對話。

      方式三:Ollama 云端

      ollama run minimax-m2.7:cloud

      方式四:NVIDIA 免費端點

      訪問 build.nvidia.com/minimaxai/minimax-m2.7 在瀏覽器中直接測試。

      .7

      制作不易,如果這篇文章覺得對你有用,可否點個關(guān)注。給我個三連擊:點贊、轉(zhuǎn)發(fā)和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      世錦賽落幕,中國球員獎金分配出爐,吳宜澤第一趙心童第三

      世錦賽落幕,中國球員獎金分配出爐,吳宜澤第一趙心童第三

      觀察鑒娛
      2026-05-05 11:10:37
      賴斯:我們需要厄德高,尤其是在決賽中;決賽遇到誰不重要

      賴斯:我們需要厄德高,尤其是在決賽中;決賽遇到誰不重要

      懂球帝
      2026-05-06 06:57:11
      蔣介石私生活有多混亂?貼身秘書晚年才敢說破,宋美齡的做法絕了

      蔣介石私生活有多混亂?貼身秘書晚年才敢說破,宋美齡的做法絕了

      芊芊子吟
      2026-04-12 21:20:03
      河北市民買菜遇"怪事",剛買的西葫蘆放了4天,竟然長滿"硬疙瘩"

      河北市民買菜遇"怪事",剛買的西葫蘆放了4天,竟然長滿"硬疙瘩"

      夜深愛雜談
      2026-05-05 22:14:55
      王清海教授:山楂的3個黃金組合,掃清血管“垃圾”,便宜又好用

      王清海教授:山楂的3個黃金組合,掃清血管“垃圾”,便宜又好用

      蠟筆小小子
      2026-04-21 14:43:37
      嘴上反對,心里狂喜:美國精英層為什么巴不得立刻再打伊朗

      嘴上反對,心里狂喜:美國精英層為什么巴不得立刻再打伊朗

      高博新視野
      2026-05-05 07:30:18
      季后賽場均14+6!博伊爾斯這個新秀值得期待!而他的女友同樣搶鏡!

      季后賽場均14+6!博伊爾斯這個新秀值得期待!而他的女友同樣搶鏡!

      籃球大圖
      2026-05-05 11:26:52
      里子面子全丟光!唐嫣新劇創(chuàng)下央8今年收視最低記錄

      里子面子全丟光!唐嫣新劇創(chuàng)下央8今年收視最低記錄

      手工制作阿殲
      2026-05-06 08:27:31
      1980年,得知父親江騰蛟將接受審判,江新德:我爸該落得這個結(jié)果

      1980年,得知父親江騰蛟將接受審判,江新德:我爸該落得這個結(jié)果

      雍親王府
      2026-05-04 13:00:14
      去醫(yī)院千萬不要和醫(yī)生說的三句話,很多人張口來,難怪越治越麻煩

      去醫(yī)院千萬不要和醫(yī)生說的三句話,很多人張口來,難怪越治越麻煩

      王二哥老搞笑
      2026-05-05 20:00:43
      你最接近生理極限的一次經(jīng)歷是什么?網(wǎng)友分享讓人目瞪口呆!

      你最接近生理極限的一次經(jīng)歷是什么?網(wǎng)友分享讓人目瞪口呆!

      夜深愛雜談
      2026-04-09 19:39:13
      巨好笑的神評來了!高手從不露臉,只在評論區(qū)大展身手

      巨好笑的神評來了!高手從不露臉,只在評論區(qū)大展身手

      蘭妮搞笑分享
      2026-05-04 19:07:21
      外媒:FIFA仍在與中印談世界杯轉(zhuǎn)播權(quán),想對印度要6千萬美元

      外媒:FIFA仍在與中印談世界杯轉(zhuǎn)播權(quán),想對印度要6千萬美元

      懂球帝
      2026-05-05 17:13:04
      張萌每一套都那么誘人

      張萌每一套都那么誘人

      鄉(xiāng)野小珥
      2026-04-30 15:18:35
      最好的報答,就是恩將仇報?孟加拉是如何讓印度欲哭無淚的

      最好的報答,就是恩將仇報?孟加拉是如何讓印度欲哭無淚的

      青途歷史
      2026-05-06 02:07:02
      長沙瀏陽市華盛煙花公司法定代表人:胡正平

      長沙瀏陽市華盛煙花公司法定代表人:胡正平

      行舟問茶
      2026-05-05 16:22:08
      眼紅啊!南寧一教師月薪14044元的截圖引熱議,網(wǎng)友:副高五級吧

      眼紅啊!南寧一教師月薪14044元的截圖引熱議,網(wǎng)友:副高五級吧

      火山詩話
      2026-05-06 07:43:22
      決勝盤錯失5-3領(lǐng)先!中國金花1-2被逆轉(zhuǎn)出局,無緣WTA1000賽正賽

      決勝盤錯失5-3領(lǐng)先!中國金花1-2被逆轉(zhuǎn)出局,無緣WTA1000賽正賽

      月下追尋者
      2026-05-05 19:45:09
      李小冉曬乘風(fēng)后臺隨拍,隨性坐姿卻依舊美到犯規(guī)

      李小冉曬乘風(fēng)后臺隨拍,隨性坐姿卻依舊美到犯規(guī)

      農(nóng)村黃煮任
      2026-05-05 21:12:13
      朱棣問姚廣孝:我大明江山能傳多少代?姚廣孝嘆道:本可傳500年

      朱棣問姚廣孝:我大明江山能傳多少代?姚廣孝嘆道:本可傳500年

      縱古貫今
      2026-05-05 21:44:08
      2026-05-06 08:56:49
      Ai學(xué)習(xí)的老章 incentive-icons
      Ai學(xué)習(xí)的老章
      Ai學(xué)習(xí)的老章
      3372文章數(shù) 11146關(guān)注度
      往期回顧 全部

      科技要聞

      告別廢話文學(xué)與幻覺!GPT-5.5 Instant發(fā)布

      頭條要聞

      牛彈琴:高市終于下跪了 中韓等亞洲人內(nèi)心感到氣憤

      頭條要聞

      牛彈琴:高市終于下跪了 中韓等亞洲人內(nèi)心感到氣憤

      體育要聞

      全世界都等著看他笑話,他帶國米拿下冠軍

      娛樂要聞

      內(nèi)娛真情誼!楊紫為謝娜演唱會送花籃

      財經(jīng)要聞

      70億,保時捷把布加迪賣了

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態(tài)度原創(chuàng)

      教育
      藝術(shù)
      家居
      手機
      游戲

      教育要聞

      26高考報什么學(xué)校選什么專業(yè),如何規(guī)劃就業(yè)

      藝術(shù)要聞

      江青鄧穎超等四位女性罕見合影,書法風(fēng)格各異引關(guān)注!

      家居要聞

      靈動實用 生活藝術(shù)場

      手機要聞

      蘋果同意支付2.5億美元和解有關(guān)Siri功能延遲的集體訴訟

      《全面戰(zhàn)爭:戰(zhàn)錘40K》可破壞環(huán)境 能徹底改變戰(zhàn)場

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 欧美最猛性XXXXX69| 亚洲日韩欧美一区二区三区| 亚洲日本不卡| 亚洲不卡视频| 狠狠噜天天噜日日噜| 国产毛分av一区二区三区| 丰满人妻熟妇乱偷人无码| 国产无套视频在线观看香蕉| 成av人电影在线观看| 午夜美女国产毛片福利视频| 亚洲色欲色欲www| 911行情蘑菇5秒跳转| 国内精品久久久久久影院中文字幕| 日韩人妻熟女中文字幕a美景之屋| 老子午夜精品无码| 免费人成再在线观看网站| 精品女人久久久| 国产精品无码dvd在线观看| 69视频在线观看精品免费| 四虎国产精品永久在线网址| 人妻熟女av一区二区三区| 99久久精品国产一区二区蜜芽| 国产成人av一区二区在线观看| 在线观看av的网站| 国产乱色国产精品播放视频| www.操.com| 亚洲午夜精品一区二区蜜桃| 国产区女主播在线观看| 日韩色无码一级毛片一区二区-百 放荡少妇高潮喷水视频 | 日本www一道久久久免费| www.91免费| 国产精品综合久久久| 久久精品免费自拍视频| 九九三级影视| 亚洲精品揄拍自拍首页一| 亚洲精品aⅴ无码精品丝袜足| av中文字幕在线资源网| 中文有码亚洲制服av片| 精品人妻午夜福利一区二区| 99re在线| 精品国产网红福利在线观看|