<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      Qwen3.6-27B 開源了,27B 小身板干翻 397B 巨無霸

      0
      分享至

      一文中,我就表達了對 Qwen 開源順序的稍稍不滿,大家明明最期待的是 27B 啊

      后來又測了幾個 Qwen3.6-35B 的量化版本,都是關閉思考,已經完全可以取代釘子戶 Qwen3-32B 了

      剛剛,萬眾期待的 Qwen3.6-27B 終于來了


      FP8 版的模型權重已經來到 30GB 級別,后面再來個 AWQ-4bit,簡直完美,單卡 4090 都輕松

      簡介

      先說結論:這是一個 27B 的 Dense 多模態模型,把上一代開源旗艦 Qwen3.5-397B-A17B(397B 總參 / 17B 激活)在幾乎所有編碼 Benchmark 上都干翻了

      是的,你沒看錯,小了 15 倍,反手給了老大哥一巴掌


      上圖是官方放出的分數對比,我挑幾個關鍵的給大家翻譯翻譯:

      • SWE-bench Verified :77.2(3.5-397B 是 76.2)

      • SWE-bench Pro :53.5(3.5-397B 是 50.9)

      • Terminal-Bench 2.0 :59.3(3.5-397B 是 52.5)

      • SkillsBench Avg5 :48.2(3.5-397B 只有 30.0,這個差距有點離譜)

      • GPQA Diamond :87.8

      • AIME 2026 :94.1

      橫向對比 Claude 4.5 Opus 這種閉源旗艦,編碼上基本也就差個 1~5 分,Terminal-Bench 居然打平(都是 59.3)

      這個參數量做到這個水平,我只能說阿里這波是真卷出來了,對得起大家的期待

      這次更新的核心賣點就兩個:

      • Agentic Coding :前端任務、倉庫級代碼推理都明顯更順滑,這次是 real-world coding 直接對標 Claude

      • Thinking Preservation :多輪對話時可以保留歷史的 thinking 上下文,代碼迭代開發場景下,不用每輪都重新"想一遍"了

      模型架構也有點意思:

      • 參數量:27B(Dense,不是 MoE,部署簡單)

      • 上下文:原生 262,144 tokens,可擴展到 1,010,000 tokens (百萬級)

      • 層數:64 層,隱藏維度 5120

      • Hidden Layout: 16 × (3 × (Gated DeltaNet → FFN) → 1 × (Gated Attention → FFN))

      • 多模態:自帶 Vision Encoder,圖片、視頻、文檔通吃

      • 支持 MTP(Multi-Token Prediction),推理速度有加成

      Gated DeltaNet + Gated Attention 的混合架構,是 Qwen3.5 就開始用的,和純 Attention 比,長上下文時顯存友好很多。這也是為什么它敢說百萬上下文。

      順便提一句,這次還同步放出了 FP8 量化版Qwen/Qwen3.6-27B-FP8:fine-grained fp8、block size 128,官方說「性能指標幾乎與原始模型一致」,顯存能砍掉一半左右,對本地部署是重磅利好

      為什么這個 27B 值得你重點關注

      老章這里掰開聊一下,27B Dense 這個尺寸對社區為什么是 sweet spot:

      1. 部署簡單 :Dense 架構沒有 MoE 路由那一套,不用折騰專家并行,vLLM/SGLang 直接一把梭

      2. 硬件門檻適中 :BF16 大約需要 54GB 顯存,2 × A100 40G、1 × H100 80G、或者 4 × 4090 都能跑; FP8 版只要 27GB 左右,單張 48G 的 L40S / A6000 Ada 就能跑

      3. 能力不妥協 :前面 benchmark 已經證明了,它比上一代 397B 還強

      4. 純開源權重 :Hugging Face 和 ModelScope 都有官方權重,商用隨便

      你用 Ollama 跑 Qwen3-30B 嫌小、跑 Qwen3.5-397B 跑不動的,現在中間這檔終于有了像樣的選手

      本地部署(重點來了)

      這次官方推薦 3 條路子:SGLang / vLLM / Hugging Face Transformers,另外還支持 KTransformers 做 CPU-GPU 異構推理。

      老章個人生產環境里最喜歡的是 vLLM

      1. vLLM 部署(推薦)

      版本要求 vllm>=0.19.0,裝新一點準沒錯:

      uv pip install vllm --torch-backend=auto

      標準啟動(8 卡 tensor parallel、262K 上下文):

      vllm serve Qwen/Qwen3.6-27B \
      --port 8000 \
      --tensor-parallel-size 8 \
      --max-model-len 262144 \
      --reasoning-parser qwen3

      帶 Tool Call(Coding Agent 場景必開):

      vllm serve Qwen/Qwen3.6-27B \
      --port 8000 \
      --tensor-parallel-size 8 \
      --max-model-len 262144 \
      --reasoning-parser qwen3 \
      --enable-auto-tool-choice \
      --tool-call-parser qwen3_coder

      開啟 MTP(多 Token 預測,推理提速)

      vllm serve Qwen/Qwen3.6-27B \
      --port 8000 \
      --tensor-parallel-size 8 \
      --max-model-len 262144 \
      --reasoning-parser qwen3 \
      --speculative-config '{"method":"qwen3_next_mtp","num_speculative_tokens":2}'

      只用文本能力(省顯存,砍掉視覺編碼器,給 KV Cache 讓路):

      vllm serve Qwen/Qwen3.6-27B \
      --port 8000 \
      --tensor-parallel-size 8 \
      --max-model-len 262144 \
      --reasoning-parser qwen3 \
      --language-model-only

      老章提個醒:官方明確說"如果 OOM 別無腦降 context,建議最少保留 128K,否則 thinking 能力會被閹割"

      2. SGLang 部署

      版本 sglang>=0.5.10

      uv pip install sglang[all]

      標準啟動:

      python -m sglang.launch_server \
      --model-path Qwen/Qwen3.6-27B \
      --port 8000 \
      --tp-size 8 \
      --mem-fraction-static 0.8 \
      --context-length 262144 \
      --reasoning-parser qwen3

      帶 Tool Use:

      python -m sglang.launch_server \
      --model-path Qwen/Qwen3.6-27B \
      --port 8000 --tp-size 8 \
      --mem-fraction-static 0.8 \
      --context-length 262144 \
      --reasoning-parser qwen3 \
      --tool-call-parser qwen3_coder

      開啟 MTP(投機解碼):

      python -m sglang.launch_server \
      --model-path Qwen/Qwen3.6-27B \
      --port 8000 --tp-size 8 \
      --mem-fraction-static 0.8 \
      --context-length 262144 \
      --reasoning-parser qwen3 \
      --speculative-algo NEXTN \
      --speculative-num-steps 3 \
      --speculative-eagle-topk 1 \
      --speculative-num-draft-tokens 4
      3. Transformers 輕量部署(測試用)

      顯存夠、但懶得裝 vLLM/SGLang,直接官方 Transformers 自帶的 server 也行:

      pip install "transformers[serving]"
      transformers serve Qwen/Qwen3.6-27B --port 8000 --continuous-batching

      注意這個是輕量級的,測試可以,上生產還是老老實實 vLLM/SGLang。

      4. 顯存不夠?上 FP8 版

      本地卡不夠的兄弟,直接把模型名換成 Qwen/Qwen3.6-27B-FP8 即可,其他啟動參數一毛一樣

      官方說指標幾乎無損,顯存需求直接腰斬

      vllm serve Qwen/Qwen3.6-27B-FP8 \
      --port 8000 \
      --tensor-parallel-size 2 \
      --max-model-len 131072 \
      --reasoning-parser qwen3

      雙卡 4090、單卡 L40S/A6000 Ada 跑起來都挺香

      使用

      起好服務后,接口完全兼容 OpenAI,老配方了

      采樣參數官方推薦值(這個很關鍵,別瞎調):

      • 思考模式(通用): temperature=1.0, top_p=0.95, top_k=20, presence_penalty=0.0

      • 思考模式(精確編碼,如 WebDev): temperature=0.6, top_p=0.95, top_k=20

      • 非思考模式: temperature=0.7, top_p=0.80, top_k=20, presence_penalty=1.5

      純文本請求:

      from openai import OpenAI
      client = OpenAI(base_url="http://localhost:8000/v1", api_key="EMPTY")

      messages = [
      {"role": "user", "content": "Type \"I love Qwen3.6\" backwards"},
      ]

      resp = client.chat.completions.create(
      model="Qwen/Qwen3.6-27B",
      messages=messages,
      max_tokens=81920,
      temperature=1.0,
      top_p=0.95,
      presence_penalty=0.0,
      extra_body={"top_k": 20},
      )
      print(resp)

      默認開啟思考,輸出里會有 ... 包裹的思考內容,不想要就按非思考模式的參數調。

      多模態(圖片)請求:

      messages = [{
      "role": "user",
      "content": [
      {"type": "image_url",
      "image_url": {"url": "https://your-image-url.jpg"}},
      {"type": "text", "text": "這張圖里有幾個圓?"},
      ]
      }]


      resp = client.chat.completions.create(
      model="Qwen/Qwen3.6-27B",
      messages=messages,
      max_tokens=81920,
      temperature=1.0,
      top_p=0.95,
      extra_body={"top_k": 20},
      )

      視頻輸入也一樣,把 type 換成 video_url 即可,官方 demo 里都有。

      老章小結

      優點:

      • 27B Dense,部署友好,社區期盼已久的甜點尺寸終于來了

      • Agentic Coding 能力真的強,SWE-bench 干翻 397B MoE 老大哥

      • 原生 262K,可擴到 1M 上下文,倉庫級代碼任務夠用

      • 多模態 + 文本雙修,一個模型吃到底

      • FP8 量化版同步放出,本地部署門檻再降一半

      • vLLM / SGLang / Transformers / KTransformers 全棧支持

      局限:

      • 27B 的盤子再怎么煉,HLE 這種超硬核推理題還是打不過 397B 和 Claude 4.5 Opus

      • 默認開啟 thinking,某些對延遲敏感的線上場景要注意切模式

      • context 不建議壓縮到 128K 以下,否則 thinking 會退化(說明這個長上下文是設計內的,硬核縮不動)

      • 關注?一波,明天出本地部署性能實測

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      爭議?56歲西蒙尼66分鐘便換下2大巨星 歐冠出局后怒推阿森納總監

      爭議?56歲西蒙尼66分鐘便換下2大巨星 歐冠出局后怒推阿森納總監

      我愛英超
      2026-05-06 06:09:59
      破案了!麥考爾點解沒有隨廣東隊去北京?原因揭曉

      破案了!麥考爾點解沒有隨廣東隊去北京?原因揭曉

      體育哲人
      2026-05-06 00:49:21
      臺灣當局集體跪諂斯太后,賴清德外交引爆全臺怒火

      臺灣當局集體跪諂斯太后,賴清德外交引爆全臺怒火

      阿晪美食
      2026-05-05 23:34:12
      阿森納1-0馬競,賽后評分出爐:不是薩卡第1,阿森納41號排第一

      阿森納1-0馬競,賽后評分出爐:不是薩卡第1,阿森納41號排第一

      側身凌空斬
      2026-05-06 04:54:46
      吉利一聲不響換上“朱雀”新車標! 被18個國家搶購,網友:太帥了

      吉利一聲不響換上“朱雀”新車標! 被18個國家搶購,網友:太帥了

      沙雕小琳琳
      2026-05-06 03:36:13
      俄烏戰爭以來曝俄軍首次大規模敗退!烏克蘭炸毀俄后勤大橋

      俄烏戰爭以來曝俄軍首次大規模敗退!烏克蘭炸毀俄后勤大橋

      項鵬飛
      2026-05-05 19:02:50
      歐洲情報聲稱:普京已在地下掩體度過數周,并禁止工作人員用手機

      歐洲情報聲稱:普京已在地下掩體度過數周,并禁止工作人員用手機

      激情與榮耀并存
      2026-05-05 15:34:41
      湖南煙花爆竹企業全面停產整頓

      湖南煙花爆竹企業全面停產整頓

      新華社
      2026-05-05 22:55:04
      巴媒:羅比尼奧因兒子遭內馬爾欺負很生氣,不接受其道歉了事

      巴媒:羅比尼奧因兒子遭內馬爾欺負很生氣,不接受其道歉了事

      懂球帝
      2026-05-06 03:58:55
      又一保險圈騙局曝光:銷冠任曉敏被警方帶走,涉案金額高達4億元

      又一保險圈騙局曝光:銷冠任曉敏被警方帶走,涉案金額高達4億元

      天天熱點見聞
      2026-05-05 19:59:02
      谷愛凌穿“會吐泡泡”的高定裙子亮相Met Gala,裙子上有1.5萬顆玻璃泡泡,制作耗時2550小時

      谷愛凌穿“會吐泡泡”的高定裙子亮相Met Gala,裙子上有1.5萬顆玻璃泡泡,制作耗時2550小時

      魯中晨報
      2026-05-05 16:26:17
      73年人生謝幕,她于2026年4月28日安詳離去

      73年人生謝幕,她于2026年4月28日安詳離去

      阿廢冷眼觀察所
      2026-05-05 11:57:43
      魯比奧確認對伊朗“史詩怒火”軍事行動已結束

      魯比奧確認對伊朗“史詩怒火”軍事行動已結束

      財聯社
      2026-05-06 04:08:05
      男子開車返滬路上看懵:旁邊的車里,主駕副駕2個女孩在睡覺?

      男子開車返滬路上看懵:旁邊的車里,主駕副駕2個女孩在睡覺?

      上觀新聞
      2026-05-05 20:34:14
      難以置信!廣東女生因拍照不滿拿萬元分手,不到3個月花男方5萬多

      難以置信!廣東女生因拍照不滿拿萬元分手,不到3個月花男方5萬多

      火山詩話
      2026-05-06 05:54:09
      當成都模式席卷全國,為何只有粵、蘇、魯、浙、閩5省選擇不跟?

      當成都模式席卷全國,為何只有粵、蘇、魯、浙、閩5省選擇不跟?

      金卡讀城
      2026-05-04 07:45:56
      1-0!薩卡立大功,阿森納淘汰馬競,挺進歐冠決賽,目標直指冠軍

      1-0!薩卡立大功,阿森納淘汰馬競,挺進歐冠決賽,目標直指冠軍

      足球狗說
      2026-05-06 04:54:03
      女性跑步:暴露這個隱私,是性感嗎?

      女性跑步:暴露這個隱私,是性感嗎?

      馬拉松跑步健身
      2026-05-05 19:18:07
      中超最新積分榜:蓉城9分領跑,泰山隊反超申花,負分球隊全清零

      中超最新積分榜:蓉城9分領跑,泰山隊反超申花,負分球隊全清零

      中超偽球迷
      2026-05-05 22:05:32
      酒局持續4小時,從下廚招待到拿刀拼命,妻子到底經歷了什么

      酒局持續4小時,從下廚招待到拿刀拼命,妻子到底經歷了什么

      笑談歷史阿晡
      2026-05-04 12:02:08
      2026-05-06 07:00:49
      Ai學習的老章 incentive-icons
      Ai學習的老章
      Ai學習的老章
      3372文章數 11146關注度
      往期回顧 全部

      科技要聞

      傳蘋果考慮讓英特爾、三星代工設備處理器

      頭條要聞

      媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

      頭條要聞

      媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

      體育要聞

      全世界都等著看他笑話,他帶國米拿下冠軍

      娛樂要聞

      內娛真情誼!楊紫為謝娜演唱會送花籃

      財經要聞

      瀏陽煙花往事

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態度原創

      教育
      游戲
      旅游
      房產
      手機

      教育要聞

      富人才不會把女兒養這么胖!家長曬女兒喝60元礦泉水,被網友群嘲

      《生化》電影被噴!游戲黨別在意 新片單純為嚇人

      旅游要聞

      “沒想到,開封這么會‘留人’”(新視窗·聚焦體驗經濟)

      房產要聞

      五一樓市徹底明牌!塔尖人群都在重倉凱旋新世界

      手機要聞

      iPhone 20周年機型或配備固態按鈕,iPhone 18再次確認工藝降級!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 欧美乱码一区二区三区| 一本色道久久综合亚洲精品不卡| 亚洲色欲色欲WWW成人网| AV网站中文| 亚洲欧美日本一区二区| 色吊丝av中文字幕亚洲?熟女| 亚洲人成电影在线播放| 国产精品 无码专区| 国产精品白浆一区二区免费看 | 午夜宅男在线| 国产亚洲精品久久久久久无挡照片 | 岛国一区二区三区av| 久久人人超碰精品caoporen| 国产精品色内内在线播放| 亚洲人成色77777| 久久这里只精品热免费99| 亚洲中文字幕无码一区| 韩国福利片在线观看播放| 999免费视频| 亚洲色偷拍区另类无码专区| 五月天婷婷一本到伊人| 天天日天天爽| 亚洲欧美精品午睡沙发| 国产不卡一区不卡二区| 狠狠色噜噜狠狠狠狠97| 欧美顶级metart祼体全部自慰| 国产精品三级一二三区| 色婷婷av一区二区三区之红樱桃| 国产国拍精品av在线观看| 五月婷婷丁香综合| 亚洲国产免费图区在线视频| 午夜黄色免费网站| 亚洲精品日本久久久中文字幕 | 久久国语露脸国产精品电影 | 亚洲国产性夜夜综合| 精品小视频在线观看| 欧美、另类亚洲日本一区二区| 国99久9在线 | 免费| аⅴ天堂最新版在线中文| 国产福利导航在线| 无码精品国产va在线观看dvd|