<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      Claude-Opus-4.6 蒸餾 Qwen3.5 V2 來了

      0
      分享至

      大家好,我是Ai學習的老章

      Claude-Opus-4.6 蒸餾 Qwen3.5 我一直很關注:


      現在 v2 來了,這次的升級重點不是"更準",而是"更快更省"——同樣的準確率,思維鏈縮短了 24%,每個 Token 產出的正確答案多了 31.6%。


      部署條件沒變,Qwen3.5-27B 4bit 單張 4090 即可本地跑起


      v2 到底改了啥?

      先看核心數據:

      指標

      v1

      v2

      變化

      HumanEval pass@1

      96.95%

      96.91%

      基本持平

      思維鏈長度

      基準

      縮短 ~24%

      顯著減少

      每 Token 正確率

      基準

      +31.6%

      大幅提升

      HumanEval+

      基準

      -1.24%

      微降

      MMLU-Pro

      基準

      -7.2%

      有所下降

      簡單說就是:代碼能力幾乎沒掉,但思考效率提升了三成

      這意味著什么?同樣一道編程題,v2 想的更少、答得更快,但正確率一樣。對于跑本地模型的人來說,生成速度本來就是瓶頸,少生成 24% 的 Token 就等于快了 24%——還不用加任何硬件。




      怎么做到的?

      v2 的訓練數據是關鍵。作者 Jackrong 用了14,000 條 Claude 4.6 Opus 風格的通用推理樣本,注意是"通用推理"——數學題、邏輯推理、文字題,不是代碼題

      這個設計思路很有意思:不針對代碼刷分,而是讓模型學會一種更高效的"思考腳手架"。結果在 HumanEval(代碼測試)上照樣拿了 96.91%,說明底層推理能力的提升是可以跨任務遷移的

      具體來說,v2 學到的推理模式長這樣:

      Let me analyze this request carefully:


      1. Identify the core objective of the problem.
      2. Break the task into clearly defined subcomponents.
      3. Evaluate constraints and edge cases.
      4. Formulate a step-by-step solution plan.
      5. Execute the reasoning sequentially and verify consistency.

      對比 v1 的長篇大論式思考,v2 更像一個有經驗的工程師——先列大綱再下手,不會在簡單問題上反復糾結。這就是 Claude Opus 的推理風格:結構化、有條理、不廢話


      訓練細節

      技術棧和 v1 一脈相承:

      • 基座模型:Qwen3.5-27B

      • 訓練框架:Unsloth + LoRA SFT

      • 訓練方式:Response-Only Training,只對 assistant 的思考部分做監督

      • 數據量:~14,000 條篩選后的高質量推理軌跡

      Base Model (Qwen3.5-27B)


      Qwen3.5-27B fine-tuned with Unsloth


      Supervised Fine-Tuning (SFT) + LoRA
      (Response-Only Training masked on "<|im_start|>assistant\n " )


      Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled-v2

      數據來源包括幾個公開的 Claude 4.6 Opus 蒸餾數據集:

      數據集

      用途

      Opus-4.6-Reasoning-3000x-filtered

      Claude 4.6 Opus 推理軌跡

      claude-opus-4.6-10000x

      大規模通用推理遷移

      claude-4.5-opus-high-reasoning-250x

      高強度結構化推理

      Qwen3.5-reasoning-700x

      補充多樣性推理樣本


      代價是什么?

      說完優點,也得說缺點。

      v2 在 **MMLU-Pro 上掉了 7.2%**,也就是通用知識推理能力有所下降。Jackrong也很坦誠地說了,由于 SFT 數據主要是通用推理類,對長上下文理解和復雜多步推理場景可能不如原版 Qwen3.5。

      我的理解是:這是一個典型的"專精 vs 通用"的權衡。如果你主要用來寫代碼、做邏輯推理、解數學題,v2 毫無疑問更好——又快又準。但如果你需要一個什么都能聊的通用模型,原版 Qwen3.5 或者 v1 可能更穩。


      怎么跑?

      跟之前一樣,GGUF 格式直接用 LM Studio、llama.cpp、Ollama 這些工具跑就行。HuggingFace 上提供了多種量化版本:

      模型地址:Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled-v2-GGUF

      之前我用 4090 跑 v1 的 27B 能到 46 Token/s,v2 思維鏈短了 24%,等效推理速度還能再快不少。

      總結

      v2 的核心價值就一句話:用更少的 Token 辦同樣的事

      • 代碼準確率不掉:HumanEval 96.91%

      • 思維鏈縮短 24%:生成更快,成本更低

      • 每 Token 正確率 +31.6%:推理效率質的飛躍

      • 代價:通用知識推理(MMLU-Pro)下降 7.2%

      對于本地部署場景,這種"推理效率優化"比單純提升準確率更有實際價值——畢竟我們的瓶頸往往不是模型不夠聰明,而是它想得太慢。

      .5

      制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      溫州一網紅景區!排隊!排隊!

      溫州一網紅景區!排隊!排隊!

      大永強
      2026-05-05 11:18:20
      足壇一夜動態:阿森納2-1晉級歐冠決賽 U17國足0-1遭印尼絕殺

      足壇一夜動態:阿森納2-1晉級歐冠決賽 U17國足0-1遭印尼絕殺

      念洲
      2026-05-06 06:37:57
      瘋狂一夜:阿森納淘汰馬競,中國隊亞洲杯落敗,利雅得新月逆襲

      瘋狂一夜:阿森納淘汰馬競,中國隊亞洲杯落敗,利雅得新月逆襲

      足球狗說
      2026-05-06 05:01:36
      直線拉升!套現約455億港元,李嘉誠又賣了

      直線拉升!套現約455億港元,李嘉誠又賣了

      每日經濟新聞
      2026-05-05 22:05:48
      吉利一聲不響換上“朱雀”新車標! 被18個國家搶購,網友:太帥了

      吉利一聲不響換上“朱雀”新車標! 被18個國家搶購,網友:太帥了

      沙雕小琳琳
      2026-05-06 03:36:13
      連續3場3-0橫掃!國乒男團完勝澳大利亞,強勢躋身世乒賽16強

      連續3場3-0橫掃!國乒男團完勝澳大利亞,強勢躋身世乒賽16強

      全景體育V
      2026-05-05 18:28:04
      賴清德“偷渡”全過程,這11個國家,中國一定要注意了

      賴清德“偷渡”全過程,這11個國家,中國一定要注意了

      一個幻想者
      2026-05-06 01:35:31
      為什么不能取消公務員周末休息?這樣老百姓辦事就不用請假了!你怎么看?

      為什么不能取消公務員周末休息?這樣老百姓辦事就不用請假了!你怎么看?

      碧翰烽
      2026-05-05 07:50:33
      男子開車返滬路上看懵:旁邊的車里,主駕副駕2個女孩在睡覺?頭都歪在一邊,主駕的手不在方向盤上,腿還蜷縮著

      男子開車返滬路上看懵:旁邊的車里,主駕副駕2個女孩在睡覺?頭都歪在一邊,主駕的手不在方向盤上,腿還蜷縮著

      新民晚報
      2026-05-05 20:20:14
      湖南瀏陽的嚴重傷亡事件,很多人關心省委書記和省長需要負責嗎

      湖南瀏陽的嚴重傷亡事件,很多人關心省委書記和省長需要負責嗎

      李昕言溫度空間
      2026-05-05 18:24:46
      別再拿“唱歌好聽”糊弄!央媒連發長文點名刀郎,遮羞布該扯下了

      別再拿“唱歌好聽”糊弄!央媒連發長文點名刀郎,遮羞布該扯下了

      娛樂圈的筆娛君
      2026-05-05 14:42:01
      女鄰居讓我幫她接電線,黑暗中我們抱到了一起,但她沒有松手

      女鄰居讓我幫她接電線,黑暗中我們抱到了一起,但她沒有松手

      千秋文化
      2026-05-04 18:34:54
      森林狼主帥:文班至少4個蓋帽是干擾球 沒必要申訴那是浪費時間

      森林狼主帥:文班至少4個蓋帽是干擾球 沒必要申訴那是浪費時間

      羅說NBA
      2026-05-06 05:52:40
      重磅:烏克蘭10枚火烈鳥導彈奔襲俄羅斯!摧毀軍工電子廠

      重磅:烏克蘭10枚火烈鳥導彈奔襲俄羅斯!摧毀軍工電子廠

      項鵬飛
      2026-05-05 18:59:49
      巴媒:羅比尼奧因兒子遭內馬爾欺負很生氣,不接受其道歉了事

      巴媒:羅比尼奧因兒子遭內馬爾欺負很生氣,不接受其道歉了事

      懂球帝
      2026-05-06 03:58:55
      悲催!一輛飛度被人群裹起來,車上扔滿垃圾,還寫著罵人的臟話…

      悲催!一輛飛度被人群裹起來,車上扔滿垃圾,還寫著罵人的臟話…

      火山詩話
      2026-05-05 08:16:25
      谷愛凌穿“會吐泡泡”的高定裙子亮相Met Gala,裙子上有1.5萬顆玻璃泡泡,制作耗時2550小時

      谷愛凌穿“會吐泡泡”的高定裙子亮相Met Gala,裙子上有1.5萬顆玻璃泡泡,制作耗時2550小時

      魯中晨報
      2026-05-05 16:26:17
      歐洲情報聲稱:普京已在地下掩體度過數周,并禁止工作人員用手機

      歐洲情報聲稱:普京已在地下掩體度過數周,并禁止工作人員用手機

      激情與榮耀并存
      2026-05-05 15:34:41
      伊朗總統辦公室官員否認總統辭職傳聞

      伊朗總統辦公室官員否認總統辭職傳聞

      新華社
      2026-05-05 23:07:08
      瀏陽爆炸煙花廠附近居民:多名中老年婦女在廠內工作,一女性從圍墻洞口逃生

      瀏陽爆炸煙花廠附近居民:多名中老年婦女在廠內工作,一女性從圍墻洞口逃生

      雞蛋bot
      2026-05-05 15:44:51
      2026-05-06 06:55:00
      Ai學習的老章 incentive-icons
      Ai學習的老章
      Ai學習的老章
      3372文章數 11146關注度
      往期回顧 全部

      科技要聞

      傳蘋果考慮讓英特爾、三星代工設備處理器

      頭條要聞

      媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

      頭條要聞

      媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

      體育要聞

      全世界都等著看他笑話,他帶國米拿下冠軍

      娛樂要聞

      內娛真情誼!楊紫為謝娜演唱會送花籃

      財經要聞

      瀏陽煙花往事

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態度原創

      手機
      時尚
      本地
      健康
      軍事航空

      手機要聞

      iPhone 20周年機型或配備固態按鈕,iPhone 18再次確認工藝降級!

      衣服不用準備太多,找到一些實用的單品才最重要,百搭又有性價比

      本地新聞

      用青花瓷的方式,打開西溪濕地

      干細胞治燒燙傷面臨這些“瓶頸”

      軍事要聞

      特朗普威脅伊朗不要向美國船開火

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲熟女综合一区二区三区| 韩国精品一区视频在线播放| 九九99久久精品在免费线18| 91亚洲国产成人aⅴ毛片大全| 97av麻豆蜜桃一区二区| 啊av在线| 国产成人午夜福利在线视频 | 色涩涩网| 精品一区二区三区在线观看| 色就综合8888| 91久久福利国产成人精品| 尤物国产在线精品一区| 亚洲偷自拍另类一区二区| 五月婷婷影院| 亚洲欧美偷国产日韩| 亚洲AV秘 无码一区二区久| 中文字幕无字幕加勒比| 阿城市| 欧美性精品不卡在线观看| 亚洲综合色无码| 99red国产| 成年性午夜免费视频网站| av一区在线观看| 国产人成777在线视频直播| а√天堂资源8在线官网在线| 欧美福利电影A在线播放| 国产精品女丝袜白丝袜| 丝袜美腿在线观看播放一区| 3d动漫精品啪啪一区二区下载| 欧美丰满熟妇性XXXX| 最大胆裸体人体牲交免费| 日本一区网站| 男女啪啪永久免费观看网站| 91免费在线| 中文字幕丰满乱子无码视频| 免费无码十八禁污污网站| 亚洲综合色网一区二区三区| 手机看片欧美| 国产成人无码AV片在线观看不卡| 国产成人精品三级在线影中文| 色墦五月丁香|