<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      最近很熱門的oMLX,Mac端大模型本地部署新選擇,Claude-Opus-4.6 蒸餾版 Qwen3.5-9B 實測

      0
      分享至

      oMLX 走的是 Apple Silicon + MLX 這條路,Windows 和 NVIDIA 這邊的朋友,這篇先看看熱鬧就好

      前文,評論區(qū)好幾個兄弟推薦測試 oMLX:

      • 博主有時間可以研究一下oMLX這個替代 LM Studio,據(jù)說比 lm 快很多倍。

      • 聽說 omlx 比 lm studio 更好用些,占用內(nèi)存更小,有沒有嘗試部署一下?

      • 有大佬做成適合 omlx 跑的 fp8 量化版了,大概 10G,可以試試。同樣機器配置,換用了 oMLX 跑 qwen3.5 9b MLX Q4 版,利落了些,15token 左右吧。雖然回復慢,但還能用。而 ollama 跑就卡頓的很。

      花半天玩了一下,先看大家最關心的測試情況:

      • oMLX 有很多亮點,UI、菜單欄、管理后臺儀表板,Chat 頁面都很漂亮,底層有 SSD KV 緩存、設置熱緩存、支持 MCP、一鍵對接各種 AI Coding Agent,OpenAI/Anthropic 兼容接口、針對 Claude Code 優(yōu)化等

      • 單請求生成速度約 20 token/s,峰值顯存/統(tǒng)一內(nèi)存占用約 5.7GB

      • 無法硬跑 Qwen3.5-27B-Claude-4.6-Opus-Distilled-MLX-4bit,LM Studio 可以強跑,但只能加載,執(zhí)行任務直接徹底卡死

      安裝、配置、使用教程

      安裝后直接進入 Perference,自定義模型位置,端口號

      模型位置后面我把他改到了外接移動硬盤


      菜單欄確實方便,一鍵啟停 server、進入管理后臺,進入聊天界面


      先要進入模型 tab 然后點下載器


      下面的瀏覽模型可以直接看能否支持當前主機


      下載速度極慢,后來我換成了 modelcope


      感覺也有 bug,直接從上面下載,他會默認下載整個項目下的不同精度模型,而我只需要 Q4


      27B 我也下了


      沒有選擇 Jackrong 原版,主要是被 mlx-community 這句話吸引了


      但是 27B 最低使得 24 GB 及以上統(tǒng)一內(nèi)存的 Mac 都能運行該模型,且還有足夠空間容納大型上下文窗口,推薦是 32GB

      官方測試數(shù)據(jù):

      Metric

      Result

      Model load time

      2.4 seconds

      Prompt ingestion

      86.5 tokens/sec

      Generation speed

      15.7 tokens/sec

      Peak RAM usage

      15.6 GB

      Bit-rate

      4.501 bits/weight

      Final size

      14 GB (3 shards)

      下載過程中進入設置頁


      資源管理這里可以控制內(nèi)存占用情況,


      下載完畢,可以選擇在設置 - 模型設置中啟動,剛開始居然沒找到哪里加載


      聊天頁面,很清爽


      儀表盤會記錄模型運行情況


      現(xiàn)在往下也能把啟動的模型一見接入到 Codex、OpenCode、OpenClaw


      它還可以做基準測試


      32K 單請求測試,電腦已經(jīng)有點卡了,TTFT 高的離譜,TPS 只有 11

      測試

      TTFT (ms)

      TPOT (ms/tok)

      pp TPS

      tg TPS

      端到端延遲

      吞吐量

      峰值內(nèi)存

      pp32768/tg128

      187.4 tok/s

      11.8 tok/s

      185.686s

      177.2 tok/s

      9.06 GB

      單請求 + 批處理能力沒敢開高,tg TPS 20.2 tok/s。輸入拉長到 4096 token 后 TTFT 從 4.8s 變成 18.8s,tg TPS 還在 19.8 tok/s,幾乎沒掉,Peak Mem 從 5.66 GB 到 6.40 GB

      并發(fā)到 2-4 路時總吞吐提升明顯,但 8 路已經(jīng)接近平臺上限,延遲代價很大。


      依舊測試閱讀理解+SVG 代碼生成 + 審美

      感覺不穩(wěn)了,需要抽卡


      重新嘗試可以識別到四次,svg 寫的很丑


      讓其優(yōu)化之后,它的腦回路讓我想笑,它直接設計了模擬人物動作,完全偏離了主題


      27B 無法跑起來

      改了 N 多配置都不行,有高手可以出出主意

      我要換 32G 的 Mac 了


      但是 LM Studio 就可以用 option 按鍵強跑,只是無法執(zhí)行任務,機器卡死


      其他再說說

      看了官方文檔,再說幾個 oMLX 的亮點,可是我都沒嘗試

      1. 連續(xù)批處理

      它基于mlx-lmBatchGenerator做并發(fā)處理,首頁給了一組非常直觀的 benchmark,機器是 M3 Ultra 512GB,模型是 Qwen3.5-122B-A10B-4bit:

      • 單請求、8k 上下文時,Prompt 處理速度能到941 tok/s

      • Token 生成速度大約54.0 tok/s

      • 8x連續(xù)批處理下,總吞吐能到190.2 tok/s

      • 對應3.36 倍吞吐提升

      • 內(nèi)存占用峰值 73 GB

      另一組我很關注的數(shù)據(jù)是Qwen3-Coder-Next-8bit

      • 8k 上下文時,Prompt 處理速度2009 tok/s

      • 8x批處理總吞吐243.3 tok/s

      • 加速比來到4.14 倍

      • 內(nèi)存占用峰值 85GB

      2. Claude Code 優(yōu)化

      README 里有一句:

      支持在 Claude Code 中使用較小上下文模型的上下文縮放。通過縮放上報的 Token 數(shù)量,讓自動壓縮在合適的時機觸發(fā),同時提供 SSE keep-alive 防止長時間預填充導致的讀取超時。

      官方給出的方向主要有兩個:

      • 通過上下文縮放,讓較小上下文模型在 Claude Code 里更容易觸發(fā)合適的自動壓縮時機

      • 通過 SSE keep-alive,降低長時間 prefill 時讀超時的風險

      它本身還支持:

      • OpenAI 兼容接口:http://localhost:8000/v1

      • Anthropic 兼容接口:POST /v1/messages

      • 工具調(diào)用

      • MCP 集成

      3. 多模型服務

      它在同一服務里支持:

      • 文本 LLM

      • VLM

      • OCR 模型

      • Embedding

      • Reranker

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      2026年調(diào)整退休人員基本養(yǎng)老金的通知正式公布了嗎?

      2026年調(diào)整退休人員基本養(yǎng)老金的通知正式公布了嗎?

      白晝說故事
      2026-05-09 11:31:21
      連續(xù)三天嫖娼一次嫖倆,花800元毀掉一手女神好牌,他圖什么?

      連續(xù)三天嫖娼一次嫖倆,花800元毀掉一手女神好牌,他圖什么?

      街上的行人很刺眼
      2026-04-25 10:55:49
      34歲女子參加同學聚會,直接上桌跳艷舞助興,網(wǎng)友:誰敢娶她?

      34歲女子參加同學聚會,直接上桌跳艷舞助興,網(wǎng)友:誰敢娶她?

      辣媒專欄記錄
      2026-05-09 08:12:54
      伊朗外長:伊當前導彈庫存與發(fā)射能力較2月28日增長20%

      伊朗外長:伊當前導彈庫存與發(fā)射能力較2月28日增長20%

      財聯(lián)社
      2026-05-08 19:08:13
      吳艷妮曬照自曝“強迫癥大爆發(fā)”:家中香水、口紅等化妝品被擺得整整齊齊,喊話網(wǎng)友:誰房間臟亂差,能讓我上門搞搞收納?

      吳艷妮曬照自曝“強迫癥大爆發(fā)”:家中香水、口紅等化妝品被擺得整整齊齊,喊話網(wǎng)友:誰房間臟亂差,能讓我上門搞搞收納?

      臺州交通廣播
      2026-05-09 02:20:27
      “英版特朗普”攻城略地,英國要變天?

      “英版特朗普”攻城略地,英國要變天?

      觀察者網(wǎng)
      2026-05-09 15:08:19
      茶行業(yè)最大的笑話:繞過茶商,用便宜的價格買到茶農(nóng)的好茶!

      茶行業(yè)最大的笑話:繞過茶商,用便宜的價格買到茶農(nóng)的好茶!

      普洱話江湖
      2026-05-08 14:12:29
      又不想訪華了?中方亮明紅線,美商界大佬爭先恐后,三大小丑狂跳

      又不想訪華了?中方亮明紅線,美商界大佬爭先恐后,三大小丑狂跳

      知法而形
      2026-05-09 17:03:01
      不愧狼姐!第3次獻唱世界杯主題曲,夏奇拉還那么美,皮克后悔嗎

      不愧狼姐!第3次獻唱世界杯主題曲,夏奇拉還那么美,皮克后悔嗎

      小妹講史
      2026-05-08 15:15:14
      公安部:吳某某被采取刑事強制措施

      公安部:吳某某被采取刑事強制措施

      澎湃新聞
      2026-05-09 12:58:03
      報道捅了馬蜂窩!徐州12公里“黑河”曝光后竟接到一個神秘電話!

      報道捅了馬蜂窩!徐州12公里“黑河”曝光后竟接到一個神秘電話!

      菁菁子衿
      2026-05-09 10:56:39
      斯普利特和開拓者矛盾加劇,九名球員支持教練,楊瀚森卻保持沉默

      斯普利特和開拓者矛盾加劇,九名球員支持教練,楊瀚森卻保持沉默

      陳赩愛體育
      2026-05-09 10:16:07
      人活多久,看排汗就知道?壽命長的人,出汗一般有這5個特征!

      人活多久,看排汗就知道?壽命長的人,出汗一般有這5個特征!

      醫(yī)學科普匯
      2026-04-22 16:58:38
      摸貓跟狗的區(qū)別

      摸貓跟狗的區(qū)別

      貓來了
      2026-05-03 09:07:50
      28分慘案3分絕殺!4強一夜再亂,廣東逆天改命,上海奪冠概率大增

      28分慘案3分絕殺!4強一夜再亂,廣東逆天改命,上海奪冠概率大增

      后仰大風車
      2026-05-09 23:12:27
      比亞迪的“陽謀”藏不住了!買大唐EV再等等!海獅08更香?

      比亞迪的“陽謀”藏不住了!買大唐EV再等等!海獅08更香?

      芭比衣櫥
      2026-05-09 17:50:16
      “4只皮皮蝦1035元”,游客稱未收到退款,官方回復:未超出調(diào)控價格,已對司機和餐館展開調(diào)查

      “4只皮皮蝦1035元”,游客稱未收到退款,官方回復:未超出調(diào)控價格,已對司機和餐館展開調(diào)查

      極目新聞
      2026-05-07 18:29:41
      布萊頓35秒閃擊3比0狼隊 歐戰(zhàn)資格重燃希望

      布萊頓35秒閃擊3比0狼隊 歐戰(zhàn)資格重燃希望

      籃壇第一線
      2026-05-10 00:05:17
      李湘和王岳倫約飯被偶遇,李湘確實瘦了!網(wǎng)友猜測可能已復婚

      李湘和王岳倫約飯被偶遇,李湘確實瘦了!網(wǎng)友猜測可能已復婚

      TVB的四小花
      2026-05-09 20:53:23
      這居然是母子合影,47 歲巴西女星簡直凍齡

      這居然是母子合影,47 歲巴西女星簡直凍齡

      下水道男孩
      2026-05-07 21:16:59
      2026-05-10 00:39:00
      Ai學習的老章 incentive-icons
      Ai學習的老章
      Ai學習的老章
      3386文章數(shù) 11148關注度
      往期回顧 全部

      科技要聞

      美國政府強力下場 蘋果英特爾達成代工協(xié)議

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現(xiàn)身

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現(xiàn)身

      體育要聞

      成立128年后,這支升班馬首奪頂級聯(lián)賽冠軍

      娛樂要聞

      50歲趙薇臉頰凹陷滄桑得認不出!

      財經(jīng)要聞

      多地號召,公職人員帶頭繳納物業(yè)費

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態(tài)度原創(chuàng)

      藝術
      時尚
      游戲
      公開課
      軍事航空

      藝術要聞

      深圳終究失去“中國第一高樓”,華潤接手地塊!

      伊姐周六熱推:電視劇《喀什戀歌》;電視劇《低智商犯罪》......

      Windows 11 PC上的Xbox模式不支持多顯示器

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美伊突然再次交火 伊朗外長:戰(zhàn)爭準備程度是1000%

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 中文字幕久久久久人妻| 国产美女久久久久| 天天躁日日躁狠狠躁欧美| 国产黄色一级性生活片| 久久国产成人免费网站| 国产精品美女自慰喷水| 无套内射无矿码免费看黄| 3p在线视频| 亚洲国产无线乱码在线观看| 日本亚洲乱码中文字幕影院| 岛国av无码免费无禁网站麦芽| 国产成人精品久久综合| 四虎影院176| 亚洲色9| 国产精品久久精品三级| 亚洲一区二区精品极品| 波多野结衣无码视频| 亚洲无码一二| 亚洲AV无码未成人网站久久精品| 日韩在线观看网站| 免费全部高h视频无码| 国产无码性爱一区二区三区| 久久婷婷五月综合色99啪ak| 狠狠干狠狠爱| 中文字幕高清在线观看| 亚洲av观看| 日韩欧美第一区二区三区| 少妇被无套内谢免费看| 丰满人妻被猛烈进入中文字幕| 国产欧美va欧美va在线| 女人的天堂av青青草| 香蕉久久久久久久av网站| 亚洲AV无码国产成人久久强迫| 人妻丰满熟妇av无码区免 | 日本高清视频网站www| 国产成人综合精品久久| 中国真实偷乱视频| 国产福利免费视频| 色老头在线一区二区三区| 国产精品1区| 国产福利姬喷水福利在线观看|