<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      在 Mac 上微調一切大模型

      0
      分享至

      聊個讓我非常興奮的項目——mlx-tune

      一句話概括:在你的 Mac 上,用 Unsloth 的 API 微調一切

      LLM、視覺模型、TTS、STT、OCR、Embedding,全都能在 Apple Silicon 上本地微調

      Mac 用戶的微調困境

      做大模型微調的同學應該都有過這種體驗:想在本地跑個小實驗驗證下 idea,結果發現 Unsloth 依賴 Triton,而 Triton 不支持 Mac

      于是你只剩兩條路:

      1. 1. 花錢開云 GPU —— 就跑個 100 條數據的實驗,有必要嗎?

      2. 2. 用 mlx-lm 原生 API —— 但代碼和 完全不兼容,到了云上還得重寫一遍

      mlx-tune(github.com/ARahim3/mlx-tune)的作者也遇到了一模一樣的問題

      他的解決思路非常簡單粗暴:把 MLX 包裝成 Unsloth 的 API

      你在 Mac 上寫的訓練腳本,換個 import 就能直接在 CUDA 集群跑

      # Unsloth (CUDA)                        # MLX-Tune (Apple Silicon)
      from unsloth import FastLanguageModel from mlx_tune import FastLanguageModel
      from trl import SFTTrainer from mlx_tune import SFTTrainer


      # 后面的代碼一模一樣!

      這才是真正解決問題的設計

      下面這張圖清楚展示了 mlx-tune 的工作流——本地原型驗證,改個 import 就能上云訓練:


      功能有多全?看完嚇一跳

      它支持的訓練方法比很多正經公司的內部工具都全:

      語言模型訓練:

      • ? SFT :基礎指令微調,這是最常用的

      • ? DPO / ORPO / KTO / SimPO :各種偏好學習方法全覆蓋

      • ? GRPO :DeepSeek R1 風格的多生成 + 獎勵訓練

      • ? CPT :持續預訓練,支持解耦學習率

      多模態訓練:

      • ? Vision :支持 Gemma 4、Qwen3.5、PaliGemma、LLaVA、Pixtral 等 VLM 微調

      • ? TTS :Orpheus、OuteTTS、Spark-TTS、Sesame/CSM、Qwen3-TTS 五個 TTS 模型

      • ? STT :Whisper、Moonshine、Qwen3-ASR、NVIDIA Canary、Voxtral 五個 STT 模型

      • ? Embedding :BERT、ModernBERT、Qwen3-Embedding、Harrier,支持對比學習

      • ? OCR :DeepSeek-OCR、GLM-OCR、olmOCR、Qwen-VL,內置 CER/WER 指標

      進階能力:

      • ? MoE 微調 :支持 39+ 種 MoE 架構,包括 Qwen3.5-35B、Mixtral、DeepSeek 系列

      • ? Gemma 4 Audio :12 層 Conformer 音頻塔,原生處理 16kHz 音頻

      • ? LFM2 :Liquid AI 的混合卷積+GQA 架構

      說真的,一個社區項目做到這個程度,相當離譜

      全景架構一覽——從 API 到硬件的五層設計:


      快速上手

      安裝很簡單,推薦用 uv:

      # 標準安裝
      uv pip install mlx-tune


      # 帶音頻支持
      uv pip install 'mlx-tune[audio]'
      brew install ffmpeg

      來個最基礎的 SFT 微調示例:

      from mlx_tune import FastLanguageModel, SFTTrainer, SFTConfig
      from datasets import load_dataset

      # 加載模型(4bit 量化,省顯存)
      model, tokenizer = FastLanguageModel.from_pretrained(
      model_name="mlx-community/Llama-3.2-1B-Instruct-4bit",
      max_seq_length=2048,
      load_in_4bit=True,
      )

      # 加 LoRA
      model = FastLanguageModel.get_peft_model(
      model,
      r=16,
      target_modules=["q_proj", "k_proj", "v_proj", "o_proj"],
      lora_alpha=16,
      )

      # 加載數據集
      dataset = load_dataset("yahma/alpaca-cleaned", split="train[:100]")

      # 訓練
      trainer = SFTTrainer(
      model=model,
      train_dataset=dataset,
      tokenizer=tokenizer,
      args=SFTConfig(
      output_dir="outputs",
      per_device_train_batch_size=2,
      learning_rate=2e-4,
      max_steps=50,
      ),
      )
      trainer.train()

      # 保存:三種格式隨你選
      model.save_pretrained("lora_model") # LoRA 適配器
      model.save_pretrained_merged("merged", tokenizer) # 合并后的完整模型
      model.save_pretrained_gguf("model", tokenizer) # GGUF 格式,直接給 Ollama 用

      如果你用過 Unsloth,這代碼看著是不是特別眼熟?對,就是同一套 API

      視覺模型微調

      VLM 微調也是同樣簡潔的體驗:

      from mlx_tune import FastVisionModel, UnslothVisionDataCollator, VLMSFTTrainer
      from mlx_tune.vlm import VLMSFTConfig

      model, processor = FastVisionModel.from_pretrained(
      "mlx-community/Qwen3.5-0.8B-bf16",
      )

      model = FastVisionModel.get_peft_model(
      model,
      finetune_vision_layers=True, # 視覺層也微調
      finetune_language_layers=True,
      r=16, lora_alpha=16,
      )

      # 訓練(數據集格式和 Unsloth 一致)
      FastVisionModel.for_training(model)
      trainer = VLMSFTTrainer(
      model=model,
      tokenizer=processor,
      data_collator=UnslothVisionDataCollator(model, processor),
      train_dataset=dataset,
      args=VLMSFTConfig(max_steps=30, learning_rate=2e-4),
      )
      trainer.train()

      Gemma 4、Qwen3.5、PaliGemma、LLaVA、Pixtral 都支持

      你甚至可以用 Vision GRPO 來訓練視覺推理能力

      TTS 微調:在 Mac 上克隆聲音

      這個功能我覺得特別有意思——在 Mac 上本地微調 TTS 模型:

      from mlx_tune import FastTTSModel, TTSSFTTrainer, TTSSFTConfig, TTSDataCollator
      from datasets import load_dataset, Audio

      # 自動檢測模型類型、編碼器和 token 格式
      model, tokenizer = FastTTSModel.from_pretrained(
      "mlx-community/orpheus-3b-0.1-ft-bf16"
      )
      model = FastTTSModel.get_peft_model(model, r=16, lora_alpha=16)

      dataset = load_dataset("MrDragonFox/Elise", split="train[:100]")
      dataset = dataset.cast_column("audio", Audio(sampling_rate=24000))

      trainer = TTSSFTTrainer(
      model=model, tokenizer=tokenizer,
      data_collator=TTSDataCollator(model, tokenizer),
      train_dataset=dataset,
      args=TTSSFTConfig(output_dir="./tts_output", max_steps=60),
      )
      trainer.train()

      Orpheus、OuteTTS、Spark-TTS、Sesame/CSM、Qwen3-TTS 都支持

      想做聲音克隆或者風格化 TTS,再也不用租 GPU 了

      工作流全景

      mlx-tune 的定位非常清晰:本地原型 → 云端量產。

      本地 Mac (mlx-tune)              云端 GPU (Unsloth)
      ├── 快速實驗 ├── 大規模訓練
      ├── 小數據集驗證 ├── 完整數據集
      ├── 秒級迭代 ├── 生產級優化
      └── 同一套代碼 ─────────────────── └── 同一套代碼

      訓練完還能直接導出:

      • ? HuggingFace 格式 :標準保存

      • ? GGUF :直接丟給 Ollama / llama.cpp

      • ? push_to_hub :一鍵推到 HuggingFace Hub

      它適合誰?

      我覺得 mlx-tune 最適合這幾類人:

      1. 1. Mac 用戶 + 微調需求 :你有 M1/M2/M3/M4/M5,想在本地跑微調實驗,這是最佳選擇

      2. 2. 混合工作流用戶 :本地調試、云端訓練,代碼無縫遷移

      3. 3. 多模態探索者 :想同時玩 LLM、Vision、TTS、STT、OCR 微調的人

      4. 4. 學習者 :想理解微調原理,在本地快速迭代比去 Colab 排隊強太多

      局限性也得說清楚:

      • ? 訓練速度肯定比不上 A100 + Unsloth,這是物理定律決定的

      • ? GGUF 導出對量化模型有限制,建議用非量化基座模型

      • ? 內存受限于 Mac 的統一內存(不過 Mac Studio 最高 512GB,夠用了)

      如果你是 Mac 用戶,又對微調大模型感興趣,強烈建議試試

      制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      賴清德專機繞路返航,4架戰機護航盡顯心虛

      賴清德專機繞路返航,4架戰機護航盡顯心虛

      音樂時光的娛樂
      2026-05-05 14:30:00
      倫敦世乒賽:8強賽對陣出爐,林詩棟3-0完成救贖,龍隊劉詩雯觀戰

      倫敦世乒賽:8強賽對陣出爐,林詩棟3-0完成救贖,龍隊劉詩雯觀戰

      晚霧空青
      2026-05-06 00:58:31
      不是文班 不是福克斯!馬刺爆冷輸球揪出水貨 33歲老將今夏恐退役

      不是文班 不是??怂梗●R刺爆冷輸球揪出水貨 33歲老將今夏恐退役

      籃球圈里的那些事
      2026-05-05 17:15:20
      五一假期結束別難過 還有45天又放假了!端午節放假通知正式出爐:6月19日-21日連放三天,不補班不調休

      五一假期結束別難過 還有45天又放假了!端午節放假通知正式出爐:6月19日-21日連放三天,不補班不調休

      每日經濟新聞
      2026-05-05 23:40:29
      美國人的歷史課本,是怎樣寫中國的?僅有20頁,記載了6個中國人

      美國人的歷史課本,是怎樣寫中國的?僅有20頁,記載了6個中國人

      抽象派大師
      2026-05-03 00:24:53
      1958年毛澤東視察濟南,酒桌上突然猛砸杯子死盯王新亭:把你隱瞞的秘密交底吧?

      1958年毛澤東視察濟南,酒桌上突然猛砸杯子死盯王新亭:把你隱瞞的秘密交底吧?

      史海孤雁
      2026-05-05 17:07:19
      突發!趙繼偉深夜11點做出重大決定,球迷:要加盟上?;虮笨??

      突發!趙繼偉深夜11點做出重大決定,球迷:要加盟上?;虮笨??

      呀古銅
      2026-05-06 06:09:06
      2001年,夫妻簽離婚協議時發現沒筆,妻子獨自上樓取筆時遇刺身亡

      2001年,夫妻簽離婚協議時發現沒筆,妻子獨自上樓取筆時遇刺身亡

      明月清風閣
      2026-05-05 21:25:06
      “新型霸凌”正在校園悄悄流行,孩子不敢說,但家長一定牢記這些

      “新型霸凌”正在校園悄悄流行,孩子不敢說,但家長一定牢記這些

      木言觀
      2026-05-05 07:09:57
      舌吻3小時、喊兒子小狼狗,狄鶯的畸形母愛終于反噬了

      舌吻3小時、喊兒子小狼狗,狄鶯的畸形母愛終于反噬了

      子芫伴你成長
      2026-05-02 22:50:39
      39歲何潔直播公布三婚,這姐還結啊,頭發都白了

      39歲何潔直播公布三婚,這姐還結啊,頭發都白了

      夢想總會變成真
      2026-05-05 21:36:52
      連沉7船!美軍動真格,真相曝光,德黑蘭權力失控,革命衛隊玩火

      連沉7船!美軍動真格,真相曝光,德黑蘭權力失控,革命衛隊玩火

      最美的巧合
      2026-05-05 16:00:24
      FIFA徹底慌了!多國集體拒高價買世界杯版權,天價泡沫徹底破裂

      FIFA徹底慌了!多國集體拒高價買世界杯版權,天價泡沫徹底破裂

      行者聊官
      2026-05-05 10:20:23
      比黃金貴3倍!1公斤賣165萬,以前農村隨手扔,看看你家有嗎

      比黃金貴3倍!1公斤賣165萬,以前農村隨手扔,看看你家有嗎

      三農雷哥
      2026-05-04 11:49:13
      百億私募暴雷,52人近1億血汗錢被套!

      百億私募暴雷,52人近1億血汗錢被套!

      三農老歷
      2026-05-05 05:42:41
      醫生發現:一旦吃上降血壓藥,這幾件事就別做了,別害了自己

      醫生發現:一旦吃上降血壓藥,這幾件事就別做了,別害了自己

      敘說醫療健康
      2026-05-06 05:00:06
      比亞迪這波降價,不只是真香,而是把一部分人直接推到了分岔路口

      比亞迪這波降價,不只是真香,而是把一部分人直接推到了分岔路口

      三農老歷
      2026-05-05 15:01:13
      球迷態度:阿森納英超領跑+歐冠進決賽,本賽季結局將如何?

      球迷態度:阿森納英超領跑+歐冠進決賽,本賽季結局將如何?

      懂球帝
      2026-05-06 05:45:10
      曾10分鐘賣500萬桶,半個娛樂圈為它帶貨!昔日網紅美食要破產了,杭州有便利店已下架

      曾10分鐘賣500萬桶,半個娛樂圈為它帶貨!昔日網紅美食要破產了,杭州有便利店已下架

      都市快報橙柿互動
      2026-05-06 00:20:04
      吳千語住進上海別墅,裝修剛完就搬了家,中產生活悄悄變了樣

      吳千語住進上海別墅,裝修剛完就搬了家,中產生活悄悄變了樣

      孤傲何妨初
      2026-05-06 04:31:12
      2026-05-06 06:56:49
      Ai學習的老章 incentive-icons
      Ai學習的老章
      Ai學習的老章
      3372文章數 11146關注度
      往期回顧 全部

      科技要聞

      傳蘋果考慮讓英特爾、三星代工設備處理器

      頭條要聞

      媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

      頭條要聞

      媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

      體育要聞

      全世界都等著看他笑話,他帶國米拿下冠軍

      娛樂要聞

      內娛真情誼!楊紫為謝娜演唱會送花籃

      財經要聞

      瀏陽煙花往事

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態度原創

      親子
      數碼
      時尚
      旅游
      公開課

      親子要聞

      這個五一,帶寶寶來北??春@病y灘細沙海浪,是小朋友最愛的天

      數碼要聞

      微星“MAG 276QRDY54”27英寸顯示器發售,6299元

      衣服不用準備太多,找到一些實用的單品才最重要,百搭又有性價比

      旅游要聞

      “沒想到,開封這么會‘留人’”(新視窗·聚焦體驗經濟)

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 久久精品www人人做人人爽| 亚洲精品乱码久久久久 | 德格县| 中文字幕无码午夜场| 999久久久| 国产全是老熟女太爽了| 国产午夜精品美女毛片视频| 思思99re6国产在线播放| 四虎成人精品永久网站| 日韩av自拍偷拍| 无码人妻精品一区二区三区9厂| 婷婷亚洲五月| 安阳市| 91网在线| 亚洲精品在线中文字幕| 亚洲国产成人丁香五月激情 | 有码一区二区三区四区| 精品亚洲国产成人av在线| 久久中国国产Av秘 入口| 学生妹无套内射正在播放| 在线观看视频91| 欧美亚洲一区二区三区在线| 精品91精品91精品国产片| 一区二区三区在线 | 日本| 狠狠色综合网站久久久久久久| 国产乱人偷精品人妻a片| A片入口| 性色蜜桃臀x88av| 国产精品黑色丝袜的老师| 性感美女av在线| 青春草在线观看播放网站| 国产在线网站| 国产成人精品永久免费视频| 一区二区三区鲁丝不卡| 欧美人妻少妇| 国产a∨精品一区二区三区不卡 | 午夜福利yw在线观看2020| 国产日韩精品一区在线不卡| 国产精品国产av片国产| 乱公和我做爽死我视频| 人人妻人人超人人|