一場原本圍繞“理想主義與商業化背叛”的世紀庭審,突然變了味。
在加州聯邦法庭上,Elon Musk被追問一個看似技術細節的問題:你們有沒有用OpenAI的模型訓練自己的AI?
他的回答并不復雜——“部分(Partly)”。
但真正引爆行業的,不是這句承認,而是他緊接著補的一句話:
“基本所有AI公司都會這么做。”
一瞬間,一個原本藏在技術幕后、行業默認但從不公開討論的做法,被直接搬上了法庭中央。
這個詞,叫“蒸餾”。
01 什么是“蒸餾”?一句話講清楚
如果用最直白的方式解釋,“蒸餾”其實不是偷,而是“學”。
更具體一點,是讓一個更強的AI當老師,把能力“教”給一個更小、更便宜的AI。
權威解釋也很一致:蒸餾是用一個模型去訓練另一個模型,讓后者模仿前者的行為與輸出,從而在更低成本下實現類似能力。
可以打個比方:不是把清華教材復印回家,而是連續問清華教授上萬道題,然后整理出一套自己的講義。結果可能非常接近,但路徑完全不同。
02 為什么“蒸餾”會成為行業剛需?
答案很簡單:錢。
訓練一個頂級大模型,成本極高。業內普遍認為,領先模型的訓練成本動輒上億美元級別。
但蒸餾改變了這件事。
通過反復調用大模型、學習輸出結果,可以在更短時間內做出一個“差不多好用”的模型,成本甚至可以壓縮到原來的零頭。
這也是為什么硅谷對這個技術既依賴,又警惕。
OpenAI、Anthropic等公司一邊使用蒸餾優化自家模型,一邊又試圖防止別人對自己做同樣的事情。
因為一旦失控,問題就變了:
你投入100億做出來的能力,別人可能用1%的成本就“復刻”。
03 xAI到底做了什么?爭議的真正焦點
回到這次庭審。根據多家權威媒體報道,馬斯克承認:
xAI確實使用了“模型蒸餾”
并且“部分”使用了OpenAI的模型進行訓練
關鍵點就在這里。行業內部蒸餾,是標準操作。
但問題是:你蒸的是“自己的模型”,還是“競爭對手的模型”?
這兩者,本質完全不同。
04 “行業慣例”這句話,有多少是真的?
馬斯克說“大家都這么干”,并非完全沒有依據。
現實情況是:
AI公司確實會用其他模型做測試和對比
蒸餾本身是成熟技術,學術界早在十年前就提出
但這里存在一個被刻意模糊的邊界:
行業普遍接受的是——用自己的模型蒸餾自己的模型
而爭議最大的,是——用競爭對手的閉源模型,系統性訓練自己的模型
后者,已經進入“灰色地帶”。
甚至有公司直接采取封鎖措施。比如Anthropic就曾因擔心違規使用,限制其他AI公司訪問其模型接口。
05 這件事真正刺痛行業的地方
如果只是技術爭議,不至于鬧到法庭。
真正的沖突,是商業邏輯。
過去幾年,AI行業的基本假設是:
誰投入更多算力、更多數據,誰就能建立長期優勢。
但蒸餾在動搖這個前提。
華爾街日報此前分析指出,蒸餾可以讓一個新模型在更短時間、用更低成本達到接近領先模型的水平,這正在沖擊巨頭的商業模型。
換句話說:領先者花巨資“造山”,后來者用蒸餾“抄路徑”。
山還在,但門檻被拆了。
06 更深一層:為什么各國政府也開始介入?
事情還在升級。
不僅是公司之間的競爭,已經開始涉及國家層面。
美國政府已明確表示,將關注外國企業通過蒸餾獲取美國AI能力的問題,并與企業共享相關情報。
原因很現實:AI不再只是商業工具,而是戰略資源。
如果蒸餾失控,相當于:
技術擴散速度遠超監管能力。
07 結局還沒到,但方向已經很清楚
這場庭審還沒結束,Sam Altman、微軟CEOSatya Nadella等關鍵人物還將出庭。
但有一件事已經確定:蒸餾,從幕后走到了臺前。它不再只是一個工程技巧,而是一個行業分水嶺。
08 寫在最后
如果用一句話總結這件事:這不是“抄不抄”的問題,而是——AI能力,究竟能不能被復制。
一旦答案是“可以”,那整個行業的游戲規則,都要重寫。
來源 | 盧山說AI精進
(ID:KEEP-POLISH)
作者 | 盧山 LUCENT LU ; 編輯 | 蝦餃
內容僅代表作者獨立觀點,不代表早讀課立場
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.