![]()
題圖來自:AI生成
把一臺主流安卓手機切到飛行模式,然后問屏幕上的AI:“幫我總結一下昨天的會議,挑三個待辦事項。”
它會答出來。答得不算驚艷,但靠譜。
從2022年11月OpenAI正式發布ChatGPT以來,幾乎所有人對AI 的認知都建立在一個樸素的邏輯上:你提的問題,會跑去一個遙遠的數據中心,由幾萬張GPU 算出答案,再傳回你的屏幕。這個過程貴、慢、依賴網絡,但所有人都默認那就是 AI 應該有的樣子。
然而僅僅三年時間,這種印象被一臺斷網的手機輕飄飄地推翻了。
特別是最近半年,和大模型行業的人聊天時,會發現一個詞的頻率越來越高——端側。
云端之上,并沒有“錢”
大模型上半場的邏輯非常清晰:參數大就是好。
GPT-4 出來之后那一年,國內拿到融資的公司,PPT 第一頁幾乎都在堆數據——多少 B 參數、多少萬億 token、多少張 H100。投資人也吃這一套。先把規模拉滿,故事就成立了。
但資金燒到當下,賬就逐漸算清楚了。
2025年OpenAI的估值雖然推到了五千億美元量級,但預計稅前虧損也達到了驚人的212億美元。Anthropic的情況看上去好一些:毛利率從2024年的 -94%改善到2025年的40%出頭,但同期 EBITDA(息稅折舊及攤銷前利潤)虧損仍有52億美元。Cohere和Mistral則反復傳出尋求被收購的消息。
這一行業里所有靠賣API 調用為生的公司,最后都站在同一條曲線的不同位置上,營收在漲,虧損也在漲,用戶越多,虧得越多。毛利率好轉的速度趕不上算力消耗擴張的速度。
這是反互聯網常識的。過去二十年,規模意味著壁壘,規模也意味著利潤。但大模型這門生意,規模意味著持續的算力消耗,因為每一次用戶和AI 的對話,背后都是真實的電費和GPU折舊。
更尷尬的是,這條曲線沒有明顯的下行點。模型再大、能力再強,單次推理的邊際成本依然擺在那里。
云端之外,暗流已動
把視線移到云端之外。
2023 年,在手機發布會上聽到“NPU”這個詞,多半會覺得有點尷尬。芯片廠商講了好幾年,但市面上幾乎沒有什么模型真的用得上,它像一個反復被寫進 PPT 又被現實辜負的未來能力。
到了2025年,這種能力開始兌現。
芯片廠商開始主動找模型公司談適配,因為客戶在問。手機用戶也開始問:為什么我的 AI 助手離線就用不了?為什么我換個網絡環境,它的反應慢了一截?這些問題意味著AI 已經被人當成水電一樣的存在了。它需要隨時可用,不能挑網絡。
模型這一側也終于跟上了。
過去幾年,量化、蒸餾、稀疏注意力這些工程方法被一批團隊反復打磨,一個幾B 參數的模型,經過精心設計,在多模態、長文本、OCR 這些原本被認為只有大模型才能干的活上,已經能做到讓人挑不出毛病的水平。
最直接的體現,是它真的能裝進設備里。手機芯片那點顯存,蘋果 A 系列大概八九 GB,驍龍旗艦差不多。以前看是天花板,現在反過來成了一種剛剛夠用的約束,逼著模型公司把每一層結構都摳到極致。
由此可見,端側AI 這兩年的真正拐點不是某一項技術突然成熟,而是模型、芯片、終端三方在同一個時間窗口里,互相找到了對方。
誰在押這條路
把端側作為主線在押的玩家,已經分成了幾撥。
第一撥是終端廠商,自己下場做模型。
蘋果的Apple Intelligence是其中最有代表性的——大約30億參數級別,主打“端側優先、云端兜底”。它的存在意味著蘋果決定不再把AI能力外包給OpenAI,即使前者聲稱是“合作”。Google 走得更激進,把Gemma Nano直接預裝到Pixel 系列,并且在Android 14之后開始向手機廠商開放底層API。
終端廠商下場的邏輯很清楚,AI 一旦成為系統級功能,它就不該是別人收過路費的地方。
第二撥是大公司開源出來的小模型。
微軟的Phi系列是這條路上的標志性產品。Phi-3用3.8B參數做出了能對標 70B模型的部分能力,證明了“小模型+ 精選數據”路線的可行性。Meta的Llama 3.2在2024年下半年推出1B / 3B版本,明確標注“為端側設計”。Google的Gemma系列走類似路線,開源出來供整個生態用。
這一撥的共同特點是:它們沒指望靠這些小模型直接掙錢。它們是在為生態鋪路。路鋪好了,再回頭收硬件、云端、其他業務的錢。
第三撥是真的把“小尺寸”當成核心戰略的創業公司。
Mistral是其中最早的。7B起家,在歐洲拿下了一批政企客戶。但因為太依賴單一開源故事,2024年微軟入股之后處境變得復雜。
國內這邊,阿里的Qwen 系列推出了從 0.5B 到 7B 的小尺寸版本,覆蓋端側多個段位,但因為同時還在做大尺寸 API 業務,端側不是主線。智譜 GLM 也有端側版本,但商業重心仍在云端。把端側當成絕對主線在做的,國內最有代表性的是面壁智能,MiniCPM 系列做到了GPT-4o同級水平。這種說法一年前幾乎所有人都覺得是夸口,但它發生了。
把這幾撥玩家放在一起看,端側AI 已經不是“小公司的避風港”,它正在成為整個行業重新組織自己的方式。
端側不是免費午餐
寫到這里,也得說句實話。端側AI前景雖然無限,但不是完美故事。
把模型塞進設備這件事,工程上的麻煩比想象中碎。安卓機型上千種,芯片各家API 不一樣,系統定制層每個廠商各有講究。一個端側模型想在這片土壤里跑順,光適配就夠小公司喝一壺——這件事沒有捷徑,只有一行行的代碼、一臺臺機器的實測,一次次跑通之后被下一代芯片打破,再重新跑通。這種活算法工程師不愛干,但端側這條路就是由這些不性感的活鋪出來的。
模型公司還得面對一個更隱性的處境:手機廠、芯片廠、車廠本身就是產業鏈里強勢的一方。被預裝、被集成看上去是“贏了”,但同時也意味著隨時要面對被替換、被壓價、被邊緣化。Mistral 這兩年在歐洲的處境多少能說明問題——它既要滿足法國政府對“主權AI”的期待,又要應付微軟入股之后被主導話語權的尷尬,左右都難做。
端側換來了商業化更扎實的路徑,但也意味著融入合作生態,成為產業鏈里若干環節中的一環。
大模型上半場比的是誰能把山攀得最高。下半場比的,是誰愿意走下山,走進具體的設備里、具體的場景里、具體的人面前。
去年那臺跑在飛行模式下的安卓手機,今年我又見過一次。
在朋友的車上,離線導航和語音都跑在本地。
云在很遠的地方。
但AI 已經到了。
本內容由作者授權發布,觀點僅代表作者本人,不代表虎嗅立場。如對本稿件有異議或投訴,請聯系 tougao@huxiu.com。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4854778.html?f=wyxwapp
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.