撰文| 郝 鑫
編輯| 吳先之
2023年初,關于“誰是中國最有技術理想的人”這個問題,十個投資人中大概有一半的回答是“Kimi(楊植麟)”。
彼時,楊植麟所創建的月之暗面(以下簡稱“月暗”),跟他本人一樣神秘且不按常理出牌。在國內大模型逐漸淪為“卷參數”的重災區時,成立半年的月暗開了第一場發布會,侃侃而談的主題是“長文本”,瞄準的方向是C端超級應用。
月暗與DeepSeek的第一次“撞車”,發生在2025年春節前夕。同一天,間隔不到兩個小時,DeepSeek發布了R1,月暗發布了Kimi k1.5。盡管兩家模型在訓練思路上有相似之處,但DeepSeek-R1憑借著模型放量、性能和開源,火遍了全球。
R1火了,全世界的人都開始打聽,DeepSeek背后的梁文鋒是何許人也。《暗涌》2023年的一篇報道被翻了出來,在里面梁文鋒提到了“研究”“探索”“不求商業回報”等話題。“中國最有技術理想”的標簽,由此被貼到了梁文鋒身上。
早期有投資人總結,月暗和DeepSeek兩家公司的相同點:靈魂人物、一流的技術團隊和鼓勵創新文化。
就在不久前,月暗面截胡了V4,先一步發布并開源了新模型K2.6。
![]()
緊接著傳出了DeepSeek尋求融資的消息,騰訊和阿里巴巴正就投資事宜展開洽談,而這兩家也是月暗的股東。
據有關人士透露,DeepSeek將以月暗作為部分估值參照基準。目前月暗的估值在180億美元,正在尋求上市。有消息稱,DeepSeek的目標估值已從最初的至少100億美元上調至超200億美元,超過了月暗。
牌局未散,籌碼未涼。月暗與DeepSeek的故事,像極了麻將桌上的高手對壘。彼此盯著對方的牌,卻又各自按自己的牌型摸打。
而麻將的魅力正在于此,不到最后一張牌翻開,誰也不知道誰會“點炮”,誰會“自摸”。
登月的“背面”
去年底,楊植麟對內展現出,公司發展健康,賬上資金相對充盈,不著急上市的坦然。
僅過去三個月,情況迎來180度轉彎,月之暗面被爆出“考慮赴港進行首次公開招股”的消息。
這一切實際有跡可循,據光子星球了解,去年的月暗內部彌漫著焦慮的情緒。一方面是來自競爭對手的壓力,面對智譜和MiniMax接連上市,部門員工難免士氣低落,因為很多人覺得大模型的窗口期很短,上市的機會稍縱即逝。
另一方面則體現在商業化上,月暗手握的資金、人才在國內屬于第一梯隊,但核心產品只有Kimi助手。這導致其收入來源極其有限,免費用戶占絕大多數,付費訂閱轉化率低,API調用量遠不如專注于B端的公司。
有業內人士告訴我們,因為此前的誤判,月暗卷入了與大廠的競爭中,結果是在國內沒有打過豆包,同時又錯過了海外市場開拓時間點。
“海外相對還是充分競爭的市場,不僅僅有GPT和Gemini,如果有大量全球客戶愿意為國產大模型買單,仍是有很大的市場。在進一步打開市場的前提下,大模型和應用的研發才能走向正向循環”。該業內人士表示,目前有效出海的領域是AI視頻領域,類似于一些創業公司體量雖小,卻仍可與大廠抗衡。
DeepSeek R1給行業敲響了警鐘,包括月暗。
技術戰略上聚焦Agent方向,Agent賽道所需要具備的長上下文記憶、任務拆解與規劃、底層模型推理能力,恰好與其技術儲備相吻合。
按楊植麟所說,Kimi K2.5以后進化邏輯,按照Token效率、長上下文以及智能體集群,三個維度的協同推進。他判斷,未來智能發展方向將從單智能體向動態生成的集群進化,這也為K2.6埋下了伏筆。
盡管Kimi助手還可以免費使用,但對高價值用戶篩選極其明顯。有很多用戶反映,在未充值會員的情況下,正常使用Kimi的速度明顯變慢,還經常遇到高峰算力不足的問題。事實上,這本身就是月暗的策略之一,在有限算力的情況下瞄準能帶來付費轉化的生產力用戶。
這種策略加速了Kimi商業化模型走向閉合。早期,Kimi沒有完全開放收費,僅推出了打賞功能,本質是高峰期優先使用權,更像是一種對免費用戶的流量調節手段,而非真正的產品分層。
去年9月,隨著“OK Computer”功能推出,轉為49、99和199元/月三檔會員,開始將深度研究、K2 Turbo、長思考等能力打包,初步嘗試按能力付費。
現在,其會員訂閱進一步細分為四檔,價格帶大幅拉長,最高檔接近700元/月,遠超此前199元的上限,新增的高階權益明顯指向專業用戶和企業級場景。
![]()
其定價邏輯不再基于能否使用,而是基于,用戶能調動多少Agent、訪問什么級別數據庫、獲得多少并行能力。這標志著Kimi徹底放棄了與豆包等C端產品的流量競爭,轉而深耕專業生產力市場,試圖從高價值用戶的付費中獲取可持續收入。
K2.6是分水嶺
總體來看,此次K2.6的更新,對Agent“動手”能力的增強,大于對“大腦”智力的加強。
![]()
K2.6的能力在搜索型Agent、長鏈路編碼、工具協作這些需要執行與檢索的任務上,已經達到和GPT?5.4、Claude Opus 4.6同一水平線;但在純推理、純數學,這類更依賴內部思維鏈與抽象邏輯的任務上,還有一些差距。
技術報告里展現了三項K2.6的核心能力。一是長程編碼能力,能夠連續編碼13小時,編寫或修改超過4000行代碼,堪稱“編碼勞模”。官方實測中,用較為冷門Zig語言重構AI模型推理,將速度從15 tokens/s提升至193 tokens/s。這是典型的“以執行代推理”的優勢體現。
二是從單兵到軍團的Agent集群能力,這是增強“手”能力的集中體現。K2.6支持的Agent集群架構,能調動高達300個子Agent并行工作,完成4000個協作步驟。相比上一代,任務完成度和交付質量都有提升。
三是Agent的自主執行能力,模型能在主動式Agent框架,如OpenClaw,中持續自主運行長達5天。這意味著它能作為7x24小時的后臺“數字員工”,處理復雜任務。
此次以K2.6為標志的更新,清晰地揭示了月之暗面一次重大的戰略轉向:從“信息容器”徹底轉向“執行引擎”,從追求對話智能,全面押注于能直接交付結果的Agentic智能。
回顧Kimi的一路來的升級,經歷了3個階段。
早期的Kimi聚焦超長文本和對話,就像一個知識淵博的圖書管理員,你問什么,他告訴你在哪本書的哪一頁。這是一個信息容器,用戶把大量信息倒進去,Kimi負責理解、檢索、總結。它不改變外部世界,只改變用戶對信息的獲取效率。
第2階段,也就是K2、K2.5時期,核心是增強代碼生成、數學推理、復雜指令遵循等能力。此時的模型從“讀”走向“算”,就像一個聰明的實習生,他能根據需求寫出可運行的代碼,但需要你檢查、部署和整合。這背后,是模型開始具備工作記憶與鏈式思考能力,不再只是被動回答問題,而是能主動規劃多步驟的思維過程。
第3階段,也就是現在的K2.6,走向了多Agent協同執行。核心是將一個復雜任務拆解為多個子任務,調度不同的“技能Agent”并行執行,最后整合交付完整成果。K2.6從一個大腦變成了“一個項目經理+一支數字員工團隊”。
正是因為智能帶來的生產力提升,帶來了月暗商業模式的轉變,從對功能收費轉變為執行任務、成果交付的收費。對月暗來說,K2.6的商業價值高于技術價值。
這是一道分水嶺,是Kimi從“信息容器”邁向“執行引擎”的拐點,也是Agent能承擔復雜工作的量產證明。
月之暗面官方在開篇引用了Linux之父的一句經典名言,“Talk is cheap. Show me the code”。或許,還應該補上一句“Only results matter.”
V4狹路相逢
狼來了的故事終于有了結尾,DeepSeek-V4預覽版在K2.6之后,姍姍來遲。
根據官方信息,V4版本的更新核心是“普惠”。通過技術創新,讓頂尖的Agent能力、百萬級超長上下文和極致的推理性能,以更低的成本被每個人和企業方便地使用。
V4在成本效率上做出了極致優化。采用MoE架構,總參數達到1.6萬億,但每次推理僅激活約490億參數,既保證了性能,又控制了成本。上下文窗口從前代的128K擴展至100萬Token,接近10倍的量級提升。同時,實現了在100萬Token長度下的97%信息召回率。
V4最具沖擊力的,可能不是其技術參數,而是在商業模式上對現有閉源巨頭的挑戰。
DeepSeek-V4的采取雙版本定價策略,一端是面向個人開發者的V4-Flash,每百萬tokens輸入是0.2元,輸出是2元;V4-Pro每百萬tokens輸入是1元,輸出是12元。粗略估算,以OpenAI和Anthropic當前最強的旗艦模型為基準,其價格大約是V4-Pro的16-25倍。
Deepseek表示,受限于高端算力,目前Pro的服務吞吐十分有限,預計下半年昇騰950超節點批量上市后,Pro的價格還會大幅下調。
關鍵是,V4-Pro并非廉價替代品。其在Agentic Coding評測中已達開源最佳,其使用體驗優于Sonnet 4.5,交付質量接近Claude Opus 4.6的非思考模式。
同樣是Agent,DeepSeek V4與Kimi K2.6的本質區別,在于它們優化Agent能力視角截然不同:一種是微觀智能驅動力,一種是宏觀集群執行力。
DeepSeek的內在哲學是模型即Agent,側重于單兵為王,通過提升模型自身的智能與效率,使單個Agent能力最大化。V4假設單個模型的能力做到天花板,那么基于其構建的Agent自然就是最強的,用戶不需要復雜的集群調度,一個Agent就能完成大多數任務。
Kimi K2.6則更偏重于Agent即系統,將Agent擰成一股繩,核心能力源于多Agent Swarm集群的協同能力。K2.6認為現實中的復雜任務,靠一個Agent串行完成太慢、太容易出錯。不如拆成幾百個小任務,讓上百個Agent并行一起做,最后匯總。即使每個Agent的智商不是頂尖,團隊協作的效率也遠超單兵。
這兩種路線并非對立,而是互相補充。前者拼智商,后者拼協作。前者是深度,后者是廣度。因為一個理想的Agent系統,可以用DeepSeek V4作為子Agent的“大腦”,再用Kimi的集群框架將這些子Agent組織起來。
從種種跡象來看,DeepSeek正在向資本和商業化靠攏,而且無法避免地將月暗拉進了這場風暴。
![]()
智譜與MiniMax已經上市,從團隊基因、技術能力、融資能力等多個因素綜合考慮,月暗成為了DeepSeek錨定估值的最佳標的。
目前,月暗的核心敘事是“長上下文本+Agent集群智能”,以此支撐起180億美元的估值。DeepSeek此時以200億美元甚至更高的目標估值去參照月暗,直接挑戰了其估值的合理性。
投資者天然會進行同類比較,更何況月暗與DeepSeek本來就有相似的地方。當月暗從唯一的選擇變成了可替代的選項之一,估值邏輯就從稀缺性溢價,就切換為可替代性折價。
DeepSeek這局牌打得極兇,技術一把梭哈,定價直接“截胡”,估值有機會反超月暗。
可它的軟肋也很明顯,開源是把雙刃劍,容易養大了對手餓死了自己。其長期以AI實驗室自居,以研究為導向,無法保證更新頻率的穩定性。V3版本發布于2024年12月,V4版本頻頻跳票,市場等得心焦。
因為堅持開源,DeepSeek難以通過模型授權收費,收入來源現在只有微薄的API調取費用。商業模式尚未建立,仍要面臨算力、人才爭奪和基建建設等高昂的成本支出。
月暗雖被“截胡”,卻還攥著幾張暗牌,比如Agent集群的工程成熟度、垂直行業的深耕、初步有成效的Agent商業模式,這些DeepSeek短期難以超越。
誰能把手里的牌打成“自摸”,看的不是誰嗓門大,而是誰能在商業化這張牌桌上,把技術真正換成籌碼。
DeepSeek摸到了“聽牌”的資格,月暗也還有“改聽”的機會。只是這張牌桌,從此再無輕松的牌可打。
微信號|TMTweb
公眾號|光子星球
別忘了掃碼關注我們!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.