網易首頁 > 網易號 > 正文申請入駐

月暗與DeepSeek的“聽牌”時刻

2026-04-24 20:03:15　來源: 光子星球

北京舉報

分享至

撰文| 郝鑫

編輯| 吳先之

2023年初，關于“誰是中國最有技術理想的人”這個問題，十個投資人中大概有一半的回答是“Kimi（楊植麟）”。

彼時，楊植麟所創建的月之暗面（以下簡稱“月暗”），跟他本人一樣神秘且不按常理出牌。在國內大模型逐漸淪為“卷參數”的重災區時，成立半年的月暗開了第一場發布會，侃侃而談的主題是“長文本”，瞄準的方向是C端超級應用。

月暗與DeepSeek的第一次“撞車”，發生在2025年春節前夕。同一天，間隔不到兩個小時，DeepSeek發布了R1，月暗發布了Kimi k1.5。盡管兩家模型在訓練思路上有相似之處，但DeepSeek-R1憑借著模型放量、性能和開源，火遍了全球。

R1火了，全世界的人都開始打聽，DeepSeek背后的梁文鋒是何許人也。《暗涌》2023年的一篇報道被翻了出來，在里面梁文鋒提到了“研究”“探索”“不求商業回報”等話題。“中國最有技術理想”的標簽，由此被貼到了梁文鋒身上。

早期有投資人總結，月暗和DeepSeek兩家公司的相同點：靈魂人物、一流的技術團隊和鼓勵創新文化。

就在不久前，月暗面截胡了V4，先一步發布并開源了新模型K2.6。

緊接著傳出了DeepSeek尋求融資的消息，騰訊和阿里巴巴正就投資事宜展開洽談，而這兩家也是月暗的股東。

據有關人士透露，DeepSeek將以月暗作為部分估值參照基準。目前月暗的估值在180億美元，正在尋求上市。有消息稱，DeepSeek的目標估值已從最初的至少100億美元上調至超200億美元，超過了月暗。

牌局未散，籌碼未涼。月暗與DeepSeek的故事，像極了麻將桌上的高手對壘。彼此盯著對方的牌，卻又各自按自己的牌型摸打。

而麻將的魅力正在于此，不到最后一張牌翻開，誰也不知道誰會“點炮”，誰會“自摸”。

登月的“背面”

去年底，楊植麟對內展現出，公司發展健康，賬上資金相對充盈，不著急上市的坦然。

僅過去三個月，情況迎來180度轉彎，月之暗面被爆出“考慮赴港進行首次公開招股”的消息。

這一切實際有跡可循，據光子星球了解，去年的月暗內部彌漫著焦慮的情緒。一方面是來自競爭對手的壓力，面對智譜和MiniMax接連上市，部門員工難免士氣低落，因為很多人覺得大模型的窗口期很短，上市的機會稍縱即逝。

另一方面則體現在商業化上，月暗手握的資金、人才在國內屬于第一梯隊，但核心產品只有Kimi助手。這導致其收入來源極其有限，免費用戶占絕大多數，付費訂閱轉化率低，API調用量遠不如專注于B端的公司。

有業內人士告訴我們，因為此前的誤判，月暗卷入了與大廠的競爭中，結果是在國內沒有打過豆包，同時又錯過了海外市場開拓時間點。

“海外相對還是充分競爭的市場，不僅僅有GPT和Gemini，如果有大量全球客戶愿意為國產大模型買單，仍是有很大的市場。在進一步打開市場的前提下，大模型和應用的研發才能走向正向循環”。該業內人士表示，目前有效出海的領域是AI視頻領域，類似于一些創業公司體量雖小，卻仍可與大廠抗衡。

DeepSeek R1給行業敲響了警鐘，包括月暗。

技術戰略上聚焦Agent方向，Agent賽道所需要具備的長上下文記憶、任務拆解與規劃、底層模型推理能力，恰好與其技術儲備相吻合。

按楊植麟所說，Kimi K2.5以后進化邏輯，按照Token效率、長上下文以及智能體集群，三個維度的協同推進。他判斷，未來智能發展方向將從單智能體向動態生成的集群進化，這也為K2.6埋下了伏筆。

盡管Kimi助手還可以免費使用，但對高價值用戶篩選極其明顯。有很多用戶反映，在未充值會員的情況下，正常使用Kimi的速度明顯變慢，還經常遇到高峰算力不足的問題。事實上，這本身就是月暗的策略之一，在有限算力的情況下瞄準能帶來付費轉化的生產力用戶。

這種策略加速了Kimi商業化模型走向閉合。早期，Kimi沒有完全開放收費，僅推出了打賞功能，本質是高峰期優先使用權，更像是一種對免費用戶的流量調節手段，而非真正的產品分層。

去年9月，隨著“OK Computer”功能推出，轉為49、99和199元/月三檔會員，開始將深度研究、K2 Turbo、長思考等能力打包，初步嘗試按能力付費。

現在，其會員訂閱進一步細分為四檔，價格帶大幅拉長，最高檔接近700元/月，遠超此前199元的上限，新增的高階權益明顯指向專業用戶和企業級場景。

其定價邏輯不再基于能否使用，而是基于，用戶能調動多少Agent、訪問什么級別數據庫、獲得多少并行能力。這標志著Kimi徹底放棄了與豆包等C端產品的流量競爭，轉而深耕專業生產力市場，試圖從高價值用戶的付費中獲取可持續收入。

K2.6是分水嶺

總體來看，此次K2.6的更新，對Agent“動手”能力的增強，大于對“大腦”智力的加強。

K2.6的能力在搜索型Agent、長鏈路編碼、工具協作這些需要執行與檢索的任務上，已經達到和GPT?5.4、Claude Opus 4.6同一水平線；但在純推理、純數學，這類更依賴內部思維鏈與抽象邏輯的任務上，還有一些差距。

技術報告里展現了三項K2.6的核心能力。一是長程編碼能力，能夠連續編碼13小時，編寫或修改超過4000行代碼，堪稱“編碼勞模”。官方實測中，用較為冷門Zig語言重構AI模型推理，將速度從15 tokens/s提升至193 tokens/s。這是典型的“以執行代推理”的優勢體現。

二是從單兵到軍團的Agent集群能力，這是增強“手”能力的集中體現。K2.6支持的Agent集群架構，能調動高達300個子Agent并行工作，完成4000個協作步驟。相比上一代，任務完成度和交付質量都有提升。

三是Agent的自主執行能力，模型能在主動式Agent框架，如OpenClaw，中持續自主運行長達5天。這意味著它能作為7x24小時的后臺“數字員工”，處理復雜任務。

此次以K2.6為標志的更新，清晰地揭示了月之暗面一次重大的戰略轉向：從“信息容器”徹底轉向“執行引擎”，從追求對話智能，全面押注于能直接交付結果的Agentic智能。

回顧Kimi的一路來的升級，經歷了3個階段。

早期的Kimi聚焦超長文本和對話，就像一個知識淵博的圖書管理員，你問什么，他告訴你在哪本書的哪一頁。這是一個信息容器，用戶把大量信息倒進去，Kimi負責理解、檢索、總結。它不改變外部世界，只改變用戶對信息的獲取效率。

第2階段，也就是K2、K2.5時期，核心是增強代碼生成、數學推理、復雜指令遵循等能力。此時的模型從“讀”走向“算”，就像一個聰明的實習生，他能根據需求寫出可運行的代碼，但需要你檢查、部署和整合。這背后，是模型開始具備工作記憶與鏈式思考能力，不再只是被動回答問題，而是能主動規劃多步驟的思維過程。

第3階段，也就是現在的K2.6，走向了多Agent協同執行。核心是將一個復雜任務拆解為多個子任務，調度不同的“技能Agent”并行執行，最后整合交付完整成果。K2.6從一個大腦變成了“一個項目經理+一支數字員工團隊”。

正是因為智能帶來的生產力提升，帶來了月暗商業模式的轉變，從對功能收費轉變為執行任務、成果交付的收費。對月暗來說，K2.6的商業價值高于技術價值。

這是一道分水嶺，是Kimi從“信息容器”邁向“執行引擎”的拐點，也是Agent能承擔復雜工作的量產證明。

月之暗面官方在開篇引用了Linux之父的一句經典名言，“Talk is cheap. Show me the code”。或許，還應該補上一句“Only results matter.”

V4狹路相逢

狼來了的故事終于有了結尾，DeepSeek-V4預覽版在K2.6之后，姍姍來遲。

根據官方信息，V4版本的更新核心是“普惠”。通過技術創新，讓頂尖的Agent能力、百萬級超長上下文和極致的推理性能，以更低的成本被每個人和企業方便地使用。

V4在成本效率上做出了極致優化。采用MoE架構，總參數達到1.6萬億，但每次推理僅激活約490億參數，既保證了性能，又控制了成本。上下文窗口從前代的128K擴展至100萬Token，接近10倍的量級提升。同時，實現了在100萬Token長度下的97%信息召回率。

V4最具沖擊力的，可能不是其技術參數，而是在商業模式上對現有閉源巨頭的挑戰。

DeepSeek-V4的采取雙版本定價策略，一端是面向個人開發者的V4-Flash，每百萬tokens輸入是0.2元，輸出是2元；V4-Pro每百萬tokens輸入是1元，輸出是12元。粗略估算，以OpenAI和Anthropic當前最強的旗艦模型為基準，其價格大約是V4-Pro的16-25倍。

Deepseek表示，受限于高端算力，目前Pro的服務吞吐十分有限，預計下半年昇騰950超節點批量上市后，Pro的價格還會大幅下調。

關鍵是，V4-Pro并非廉價替代品。其在Agentic Coding評測中已達開源最佳，其使用體驗優于Sonnet 4.5，交付質量接近Claude Opus 4.6的非思考模式。

同樣是Agent，DeepSeek V4與Kimi K2.6的本質區別，在于它們優化Agent能力視角截然不同：一種是微觀智能驅動力，一種是宏觀集群執行力。

DeepSeek的內在哲學是模型即Agent，側重于單兵為王，通過提升模型自身的智能與效率，使單個Agent能力最大化。V4假設單個模型的能力做到天花板，那么基于其構建的Agent自然就是最強的，用戶不需要復雜的集群調度，一個Agent就能完成大多數任務。

Kimi K2.6則更偏重于Agent即系統，將Agent擰成一股繩，核心能力源于多Agent Swarm集群的協同能力。K2.6認為現實中的復雜任務，靠一個Agent串行完成太慢、太容易出錯。不如拆成幾百個小任務，讓上百個Agent并行一起做，最后匯總。即使每個Agent的智商不是頂尖，團隊協作的效率也遠超單兵。

這兩種路線并非對立，而是互相補充。前者拼智商，后者拼協作。前者是深度，后者是廣度。因為一個理想的Agent系統，可以用DeepSeek V4作為子Agent的“大腦”，再用Kimi的集群框架將這些子Agent組織起來。

從種種跡象來看，DeepSeek正在向資本和商業化靠攏，而且無法避免地將月暗拉進了這場風暴。

智譜與MiniMax已經上市，從團隊基因、技術能力、融資能力等多個因素綜合考慮，月暗成為了DeepSeek錨定估值的最佳標的。

目前，月暗的核心敘事是“長上下文本+Agent集群智能”，以此支撐起180億美元的估值。DeepSeek此時以200億美元甚至更高的目標估值去參照月暗，直接挑戰了其估值的合理性。

投資者天然會進行同類比較，更何況月暗與DeepSeek本來就有相似的地方。當月暗從唯一的選擇變成了可替代的選項之一，估值邏輯就從稀缺性溢價，就切換為可替代性折價。

DeepSeek這局牌打得極兇，技術一把梭哈，定價直接“截胡”，估值有機會反超月暗。

可它的軟肋也很明顯，開源是把雙刃劍，容易養大了對手餓死了自己。其長期以AI實驗室自居，以研究為導向，無法保證更新頻率的穩定性。V3版本發布于2024年12月，V4版本頻頻跳票，市場等得心焦。

因為堅持開源，DeepSeek難以通過模型授權收費，收入來源現在只有微薄的API調取費用。商業模式尚未建立，仍要面臨算力、人才爭奪和基建建設等高昂的成本支出。

月暗雖被“截胡”，卻還攥著幾張暗牌，比如Agent集群的工程成熟度、垂直行業的深耕、初步有成效的Agent商業模式，這些DeepSeek短期難以超越。

誰能把手里的牌打成“自摸”，看的不是誰嗓門大，而是誰能在商業化這張牌桌上，把技術真正換成籌碼。

DeepSeek摸到了“聽牌”的資格，月暗也還有“改聽”的機會。只是這張牌桌，從此再無輕松的牌可打。

微信號｜TMTweb

公眾號｜光子星球

別忘了掃碼關注我們！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.