月之暗面的下一代大模型Kimi K3計劃在今年第三季度正式發布。
根據已經披露的信息,這款模型的參數量將達到2.5萬億,比目前K2系列翻了一倍還多,上下文長度標準也將提升至1M左右,內部測試數據遠遠超過這個數值。
橫向對比一下,不久前發布的DeepSeek V4 Pro版本參數量約1.6萬億,百度文心5.0是2.4萬億。
K3的2.5萬億意味著它將成為國產大模型陣營中參數規模最高的產品之一,把此前行業普遍認為的2萬億短期天花板直接往上抬了一截。
參數規模當然不等于全部能力。大模型的評判維度很多,訓練數據的質量、算力調度的效率、推理速度、上下文窗口的長度都會影響最終體驗。
月之暗面這次也做了不少架構層面的調整。K3采用了MoE混合專家架構,每次推理只激活部分參數以平衡效率和性能,同時在預訓練中確認集成了KDA關鍵依賴注意力技術路徑。
這項實驗性架構此前在基準分數、推理速度和經濟性三項指標上都表現優于傳統方案,但能否在2.5萬億的體量下真正跑通,還要看正式發布后的表現。
很多人會關心一個問題,參數量翻倍之后,普通用戶能用上嗎,用得上嗎。高參數意味著更高的算力成本和運營支出,這也是為什么K3的內部測試上下文遠超1M,但最終是否向用戶開放還懸而未決。
目前行業內真正能做到普惠級超長上下文的還看DeepSeek V4,后者在算力優化上確實做到了極致。月之暗面能否在K3上找到同樣的平衡點,直接關系到這款產品對普通用戶的可用性。
商業層面上,月之暗面最近過得不算差也不算輕松。今年1月以來估值從43億美元漲到180億美元,翻了四倍,今年2月融資7億美元,被同行智譜和MiniMax在港股上市后的高溢價推上去的。
2025年11月以來,海外API收入暴增四倍,付費用戶月增長率超過170%。競爭同樣激烈,字節豆包月活逼近3.5億,千問一季度月活環比翻了近10倍至1.66億,DeepSeek的用戶端數據近期有所回落。
大模型賽道早已過了單點技術優勢可以吃幾年的階段,誰能把技術優勢和商業場景真正銜接上,誰才站得穩。
2.5萬億參數,放在一年前是整個行業難以想象的數字,但技術指標的意義終究要落在可用性和性價比上。參數翻倍的K3到底能給用戶帶來什么實質性的體驗提升,等到第三季度正式發布才能知道答案。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.