4月24日,DeepSeek正式推出、并開源全新系列模型DeepSeek-V4的預覽版本。據了解,DeepSeek-V4可支持百萬字超長上下文,號稱在Agent能力、世界知識和推理性能上均實現了國內與開源領域的領先。
據DeepSeek方面介紹,DeepSeek-V4開創了一種全新的注意力機制,在Token維度進行壓縮,結合DSA稀疏注意力(DeepSeek Sparse Attention),實現了全球領先的長上下文能力,相比于傳統方法大幅降低了對計算和顯存的需求。同時,DeepSeek-V4針對Claude Code 、OpenClaw、OpenCode、CodeBuddy等主流Agent產品進行了適配和優化,在代碼任務、文檔生成任務等方面表現均有提升。
據了解,DeepSeek-V4分為DeepSeek-V4-Pro和DeepSeek-V4-Flash兩個版本。其中,DeepSeek-V4-Pro參數達1.6T,激活參數達49B,在數學、STEM、競賽型代碼的測評中,超越當前所有已公開評測的開源模型,取得了比肩世界頂級閉源模型的成績。在世界知識測評中,DeepSeek-V4-Pro也大幅領先其他開源模型,僅稍遜于Gemini-Pro-3.1。
![]()
Agent能力層面,DeepSeek-V4-Pro在Agentic Coding評測中已達到當前開源模型最佳水平,并在其他Agent相關評測中同樣表現優異。據DeepSeek方面透露,目前該模型已成為內部員工使用的Agentic Coding模型,而且據評測反饋其使用體驗優于Sonnet 4.5,交付質量接近Opus 4.6非思考模式,但與Opus 4.6思考模式存在一定差距。
而DeepSeek-V4-Flash的參數則達284B,激活參數13B,雖然在世界知識儲備方面稍遜一籌,但展現出了接近DeepSeek-V4-Pro的推理能力。在Agent測評中,DeepSeek-V4-Flash在簡單任務上與 DeepSeek-V4-Pro 旗鼓相當,但在高難度任務上仍有差距。
目前,用戶登錄DeepSeek官網、官方App即可與DeepSeek-V4對話,其中專家模式由DeepSeek-V4-Pro支持,快速模式由DeepSeek-V4-Flash支持。
需要注意的是,繼不久前有消息稱,DeepSeek正就首次引入外部資本展開洽談,并且騰訊、阿里均有意參與后。日前有消息源透露,DeepSeek計劃本輪增資500億元,其中內部增資200億元,對外募資300億元,且所有參與投資的機構需50億元起投。而在估值方面,據稱DeepSeek本輪融前估值為3000億元。
但對此消息,DeepSeek方面尚未進行回應。
【本文圖片來自網絡】
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.