剛被GPT5.5刷屏幾小時(shí),國(guó)產(chǎn)大模型就扔出王炸?
近日,DeepSeek憋了15個(gè)月的大更新終于來了,DeepSeek-V4系列正式上線,還同步開源!海外網(wǎng)友直接炸鍋,評(píng)論區(qū)滿屏“鯨魚回來了”“便宜又強(qiáng)大”,連OpenAI的熱度都被分走不少。
這次更新不僅是模型迭代,更是給整個(gè)行業(yè)扔下了一顆“價(jià)格+性能”的雙響炮。
這意味著你可以直接扔進(jìn)去一本小說、一份超長(zhǎng)合同,模型都能完整理解。
![]()
參數(shù)方面,Pro是1.6萬億總參數(shù),F(xiàn)lash是2840億總參數(shù),預(yù)訓(xùn)練數(shù)據(jù)都超過32萬億。
價(jià)格更是延續(xù)了DeepSeek的“卷王”風(fēng)格:Pro每百萬tokens輸入1元、輸出12元;Flash輸入0.2元、輸出2元。網(wǎng)友直接感慨:“還是那個(gè)DeepSeek,太普惠了!”
這次更新最受關(guān)注的,是DeepSeek終于用上了國(guó)產(chǎn)算力!官方小字透露,V4系列和華為昇騰合作,但受限于高端算力,Pro版本的服務(wù)吞吐目前很有限。
不過別急,下半年昇騰950超節(jié)點(diǎn)批量上市后,Pro的價(jià)格還會(huì)大幅下調(diào)。這波操作不僅打破了國(guó)外算力壟斷的焦慮,更讓國(guó)產(chǎn)大模型的未來多了幾分底氣。
DeepSeek-V4的性能到底有多強(qiáng)?官方給出的評(píng)測(cè)數(shù)據(jù)相當(dāng)能打:
Pro版本:Agent能力直接干到開源模型天花板,內(nèi)部員工用它寫代碼的體驗(yàn)比Anthropic的Sonnet 4.5還好,交付質(zhì)量接近Opus 4.6非思考模式。
世界知識(shí)測(cè)評(píng)大幅領(lǐng)先其他開源模型,僅略遜于Gemini-Pro-3.1;數(shù)學(xué)、STEM、競(jìng)賽代碼方面,超越所有公開開源模型,比肩頂級(jí)閉源。
Flash版本:雖然世界知識(shí)稍弱,但推理能力接近Pro,而且更快更便宜。簡(jiǎn)單任務(wù)和Pro旗鼓相當(dāng),高難度任務(wù)略有差距,適合日常快速使用。
更牛的是,Pro-Max模式在標(biāo)準(zhǔn)推理基準(zhǔn)上,竟然優(yōu)于GPT5.2和Gemini3.0-Pro,只比GPT5.4和Gemini3.1-Pro差一點(diǎn)。這在開源模型里,絕對(duì)是斷層領(lǐng)先的存在。
就在說-to-AGI的目標(biāo)不斷靠近”。技術(shù)突破與遺憾,未來還要補(bǔ)哪些課?
![]()
未來DeepSeek計(jì)劃精簡(jiǎn)架構(gòu)、研究訓(xùn)練穩(wěn)定性理論、探索更稀疏的嵌入技術(shù),還要加入多模態(tài)能力。
不過這次V4沒發(fā)布多模態(tài)版本,有猜測(cè)是算力和資金不足。畢竟多模態(tài)已是行業(yè)標(biāo)配,DeepSeek至今沒切入,融資確實(shí)迫在眉睫。
評(píng)論區(qū)聊聊你的看法,覺得有用的話別忘了點(diǎn)贊收藏,讓更多人知道這個(gè)國(guó)產(chǎn)卷王!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.