<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      DeepSeek V4重磅發(fā)布,百萬(wàn)上下文成標(biāo)配,華為昇騰率先適配!

      0
      分享至

      4 月 24 日的 AI 技術(shù)圈再次因大模型的升級(jí)而沸騰。

      整理 | 屠敏

      出品 | CSDN(ID:CSDNnews)

      就在 OpenAI 于凌晨剛推出 版本之后的幾個(gè)小時(shí),國(guó)產(chǎn)大模型也迎來(lái)了重磅時(shí)刻——DeepSeek-V4 預(yù)覽版官宣上線(xiàn),并同步開(kāi)源

      官方發(fā)布 58 頁(yè)完整技術(shù)報(bào)告,讓開(kāi)源大模型邁入百萬(wàn) token 高效上下文時(shí)代,徹底重構(gòu)長(zhǎng)文本大模型的效率與能力邊界。


      開(kāi)源地址:

      • https://huggingface.co/collections/deepseek-ai/deepseek-v4

      • https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

      技術(shù)報(bào)告:

      • https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf


      雙模型齊發(fā):1.6T 旗艦與 284B 輕量版,均支持百萬(wàn)字上下文

      最新發(fā)布的 DeepSeek-V4 系列一次性推出兩款全新的 MoE 架構(gòu)大模型,全部支持 百萬(wàn)字超長(zhǎng)上下文,按照模型大小來(lái)分:

      • DeepSeek-V4-Pro:總參數(shù)量為 1.6T、激活參數(shù)為 49B, 在知識(shí)、推理、代碼、智能體、長(zhǎng)文檔理解上比肩頂級(jí)閉源模型;

      • DeepSeek?V4?Flash:總參數(shù) 284B,激活參數(shù)為 13B,以極小激活參數(shù)量實(shí)現(xiàn)逼近旗艦的推理性能。


      官方表示,兩款模型在 Agent 能力、世界知識(shí)和推理性能上均實(shí)現(xiàn)國(guó)內(nèi)與開(kāi)源領(lǐng)域的領(lǐng)先。 即日起,登錄 DeepSeek 官網(wǎng) chat.deepseek.com 或官方App,就可以直接體驗(yàn)最新的 DeepSeek-V4 能力。

      此外,API 服務(wù)已同步更新,通過(guò)修改 model_name 為 deepseek-v4-pro 或 deepseek-v4-flash 即可調(diào)用。



      架構(gòu)升級(jí),關(guān)鍵技術(shù)創(chuàng)新大幅提高上下文效率

      從技術(shù)架構(gòu)層面來(lái)看,DeepSeek?V4 沒(méi)有停留在堆參數(shù)、擴(kuò)數(shù)據(jù)的傳統(tǒng)路線(xiàn),而是從注意力機(jī)制、殘差連接、優(yōu)化器三大底層維度,進(jìn)行了技術(shù)升級(jí)。

      簡(jiǎn)單來(lái)看,與 DeepSeek-V3 架構(gòu)相比,DeepSeek-V4 系列保留了 DeepSeekMoE 框架和多詞元預(yù)測(cè)(MTP)策略,同時(shí)在架構(gòu)和優(yōu)化方面引入了多項(xiàng)關(guān)鍵創(chuàng)新:

      • 采用混合注意力架構(gòu),將壓縮稀疏注意力(CSA)和重壓縮注意力(HCA)結(jié)合,用于提升長(zhǎng)上下文處理效率。CSA 沿序列維度壓縮鍵值緩存,然后執(zhí)行 DeepSeek 稀疏注意力(DSA),而 HCA 對(duì)鍵值緩存應(yīng)用更激進(jìn)的壓縮,但保持了密集注意力;

      • 為了增強(qiáng)建模能力,DeepSeek 也在架構(gòu)中引入了流形約束超連接(mHC),在傳統(tǒng)殘差連接基礎(chǔ)上進(jìn)一步增強(qiáng)信息傳遞能力;

      • 以及 Muon 優(yōu)化器被引入了 DeepSeek-V4 系列的訓(xùn)練中,用于加快收斂速度并提升訓(xùn)練穩(wěn)定性。


      在訓(xùn)練維度,DeepSeek 在超過(guò) 32T 高質(zhì)量、多樣化的 token 上對(duì)兩個(gè)模型進(jìn)行了預(yù)訓(xùn)練,并在此基礎(chǔ)上引入了一整套完整的后訓(xùn)練流程,進(jìn)一步增強(qiáng)模型能力。

      同時(shí),據(jù)技術(shù)報(bào)告顯示,DeepSeek-V4 系列在長(zhǎng)上下文場(chǎng)景下也表現(xiàn)出極高的效率。在百萬(wàn) Token 的上下文設(shè)置下,DeepSeek-V4-Pro 僅需 DeepSeek-V3.2 的 27% 單 Token 推理 FLOP,KV cache 占用僅為 10%。

      正因此,DeepSeek 能夠?qū)ⅰ鞍偃f(wàn) token 上下文”作為常規(guī)能力來(lái)支持,從而顯著提升長(zhǎng)時(shí)序任務(wù)的可行性,并為測(cè)試階段的進(jìn)一步擴(kuò)展提供了空間。正如官方所說(shuō):“從現(xiàn)在開(kāi)始,1M(一百萬(wàn))上下文將是 DeepSeek 所有官方服務(wù)的標(biāo)配。



      性能比肩頂級(jí)閉源模型

      值得注意的是,DeepSeek-V4-ProMax 是 DeepSeek-V4-Pro 的最高推理模式,重新定義了開(kāi)放模型的性能標(biāo)準(zhǔn),在核心任務(wù)上超越了其前代產(chǎn)品。

      另外,DeepSeek-V4 系列的性能在多個(gè)維度都有了全面的提升:

      • 在廣義世界知識(shí)評(píng)估中,DeepSeek-V4-Pro 的最高推理模式 DeepSeek-V4-Pro-Max,在 SimpleQA 和 Chinese-SimpleQA 等基準(zhǔn)測(cè)試上,顯著優(yōu)于主流開(kāi)源模型。


      在教育類(lèi)知識(shí)評(píng)估方面(包括 MMLU-Pro、HLE 和 GPQA),DeepSeek-V4-Pro-Max 相較開(kāi)源模型仍保持小幅領(lǐng)先。同時(shí),它與領(lǐng)先的閉源模型 Gemini-3.1-Pro 的差距已經(jīng)大幅縮小,但在這些知識(shí)類(lèi)測(cè)試中仍略遜一籌。


      • 在推理維度,通過(guò)增加推理 token 的投入,DeepSeek-V4-Pro-Max 在標(biāo)準(zhǔn)推理基準(zhǔn)上展現(xiàn)出優(yōu)于 GPT-5.2 和 Gemini-3.0-Pro 的表現(xiàn)。

        不過(guò),其性能仍略低于 GPT-5.4 和 Gemini-3.1-Pro,這表明其整體發(fā)展水平大約落后最前沿模型 3 到 6 個(gè)月。

        此外,DeepSeek-V4-Flash-Max 在復(fù)雜推理任務(wù)中達(dá)到了接近 GPT-5.2 和 Gemini-3.0-Pro 的表現(xiàn),體現(xiàn)出較高的性?xún)r(jià)比。

      • Agent 能力上,在公開(kāi)基準(zhǔn)測(cè)試中,DeepSeek-V4-Pro-Max 與領(lǐng)先開(kāi)源模型(如 Kimi-K2.6 和 GLM-5.1)表現(xiàn)相當(dāng),但略遜于頂級(jí)閉源模型。在內(nèi)部評(píng)測(cè)中,DeepSeek-V4-Pro-Max 超過(guò)了 Claude Sonnet 4.5,并接近 Claude Opus 4.5 的水平。

      • 在支持 100 萬(wàn) token 上下文窗口的情況下,DeepSeek-V4-Pro-Max 在合成任務(wù)和真實(shí)場(chǎng)景中均表現(xiàn)出色,甚至在學(xué)術(shù)基準(zhǔn)測(cè)試中超過(guò)了 Gemini-3.1-Pro。


      相比 DeepSeek-V4-Pro-Max,DeepSeek-V4-Flash-Max 由于參數(shù)規(guī)模更小, 在知識(shí)類(lèi)評(píng)估中的表現(xiàn)略低。但在給予更大思考預(yù)算時(shí),其推理任務(wù)表現(xiàn)可以接近 DeepSeek-V4-Pro-Max。

      在 Agent 評(píng)測(cè)中,DeepSeek-V4-Flash-Max 在部分基準(zhǔn)上能夠與 DeepSeek-V4-Pro-Max 持平,但在更復(fù)雜、高難度任務(wù)中仍存在差距。


      算力支持

      值得注意的是,對(duì)于行業(yè)最關(guān)注的國(guó)產(chǎn)算力落地,DeepSeek 在技術(shù)報(bào)告中指出,他們?cè)?NVIDIA GPU 和華為 Ascend NPU 平臺(tái)上,對(duì)細(xì)粒度 EP(Expert Parallelism)方案進(jìn)行了驗(yàn)證。

      另一方面,華為昇騰超節(jié)點(diǎn)系列產(chǎn)品也宣布全面支持,本次通過(guò)雙方芯模技術(shù)緊密協(xié)同,實(shí)現(xiàn)異騰超節(jié)點(diǎn)全系列產(chǎn)品支持 DeepSeek V4 系列模型。



      API 同步開(kāi)放:無(wú)縫兼容主流接口,一鍵接入最強(qiáng)開(kāi)源長(zhǎng)上下文

      時(shí)下 DeepSeek?V4 API 已同步上線(xiàn),支持 OpenAI ChatCompletions 與 Anthropic 接口規(guī)范。

      訪(fǎng)問(wèn)新模型時(shí),base_url 不變, model 參數(shù)需要改為 deepseek-v4-pro 或 deepseek-v4-flash。


      另外,DeepSeek 官方還提到,舊有的 API 接口的兩個(gè)模型名 deepseek-chat 與deepseek-reasoner 將于三個(gè)月后(2026-07-24)停止使用。當(dāng)前階段內(nèi),這兩個(gè)模型名分別指向 deepseek-v4-flash 的非思考模式與思考模式。

      普通用戶(hù)可直接登錄 DeepSeek 官網(wǎng)或官方 App,體驗(yàn) 100 萬(wàn) Token 上下文帶來(lái)的震撼能力:一次性上傳整本書(shū)、整個(gè)項(xiàng)目代碼、整份合同文檔,實(shí)現(xiàn)真正的 “一次性讀懂、全程記憶、深度推理”。

      DeepSeek?V4 的到來(lái),不只是一次模型升級(jí),更是開(kāi)源大模型進(jìn)入 “百萬(wàn)上下文高效時(shí)代” 的標(biāo)志。它用架構(gòu)創(chuàng)新證明:超長(zhǎng)上下文不必靠暴力算力,小激活參數(shù)也能擁有頂級(jí)推理。

      開(kāi)源地址:

      • https://huggingface.co/collections/deepseek-ai/deepseek-v4

      • https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

      技術(shù)報(bào)告:

      • https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

      「粉絲專(zhuān)屬回饋:60+ 頂級(jí)大廠(chǎng) AI 實(shí)戰(zhàn) PPT 限時(shí)領(lǐng)!」

      2026 奇點(diǎn)智能技術(shù)大會(huì)·上海站圓滿(mǎn)落幕!整整兩天,CSDN 與奇點(diǎn)智能研究院攜手,把“AI 正在如何重塑軟件開(kāi)發(fā)”徹底攤開(kāi)講透了。

      這不僅僅是一場(chǎng)會(huì)議,更是一份關(guān)于未來(lái)的答案。從 NVIDIA、微軟、Google 的全球視野,到華為、阿里、騰訊、京東、網(wǎng)易、快手、昆侖萬(wàn)維的本土實(shí)踐;從月之暗面、階躍星辰、MiniMax 的獨(dú)角獸洞察,再到北大、智源、奇點(diǎn)智能研究院的前沿探索。

      Agent 正在成為新入口,軟件形態(tài)正在被重寫(xiě)。

      錯(cuò)過(guò)了現(xiàn)場(chǎng)?沒(méi)關(guān)系!為回饋粉絲,我們特將本次大會(huì)的高質(zhì)量演講 PPT 完整打包。

      領(lǐng)取方式: 在公眾號(hào)后臺(tái)私信發(fā)送 「奇點(diǎn)」 二字,即可一鍵獲取全套干貨。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      國(guó)際油價(jià),快速下跌

      國(guó)際油價(jià),快速下跌

      第一財(cái)經(jīng)資訊
      2026-05-01 22:19:51
      國(guó)民副主席被逼到墻角,黃復(fù)興系統(tǒng)沒(méi)人說(shuō)話(huà),季麟連到底算誰(shuí)的人

      國(guó)民副主席被逼到墻角,黃復(fù)興系統(tǒng)沒(méi)人說(shuō)話(huà),季麟連到底算誰(shuí)的人

      娛樂(lè)的宅急便
      2026-05-02 00:35:12
      以色列終究沒(méi)要那些血糧!參聯(lián)會(huì)主席承認(rèn):俄羅斯幫伊朗對(duì)抗美軍

      以色列終究沒(méi)要那些血糧!參聯(lián)會(huì)主席承認(rèn):俄羅斯幫伊朗對(duì)抗美軍

      鷹眼Defence
      2026-05-01 16:43:31
      銀行員工轉(zhuǎn)走儲(chǔ)戶(hù)1800萬(wàn)炒股,銀行不擔(dān)責(zé),老百姓還能信嗎?離譜

      銀行員工轉(zhuǎn)走儲(chǔ)戶(hù)1800萬(wàn)炒股,銀行不擔(dān)責(zé),老百姓還能信嗎?離譜

      眼光很亮
      2026-05-01 14:08:04
      剛看到湖南的一紙通報(bào),荒誕到連編劇都不敢這么寫(xiě)

      剛看到湖南的一紙通報(bào),荒誕到連編劇都不敢這么寫(xiě)

      小陸搞笑日常
      2026-05-01 15:31:33
      謎底揭曉、國(guó)民黨大獲全勝!鄭麗文就“統(tǒng)一”發(fā)聲,賴(lài)清德丟盡臉

      謎底揭曉、國(guó)民黨大獲全勝!鄭麗文就“統(tǒng)一”發(fā)聲,賴(lài)清德丟盡臉

      共工之錨
      2026-05-01 00:22:26
      別再吹天生美貌!朱珠真實(shí)原生臉曝光,整容前后差距一目了然

      別再吹天生美貌!朱珠真實(shí)原生臉曝光,整容前后差距一目了然

      小娛樂(lè)悠悠
      2026-04-27 09:21:13
      莫氏雞煲開(kāi)多家分店后老店熱度不減,9名剁雞師傅每天工作十三四個(gè)小時(shí),老板娘發(fā)聲:人多人少都開(kāi)心

      莫氏雞煲開(kāi)多家分店后老店熱度不減,9名剁雞師傅每天工作十三四個(gè)小時(shí),老板娘發(fā)聲:人多人少都開(kāi)心

      極目新聞
      2026-05-01 18:33:42
      醪糟再次被關(guān)注!醫(yī)生發(fā)現(xiàn):高血脂患者喝醪糟,不用多久4大變化

      醪糟再次被關(guān)注!醫(yī)生發(fā)現(xiàn):高血脂患者喝醪糟,不用多久4大變化

      芹姐說(shuō)生活
      2026-04-19 15:52:53
      你最接近生理極限的一次經(jīng)歷是什么?網(wǎng)友分享讓人目瞪口呆!

      你最接近生理極限的一次經(jīng)歷是什么?網(wǎng)友分享讓人目瞪口呆!

      夜深?lèi)?ài)雜談
      2026-04-09 19:39:13
      隨著森林狼4-2爆冷淘汰掘金,西部半決賽定3席!最終4強(qiáng)基本如下

      隨著森林狼4-2爆冷淘汰掘金,西部半決賽定3席!最終4強(qiáng)基本如下

      小火箭愛(ài)體育
      2026-05-01 12:32:21
      半年打一針,4000萬(wàn)慢性鼻竇炎有新藥了

      半年打一針,4000萬(wàn)慢性鼻竇炎有新藥了

      醫(yī)學(xué)界
      2026-04-29 19:56:22
      退休人員速查!1992年前干過(guò)這4類(lèi)工作 每月多領(lǐng)一筆錢(qián) 別白吃虧

      退休人員速查!1992年前干過(guò)這4類(lèi)工作 每月多領(lǐng)一筆錢(qián) 別白吃虧

      混沌錄
      2026-04-22 19:51:07
      Starz出品,這3部黃暴爽劇別看刪減版

      Starz出品,這3部黃暴爽劇別看刪減版

      來(lái)看美劇
      2026-05-01 19:58:14
      兩難啊!兒子月薪6000,兒媳無(wú)業(yè),竟要父母拿30多萬(wàn)養(yǎng)老錢(qián)還房貸

      兩難啊!兒子月薪6000,兒媳無(wú)業(yè),竟要父母拿30多萬(wàn)養(yǎng)老錢(qián)還房貸

      火山詩(shī)話(huà)
      2026-04-30 15:03:29
      金靖近照大變樣!暴瘦脫相撞臉女星,網(wǎng)友:沒(méi)以前有靈氣了

      金靖近照大變樣!暴瘦脫相撞臉女星,網(wǎng)友:沒(méi)以前有靈氣了

      草莓解說(shuō)體育
      2026-05-01 14:41:01
      全票通過(guò)!FCC徹底封殺中國(guó)實(shí)驗(yàn)室,75%美企電子測(cè)試陷入絕境

      全票通過(guò)!FCC徹底封殺中國(guó)實(shí)驗(yàn)室,75%美企電子測(cè)試陷入絕境

      藍(lán)色海邊
      2026-05-01 15:00:29
      石破茂曾說(shuō)得很透徹,中國(guó)軍力再?gòu)?qiáng)也嚇不倒高市,日本還會(huì)走老路

      石破茂曾說(shuō)得很透徹,中國(guó)軍力再?gòu)?qiáng)也嚇不倒高市,日本還會(huì)走老路

      動(dòng)漫里的童話(huà)
      2026-05-01 23:55:42
      事態(tài)升級(jí)!恩利喝女網(wǎng)紅嘴里飲料,伊能靜發(fā)文硬剛,評(píng)論區(qū)炸鍋

      事態(tài)升級(jí)!恩利喝女網(wǎng)紅嘴里飲料,伊能靜發(fā)文硬剛,評(píng)論區(qū)炸鍋

      攬星河的筆記
      2026-05-01 18:15:19
      上海醫(yī)保新政落地!5月起配藥這部分費(fèi)用提高了

      上海醫(yī)保新政落地!5月起配藥這部分費(fèi)用提高了

      看看新聞Knews
      2026-05-01 13:24:05
      2026-05-02 02:04:49
      CSDN incentive-icons
      CSDN
      成就一億技術(shù)人
      26505文章數(shù) 242276關(guān)注度
      往期回顧 全部

      科技要聞

      DeepSeek發(fā)布多模態(tài)論文又連夜刪除

      頭條要聞

      美軍對(duì)伊朗最新打擊方案披露 包含出動(dòng)地面部隊(duì)

      頭條要聞

      美軍對(duì)伊朗最新打擊方案披露 包含出動(dòng)地面部隊(duì)

      體育要聞

      無(wú)奈!約基奇:這要在塞爾維亞 全隊(duì)早被炒了

      娛樂(lè)要聞

      馬筱梅產(chǎn)后身材恢復(fù)超好 現(xiàn)身戶(hù)外直播

      財(cái)經(jīng)要聞

      GPU神話(huà)松動(dòng),AI真正的戰(zhàn)場(chǎng)變了

      汽車(chē)要聞

      限時(shí)9.67萬(wàn)起 吉利星越L/星瑞i-HEV智擎混動(dòng)上市

      態(tài)度原創(chuàng)

      健康
      房產(chǎn)
      時(shí)尚
      手機(jī)
      軍事航空

      干細(xì)胞治燒燙傷面臨這些“瓶頸”

      房產(chǎn)要聞

      所有戶(hù)型全賣(mài)爆!海口TOP級(jí)豪宅,景觀(guān)樣板間五一全線(xiàn)開(kāi)放!

      這個(gè)夏天,彩色褲子又火了!

      手機(jī)要聞

      曝iPhone18Pro相機(jī)史詩(shī)級(jí)升級(jí),這次你期待嗎?

      軍事要聞

      伊朗:持續(xù)推進(jìn)海上封鎖的行為不可容忍

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 亚洲精品有码在线观看| 麻豆国产乱人伦精品一区二区| 国产成人啪精品视频网站| 国产欧美日韩精品a在线观看 | 久久老司机| 大香伊蕉在人线国产网站首页| 丁香五月天堂| 亚洲欧美成人一区二区在线电影 | 无码人妻丰满熟妇区五十路在线| 精品国产亚洲一区二区在线3d| 亚洲乱码国产乱码精品精剪 | 黄色免费在线网址| 久草免费av| 韩国19禁无遮挡啪啪无码网站 | 国产人在线成免费视频| 久久人妻无码一区二区| 国产欧美精品| 亚洲国产品综合人成综合网站| 97色伦图片97综合影院| 91视频亚洲| 亚洲午夜无码极品久久| 国产成人精品亚洲午夜麻豆| 亚洲综合av一区二区三区| 人人妻人人添人人爽欧美一区| 精品国产高清中文字幕| 国产精品有码无码AV在线播放| 四虎永久在线精品国产| 男同裸体网站| 色老二精品视频在线观看| 久久国产精品久久精品国产 | 国产精品无码av在线播放| 国产精品肥臀在线观看| 久久这里只有热精品18| 日本乱一区二区三区在线| 激情自拍av| 国产亚洲精品成人无码精品网站 | 亚洲黄色无码| 国产精品无码AⅤ在线观看播放| 欧美寡妇xxxx黑人猛交| 亚洲欧洲日韩国内高清| 亚洲女人天堂|