<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek V4 炸場發布!1.6T 參數開源 + 百萬上下文標配,改寫中國 AI 底層規則 | 前沿在線

      0
      分享至



      編輯:前沿在線 編輯部

      就在昨日,讓全球 AI 圈苦等 15 個月的DeepSeek V4終于來了!


      4 月 24 日上午,DeepSeek正式發布新一代旗艦 MoE 大模型DeepSeek-V4預覽版,同步完成MIT 協議全量開源,上線 HuggingFace、ModelScope 兩大開源平臺,附帶 58 頁完整技術報告,官網、官方 App 與 API 服務全渠道同步更新。

      技術報告地址:

      https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

      而就在發布前一天,OpenAI 剛剛推出 GPT-5.5,這場針尖對麥芒的前后腳發布,直接把 2026 年大模型的 “諸神之戰” 推向了最高潮。


      沒有預熱直播、沒有高管站臺、沒有冗長的路線圖宣講,DeepSeek 用最硬核的方式,扔出了改寫行業規則的王炸:全系原生標配 100 萬 token 上下文窗口,最高 384K token 輸出長度,1.6T 萬億參數旗艦模型免費商用,推理成本較海外頂級閉源模型最高下探 99%,全棧深度適配國產算力平臺。


      這不是一次常規的版本迭代,而是一次 AI 基礎設施級別的革命。它直接把一年前還是 Gemini 獨家王牌的百萬上下文能力,從閉源巨頭手里的 “高端奢侈品”,打成了全行業觸手可及的 “水電煤”;

      它用底層架構創新,徹底重構了大模型的成本結構與研發范式;它與國產算力的深度綁定,更是讓中國 AI 全棧自主可控的閉環,第一次真正照進現實。


      不講廢話,先上硬菜:DeepSeek V4 的核心王炸

      這次 DeepSeek 一口氣放出雙版本,沒有擠牙膏,直接拉滿了開源大模型的能力上限,核心參數與能力一目了然:


      能力層面,官方數據與第三方測評交叉驗證,V4-Pro已經摸到了全球閉源頂流的門檻

      • Agent 與代碼能力Agentic Coding 評測拿下開源模型最佳成績,內部員工實測體驗優于 Anthropic Sonnet 4.5,交付質量接近Opus 4.6非思考模式;Vals AI 代碼基準測試中,以壓倒性優勢登頂開源權重模型榜首,直接擊敗 Gemini 3.1 Pro 等閉源模型,較上代 V3.2 實現10 倍性能躍升;


      • 世界知識與推理:世界知識測評大幅領先所有開源模型,僅稍遜于谷歌 Gemini-Pro-3.1;數學、STEM、競賽級代碼測評中,超越所有已公開的開源模型,比肩全球頂級閉源模型;


      • 長上下文效率:相較前代 V3.2,推理 FLOPs降低 73%,KV 緩存大小減少90%,徹底解決了百萬上下文推理的性能衰減與算力浪費問題,官方直接官宣:“從現在開始,1M 上下文將是 DeepSeek 所有官方服務的標配”。


      最狠的還是定價。Flash 版0.14/0.28 美元的百萬 token定價,較 Claude Opus 4.7便宜 99% 以上;Pro 版定價也僅為 GPT-4 的 1/70,比海外頂級模型平均便宜 60%。

      更關鍵的是,官方在定價頁直接埋下彩蛋:受限于當前高端算力供給,Pro 版服務吞吐有限,預計下半年華為昇騰 950 超節點批量上市后,Pro 版價格將大幅下調。



      15 個月磨一劍:不是堆參數內卷,是中國大模型研發范式的革命

      在 V4 發布之前,DeepSeek 一度被圈內外質疑 “掉隊了”。

      過去 15 個月,整個大模型行業陷入了 “月月發版、季度迭代” 的內卷怪圈,廠商們扎堆堆參數、卷多模態、拼營銷造勢,而DeepSeek三次推遲 V4 發布,在多模態熱潮中全程低調,甚至傳出核心研究員流失的傳聞,“DeepSeek 跟不上節奏了” 的聲音在中英文 AI 圈反復發酵。


      但 DeepSeek 的回應,只有發布稿結尾那句引自《荀子?非十二子》的話:“不誘于譽,不恐于誹,率道而行,端然正己。”


      翻開 V4 的 58 頁技術報告就會明白,這 15 個月的 “隱身期”,DeepSeek 根本沒參與行業的無效內卷,而是干成了一件事:徹底重構了大模型的底層研發范式,把國內大模型從 “堆參數、追熱點、突擊發版” 的粗放模式,拉向了“論文預研 - 技術驗證 - 工程落地”的體系化創新路徑


      V4 的每一項核心技術創新,都不是臨時抱佛腳的突擊成果,而是過去 15 個月里,一步步通過頂會論文、開源項目完成驗證的長期積累:

      • 2025 年 12 月,DeepSeek在 arXiv 發布mHC 流形約束超連接論文,解決了萬億級參數模型訓練中的梯度不穩、信號爆炸問題,把層間信號放大從傳統方法的 3000 倍壓縮到 1.6 倍以內,訓練效率提升 30%,為 1.6T 參數模型的穩定訓練筑牢了根基;


      • 2026 年 1 月,開源Engram 條件記憶機制,把靜態知識存儲與動態推理計算分離,實現 O (1) 級別的長上下文信息檢索,長文本檢索準確率從 84.2 提升到 97.0,為百萬上下文能力鋪平了道路;


      • 半年前V3.2-Exp版本,首次放出DSA 稀疏注意力機制,當時外界普遍認為這是一次 “無亮點的中間更新”,如今回頭看,這正是 V4 百萬上下文能力的核心地基;


      • 此外,CSA+HCA 混合注意力架構、Muon優化器TileLang 算子開發 DSL、MegaMoE 融合內核,無一不是提前完成開源驗證、社區反饋,最終在 V4 上完成了體系化集成。

      這正是OpenAI、谷歌等海外頂級機構一直堅守的研發邏輯也是國內大模型行業一直缺失的長期主義。

      過去,國內廠商的迭代,大多是基于現有架構的參數擴容、場景微調,底層創新寥寥無幾;而 DeepSeek 用 15 個月的時間證明,中國 AI 企業不用靠跟風內卷,也能靠底層技術創新,追上甚至超越全球頂尖水平。


      密歇根州立大學教授 Steve Hsu 實測后評價:“它在數學和物理領域的表現又快又聰明,最終結果精致且準確,這背后是長期扎實的基礎研究,而非短期的工程微調。

      而開發者社區最高贊的評論更是一語中的:“做科研的人才知道,敢開源、愿意開源的團隊,到底有多牛?!?/p>


      為國產化而生:黃仁勛最擔心的事,正在發生

      V4 發布最被行業低估,卻最具戰略意義的一點,是它底層架構開始,就為國產算力平臺做了全鏈路的量身設計—— 這不是簡單的模型移植,而是一次算子、內核到架構的徹底重構,為的就是徹底擺脫對海外算力生態的依賴。

      英偉達 CEO 黃仁勛此前在播客中直言不諱:“DeepSeek 的進步意義重大。要是哪天像 DeepSeek 這樣的頂級成果,先在華為平臺上出現,那對美國會是非常糟糕的結果。”


      而 V4 的發布,讓這句預警徹底成為了現實。

      發布當日,華為昇騰官方直接官宣,將于當日下午 4 點直播DeepSeek V4 在昇騰平臺的首發寒武紀同步宣布,已基于 vLLM 推理框架完成對 V4 雙版本的 Day 0 適配,適配代碼已開源至 GitHub。官方數據更是直接給出實錘:V4 全棧適配華為昇騰 950PR國產算力平臺,推理速度較 V3 版本提升 35 倍,能耗降低 40%。


      行業資深從業者拆解了 V4 為國產算力適配的三大底層設計,每一步都踩在了國產算力生態的核心痛點上:

      1. 推理端全面引入 MXFP4 低精度格式徹底降低了對 NVIDIA FP8 生態的綁定,可完美適配華為昇騰、寒武紀、壁仞等國產芯片的低精度推理能力,從推理端撕開了 CUDA 生態的壟斷口子;

      2. 底層算子改用 TileLangDSL開發不再完全依賴 CUDA 編寫底層內核,而是用更高一層的領域專用語言描述計算邏輯,可跨硬件平臺編譯,把模型向國產芯片遷移的成本降到了最低;

      3. 專為國產算力設計 MegaMoE 融合內核:核心解決專家并行中的通信等待問題,精準命中國產算力平臺的多卡通信痛點,目前已在華為昇騰平臺成功跑通。


      這一系列設計,徹底打破了過去國產大模型“訓練靠英偉達、國產適配只是補充”的行業常態。

      盡管官方確認,V4 的預訓練階段仍采用英偉達 GPU 完成,但從后訓練到推理的全流程,已完成國產算力平臺的深度適配,而底層架構的設計,更是為未來全流程國產訓練鋪平了道路。

      過去幾年,中美 AI 競爭的核心,始終繞不開算力芯片的卡脖子難題。美國的出口管制,讓國內 AI 企業始終面臨高端 GPU 斷供的風險;而國產算力雖然完成了芯片量產,卻長期陷入“有芯片、無頂級模型適配”的困境,性能無法充分釋放。


      DeepSeek V4 與昇騰的深度適配,徹底補上了這關鍵一環。它實現了從底層算力芯片,到上層大模型架構,再到推理部署生態的全棧自主可控閉環:國產算力有了能充分釋放性能的頂級模型,頂級模型有了不受海外管制約束的算力底座。路透社在報道中直言:DeepSeek-V4 與華為昇騰的適配,表明中國正在加速減少對美國尖端芯片的依賴。


      實測見真章:有驚喜也有遺憾,開源平權時代真的來了

      發布 24 小時內,整個開發者社區已經掀起了 V4 的實測熱潮,從頂級開發者到普通用戶,都在用最嚴苛的場景,檢驗這款 “開源新王” 的真實實力。

      從實測結果來看,V4 的長上下文能力,確實做到了行業頂尖水平。有用戶實測,用V4-Flash處理一本10M的 epub 電子書提取幾萬關鍵字生成 json 文件,僅用 2 分鐘就完成,花費僅 0.5 元,且提取質量和篇幅較 V3.2 有大幅提升。

      還有開發者用百萬 token 級別的全量代碼庫測試,V4-Pro 能一次性完成全倉庫的架構理解、漏洞排查與功能迭代,徹底告別了過去碎片化切片、上下文丟失的痛點。


      代碼與推理能力上,V4 也交出了亮眼的答卷。Arena.ai 最新榜單顯示,V4 Pro(思考模式)位列代碼競技場開源模型第 3 位、綜合榜單第 14 位,躋身全球頂級模型行列。

      經典的 “洗車測試” 邏輯題,V4 一次性順利通過;但在 “絕望的父親” 紅綠色盲遺傳題中,V4 未能一輪命中核心邏輯,在復雜常識推理場景中仍有優化空間。

      為了最大化釋放推理能力,V4 全系標配了三檔思考模式(Non-Think/Think High/Think Max),開發者可通過 API 的 reasoning_effort 參數調整思考強度,復雜 Agent 場景可直接開啟 Max 模式,模型會先輸出完整的思維鏈,再給出最終答案,大幅提升準確率。

      但大量普通用戶反饋,在簡單日常任務中,V4 存在 “過度思考” 的問題,答案冗余、推理步驟繁瑣,反而影響了響應效率。


      而最讓行業遺憾的,是V4 依然是純文本模型,并未搭載多模態能力。在 GPT-5.5、Claude 4.7、GLM-5.1 等同期模型都把多模態作為核心賣點的當下,V4 在視覺理解、多模態 Agent 等場景中,已經落后于行業主流節奏。

      行業從業者分析,這大概率是因為國產算力適配的優先級過高,占用了核心研發資源,多模態能力只能等到后續迭代版本更新。

      Agent 適配方面,也有開發者實測發現,V4 在與 Claude Code 等主流 Agent框架的聯動中,工具調用的觸發靈敏度不及同期多款國產頭部模型,復雜工程場景中,存在約束遵守不到位、未與用戶完成關鍵確認就執行操作的問題,在工程化落地的細節上,仍有打磨空間。


      但瑕不掩瑜,V4 的發布,已經徹底改寫了開源與閉源的競爭天平。當 1.6T 參數的頂級模型,用 MIT 協議免費商用,消費級顯卡就能部署普惠版,推理成本低至海外模型的 1%,閉源巨頭的護城河,正在快速瓦解。


      海外 X 平臺上,高贊評論直言:“中國正在主導 AI,他們已經追上來了。DeepSeek V4 Flash 比 Opus 4.7 便宜 99%,這不是筆誤,是行業的地震?!?更有開發者一語道破本質:“就算你不用 DeepSeek,你現在用的 AI 工具,幾乎都受到了 DeepSeek 開源成果的影響。

      沒有 DeepSeek,今天的 AI 生態絕不會是這個樣子?!?/p>


      終局預判:大模型行業洗牌開始,90% 的 AI 應用都要重做了

      V4 的發布,不是競爭的結束,而是更高維度競爭的開始。

      對 DeepSeek 自身而言,它正面臨著一場從 “奇襲者” 到 “守城者” 的關鍵轉型。過去,DeepSeek靠極致的技術效率,一次次完成對行業的奇襲,成為了開源大模型領域的標桿;而現在,V4 把它推到了 “AI 基礎設施服務商” 的位置上,接下來它必須回答一個核心問題:開源帶來的生態紅利,如何轉化為可持續的商業閉環?


      目前,國內大模型行業的商業化仍在探索階段,開源模型的商業化更是難上加難。如何在保持開源開放的同時,找到穩定的盈利模式,支撐起長期的底層技術研發,是 DeepSeek 必須跨過的門檻

      而官方 “下半年昇騰算力量產后降價” 的承諾,也意味著它的商業化節奏,將與國產算力的供給深度綁定,這既是最大的機遇,也是最大的不確定性。

      對整個大模型行業而言,V4 的發布,直接開啟了新一輪的行業洗牌。當百萬上下文成為標配、頂級模型能力開源免費、推理成本暴跌 99%,那些沒有核心技術創新、只靠堆參數、拼營銷、跟風內卷的中小模型廠商,將徹底失去生存空間。

      行業的馬太效應會進一步加劇,資源與市場份額,將快速向擁有底層技術創新、全棧適配能力、生態建設能力的頭部廠商集中


      而對整個 AI 產業來說,V4帶來的最大變革,是AI 應用開發范式的徹底重構

      百萬上下文的普惠,直接打破了過去AI 應用開發的核心枷鎖。過去,開發者 80% 的精力,都花在向量拆分、知識庫切片、上下文補全這些補丁工作上,根本無法聚焦場景創新;而現在,全量文檔端到端理解、長程邏輯連貫推理、跨周期智能體任務,都成為了可能。


      這意味著,90% 的現有 AI 應用,都將面臨重構。法律行業,整套案件卷宗可以一次性完成證據梳理與文書撰寫;金融行業,全行業年報研報可以一次性完成深度分析與風險排查;代碼開發領域,全量代碼庫可以一次性完成調試與迭代;企業服務領域,中小企業零成本就能搭建專屬的智能助手。AI 創業的門檻,被降到了前所未有的低點,中小團隊不用再為算力與模型能力發愁,只需要聚焦場景創新,就能做出有價值的 AI 應用。


      2026 年的 AI 市場,已經進入了諸神混戰的時代。前有 GPT-5.5、Claude 4.7 等海外巨頭壓陣,后有一眾國產頭部模型同臺競技,DeepSeek V4的登場,不是為了給這場內卷的戰爭再添一把火,而是用開源平權的方式,改寫了戰爭的規則。


      它用 15 個月的長期主義證明,大模型的競爭,從來不是參數與發版速度的內卷,而是底層技術創新、成本效率控制、產業落地能力的綜合比拼。它用全棧國產化的適配證明,中國 AI 產業完全可以走出一條自主可控的突圍之路。它用免費開源的普惠,讓百萬上下文能力從巨頭的專屬壁壘,變成了全行業的基礎設施。

      從這一刻起,AI 產業的平權時代,正式到來。而 DeepSeek 用行動印證了它的宣言:不誘于譽,不恐于誹,率道而行,端然正己


      前沿動態前沿大會
      前沿人物

      「在看」,給前前加雞腿

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      曾敲詐中國10億美元、拒飛機借道,如今又找上中國

      曾敲詐中國10億美元、拒飛機借道,如今又找上中國

      光輝與陰暗
      2026-05-12 15:52:19
      他接受紀律審查和監察調查

      他接受紀律審查和監察調查

      錫望
      2026-05-11 21:56:44
      特朗普威脅讓伊朗“再也笑不出來”

      特朗普威脅讓伊朗“再也笑不出來”

      參考消息
      2026-05-11 14:37:08
      又一個郭晶晶?退役后嫁頂級豪門,7年連生4娃,如今已是頂級闊太

      又一個郭晶晶?退役后嫁頂級豪門,7年連生4娃,如今已是頂級闊太

      珺瑤婉史
      2026-05-03 19:20:12
      “問界坐館,四界散仔”,華為汽車的江湖暗流

      “問界坐館,四界散仔”,華為汽車的江湖暗流

      速度計
      2026-05-11 10:26:50
      內娛嘴親爛了也沒他倆眼神動人!道哥實錘:這才是真CP感

      內娛嘴親爛了也沒他倆眼神動人!道哥實錘:這才是真CP感

      可樂談情感
      2026-05-11 20:53:09
      西班牙女主持人自曝:為了給兒子簽名手套和皇馬現役門將發生關系

      西班牙女主持人自曝:為了給兒子簽名手套和皇馬現役門將發生關系

      鄉野小珥
      2026-05-11 20:37:06
      乒聯公布第20周世界排名:張本美和第3創新高!林詩棟梁靖崑回升

      乒聯公布第20周世界排名:張本美和第3創新高!林詩棟梁靖崑回升

      全言作品
      2026-05-11 16:18:28
      如果一個家庭長期沒酒局、沒社交,也少走親戚,只能說明這兩個問題

      如果一個家庭長期沒酒局、沒社交,也少走親戚,只能說明這兩個問題

      心理觀察局
      2026-05-04 09:23:46
      第1現場|俄烏對峙下的紅場閱兵:36年來首次未見坦克

      第1現場|俄烏對峙下的紅場閱兵:36年來首次未見坦克

      澎湃新聞
      2026-05-09 21:40:28
      南方電網員工年終獎、工資待遇曝光!

      南方電網員工年終獎、工資待遇曝光!

      老楊說光伏
      2026-05-11 17:12:16
      頂著一路罵聲,巴黎市區第三高樓驚艷封頂,官方:以后不準再建!

      頂著一路罵聲,巴黎市區第三高樓驚艷封頂,官方:以后不準再建!

      GA環球建筑
      2026-05-11 22:55:32
      地主惡霸劉文彩:子孫眾多,后代回來祭拜,光飯菜就準備了200席

      地主惡霸劉文彩:子孫眾多,后代回來祭拜,光飯菜就準備了200席

      阿器談史
      2026-05-11 15:43:13
      北京備戰G3!許利民記錄計劃,杰曼周琦加練,曾凡博強化三分!

      北京備戰G3!許利民記錄計劃,杰曼周琦加練,曾凡博強化三分!

      籃球資訊達人
      2026-05-12 14:34:44
      瀏陽煙花驚天瞞報:3副市長免職,問責不止

      瀏陽煙花驚天瞞報:3副市長免職,問責不止

      天天都是好日子
      2026-05-11 16:53:00
      烏軍指揮官:前線士兵月薪不到1400美元,誰還守1500公里戰線

      烏軍指揮官:前線士兵月薪不到1400美元,誰還守1500公里戰線

      桂系007
      2026-05-12 05:26:17
      成都男子被“天降鋼管”砸傷縫8針,傷者:肇事者已找到,警方帶走調查

      成都男子被“天降鋼管”砸傷縫8針,傷者:肇事者已找到,警方帶走調查

      封面新聞
      2026-05-12 10:20:04
      估價8萬!帶有麒麟號的100元紙幣,誰有就發了!

      估價8萬!帶有麒麟號的100元紙幣,誰有就發了!

      富哥愛收藏
      2026-05-10 14:09:59
      現實版“高達”!宇樹發布載人變形機甲,定價390萬元起

      現實版“高達”!宇樹發布載人變形機甲,定價390萬元起

      界面新聞
      2026-05-12 13:56:02
      “活該全村人都瞧不起我家!”農村女孩的自述火了,看清父母為人

      “活該全村人都瞧不起我家!”農村女孩的自述火了,看清父母為人

      妍妍教育日記
      2026-05-11 18:22:42
      2026-05-12 16:28:49
      前沿在線 incentive-icons
      前沿在線
      前沿在線官方賬號,關注AI、機器人、智能車等前沿領域;
      202文章數 1235關注度
      往期回顧 全部

      科技要聞

      宇樹發布載人變形機甲,定價390萬元起

      頭條要聞

      女子立遺囑遺產歸弟弟 其女起訴兩人返還857萬及房產

      頭條要聞

      女子立遺囑遺產歸弟弟 其女起訴兩人返還857萬及房產

      體育要聞

      總是掉鏈子的“倒霉蛋”,闖進了歐戰決賽

      娛樂要聞

      劉濤曬媽祖誕辰活動照 評論區變許愿池

      財經要聞

      黃仁勛真是被白宮徹底封殺了

      汽車要聞

      吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

      態度原創

      家居
      游戲
      教育
      親子
      手機

      家居要聞

      極簡主義下的居住場域與空間

      任天堂官方貼心提醒!購買會員需注意 很快漲價

      教育要聞

      正確率5%的解方程

      親子要聞

      三歲分床,五歲分房,真的有必要嗎?

      手機要聞

      消息稱三星計劃推出軍用“Galaxy S26戰術版”手機

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产jjizz女人多水喷水| 手机看片国产日韩| 亚洲黄色中文字幕| 国产精一区二区三区午夜| 久久久女人与动物群交毛片| 亚洲国产成人麻豆精品| 亚洲三区自拍| 中文字幕无码av波多野吉衣| 亚洲综合激情另类专区| 中文字幕一区二区人妻电影| 玩弄美艳馊子高潮无码| 欧美最猛性xxxxx免费| 欧亚乱色一区二区三区| 99视频在线精品国自产拍 | 国产人禽杂交18禁网站| 亚洲人成网网址在线看| 久久精品国产77777蜜臀| 欧美丰满美乳XXⅩ高潮www| 国产精品VA在线观看老妇女| 91伊人国产| 国产丝袜美女一区二区三区| 富婆如狼似虎找黑人老外| 热re99久久精品国产66热6| 奇米影视狠狠精品7777| 日日摸日日踫夜夜爽无码| 日韩精品三区二区三区| 亚洲中文字幕日韩| 亚洲第一在线综合网站| 狠狠操中文字幕| 亚洲伊人情人综合网站| 三上悠亚久久精品| 精品女同一区二区三区免费站| 成年男人裸j网站| 丰满少妇高潮在线观看| 白嫩日本少妇做爰| 免费观看精品视频999| 四虎影视库国产精品一区| 国产一区二区三区美女| 老司机亚洲精品| 无码 人妻 在线 视频| 久久国产精品免费99|