<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek-V4上線:使用華為芯片訓練,性能比Gemini差3-6個月,價格優勢明顯

      0
      分享至



      出品|搜狐科技

      作者鄭松毅 常博碩

      編輯| 楊 錦

      DeepSeek V4,來了!

      OpenAI GPT 5.5 前腳剛發布,DeepSeek就亮出了“真家伙”。

      就在剛剛,DeepSeek-V4的預覽版本正式上線并同步開源。

      據官方介紹,DeepSeek-V4擁有百萬字超長上下文,在 Agent 能力、世界知識和推理性能上均實現國內與開源領域的領先。模型按大小分為兩個版本:


      更具產業里程碑意義的是,DeepSeek-V4 從模型設計之初就深度適配國產算力,在華為昇騰芯片生態實測跑通,成為全球首個在國產算力底座上完成訓練與推理的萬億參數級模型,打破對海外芯片與框架的長期依賴。


      性能比肩頂級閉源模型

      價格比Claude便宜21倍

      官方實測數據顯示,DeepSeek-V4-Pro性能比肩頂級閉源模型。


      Agent(智能體)能力方面,相比前代模型,DeepSeek-V4-Pro的能力顯著增強。在 Agentic Coding 評測中,V4-Pro 已達到當前開源模型最佳水平,并在其他 Agent 相關評測中同樣表現優異。

      DeepSeek介紹,目前 DeepSeek-V4 已成為公司內部員工使用的 Agentic Coding 模型,據評測反饋使用體驗優于 Sonnet 4.5,交付質量接近 Opus 4.6 非思考模式,但仍與Opus 4.6 思考模式存在一定差距。

      DeepSeek給出的結論相對克制。在知識與推理任務上,其性能已經超過主流開源模型,并接近Gemini等閉源系統,但仍存在約3到6個月差距。在 agent和代碼任務上,其表現接近甚至部分超過Claude Sonnet。

      此外,在數學、STEM、競賽型代碼的測評中,DeepSeek-V4-Pro超越當前所有已公開評測的開源模型(包括月之暗面的K2.6 Thinking、智譜GLM-5.1 Thinking等),取得了比肩世界頂級閉源模型的優異成績。


      相較之下,DeepSeek-V4-Flash主打性價比,能夠提供更加快捷、經濟的 API 服務。在 Agent 測評中,DeepSeek-V4-Flash 在簡單任務上與 DeepSeek-V4-Pro 旗鼓相當,但在高難度任務上仍有差距。

      據悉,V4-Pro 與 V4-Flash 最大上下文長度為 1M,均同時支持非思考模式與思考模式,其中思考模式支持 reasoning_effort 參數設置思考強度(high/max)。對于復雜的 Agent 場景建議使用思考模式,并設置強度為 max。使用價格如下:


      DeepSeek表示,“受限于高端算力,目前Pro的服務吞吐十分有限,預計下半年昇騰950超節點批量上市后,Pro的價格會大幅下調?!?/p>

      再看看國際友商價格對比,可見DeepSeek的實惠:



      混合架構解決工程落地痛點

      全面適配國產算力

      大模型處理超長文本的最大痛點,從來不是 “能不能裝下”,而是跑不動、記不住、算不起。隨著傳統注意力機制呈平方級復雜度攀升,百萬Token場景下顯存與算力直接 “爆炸”,幾乎無法工程落地。

      DeepSeek-V4 的發布,標志著大模型正式走出 “參數競賽”,進入效率優先下一代賽道。

      從一口氣審計全量代碼庫、一次性解析千頁合同,到全程記住長時間會議、串聯多輪復雜智能體任務,V4讓AI 真正具備“完整理解、長期記憶、深度推理”的能力,同時把使用成本大幅下拉。

      這一切得益于DeepSeek業內首創“CSA (壓縮稀疏注意力) + HCA (重度壓縮注意力)”的混合架構。用一套“分級壓縮 + 分級檢索”思路,把效率拉到極致。這一新方法顯著減少了計算復雜度,提升了長上下文處理的效率。


      具體來看,CSA像給長文本做重點精讀。先把每 4 個Token壓縮成一個信息塊,再用稀疏檢索只挑最相關的內容,既保留中段細節,又大幅削減計算量,兼顧精準與效率。HCA像給長文本做大綱速讀,把海量信息濃縮成框架級塊,專門負責全局邏輯。

      官方數據顯示:1M Token場景下,V4-Pro 僅需 V3.2 的 27% 推理算力、10% KV 緩存;Flash 版更是低至 10% 算力、7% 緩存。

      除了混合注意力,V4 還帶來三項關鍵技術革新,構成完整效率革命:

      升級傳統殘差連接,把信號傳播約束在穩定流形上,深層不衰減、訓練不炸數值。

      Muon 優化器替代傳統 AdamW,收斂更快、訓練更穩,完美適配 MoE 大模型與低精度訓練,解決大批次長上下文訓練的抖動難題。

      全鏈路工程優專家并行細粒度通信重疊、TileLang 內核開發、FP4 量化感知訓練、異構 KV 緩存管理,從計算、通信、存儲全方位降本提速,推理加速最高近2倍。

      最受大家關心的,是V4這次是否成功全面適配國產算力?

      報告指出,DeepSeek-V4在英偉達 GPU 與華為昇騰 NPU 兩大硬件平臺上,對細粒度 EP 優化方案完成了全面驗證。相較于性能優異的非融合基線方案,該方案在通用推理負載場景下可實現1.50~1.73 倍的加速比。

      有業內觀點指出,這代表已經完成華為昇騰平臺的適配和實測落地。但目前對外開源的只有英偉達GPU版本,昇騰適配代碼未開源,屬于閉源適配優化。

      值得一提的是,寒武紀在軟硬一體生態中,已經完成基于 vLLM 推理框架完成對 285B DeepSeek-V4-flash 和 1.6T DeepSeek-V4-pro 的適配,適配代碼已開源到 GitHub 社區。

      剩下的,就等DeepSeek-V4的實用表現了。還有DeepSeek的首輪融資最終花落誰家,也還是個謎題。

      “不誘于譽,不恐于誹,率道而行,端然正己?!?/p>

      DeepSeek官方在文章最后表示,他們將始終秉持長期主義的原則理念,在嘗試與思考中踏實前行,努力向實現 AGI 的目標不斷靠近?!?/p>




      運營編輯 |曹倩審核|孟莎莎




      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      蘭州擒獲殺人惡魔:八名特警破門而入,搏斗十分鐘,情節堪比武俠劇

      蘭州擒獲殺人惡魔:八名特警破門而入,搏斗十分鐘,情節堪比武俠劇

      隴史薈王文元
      2026-04-11 07:34:39
      妻子給我戴綠帽,我問她那個男人哪里比我強,她的回答讓我崩潰

      妻子給我戴綠帽,我問她那個男人哪里比我強,她的回答讓我崩潰

      徐俠客有話說
      2026-05-07 11:32:35
      五一小長假第4天,過氣藝人淪為景區NPC打工人,看看都有誰?

      五一小長假第4天,過氣藝人淪為景區NPC打工人,看看都有誰?

      削桐作琴
      2026-05-05 01:30:13
      67歲畢福劍泰州農村商演!親自為70歲老人賀壽,曝出場費20幾萬

      67歲畢福劍泰州農村商演!親自為70歲老人賀壽,曝出場費20幾萬

      裕豐娛間說
      2026-05-06 13:29:12
      646億財務造假終被抓,兒子投資來源不明,實業報國六年騙局

      646億財務造假終被抓,兒子投資來源不明,實業報國六年騙局

      玲兒愛唱歌
      2026-05-07 05:07:45
      老話說“一地菜花蛇,十里無毒蛇”,菜花蛇這么厲害?它能打贏眼鏡王蛇嗎?

      老話說“一地菜花蛇,十里無毒蛇”,菜花蛇這么厲害?它能打贏眼鏡王蛇嗎?

      農夫也瘋狂
      2026-05-03 16:17:27
      美國汽油價格突破每加侖4.50美元

      美國汽油價格突破每加侖4.50美元

      界面新聞
      2026-05-06 15:38:11
      五一假期突傳噩耗!4位名人相繼離世,平均年齡未滿60令人惋惜

      五一假期突傳噩耗!4位名人相繼離世,平均年齡未滿60令人惋惜

      林輕吟
      2026-05-06 14:41:30
      林徽因落選的國徽方案,網友看后感嘆:審美確實厲害,但真不合適

      林徽因落選的國徽方案,網友看后感嘆:審美確實厲害,但真不合適

      浩渺青史
      2026-04-17 13:55:15
      A股:大家要做好準備了,明天(5月8日),不出意外會這么走

      A股:大家要做好準備了,明天(5月8日),不出意外會這么走

      財經大拿
      2026-05-07 13:51:54
      20年代,林徽因與冰心郊游的唯一合影,這是他們的真實容顏

      20年代,林徽因與冰心郊游的唯一合影,這是他們的真實容顏

      以茶帶書
      2026-04-25 19:22:44
      尷尬!家長因孩子膝蓋磕破責怪老師被回懟,“是五一假期磕破的”

      尷尬!家長因孩子膝蓋磕破責怪老師被回懟,“是五一假期磕破的”

      火山詩話
      2026-05-06 06:39:14
      歌手王嘉爾食物中毒,稱“再也不吃那些垃圾食品了”,曾因食用生腌醬蟹被送往急診

      歌手王嘉爾食物中毒,稱“再也不吃那些垃圾食品了”,曾因食用生腌醬蟹被送往急診

      花樣TV
      2026-05-07 16:09:06
      一杯茶蒸發300億!霸王茶姬泡沫破裂,創始人套現進7億離場

      一杯茶蒸發300億!霸王茶姬泡沫破裂,創始人套現進7億離場

      謝綸郵輪攝影
      2026-04-17 15:33:57
      三星開始推送穩定版One UI 8.5 首批覆蓋7款Galaxy設備

      三星開始推送穩定版One UI 8.5 首批覆蓋7款Galaxy設備

      CNMO科技
      2026-05-07 13:24:15
      理想CEO李想:呼吁所有增程車企同行,共同推廣5C增程技術

      理想CEO李想:呼吁所有增程車企同行,共同推廣5C增程技術

      IT之家
      2026-05-07 16:36:07
      1941年,日本為啥不全力壓垮中國,非要轉頭偷襲美國?

      1941年,日本為啥不全力壓垮中國,非要轉頭偷襲美國?

      賤議你讀史
      2026-05-01 02:05:03
      你們都是什么時候對男女之事開竅的?網友:果然還是攔不住有心人

      你們都是什么時候對男女之事開竅的?網友:果然還是攔不住有心人

      夜深愛雜談
      2026-02-21 21:37:02
      撞見妻子進酒店,我把照片發給那個男人的老婆,妻子鼻青臉腫回家

      撞見妻子進酒店,我把照片發給那個男人的老婆,妻子鼻青臉腫回家

      千秋文化
      2026-05-03 20:27:24
      毀三觀!體壇 4 大丑聞曝光:貪財好色、婚內出軌,比娛樂圈還亂

      毀三觀!體壇 4 大丑聞曝光:貪財好色、婚內出軌,比娛樂圈還亂

      橙星文娛
      2026-04-27 16:46:45
      2026-05-07 17:23:00
      搜狐科技 incentive-icons
      搜狐科技
      搜狐科技官方賬號
      4800文章數 9192關注度
      往期回顧 全部

      科技要聞

      月之暗面完成20億美元融資,估值突破200億

      頭條要聞

      費高云落馬:任市委書記僅一年多 曾因爆炸事故被問責

      頭條要聞

      費高云落馬:任市委書記僅一年多 曾因爆炸事故被問責

      體育要聞

      巴黎再進歐冠決賽,最尷尬的情況還是發生了

      娛樂要聞

      小S阿雅重返大S母校,翻看大S畢業照

      財經要聞

      特朗普:美伊“很有可能”達成協議

      汽車要聞

      理想為什么不做轎車,有了解釋……

      態度原創

      本地
      健康
      時尚
      公開課
      軍事航空

      本地新聞

      用青花瓷的方式,打開西溪濕地

      干細胞治燒燙傷面臨這些“瓶頸”

      “白色闊腿褲”今年夏天又火了!這樣穿時髦又高級

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普:美伊"很可能"達成協議

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲中文字幕无码久久2018| 欧美在线观看一区二区三区| 亚洲精品一区久久久久一品av| www中文字幕在线观看| 九九视频在线| 狠狠躁夜夜躁av网站中文字幕| 久久91精品国产91久久麻豆| 欧美自拍视频| 日日夜夜天天| 亚洲色欲色欲www| 国产精品高潮呻吟久久| 肉色超薄丝袜脚交一区二区| 色拍自拍亚洲综合图区| 自拍视频在线观看成人| 亚洲第一国产综合| 精品人人妻人人澡人人爽牛牛| 亚洲久悠悠色悠在线播放| 邻居少妇张开腿让我爽了在线观看| 日韩秘 无码一区二区三区| 亚洲人妻精品中文字幕| 亚洲AV噜噜在线成人网站| 久激情内射婷内射蜜桃| 亚洲AV无码有乱码在线观看 | 日韩AV有码无码一区二区三区| 久久久久无码精品亚洲日韩 | 国产精品乱码人妻一区二区三区| 超碰人人插| 久久久久免费看少妇高潮A片| 国产一级一片免费播放| 久久亚洲精品国产精品婷婷| 成人做爰69片免费看网站| 视频一区自拍偷拍| 国产成人精品高清在线观看93| 成年网站免费视频A在线双飞| 丁香五月色情| 夜夜躁网| 四虎影视永久无码精品| 亚洲一区二区三区四区av| 日韩成人网上操叉不卡| 国产日本一区二区在线| 亚洲欧美日韩综合在线一|