<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek-V4實測:超高效上下文,更像是token價格戰的序章

      0
      分享至


      準備好做Agent基模,價格戰可能下半年到來。

      文|陳梅希

      編|園長

      沒有開聲勢浩大的全球發布會,沒有安排老板錄制一檔視頻博客,DeepSeek-V4預覽版就這么默默更新了,一如它過去所做的那樣。時間選在了周五上午,作為自媒體從業者也萬分感謝,沒有讓我們在周末的北影節觀影現場突然離場去研究一個大模型的全新版本。



      公告里說的和沒說的

      更新通知發布在DeepSeek的官方公眾號,全文只有1087個字。同步公開的,DeepSeek-V4 模型的開源鏈接和技術報告。縱覽這些公開信息,有以下幾件事值得關注:

      1.官網、App、API調用全部上線新模型,分為DeepSeek-v4-pro和DeepSeek-v4-flash兩種,可自行切換調用。兩種模型均為開源模型。

      性能上,開源的DeepSeek-V4-Pro能比肩頂級閉源模型。Agent能力大幅提高,其中Coding能力在其公司內部的評測體驗中“優于 Sonnet 4.5,交付質量接近 Opus 4.6 非思考模式,但仍與 Opus 4.6 思考模式存在一定差距”;文檔和PPT生成能力均大幅提升。(第二部分我們將對其代碼能力和PPT生成能力進行橫向測評。)

      DeepSeek內部已將員工使用的Agentic Coding 模型切換為DeepSeek-V4,證明其在實際研發場景中已具備生產力價值。

      2.技術革新方面,這個版本在上下文問題上最值得關注的是超高的上下文效率,而非上下文規模。

      DeepSeek-V4通過全新的混合注意力機制,在實現超長上下文能力的同時,降低了對計算和顯存的需求,根據官方文檔:“從現在開始,1M(一百萬)上下文將是 DeepSeek 所有官方服務的標配。”

      閱讀其技術文檔可以發現,全新的注意力機制結合了CSA (Compressed Sparse Attention,壓縮稀疏注意力)和HCA (Heavily Compressed Attention,重度壓縮注意力),其中CSA搭配DeepSeek自研的稀疏注意力算法,而HCA對鍵值緩存采用更高的壓縮倍率,但保留了Transformer架構里的稠密注意力算法。粗淺理解一下,就是壓縮得少的跳著看,已經被猛猛壓縮過的那就每個都看。

      To enhance long-context efficiency, we design a hybrid attention mechanism combining Compressed Sparse Attention (CSA) and Heavily Compressed Attention (HCA). CSA compresses the KV caches along the sequence dimension and then performs DeepSeek Sparse Attention (DSA) (DeepSeek-AI, 2025), whereas HCA applies more aggressive compression to the KV caches but keeps dense attention.

      這種混合注意力機制的核心理念,是在超長上下文中,并不是所有鍵值都需要全注意力和稠密計算。其實帶入人類自己的閱讀體驗也是如此,我們看論文時總是聚精會神地先看摘要、導語和結論,而在文獻綜述環節意識模糊。本科選修網絡文學課,老師在第一節課就告訴我們這學期要至少讀完兩千萬字的網文,并介紹了一種“掃文”方式:對角線閱讀法,每頁書只看左上角、正中間、右下角,現在想想,這何嘗不是一種稀疏注意力算法。

      注意力的壓縮,是為了減少計算量,最終目標是提升超長上下文的效率。根據技術報告,“在一百萬tokens上下文中,V4-Pro的推理計算量僅需V3.2的27%,KV緩存占用僅為10%。”

      In the one-million-token context setting, DeepSeek-V4-Pro requires only 27% of single-token inference FLOPs and 10% of KV cache compared with DeepSeek-V3.2.


      3.按理說,token壓縮結合稀疏注意力機制提高計算效率后,廠商的計算成本和顯存成本(同等token規模下)都會大幅減少,最終會反映到token定價上。DeepSeek-V4在今天也公布了定價,每百萬tokens的定價如下:


      這個價格,和海外頭部大模型相比,有很大的優勢。以DeepSeek-V4自稱交付質量接近的Opus 4.6 非思考模型為例,命中緩存的輸入單價為0.5美元/百萬token,未命中緩存的輸入單價為5美元/百萬token,輸出單價為25美元/百萬token。按4月24日當日匯率計算,DeepSeek-V4-pro的三項單價,分別是Opus 4.6的24%、35%和14%。


      海外頭部大模型API調用計價(截至2026.4.24),刺猬公社手動統計,僅供參考;數據來源:各平臺官網

      但和國內競品相比,DeepSeek-V4暫時還沒有對著價格大砍一刀的架勢。

      國內模型中同樣有百萬上下文能力的是阿里在本月初發布的Qwen3.6-plus,對單次輸入的token數進行分層計價,當單次輸入小于256K時,Qwen3.6-plus的輸入和輸出單價均介于DeepSeek-V4-Flash和DeepSeek-V4-Pro之間。


      國內頭部大模型API調用計價(截至2026.4.24),刺猬公社手動統計,僅供參考;數據來源:各平臺官網、公告

      4.準備好做Agent基模,價格戰可能下半年到來

      華為昇騰芯片在DeepSeek 官方公告中被提及,雖然只是以出現在圖片注釋中的低調形式。在更新公告的定價說明截圖下,有一行注釋小字:“受限于高端算力,目前Pro的服務吞吐十分有限,預計下半年昇騰950超節點批量上市后,Pro的價格會大幅下調。”

      這條注釋,也許在宣告一種可能性:在DeepSeek-V4 使用大幅降低計算成本的新注意力機制后,V4-Pro沒有大幅降價,是因為高端算力稀缺,而不是成本不允許降價。換言之,一旦國產高端算力在下半年順利接棒,DeepSeek就有空間大幅下調token定價。

      DeepSeek也做好了充足的、充當Agent 基模的準備,畢竟在更新公告里特意寫道自己“針對 Claude Code 、OpenClaw、OpenCode、CodeBuddy 等主流的 Agent 產品進行了適配和優化”。除了三位耳熟能詳的Agent選手,CodeBuddy是騰訊云開發的代碼助手。

      超高效上下文,更像是token價格戰的一頁序章。也有從業者提供了另一種視角:當DeepSeek已經公開宣布下半年會大幅下調V4-Pro價格后,DeepSeek的模型能力線和價格線,將成為閉源模型的“斬殺線”。


      實測DeepSeek-V4-Pro

      因為更新公告里重點提及了代碼能力、PPT生成能力,刺猬公社基于這兩個領域,對DeepSeek-V4預覽版進行了簡單的橫向測試,對照的是近期發布/更新的,分別以這兩項能力為賣點的產品。

      1.代碼能力VS阿里秒悟

      秒悟是阿里巴巴ATH事業群于將近10天前發布的AI開發平臺,讓0代碼能力的用戶能使用自然語言完成自己的產品開發。剛上線時,我讓秒悟做了一個《作家推薦器》,通過給用戶做8道選擇題判斷TA可能喜歡的作家,題庫一共30道,覆蓋100位作家。經過大概1個小時的調試后,這個測試小網頁上線了:


      雖然不知道為什么秒悟在配色上唯愛清華紫,而且在出文本選擇題的時候像吃了50噸張嘉佳(然而它自己建構的作家庫里沒有張嘉佳),但作為和朋友自娛自樂的小玩具,可用度還是非常高的。我自己做了測試,竟然真的測出了我喜歡的作家。


      DeepSeek-V4-Pro正式上線后,我用同樣的提示詞,測試它做網頁的能力。大概5分鐘后,測試網頁完成了。


      第一次生成,點擊跳轉邏輯并未生效,DeepSeek選擇重寫數千行代碼,先提供了一個只包含10個作家的簡化版。等簡化版運行成功,它確認自己代碼結構沒有問題后,我讓它把作家庫恢復到100個,它依然選擇了把代碼全部重寫,而不是讓我替換若干個代碼模塊。

      DeepSeek給出的解決方式,讓我恍惚覺得自己擁有無限的token火力,在對這個小小的網頁需求進行過飽和攻擊,而在此過程中,我其實完全沒有付費。


      橫向測評之后,秒悟的優勢在于0操作門檻,最終的交付結果是一個用戶可以打開的網頁,用戶可以直接分享給朋友或是互聯網上的任何人。劣勢在于價格,做一個作家推薦器大概花掉了40000積分,按照積分的零售價格是40塊,如果不想花錢,按每天登錄贈送2000積分的速度,大概連續登錄20天可以做一個玩具網頁。最終我斥39元巨資訂購了每月100000積分的套餐。

      DeepSeek-V4-Pro的最大優勢當然是免費,幾千行代碼說寫就寫;另一個優勢是快速,雖然沒有左拉一個助手,右拉一個設計師,建構若干項蜂群工程,但不到10分鐘就做完了。劣勢則是只能生成一份代碼,讓我打包成html格式再去瀏覽器打開,如果想直接分享到線上,還需要自己完成部署。另外,如果說使用qwen的秒悟像吃了五十噸張嘉佳老師,那么DeepSeek做出來的作家推薦器就像是吃了五十噸DeepSeek。


      2.PPT生成能力VS MaxHermes

      測試PPT生成能力時,我直接選擇了使用DeepSeek-V4的技術文檔,共59頁pdf,要求是生成一個給大學生做講座用的PPT。

      MaxHermes很快完成了一個可以直接下載的PPT文件,結構和美化都做得不錯。劣勢是要花錢,為了使用MaxHermes,我需要花39元買一個基礎版會員,再花49元訂購一個token plan包月。


      DeepSeek則生成了代碼,需要在本地用Python運行,沒有那些Agent方便,而且樣式有些過于樸素了。最大優點依然是完全免費,留了圖片的占位符,需要用戶自己做一些圖片替換工作。題外話,為什么不管寫網站還是做PPT,大模型們都不約而同地默認選擇了紫色系?


      如果用Claude Code 、OpenClaw等Agent產品搭配DeepSeek 4.0的API,應該能獲得更便捷的體驗,但就要走DeepSeek的API計費邏輯了,無法像現在這樣完全免費。

      更何況,現在是周五晚上9點半國產大模型的更新固然重要使我從早到晚坐在電腦前興奮地敲了一天字但是周五晚上跟朋友約好去五道營喝酒聽歌同樣重要我將在關注AI進展的同時保衛我的線下生活那正是我在開頭就感謝DeepSeek 在周五上午發布更新的原因。




      媒介合作聯系微信號|ciweimeijiejun

      如需和我們交流可后臺回復“進群”加社群

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      人倫之亂的背后,是我們在金錢面前,親手殺死那個叫“家”的地方

      人倫之亂的背后,是我們在金錢面前,親手殺死那個叫“家”的地方

      小影的娛樂
      2026-05-07 15:39:46
      里夫斯可能是被高估了,但縱觀他的職業生涯,他也不應該那么不堪

      里夫斯可能是被高估了,但縱觀他的職業生涯,他也不應該那么不堪

      稻谷與小麥
      2026-05-06 22:28:29
      黃一鳴宣布放棄起訴王思聰,不做親子鑒定,靠自己賺錢帶女兒瀟灑

      黃一鳴宣布放棄起訴王思聰,不做親子鑒定,靠自己賺錢帶女兒瀟灑

      以茶帶書
      2026-05-06 20:47:52
      美國剛扔出最毒芯片封鎖令,中國只用三天就回了一句:不需要你了

      美國剛扔出最毒芯片封鎖令,中國只用三天就回了一句:不需要你了

      菁菁子衿
      2026-05-06 09:48:23
      馬刺3將身價暴漲!尚帕尼攻守一體,哈珀潛力無限,卡斯爾強殺傷

      馬刺3將身價暴漲!尚帕尼攻守一體,哈珀潛力無限,卡斯爾強殺傷

      籃球資訊達人
      2026-05-07 13:58:06
      她是吳宜澤姐姐,血脈壓制從小揪弟弟耳朵,長得漂亮是機車愛好者

      她是吳宜澤姐姐,血脈壓制從小揪弟弟耳朵,長得漂亮是機車愛好者

      以茶帶書
      2026-05-05 16:57:12
      為什么不能取消公務員周末休息?這樣老百姓辦事就不用請假了!你怎么看?

      為什么不能取消公務員周末休息?這樣老百姓辦事就不用請假了!你怎么看?

      碧翰烽
      2026-05-05 07:50:33
      王近山不經請示干掉日本戰地觀戰團,毛主席:早就聽說有個王瘋子

      王近山不經請示干掉日本戰地觀戰團,毛主席:早就聽說有個王瘋子

      鶴羽說個事
      2026-04-20 22:56:36
      深圳交警在多條高速上線“龜速車”抓拍系統

      深圳交警在多條高速上線“龜速車”抓拍系統

      IT之家
      2026-05-07 15:31:19
      任何一個男人到了六十歲后,只要還對異性懷有欣賞與追求,往往因為這兩件事

      任何一個男人到了六十歲后,只要還對異性懷有欣賞與追求,往往因為這兩件事

      心理觀察局
      2026-05-04 08:51:11
      FIFA急瘋了!2000萬美元打發叫花子?許多國家和中國一樣不買單了

      FIFA急瘋了!2000萬美元打發叫花子?許多國家和中國一樣不買單了

      春序娛樂
      2026-05-07 04:52:17
      一批年輕女性靠 “崩老頭” 賺快錢,而80、90后成為被崩的“老頭”!

      一批年輕女性靠 “崩老頭” 賺快錢,而80、90后成為被崩的“老頭”!

      品牌新
      2026-05-06 16:28:30
      中國“撿錢”時代可能要來了:若手中只有10萬,試試死啃這兩條線

      中國“撿錢”時代可能要來了:若手中只有10萬,試試死啃這兩條線

      世界圈
      2026-04-20 13:02:44
      1200萬預賠款已到賬!瀏陽煙花廠爆炸遇難者,人均或賠120萬以上

      1200萬預賠款已到賬!瀏陽煙花廠爆炸遇難者,人均或賠120萬以上

      火山詩話
      2026-05-06 17:05:43
      哈登又拉胯了!美記:又一場典型的哈登季后賽表現,三分7投1中!

      哈登又拉胯了!美記:又一場典型的哈登季后賽表現,三分7投1中!

      愛體育
      2026-05-06 23:20:50
      老師多次提醒:軍校是沒有回頭路的,如果因為軍隊待遇好而報考,建議別報!

      老師多次提醒:軍校是沒有回頭路的,如果因為軍隊待遇好而報考,建議別報!

      譚老師地理大課堂
      2026-04-24 00:05:13
      隨著拜仁5-6出局,歐冠最新奪冠賠率出爐:英超領頭羊第一

      隨著拜仁5-6出局,歐冠最新奪冠賠率出爐:英超領頭羊第一

      側身凌空斬
      2026-05-07 05:12:02
      破案!曾凡博一打廣東就暴走的真正原因找到,京媒罕見批評崔永熙

      破案!曾凡博一打廣東就暴走的真正原因找到,京媒罕見批評崔永熙

      后仰大風車
      2026-05-07 08:15:10
      美國打出最后一張牌之時,就是日本亡國滅種之日

      美國打出最后一張牌之時,就是日本亡國滅種之日

      溫讀史
      2026-05-04 22:32:17
      俄副部長叛逃美國,俄軍每天最低傷亡千人,仍在組織新攻勢!

      俄副部長叛逃美國,俄軍每天最低傷亡千人,仍在組織新攻勢!

      知兵
      2026-05-04 16:06:33
      2026-05-07 16:52:49
      刺猬公社 incentive-icons
      刺猬公社
      聽記者講幕后,聽新聞前輩講古
      10053文章數 172587關注度
      往期回顧 全部

      科技要聞

      月之暗面完成20億美元融資,估值突破200億

      頭條要聞

      費高云落馬:任市委書記僅一年多 曾因爆炸事故被問責

      頭條要聞

      費高云落馬:任市委書記僅一年多 曾因爆炸事故被問責

      體育要聞

      巴黎再進歐冠決賽,最尷尬的情況還是發生了

      娛樂要聞

      小S阿雅重返大S母校,翻看大S畢業照

      財經要聞

      特朗普:美伊“很有可能”達成協議

      汽車要聞

      理想為什么不做轎車,有了解釋……

      態度原創

      游戲
      旅游
      親子
      房產
      公開課

      索尼PS5獨占新作銷量太爛了!前十都進不去 回本堪憂

      旅游要聞

      海邊游玩必看!方海浪、離岸流……這些安全盲區別忽視

      親子要聞

      滬12區幼兒園今日啟動報名驗證!完善信息與驗證材料

      房產要聞

      負債23億,抵押482畝地!海南這家巨頭,慘遭拍賣!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产综合有码无码中文字幕| www.大熟女| 国产精品老热丝在线观看| 精品久久久久久中文字幕2017| 精品国产一区二区三区麻豆 | 亚洲一区二区三区成人网站| 影音先锋女人av鲁色资源网小说| 无码国产精品一区二区免费式影视| 黑人成人网| 亚洲色另类| 国产精品久久久天天影视香蕉 | AV无码中文字幕不卡一区二区三区| 久久久精品妓女影院妓女网 | 性欧美暴力猛交69hd| 中文字幕在线日亚州9| 麻豆精品久久久久久中文字幕无码| 中文字幕一区二区三区在线毛片| 久久SE精品一区精品二区| 一区二区三区午夜| 国内少妇偷人精品视频| 老熟女一区二区免费| 精久视频| 做暖暖视频在线看片免费| 老湿机69福利| 久久国内精品自在自线400部 | 亚洲一区二区三级av| 婷婷综合缴情亚洲五月伊| 日韩av最新| 国产精品1区2区| 国产精品亚洲a∨天堂| 精品国产大片中文字幕| 91狠狠操| 亚洲爆乳无码精品aaa片蜜桃| 国产无遮挡无码视频在线观看| 欧美操逼色图| 中文字幕乱码人妻综合二区三区| 无码国产精品一区二区免费I6| 久久免费看少妇高潮v片特黄| 亚洲一级电影| 人妻?第一页| 蜜臀久久99精品久久久久久做爰|