<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      DeepSeek-V4-Flash 本地部署,2 x H20(96GB版本),性能簡測

      0
      分享至

      繼續看看 V4,本文看下 DeepSeek-V4-Flash 本地部署

      我的設備

      • CPU :Intel Xeon Platinum 8457C

      • 內存 :480 GiB

      • GPU :2 x NVIDIA H20,單卡顯存 96 GB

      • 驅動版本:580.126.09

      • CUDA 版本:13.0

      • 系統盤:100G

      • 數據盤:1T

      1、模型下載

      模型文件 160GB

      國內網絡,模型下載

      modelscope download --model deepseek-ai/DeepSeek-V4-Flash --local_dir /data/models/DeepSeek-V4-Flash
      2、vLLM Docker 鏡像準備

      安裝vllm-nightly我從沒有成功過,只有Docker最省心

      docker pull vllm/vllm-openai:deepseekv4-cu129

      3、啟動腳本

      大家也看到了,即便是 Flash,能跑得起的設備也很少,AMD 全軍覆沒

      看了幾個 issues,消費級英偉達顯卡也都不配

      上面的啟動腳本我的 2xH20 自然也不配,啟動 N 次,都是 OOM


      不斷試錯之后,實際使用的腳本:

      docker run -d \
      --name vllm-deepseek-v4-flash \
      --restart unless-stopped \
      --gpus all \
      --privileged \
      --ipc=host \
      -p 8000:8000 \
      -v /data/models:/models:ro \
      -e VLLM_ENGINE_READY_TIMEOUT_S=3600 \
      vllm/vllm-openai:deepseekv4-cu129 \
      /models/DeepSeek-V4-Flash \
      --trust-remote-code \
      --kv-cache-dtype fp8 \
      --block-size 256 \
      --enable-expert-parallel \
      --data-parallel-size 2 \
      --gpu-memory-utilization 0.95 \
      --max-model-len 7000 \
      --tokenizer-mode deepseek_v4 \
      --tool-call-parser deepseek_v4 \
      --enable-auto-tool-choice \
      --enforce-eager

      模型默認 max seq len1048576,完全搞不動,所以我這里 --max-model-len 只設 7K


      啟動正常,幾個日志關鍵信息分享一下:

      1、模型原始 Safetensors 權重文件高達 148.66 GiB(EXT4 文件系統顯示的 size),但在啟用 FP8 量化 和 Expert Parallelism(EP) 后,單個 Worker 進程(Rank)加載的權重被壓縮到了 77.6 GiB

      2、扣除權重和系統預留后,只剩下了約 9.29 GiB 用于緩存

      3、并發能力,日志顯示 Maximum concurrency for 7,000 tokens perrequest: 3.72x。這意味著在長文本(7k tokens)情況下,系統僅能支持約 3.72 個并發請求

      4、模型總共有 256 個專家,通過并行配置,每個 Worker 維護 128 個。這樣做既利用了多卡的算力,又分攤了專家權重的顯存壓力

      5、日志顯示 Using DeepSeek's fp8_ds_mla KV cacheformat。這是 DeepSeek 的“獨門絕技”,通過低秩壓縮技術(Multi-head Latent Attention),在 FP8 模式下極大地緩解了內存帶寬壓力(擴展閱讀:)

      6、日志還可以看到 TileLang 完成了 mhc_pre_big_fuse_tilelang 等內核的編譯

      7、啟動速度:整個引擎初始化(Profile + Cache 創建 + Warmup)耗時約 233 秒。對于這種規模的模型,這個速度表現尚可,大部分時間花在了 DeepGEMM warmup(2 分 36 秒)


      性能情況

      效果就別追求了,看看性能


      平均生成速度 8.33?。。∵b遙領先的卡嗎?

      哦哦,不對是 H20

      難以置信,要知道我測試

      關閉思考

      查了一下 DeepSeek API 文檔,可以關閉思考


      寫了一個腳本再測、,對比思考與非思考下性能,各跑 10 次取平均,同樣的 prompt,max_tokens=1024

      結果如下:


      再見,浪費了寶貴的幾個小時!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      確定!正式官宣加盟,空降達拉斯啊,弗拉格終于有救了?

      確定!正式官宣加盟,空降達拉斯啊,弗拉格終于有救了?

      球童無忌
      2026-05-05 13:40:30
      西蒙尼:如果我們被淘汰,那說明對手配得上晉級

      西蒙尼:如果我們被淘汰,那說明對手配得上晉級

      懂球帝
      2026-05-06 06:37:12
      我國又一款摩托車奪冠!春風動力在世界摩托車大獎賽上大幅度領先

      我國又一款摩托車奪冠!春風動力在世界摩托車大獎賽上大幅度領先

      科普大世界
      2026-05-05 21:57:22
      虧損超1.5億!《寒戰1994》票房崩塌,我感慨:這塊金字招牌砸了

      虧損超1.5億!《寒戰1994》票房崩塌,我感慨:這塊金字招牌砸了

      靠譜電影君
      2026-05-05 10:40:44
      驚呼繩子“沒拴緊沒拴緊”,女子景區“探險”時高空墜落;女子是否搶救過來,四川華鎣相關部門稱會發通報

      驚呼繩子“沒拴緊沒拴緊”,女子景區“探險”時高空墜落;女子是否搶救過來,四川華鎣相關部門稱會發通報

      大風新聞
      2026-05-05 17:39:06
      上海偶遇Angelababy!素顏帶小海綿抓娃娃,現場無人打擾太暖心

      上海偶遇Angelababy!素顏帶小海綿抓娃娃,現場無人打擾太暖心

      觀魚聽雨
      2026-05-05 23:43:22
      河北一戶人家,因“月季花小院”走紅,太養眼,猶如人間仙境

      河北一戶人家,因“月季花小院”走紅,太養眼,猶如人間仙境

      三農老歷
      2026-05-05 00:08:43
      摩根:我的歷史最佳11人無梅西很正常,他甚至不是阿根廷的歷史最佳

      摩根:我的歷史最佳11人無梅西很正常,他甚至不是阿根廷的歷史最佳

      懂球帝
      2026-05-05 21:57:05
      吳宜澤世錦賽奪冠,同為00后的顏丙濤社媒送祝賀,解禁時間已確定

      吳宜澤世錦賽奪冠,同為00后的顏丙濤社媒送祝賀,解禁時間已確定

      小火箭愛體育
      2026-05-05 19:46:07
      米切爾和詹姆斯·哈登為何相信騎士隊,已準備好爆冷擊敗活塞隊

      米切爾和詹姆斯·哈登為何相信騎士隊,已準備好爆冷擊敗活塞隊

      好火子
      2026-05-06 05:32:12
      豆包突然要收費,其實是給所有普通人提了個醒!

      豆包突然要收費,其實是給所有普通人提了個醒!

      秋葉PPT
      2026-05-05 08:22:06
      套現約455億,李嘉誠又賣了

      套現約455億,李嘉誠又賣了

      第一財經資訊
      2026-05-05 23:54:56
      最便宜的豐田小車來了!配1.0L發動機油耗2.8L,不足4萬太香了

      最便宜的豐田小車來了!配1.0L發動機油耗2.8L,不足4萬太香了

      娛樂圈的筆娛君
      2026-05-05 21:17:39
      我家樓下有個少婦,離婚有一年了,長得非常漂亮,我想把她追到手

      我家樓下有個少婦,離婚有一年了,長得非常漂亮,我想把她追到手

      那年秋天
      2026-05-05 18:00:07
      大快人心!白洋淀五一徹底涼涼,靠宰客斂財的景區終于迎來了報應

      大快人心!白洋淀五一徹底涼涼,靠宰客斂財的景區終于迎來了報應

      社會日日鮮
      2026-05-05 20:11:56
      特斯拉 Model Y L 續航、能耗太強了,表顯跑出了 1:1

      特斯拉 Model Y L 續航、能耗太強了,表顯跑出了 1:1

      新浪財經
      2026-05-05 17:57:05
      蘭州飯館掛錢學森袁隆平照片,被投訴,老板反手報警:崇拜,不摘

      蘭州飯館掛錢學森袁隆平照片,被投訴,老板反手報警:崇拜,不摘

      觀察鑒娛
      2026-05-05 10:24:44
      媽媽帶3歲兒子送外賣不幸遭遇車禍,孩子滿臉傷痕不哭不鬧一直守在身旁:這一刻他就是媽媽的“守護天使”

      媽媽帶3歲兒子送外賣不幸遭遇車禍,孩子滿臉傷痕不哭不鬧一直守在身旁:這一刻他就是媽媽的“守護天使”

      大象新聞
      2026-05-05 20:46:37
      阿森納通往歐冠決賽之路:11勝3平僅丟6球,勝拜仁國米馬競

      阿森納通往歐冠決賽之路:11勝3平僅丟6球,勝拜仁國米馬競

      懂球帝
      2026-05-06 05:24:44
      特朗普:已賺回出兵成本的37倍!美國已經賣了1億桶委內瑞拉石油,未來一個月還有1億桶,他此前呼吁中國購買委石油,中方:其他國家無權指手畫腳

      特朗普:已賺回出兵成本的37倍!美國已經賣了1億桶委內瑞拉石油,未來一個月還有1億桶,他此前呼吁中國購買委石油,中方:其他國家無權指手畫腳

      每日經濟新聞
      2026-05-03 09:07:16
      2026-05-06 06:51:00
      Ai學習的老章 incentive-icons
      Ai學習的老章
      Ai學習的老章
      3372文章數 11146關注度
      往期回顧 全部

      科技要聞

      傳蘋果考慮讓英特爾、三星代工設備處理器

      頭條要聞

      媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

      頭條要聞

      媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

      體育要聞

      全世界都等著看他笑話,他帶國米拿下冠軍

      娛樂要聞

      內娛真情誼!楊紫為謝娜演唱會送花籃

      財經要聞

      瀏陽煙花往事

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態度原創

      手機
      房產
      家居
      時尚
      公開課

      手機要聞

      iPhone 20周年機型或配備固態按鈕,iPhone 18再次確認工藝降級!

      房產要聞

      五一樓市徹底明牌!塔尖人群都在重倉凱旋新世界

      家居要聞

      靈動實用 生活藝術場

      衣服不用準備太多,找到一些實用的單品才最重要,百搭又有性價比

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 5566先锋影音夜色资源站在线观看| 最新国产AV最新国产在钱| 91中文字幕在线观看| 亚洲欧洲日产最新| 久久久久久毛片免费播放| 国产成人久久777777| 亚洲熟妇无码av在线播放| WWW色色| 日本二区视频在线观看| 亚洲中文字幕精品乱码| 8ⅹ8x擦拨擦拨成人免费视频| 欧美色综合| 国内揄拍国内精品少妇国语| 淳化县| 色综合久久久无码网中文| 少妇内射兰兰久久| www.艹| 亚洲av永久无码精品水牛影视| 国产精品大屁股白浆久久| 野花社区日本免费图片| 国产破处| 国产综合无码一区二区辣椒| 国产丝袜在线精品丝袜| 国自产拍在线| 2019精品国自产拍在线不卡| 草草浮力影院| 国产v片中文字幕| 夜夜高潮次次欢爽av女| 亚洲最大天堂av在线| 中文字幕精品亚洲字幕成| 蜜臀久久精精品久久久久久噜噜| 国产精品免费看久久久无码| 国产成人亚洲欧美日韩| 国产在线观看www污污污| 国产精品yy9299在线观看| 小鲜肉自慰网站xnxx| 日韩成人高清在线视频| 99精品国产在热久久| 亚洲综合精品伊人久久| 国产精品推荐天天看天天爽| 老色鬼永久精品网站|