4月24日,值得書寫的一天。
DeepSeek V4發布,同日OpenAI發布GPT-5.5。兩大模型隔空對決。
深圳夢注意到,一條微博熱搜瞬間引爆全網——#。
這個預言就是:根據 DeepSeek-V4 技術報告點名華為昇騰,其并細粒度專家并行(EP)方案同時在英偉達 GPU 和華為昇騰 NPU 上完成驗證,相比非融合基線在通用推理場景中實現。另據 DeepSeek 公眾號披露,受限于高端算力,目前 DeepSeek-V4-Pro 的服務吞吐十分有限,預計下半年昇騰 950 超節點批量上市后,其價格會大幅下調。
當天,華為昇騰直播解讀 DeepSeek-V4 技術,并披露昇騰 950 性能表現。
值得一提的是,OpenAI 首席執行官薩姆 · 奧特曼在社交平臺上分享了英偉達 CEO 黃仁勛發給他的一封電郵,后者附上了他給英偉達全體員工的一封電郵,要求他們使用 OpenAI 的 Codex 編程工具。黃仁勛在郵件中寫道:" 親愛的英偉達員工們,基于 GPT-5.5 的 OpenAI Codex 現已正式發布,面向所有英偉達員工開放!我們 10000 名員工——涵蓋工程、產品、法務、市場營銷、財務、銷售、人力資源、運營和開發者項目等各個部門——都已提前體驗,并已用它創造了許多令人驚嘆的成果…… Codex 不僅適用于軟件團隊,每個人都應該使用 Codex 智能體。它們是我們的隊友,是讓我們超越以往的超能力。更好、更智能、更快。OpenAl 和英偉達團隊在 Endeavor 中搭建了一個 Codex 實驗室,旨在極大地促進你們的入門學習。未來幾周將舉辦一系列線上研討會。讓我們一起邁向光速時代。歡迎來到人工智能時代。"
深圳夢還注意到,4月24日,深圳技術大學一則推文稱:4月24日上午,深圳技術大學在C3行政樓101報告廳舉行“文化潤心大講堂”,特邀著名經濟學家、澤平宏觀創始人任澤平,為學校師生開講“中國宏觀展望:新周期”主題報告。他特別提到“AI不是風口,是海嘯”等核心觀點,并明確了企業出海、擁抱AI、挖掘新需求的應對路徑。
是的,在深圳,“AI不是風口,是海嘯”,讓我們邁向光速時代!
AI海嘯來了:DeepSeek V4發布,中國AI的"iPhone時刻"
這可能是我們這代人最重要的機遇。4月24日,DeepSeek V4發布,同日OpenAI發布GPT-5.5。兩大模型隔空對決,但這一次,中國的牌不一樣了。
01 黃仁勛說對了
4月15日,英偉達CEO黃仁勛在一檔播客節目中突然拔高音量,說了一句分量很重的話:
"如果DeepSeek先在華為平臺上發布,那對我們國家來說將是災難性的。"
9天后的4月24日,華為昇騰CANN官方開啟直播:DeepSeek V4昇騰首發。
一條微博熱搜瞬間引爆全網——#。
而這場風暴的中心,有一個被很多人忽略的坐標:深圳。
華為總部所在的深圳坂田基地,正是DeepSeek V4與昇騰芯片深度適配的技術策源地。2025年9月,昇騰超節點暨CANN生態合作大會就是在深圳龍崗華為坂田基地舉辦,匯聚了政府部門、龍頭企業、科研院所,共同推動國產算力生態建設。4月24日當天,華為昇騰CANN官方直播也正是在深圳完成"DeepSeek V4昇騰首發"。
黃仁勛真正關注的不是中國做出好模型,而是頂級開源模型不再以英偉達CUDA生態為唯一優化起點。過去二十年,CUDA是全球AI開發的"默認操作系統"——寫代碼、跑模型、做訓練,都繞不開英偉達。而現在,情況正在發生變化。
有趣的是,就在DeepSeek V4發布前后,OpenAI首席執行官薩姆·奧特曼在社交平臺上分享了一封黃仁勛發給英偉達全體員工的內部郵件——黃仁勛在郵件中要求所有員工使用OpenAI的Codex編程工具來輔助日常開發。
一邊在播客中警告"DeepSeek先在華為平臺上發布將是災難性的",一邊在公司內部全力推動員工使用OpenAI的AI編程工具。黃仁勛比任何人都清楚:AI不僅僅是模型競賽,更是生態和工具鏈的全面滲透。
DeepSeek首次在官方技術報告中,把華為昇騰NPU(神經網絡處理器)和英偉達GPU(圖形處理器)寫進了同一份硬件驗證清單——
"我們在英偉達GPU和華為昇騰NPU兩個平臺上均驗證了細粒度EP(專家并行)方案。"
![]()
▲昇騰 950 性能表現(圖源:昇騰 CANN 直播截圖)
這標志著萬億參數級別的模型首次在正式文檔中完成了對國產AI芯片的"官方認定"。全球開發者第一次看到:存在一條不依賴英偉達、同樣可運行萬億參數頂級大模型的完整路徑。
2025財年,英偉達全年營收1305億美元,同比增長114%,數據中心收入達1152億美元,依然是全球AI算力的絕對領導者。但在中國市場,英偉達GPU份額已從巔峰時期的95%降至約55%,國產AI芯片出貨量占比已達41%。兩條技術路線并行發展的格局正在成型。
02 開源的核彈:性能碾壓、價格屠夫
4月24日,AI圈迎來真正的"神仙打架"。
OpenAI發布GPT-5.5,代號"土豆"(Spud),自GPT-4.5以來首次從零重訓,API輸入價5美元、輸出價30美元每百萬Token——價格直接翻倍。
同一天,DeepSeek發布V4預覽版,同步開源,MIT協議,兩個版本任你選:
DeepSeek V4-ProDeepSeek V4-FlashGPT-5.5總參數
1.6萬億
未公開
激活參數
490億
130億
上下文長度
100萬Token
100萬Token
100萬Token
輸入價格(元/百萬Token)
1元
0.2元
約36元
輸出價格(元/百萬Token)
24元
2元
約216元
DeepSeek V4-Flash的輸出價,是GPT-5.5的近百分之一。Pro版約為十分之一。
這不是差一點,這是降維打擊。
更關鍵的是,性能并沒有打折。在核心能力上,DeepSeek V4-Pro在多個基準測試中比肩甚至超越頂級閉源模型:
![]()
MMLU通用知識:92.8分(GPT-5為92.5分)
MMLU-Pro復雜推理:88.5分(GPT-5為87.5分)
HumanEval代碼生成:93.8%(GPT-5為93.4%)
MATH競賽數學:85.2分(GPT-5為84.7分)
SWE-bench真實編程:81.5%(Claude Opus 4.7為80.9%)
Codeforces編程競賽:3206 Elo,相當于人類選手第23名,開源最高
在Agent能力方面,V4-Pro內部評測體驗優于Claude Sonnet 4.5,交付質量接近Opus 4.6非思考模式。在第三方vals.ai榜單上,DeepSeek V4排名開源第一、全球第九。
國產模型性能追平、成本碾壓。這意味著什么?意味著AI開發者的成本門檻即將暴跌,國產AI應用即將迎來大爆發。
2025年,騰訊元寶接入DeepSeek后月活增長265%,豆包應用月活破1億。而V4-Flash 0.2元/百萬Token的價格,相當于讓每一個中小開發者都能以接近零的成本構建自己的AI產品。
深圳是全國最早全面擁抱DeepSeek的城市。早在2025年2月,深圳就基于政務云環境面向全市各區各部門正式提供DeepSeek模型應用服務——超過160家深圳企業接入DeepSeek,28家市屬國企舉辦DeepSeek專題研討會,深圳海事局更是以昇騰910 AI服務器為核心落地了算力底座。從政務系統到水務環保,從金融證券到港口物流,深圳用最實際的動作證明:國產大模型不是概念,而是每天都在運轉的基礎設施。
長文本方面,DeepSeek V4全系標配100萬Token上下文——相當于把整個《三體》三部曲一次性喂給AI。前代128K上下文已是一代人的記憶,如今直接提升近10倍,且通過創新的DSA稀疏注意力機制,在百萬Token場景下,V4-Pro的單token推理FLOPs僅為前代的27%,KV緩存占用僅為10%。
百萬Token,不再是昂貴的高配,而是標準配置。
普惠時代,真的來了。
03 國產算力的"iPhone時刻"
如果價格和性能只是"量變",那么DeepSeek V4與華為昇騰的深度適配,就是真正的"質變"。
4月24日上午,DeepSeek發布V4預覽版。下午,華為官方宣布:昇騰超節點全系列產品全面支持DeepSeek V4。
這不是一次普通的商業合作。這是國產大模型與國產算力的標志性組合,標志著中國AI兩條最粗的腿終于綁在了一起。
華為這次拿出的底牌令人震撼。昇騰Atlas 350加速卡搭載昇騰950PR處理器:
單卡算力達到英偉達H20的2.87倍
HBM容量比H20多出16%(達112GB)
多模態生成速度比H20快60%
國內唯一支持FP4低精度推理
要知道,H20是英偉達專門為中國市場定制的合規版本,算力約為H100的三成。而昇騰950PR的性能接近它的3倍,成本卻僅為三分之一。
在8K輸入場景下實測:昇騰950超節點運行DeepSeek V4-Pro,TPOT延遲僅20ms,單卡吞吐達4700TPS;運行V4-Flash,延遲僅10ms。
華為說這"重新定義了長文本推理的性能天花板"。
DeepSeek官方在備注中寫了一句意味深長的話:"受限于高端算力,目前V4-Pro的服務吞吐仍有限。預計下半年昇騰950超節點批量上市后,Pro版本價格會大幅下調。"
![]()
▲ DeepSeek-V4 技術報告
這意味著什么?意味著下半年國產算力大規模鋪開后,頂級大模型的價格可能還有數倍的下降空間。
04 CUDA之外的選擇:國產GPU集體起跑
DeepSeek V4與國產算力的深度融合,也讓深圳這座"AI先鋒城市"走到了聚光燈下。
2024年3月,深圳"20+8"產業集群2.0版發布,人工智能首次從軟件與信息服務集群中獨立升格,成為7個"戰略重點類"產業集群之一——與半導體、新能源并列,舉全市之力超常規支持。2025年3月,深圳發布《加快打造人工智能先鋒城市行動計劃(2025-2026年)》,提出到2026年實時可用智能算力超過80EFlops,規劃建設十大AI產業集聚區,推出"訓力券""語料券""模型券"降低企業成本。
數據顯示,2025年深圳人工智能核心產業營收約2200億元,集聚典型企業超,2600家,正加速構建全球領先的AI產業生態。產業集聚,頭部企業引領全棧創新在深圳AI產業的“雁首”,華為、騰訊、榮耀等企業持續釋放技術動能。
2026年3月,深圳印發《加快推進人工智能服務器產業鏈高質量發展行動計劃(2026-2028年)》,推動AI服務器全產業鏈——核心芯片、存儲、液冷、高速光模塊——在深圳創新集聚。
深圳在算力上也在全面迎戰:3月26日,深圳市投建的11000P 智能算力集群正式點亮,加上去年先期點亮的3000P,目前該集群已全面建成14000P智能算力。這是全國首個使用全國產先進芯片構建的萬卡級全棧自主可控智算集群。
此次點亮的智能算力集群是全國首個萬卡昇騰910C超節點智算集群,其投運標志著深圳構建自主可控算力底座上取得突破性進展。該項目全部采用國產先進芯片,依托全棧自主可控技術,打造具備國際競爭力的“昇騰+CANN”自主軟硬件生態,有效引導人工智能底層技術創新,推進關鍵技術國產化進程。
值得一提的是,深圳正在打造全棧自主的基礎算力底座。訓練芯片方面,華為構建從芯片、集群、軟件棧、開發框架到行業應用的全棧自主可控AI計算生態,全面對標替代英偉達計算生態,昇騰910系列芯片性能比肩國外主流產品,成為國產AI芯片的主力軍。在端側AI芯片及推理芯片方面,云天勵飛、云豹智能、鯤云科技、墨芯科技等公司相關芯片,已在細分場景實現商業化落地。
回到4月24日。除了華為昇騰,寒武紀、摩爾線程、天數智芯等國產芯片廠商同步宣布Day 0適配。
這不是一家企業在戰斗,是整條國產算力產業鏈在同一天起跑。
2025年,國產AI芯片迎來"豐收之年"。寒武紀首度全年盈利,營收65億元,同比增長453%;天數智芯營收10.34億元,同比增長91.6%;摩爾線程營收15.06億元,同比增長243%;沐曦股份營收16.44億元,同比增長121%。
國產AI芯片出貨量占比已達41%,英偉達份額從95%跌至55%。山西證券研報預測,國產化替代率即將突破50%的關鍵轉折點。
更深層的變化在生態層面。2025年8月,華為宣布CANN(昇騰計算架構)全面開源,對標英偉達的CUDA。目前昇騰生態已吸引超3000家合作伙伴、400萬開發者。阿里通義、字節豆包等頭部大模型已完成從CUDA到CANN的全棧適配。
英偉達CUDA生態經過二十多年積累,擁有成熟的工具鏈和龐大的開發者社區,依然是全球AI開發的主流選擇。而國產算力生態正在快速追趕——從"能用"到"好用"到"主動選擇",完成了三級跳。兩條技術棧并行發展,為全球開發者提供了更多選擇。
05 新架構:花小錢,辦大事
DeepSeek V4之所以能在性能和成本上同時碾壓,核心秘密在于架構創新。
一是MoE混合專家架構——"聰明調度"。
DeepSeek V4-Pro總參數高達1.6萬億,但每次任務僅激活約490億參數——只"喚醒"3%的專家來解決問題。V4-Flash更極致:2840億總參數,只激活130億。
打個比方:如果你的公司有16000名員工,但每次項目只需要調490名最對口的專業人員來干,效率和成本可想而知。
二是混合注意力機制——"兼顧全局與細節"。
V4首創融合兩種注意力機制:CSA(壓縮稀疏注意力)和HCA(重度壓縮注意力)。處理長篇內容時,它既能精準定位關鍵細節,又能快速掌握宏觀大意,算力需求較前代大幅降低。
三是FP4+FP8混合精度——極致壓縮。
V4的MoE專家權重采用FP4精度,恰好是華為昇騰950PR芯片的原生支持精度。這意味著在國產芯片上運行V4,效率反而可能更高。
再加上Muon優化器替代AdamW實現更快收斂、mHC流形約束超連接增強傳統殘差連接、單token推理FLOPs降至前代的27%……
"花小錢,辦大事",DeepSeek用中國智慧定義了AI效率的新標準。
06 這一代人的機遇
回到開頭那個問題:為什么說這是我們這代人最重要的機遇?
因為AI正在從"比誰更聰明"進入"比誰更便宜、更快、更普惠"的新階段。
黃仁勛說:"AI的終極目標,是將廉價的電子轉化為高價值的Token。"2026年全球AI產業進入"商業兌現期",推理算力占比首次超過70%。這意味著AI不再是實驗室里的玩具,而是深入每一個行業、每一個崗位、每一個日常場景的生產力工具。
OpenAI內部超85%員工每周使用GPT-5.5驅動的Codex。英偉達預計AI推理規模很快將達到訓練負載的十億倍。
而當推理成本降到DeepSeek V4-Flash的0.2元/百萬Token時,每一個普通人都能擁有一個幾乎免費的超級AI助手。
2025年中國算力市場規模預計達8351億元,增長30%。上海、湖北、四川等多地智算中心明確要求國產芯片占比超50%。中國移動哈爾濱智算中心已實現100%國產化。
而深圳,正在成為這場AI普惠浪潮的"超級加速器"。
2026年深圳市政府工作報告明確提出:加快建設全球人工智能先鋒城市,人工智能產業集群增加值增長10%以上,加強全棧自主可控AI軟硬件生態建設。深圳開放智算中心位于河套深港科技創新合作區,規劃打造10萬卡級別超強算力集群;鵬城云腦Ⅲ作為國家級AI算力平臺,正建設E級智能算力核心節點。
更關鍵的是,深圳擁有華為(昇騰芯片)、騰訊(云端算力)、大疆(具身智能)、比亞迪(智能駕駛)等一批具備全球競爭力的科技巨頭,以及2800余家AI企業構成的完整產業鏈。當DeepSeek V4這樣的開源"地基"遇上深圳這樣的產業"高樓",從模型到算力、從芯片到應用的全棧國產化閉環,正在這里加速形成。
這不是技術競賽的故事,而是一個萬億級產業從底層到應用全面重構的故事。
07 尾聲:兩條技術棧,兩種未來,AI海嘯已經來了
DeepSeek V4的發布,表面上看是一場模型更新,實質上是AI產業格局的一次深刻變化。
GPT-5.5以5美元/百萬Token輸入、30美元/百萬Token輸出的高端定價,走的是"美國技術棧"——閉源、高價、英偉達綁定、企業級市場。
DeepSeek V4以0.2元/百萬Token輸入、2元/百萬Token輸出的極致定價,走的是"中國技術棧"——開源、普惠、昇騰適配、全民可用。
黃仁勛說,世界分裂為兩個技術生態是"災難性的"。站在產業角度看,他的擔憂有其合理性——全球AI生態的分裂會增加開發成本、降低效率。但站在中國角度看,自主可控的技術棧是產業安全的必然選擇。
2025年7月,黃仁勛在北京接受采訪時說過另一句話:"DeepSeek和通義千問都是世界頂尖的開源大模型。"他還說:"中國在開源方面做得很出色,不僅助力形成中國的人工智能生態,還推動了全球其他地區人工智能生態的構建。"
英偉達CEO預言成真,相信不僅不能成為”災難“,更應該是對全球的重要貢獻。
4月24日這天,DeepSeek V4和GPT-5.5同日上線,被稱為AI圈的"雙王炸"。兩者的定價策略、生態路徑、技術路線,已經勾勒出兩條截然不同的未來圖景。
深圳夢還注意到,4月24日,深圳技術大學一則推文稱:4月24日上午,深圳技術大學在C3行政樓101報告廳舉行“文化潤心大講堂”,特邀著名經濟學家、澤平宏觀創始人任澤平,為學校師生開講“中國宏觀展望:新周期”主題報告中,特別提到“AI不是風口,是海嘯”等核心觀點,簡要分析了中國經濟向高質量轉型、以AI和新能源為核心的第四次科技革命等關鍵特征,并明確了企業出海、擁抱AI、挖掘新需求的應對路徑。
是的,AI海嘯已經來了。
不是看誰能造出最聰明的模型,而是看誰能把最聰明的模型送到最多人手里。
這一次,中國的回答是:開源、普惠、自主。
深圳的回案是:自主、可控、低成本國產算力供給。
本文數據來源:DeepSeek官方API文檔、DeepSeek V4技術報告(58頁)、華為昇騰官方公告、OpenAI官方公告、《2025深圳人工智能產業發展白皮書》、深圳市政府工作報告、深圳特區報、騰訊科技、36氪、21世紀經濟報道等。
部分基準測試數據來自第三方平臺vals.ai和arena.ai,最終以各廠商官方數據為準。
來源:深圳夢(微信號ID:SZeverything)
我們的使命是:星辰大海,只與夢想者同行!
擁有深圳夢,請關注(微信號ID:SZeverything)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.