<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      能跑AI推理的CPU服務器,是如何誕生的

      0
      分享至

      文 | 李薇

      編輯 | 宋辰

      一石激起千層浪。

      DeepSeek點燃了各個行業(yè)對于AI應用的熱情,AI應用在2025年真正進入到了千行百業(yè),創(chuàng)造了非常多實際落地業(yè)務的價值。

      “為搭上這趟‘快車’,所有企業(yè)都在第一時間全力以赴。”作為算力基礎設施提供商,浪潮信息副總經(jīng)理趙帥深刻感受到了這一點,就連春節(jié)假期,都有大量的互聯(lián)網(wǎng)云廠商找到浪潮信息,提出盡快大幅增加采購量。

      大廠很快就購買了大量支持部署滿血版DeepSeek的服務器,但還有很多中小企業(yè)、教育科研機構(gòu),陷入了選擇困境——一方面他們也想用DeepSeek去創(chuàng)造價值,但另一方面部署滿血版DeepSeek的費用非常高,他們也并不需要上千人的高并發(fā)。

      用CPU代替GPU去推理,靠譜嗎?

      1月底,DeepSeek的“大火”剛剛?cè)计饋淼臅r候,由于訓練和推理算力門檻下降,有聲音認為,市場不再需要那么強大的算力了。

      但是,回看第一次工業(yè)革命,瓦特改良的蒸汽機讓煤炭燃燒更加高效,但結(jié)果卻是煤炭需求飆升。這就是“杰文斯悖論”:當技術進步提高了效率,資源消耗不僅沒有減少,反而激增。

      據(jù)IDC數(shù)據(jù)顯示,到2027年,智能算力規(guī)模增長1.7倍,用于推理的工作負載占比72.6%,AI算力需求將面臨巨大的供應缺口,未來所有的算力都需要具有智能的能力。

      全球算力市場正因DeepSeek發(fā)生巨變——DeepSeek讓更多的用戶和場景加入AI當中,帶動了大模型的普及和應用落地,單一模型的訓練和推理算力需求在下降,但由此所帶來的技術普及是更大的算力需求。

      DeepSeek將大模型推理成本壓縮了97%,全球的算力需求卻將因其高性價比反而呈現(xiàn)指數(shù)級膨脹。

      正如英偉達創(chuàng)始人黃仁勛斷言:“AI的計算需求事實上是加速的,模型推理需要的算力消耗比我們當下以為的還要多100倍。”

      事實上,借助分布式架構(gòu),CPU在推理方面的性能表現(xiàn)并不弱。通用CPU服務器憑借其獨特優(yōu)勢,成為中小規(guī)模并發(fā)場景部署DeepSeek-R1 32B、QwQ-32B等新一代大推理模型的最佳選擇。

      在AI模型推理過程中,特別是在大語言模型推理中,對算力的需求尤其突出。不過,由于CPU并不擅長矩陣類的計算指令,一度難以打入AI芯片核心戰(zhàn)場。同樣,CPU服務器部署大模型面臨算力、內(nèi)存容量和帶寬方面的挑戰(zhàn)。

      但當大模型在企業(yè)場景中的應用日趨廣泛,以及與企業(yè)業(yè)務系統(tǒng)的融合更加緊密之時,加上高性能數(shù)據(jù)中心級GPU計算資源稀缺昂貴,CPU成為GPU以外的最優(yōu)選。

      CPU服務器具備卓越的通用性和靈活性,可同時支持AI推理、云計算、數(shù)據(jù)庫等多種工作負載,避免了專用AI硬件的使用局限,為大模型應用與現(xiàn)有IT基礎設施的融合提供了更加靈活、經(jīng)濟的方案,企業(yè)能夠以較低的硬件投入快速實現(xiàn)大模型應用落地。

      此外,通用CPU服務器還有比較成熟的軟件生態(tài)系統(tǒng)、編程工具、開發(fā)工具,容易集成到現(xiàn)有的軟件架構(gòu)當中去。它還具有高可靠性的硬件設計,可以24小時開機,平均無故障時間也較長。

      基于對中小規(guī)模并發(fā)需求的深入理解,浪潮信息于近日推出創(chuàng)新性產(chǎn)品——元腦CPU推理服務器,可高效運行DeepSeek和千問QwQ等新一代大推理模型。

      此次浪潮信息推出的元腦CPU推理服務器NF8260G7和NF8480G7,采用了4顆高性能通用CPU和多通道內(nèi)存系統(tǒng),通過先進的張量并行策略和AMX加速技術,單機即可高效運行DeepSeek-R1 32B和QwQ-32B推理模型,單用戶性能超20 tokens/s,可同時處理20個并發(fā)用戶請求,與云計算、數(shù)據(jù)庫等通用關鍵業(yè)務場景融合提供更高效、更靈活、更穩(wěn)定的AI通用算力支撐。

      更值得一提的是,元腦CPU推理服務器上部署了AIStation、InManage等管理軟件,實現(xiàn)了開箱即用。

      元腦CPU推理服務器不僅大大減輕了中小企業(yè)的負擔,還降低了使用門檻。市面上常見的DeepSeek滿血版一體機的價格均在百萬元以上,甚至達到幾百萬元,用通用CPU服務器去做蒸餾版模型,初始投資可能只需前者的1/10。

      趙帥強調(diào),DeepSeek爆火之后,浪潮信息一系列工作的核心出發(fā)點,就是面向不同用戶的應用場景,開發(fā)高效、易用的產(chǎn)品,為AI大模型的落地提供更好的支撐。

      算力重構(gòu),軟硬協(xié)同先行

      浪潮信息早在去年就做出了一個重要的布局,升級元腦智算品牌,并提出“一切計算皆AI”,即AI會滲透到千行百業(yè),滲透到多種應用場景中去發(fā)揮它的價值。

      “我們會用不同類型的服務器適配客戶不同類型的場景,在客戶不同業(yè)務選擇下都能選擇到最高性價比的產(chǎn)品去做AI。這個是我們最重要的愿景之一。”趙帥表示,“浪潮信息此次推出CPU推理服務器,正是這個愿景在落地當中很重要的一環(huán)。”

      在趙帥看來,AI推理并非一個純硬件的工作,軟硬件協(xié)同優(yōu)化才能讓性能發(fā)揮到極致。所以元腦CPU推理服務器采用張量并行策略和AMX加速技術,大幅提升了模型推理性能和并發(fā)數(shù)。

      另外,由于元腦CPU推理服務器還加入了浪潮信息自研開發(fā)的AIStation平臺,用戶可以根據(jù)自己的應用場景,通過簡單的界面點選當前最適用的平臺。

      這些設計上的小心思,一方面能夠讓用戶挖掘單機本身的推理性能,另一方面又能簡化和降低用戶使用AI的門檻,“這是元腦CPU推理服務器和其他CPU服務器最不一樣的地方”。

      綜合來看,元腦CPU推理服務器采用了多項創(chuàng)新技術:

      算力方面,元腦CPU推理服務器設計上采用4顆32核心英特爾至強處理器6448H,具有AMX(高級矩陣擴展)AI加速功能,支持張量并行計算,并通過多通道內(nèi)存系統(tǒng)設計可支持32組DDR5內(nèi)存,從而在單機具備超強的BF16精度AI推理能力、最大16T內(nèi)存容量和1.2TB/s內(nèi)存帶寬,更好滿足模型權(quán)重、KV Cache等計算和存儲需求,大幅提升大模型推理性能。同時,元腦四路服務器具備高可靠性,可保障關鍵應用和AI推理應用持續(xù)穩(wěn)定運行。

      算法方面,元腦CPU推理服務器對業(yè)界主流的企業(yè)級大模型推理服務框架vLLM進行深度定制優(yōu)化,通過張量并行和內(nèi)存綁定技術,效率最高提升4倍。同時,面對內(nèi)存帶寬的極限挑戰(zhàn),元腦CPU推理服務器為進一步提升解碼性能,采用了AWQ(激活感知權(quán)重量化)技術,實現(xiàn)了2倍解碼性能提升。

      談到浪潮信息對未來AI的布局,趙帥強調(diào):“一方面要重視基礎大模型,另一方面也要重視模型經(jīng)過強化學習或者蒸餾后在千行百業(yè)的落地。浪潮信息也在持續(xù)進行基礎大模型的研究,在基礎大模型領域的算法創(chuàng)新,將賦能我們在不同AI場景中的算力性能提升,通過系統(tǒng)化的創(chuàng)新,用更多產(chǎn)品陣列去滿足不同類型、不同行業(yè)、不同規(guī)模用戶對于AI算力的需求。”

      國家互聯(lián)網(wǎng)辦公室披露的數(shù)據(jù)顯示,截至去年12月,中國已成功通過國家級備案的AI大模型數(shù)量達到了令人矚目的188家。

      華麗的數(shù)字背后,離不開計算產(chǎn)業(yè)的鼎力相助。而AI改變世界的“進度條”,才剛剛開始。

      聲明:個人原創(chuàng),僅供參考

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      毛主席原定1950年舉行開國大典,斯大林得知后變臉:必須立刻改期

      毛主席原定1950年舉行開國大典,斯大林得知后變臉:必須立刻改期

      文史達觀
      2026-05-19 11:23:47
      澳洲14天強硬驅(qū)離!中資16.8億稀土股份被逼出清,北京反擊

      澳洲14天強硬驅(qū)離!中資16.8億稀土股份被逼出清,北京反擊

      紀中百大事
      2026-05-21 09:35:38
      如何看待2025年上海新出生人口僅有10.7萬,評論區(qū)吵翻天…

      如何看待2025年上海新出生人口僅有10.7萬,評論區(qū)吵翻天…

      慧翔百科
      2026-05-21 08:29:04
      白俄羅斯欲參加對烏戰(zhàn)爭?

      白俄羅斯欲參加對烏戰(zhàn)爭?

      高博新視野
      2026-05-20 07:30:16
      天津市人大財政經(jīng)濟委員會原副主任委員苑廣睿被“雙開”

      天津市人大財政經(jīng)濟委員會原副主任委員苑廣睿被“雙開”

      界面新聞
      2026-05-21 16:17:19
      所有發(fā)達國家都有一個共性:人工很貴,勞動很值錢。

      所有發(fā)達國家都有一個共性:人工很貴,勞動很值錢。

      流蘇晚晴
      2026-01-27 18:18:22
      OpenAI徹底震撼數(shù)學界,80年核心猜想被破解!菲爾茲獎得主驚呼坐不穩(wěn)

      OpenAI徹底震撼數(shù)學界,80年核心猜想被破解!菲爾茲獎得主驚呼坐不穩(wěn)

      新智元
      2026-05-21 12:49:57
      普京剛要登機離國,烏克蘭的導彈就來了,誰想壞了中俄的好事?

      普京剛要登機離國,烏克蘭的導彈就來了,誰想壞了中俄的好事?

      漫步獨行俠
      2026-05-22 08:29:11
      其實我們也有合規(guī)的楊梅,只不過被賣到了國外

      其實我們也有合規(guī)的楊梅,只不過被賣到了國外

      黑噪音
      2026-05-20 17:06:54
      《緋聞女孩》女主亮相Fendi派對,經(jīng)典手袋26年后再度翻紅

      《緋聞女孩》女主亮相Fendi派對,經(jīng)典手袋26年后再度翻紅

      生活觀察員啊
      2026-05-21 01:14:21
      巴基斯坦戰(zhàn)略專家:這三場戰(zhàn)爭已表明,中國才是世界最強超級大國

      巴基斯坦戰(zhàn)略專家:這三場戰(zhàn)爭已表明,中國才是世界最強超級大國

      甜美蜜桃派
      2026-05-07 18:35:53
      “100%椰子水”再調(diào)查:又有5款送檢產(chǎn)品均顯示“外源水、糖添加”,涉及這些品牌——

      “100%椰子水”再調(diào)查:又有5款送檢產(chǎn)品均顯示“外源水、糖添加”,涉及這些品牌——

      新京報
      2026-05-20 13:21:02
      比開塞露還管用!這3種“推屎”食物,每天吃一點,清空宿便

      比開塞露還管用!這3種“推屎”食物,每天吃一點,清空宿便

      白宸侃片
      2026-05-19 11:56:50
      艾司唑侖立大功!老人吃艾司唑侖,不止助眠,還有5大獲益

      艾司唑侖立大功!老人吃艾司唑侖,不止助眠,還有5大獲益

      健康之光
      2026-05-19 16:58:40
      范喬丹主動降薪800萬!火箭騰出頂薪空間,沖冠拼圖穩(wěn)了?

      范喬丹主動降薪800萬!火箭騰出頂薪空間,沖冠拼圖穩(wěn)了?

      有態(tài)度的體育小白
      2026-05-22 07:42:51
      其實他才是對華敵意最深的美國總統(tǒng),差一點鎖死咱們的崛起之路

      其實他才是對華敵意最深的美國總統(tǒng),差一點鎖死咱們的崛起之路

      開著車去流浪
      2026-05-15 15:28:45
      法網(wǎng)簽表出爐:鄭欽文獲好簽!首輪戰(zhàn)資格賽選手+與高芙同在2/4區(qū)

      法網(wǎng)簽表出爐:鄭欽文獲好簽!首輪戰(zhàn)資格賽選手+與高芙同在2/4區(qū)

      我愛英超
      2026-05-21 21:01:06
      人到七十,若這五種“欲望”還在,恭喜你,余生仍是春天。

      人到七十,若這五種“欲望”還在,恭喜你,余生仍是春天。

      三農(nóng)老歷
      2026-05-18 15:16:56
      馬浚偉任上市集團CEO年薪252萬,就職首日曬辦公室,屋內(nèi)滿是綠植

      馬浚偉任上市集團CEO年薪252萬,就職首日曬辦公室,屋內(nèi)滿是綠植

      小撇說事
      2026-05-21 01:27:36
      陪玩陪睡根本不夠!認干爹、舔手指,背地里的陰暗面完全藏不住了

      陪玩陪睡根本不夠!認干爹、舔手指,背地里的陰暗面完全藏不住了

      杰絲聊古今
      2026-05-03 13:35:27
      2026-05-22 09:27:00
      大咖科技TechChic incentive-icons
      大咖科技TechChic
      聚焦科技領域,用財經(jīng)視角穿透商業(yè)世界。
      312文章數(shù) 17關注度
      往期回顧 全部

      科技要聞

      三年間,AI研究員從年薪百萬漲到破億

      頭條要聞

      克宮:不排除普京與特朗普11月在中國深圳會晤的可能

      頭條要聞

      克宮:不排除普京與特朗普11月在中國深圳會晤的可能

      體育要聞

      常住人口7000的小鎮(zhèn),擁有了一支德甲球隊

      娛樂要聞

      反轉(zhuǎn)!金秀賢與金賽綸未成年時交往不實

      財經(jīng)要聞

      又一存儲芯片類產(chǎn)品,價格暴漲300%

      汽車要聞

      配1.5L動力/增加新配色 吉利帝豪向上系列將于5月24日上市

      態(tài)度原創(chuàng)

      健康
      數(shù)碼
      家居
      手機
      游戲

      外泌體與干細胞竟是“快遞”與“工廠”的關系?

      數(shù)碼要聞

      投影、音響、云臺三體合一僅800元!哈趣投影儀H3 pro圖賞

      家居要聞

      風格碰撞 個性與藝術

      手機要聞

      OPPO Reno16外觀公布,F(xiàn)ind X9 Ultra哈蘇專業(yè)影像配件套裝開售

      為什么烏魯魯那么CS的干員,卻很少見到三角洲玩家吐槽他?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 久久精品亚洲中文字幕无码网站| 最新日韩精品中文字幕| 亚洲国产精品第一二三区| 亚洲图片视频丝袜| 国产精品99久久久久久董美香| 中文字幕AV无码专区第一页| 在线观看国产亚洲视频免费| 四虎永久精品免费视频| 少妇无码| 亚洲AV日韩AV无码中出| 男人的天堂在线视频| 国产精品真实对白精彩久久| 天天躁日日躁狠狠躁欧美老妇小说| 亚洲日本激情| 国产在线视频一区二区三区| 亚洲涩涩爱| 少妇人妻挤奶水中文视频毛片| 亚洲高清无在码在线电影| 亚洲熟妇自偷自拍另欧美| 国产又色又爽又黄又免费软件| 亚洲制服中文字幕| 真实国产精品视频400部| 亚洲成在人网站天堂大块网| 99热这里| 丁香六月久久婷婷开心| 特黄三级又爽又粗又大| 天天躁日日躁狠狠躁av麻豆| 懂色av一区二区夜夜嗨| 国产精品久久久久久av| 亚洲天堂一区二区| 中文字幕久久精品人妻| 国产综合视频一区二区三区| 日本一区二区三区专线| 操碰网| 久久久久成人精品免费播放动漫| 国产无套无码AⅤ在线观看| A级毛片高清免费视频播放出要看| 精品亚洲一区二区三区四区五区 | 色偷偷免费视频| 少妇把腿扒开让我爽爽视频| 国产真实伦在线观看视频|