![]()
芯東西(公眾號:aichip001)
作者 ZeR0
編輯 漠影
隨著各類智能體應(yīng)用需求爆發(fā),本地工作站成為比云端部署速度更快、成本更低、靈活高效、安全可控的選擇。
對于云邊端如何協(xié)同支撐算力需求,英特爾提出了企業(yè)AI三層部署架構(gòu):
(1)中央級AI服務(wù)器集群:提供規(guī)模化算力底座,支撐多智能體高效協(xié)同與全尺寸大模型推理規(guī)模化推理。
(2)個(gè)人級AI PC:支撐端側(cè)小模型及輕量化智能體運(yùn)行。
(3)部門級/邊緣域AI工作站/服務(wù)器:承載靠近業(yè)務(wù)一線的智能體應(yīng)用與大模型推理,兼顧性能、成本與易用性。
IDC數(shù)據(jù)顯示,AI驅(qū)動(dòng)工作站呈現(xiàn)端側(cè)AI算力快速增強(qiáng)、多元專業(yè)場景全面適配、端云協(xié)同高效聯(lián)動(dòng)、本地?cái)?shù)據(jù)安全持續(xù)強(qiáng)化四大趨勢,預(yù)計(jì)2026年中國AI工作站出貨量同比增長65.2%,占整體工作站市場51.7%。
工作站如何既支撐科學(xué)計(jì)算、金融分析、影像渲染等傳統(tǒng)重負(fù)載工作流運(yùn)轉(zhuǎn),又能滿足大模型推理、智能體部署、內(nèi)容創(chuàng)作及專業(yè)圖形處理的需求?
近日,英特爾給出了它的答案——面向新一代AI工作站的至強(qiáng)600工作站處理器和銳炫Pro B70、B65 GPU顯卡。
![]()
現(xiàn)場演示了基于1顆至強(qiáng)698X處理器,接入云端大模型,容器化部署80只“龍蝦”智能體,幫助企業(yè)實(shí)現(xiàn)本地高密度智能體的中心化托管。這些“龍蝦”能并行運(yùn)行多輪問答任務(wù),共同完成一個(gè)復(fù)雜的智能體任務(wù)。
如果在至強(qiáng)698X的基礎(chǔ)上,額外引入4張銳炫Pro B70顯卡,容器化部署高密度智能體及擁有800億參數(shù)的本地大模型,可以讓24只“龍蝦”智能體通過本地“蝦腦”并行監(jiān)控24只個(gè)股,每隔10秒完成一輪迭代,這樣只需小時(shí)級別的時(shí)間,就能分析完所有個(gè)股。
至此,英特爾銳炫Pro B系列已集齊4款產(chǎn)品:半高單槽的B50(16GB)、主力B60(24GB)、進(jìn)階B65(32GB/20 Xe核心)和旗艦B70(32GB/32 Xe核心)。
![]()
英特爾市場營銷集團(tuán)副總裁、中國區(qū)總經(jīng)理郭威談道,AI落地路徑正走向多元,不再局限于云端服務(wù)等單一模式,大量高算力、重負(fù)載的AI生產(chǎn)力工作發(fā)生在企業(yè)部門的一線場景,高性能工作站正是這類用戶的理想平臺,讓AI從概念走向桌面生產(chǎn)力。
英特爾中國區(qū)技術(shù)部總經(jīng)理高宇分享說,工作站市場是一個(gè)持續(xù)成長的藍(lán)海,英特爾看到近兩年工作站市場呈現(xiàn)爆發(fā)式成長的勢頭。至強(qiáng)600HR和銳炫Pro B70共同為新一代AI工作站構(gòu)筑了更完整、更穩(wěn)固的底座。
![]()
▲英特爾中國區(qū)技術(shù)部總經(jīng)理高宇展示新品
一、至強(qiáng)600:性能、擴(kuò)展、AI、管理四管齊下
通過至強(qiáng)600系列,英特爾將數(shù)據(jù)中心級至強(qiáng)6家族的架構(gòu)能力完整下放至工作站平臺。
英特爾至強(qiáng)600工作站處理器采用模塊化Chiplet架構(gòu),兩個(gè)IO Chiplet和多個(gè)計(jì)算Die組成一個(gè)完整CPU,主要特點(diǎn)包括:
![]()
(1)性能:最高配備86個(gè)性能核,最高支持4TB內(nèi)存,相比上一代旗艦處理器,多線程性能較上代提升高達(dá)61%,單線程性能提升9%,睿頻最高可達(dá)4.8GHz。
![]()
(2)擴(kuò)展:支持128條PCIe 5.0通道,配合W890芯片組,提供豐富靈活的擴(kuò)展能力;8通道DDR5內(nèi)存,支持6400MT/s DDR5RDIMM、8000MT/sMRDIMM內(nèi)存;首次將CXL 2.0服務(wù)器技術(shù)引入工作站,可快擴(kuò)CXL內(nèi)存池,實(shí)現(xiàn)更高效的KV cache的off loading,加速AI推理。
(3)AI:每核內(nèi)置英特爾AMX引擎,新增FP16原生支持,AI與機(jī)器學(xué)習(xí)性能提升最高達(dá)17%,圖像降噪等典型影像處理場景速度提升高達(dá)4至5倍,可有效降低企業(yè)本地AI部署的門檻與TCO。
![]()
(4)管理:依托英特爾vPro技術(shù)體系,支持多種管理特性、多密鑰內(nèi)存加密與一鍵恢復(fù)等企業(yè)級功能,適配塔式、機(jī)架式及邊緣等多種部署形態(tài),滿足企業(yè)靈活運(yùn)維的需求。
![]()
該平臺還繼承了英特爾高可用的基因,通過4大類48項(xiàng)RAS功能加固了平臺的穩(wěn)定性,為關(guān)鍵任務(wù)保駕護(hù)航。
![]()
據(jù)英特爾披露,對比上一代至強(qiáng)W3595X工作站,新一代至強(qiáng)698X工作站在運(yùn)行中尺度氣象研究和預(yù)測模型WRF時(shí)加速87%,運(yùn)行AlphaFold 3蛋白質(zhì)預(yù)測時(shí)加速44%,運(yùn)行由英特爾開源的AI圖像降噪庫Open Image Denoise(OIDN)時(shí)加速400%。
“得益于AMX和AVX512指令集加持,以及英特爾提供的OpenVINO和OneAPI工具套件,可以實(shí)現(xiàn)CPU對AI的直接推理加速,再配合上這個(gè)平臺可以直接支持8張PCIe 5.0 x16的GPU的能力,至強(qiáng)600平臺是目前AI工作站的最佳選擇。”高宇說。
他在會后的媒體采訪期間透露,后續(xù)至強(qiáng)還將支持?jǐn)?shù)據(jù)傳輸速率達(dá)到12800MT/s的MRDIMM,這對AI及HPC(高性能計(jì)算)工作負(fù)載都很重要。
英特爾中國區(qū)顯卡和AI高級產(chǎn)品總監(jiān)徐金平補(bǔ)充說,銳炫Pro B70的價(jià)格也很有競爭力,同時(shí)英特爾正持續(xù)加大對新模型、新生態(tài)的投入。
二、銳炫Pro B70:大顯存、長窗口、高并發(fā)
英特爾銳炫Pro B70顯卡基于第二代Xe2架構(gòu),配備32GB顯存,AI算力峰值高達(dá)367TOPS,對圖形渲染、通用并行計(jì)算與AI加速計(jì)算等專業(yè)工作負(fù)載都進(jìn)行了專項(xiàng)優(yōu)化。
銳炫Pro B65同樣搭載32GB顯存,提供197TOPS算力,價(jià)格更親民,面向?qū)︼@存敏感但算力需求適中的用戶群。
![]()
銳炫Pro B70的架構(gòu)設(shè)計(jì)有如下重點(diǎn):
- 搭載32個(gè)Xe核心,每個(gè)Xe核心有8個(gè)向量處理核心(XVE)和8個(gè)矩陣計(jì)算核心(XMX),延續(xù)了Xe架構(gòu)在通用并行計(jì)算上的能力,并對數(shù)據(jù)吞吐和執(zhí)行效率做了提升。
- 32個(gè)光線追蹤單元,通過物理引擎處理實(shí)時(shí)光追計(jì)算。
- 強(qiáng)大的視頻編解碼和后處理單元,對很多最新視頻格式都實(shí)現(xiàn)了硬編硬解。
面向AI推理需求,銳炫Pro B70在AI推理場景中支持更大規(guī)模的AI模型與更長的上下文窗口,可在多用戶并發(fā)場景下支持高吞吐量與快速響應(yīng)。
![]()
面向多樣化部署需求,該顯卡支持SR-IOV虛擬化與50余家ISV軟件認(rèn)證,可靈活擴(kuò)展多卡配置,配合完整的Linux軟件棧(含vLLM、oneAPI、PyTorch)。
銳炫Pro B70運(yùn)行11款專業(yè)GPU應(yīng)用上的表現(xiàn)如下圖所示,對比B60提升顯著,并完成了針對這些專業(yè)軟件的適配和認(rèn)證,確保長期跑得穩(wěn)、結(jié)果可信、功能完整且與實(shí)際工作流高度兼容。
![]()
現(xiàn)場演示了基于銳炫Pro B70的多項(xiàng)本地AI應(yīng)用效果:
(1)文生圖:一臺本地筆記本連接到Demo區(qū)的一臺4卡銳炫Pro B70工作站,在ComfyUI工作區(qū)上,僅用3.9秒,就生成了一張1024×1024的高清圖片。單張銳炫Pro B70顯卡僅需不到30秒,就能生成一張4K分辨率的高清圖。
(2)圖生圖:基于單卡銳炫Pro B70,亦心科技AI閃繪應(yīng)用能將手繪草圖近乎實(shí)時(shí)地繪制成高清設(shè)計(jì)大作。
(3)圖生視頻:使用單張銳炫Pro B70,在本地運(yùn)行Wan 2.2 I2V-18B FP8開源模型,92秒生成一段5秒480P視頻。
(4)“龍蝦”智能體:基于酷睿Ultra加單張銳炫Pro B70的個(gè)人龍蝦工作站方案,運(yùn)行本地Qwen 3.5-35B A3B量化模型,去模擬小說續(xù)寫場景,可輕松支撐128K或256K滿上下文推理。
![]()
知名車評人、旅行家韓路重點(diǎn)夸了銳炫Pro B70的視頻編解碼性能。對于重型視頻節(jié)目,大概有10-20軌4K 60的素材并行,如果顯卡解碼能力不行,拖拽時(shí)會特別慢,使用銳炫Pro B70后提效顯著,剪輯同事反饋說拖拽很流暢。
還有一些面向企業(yè)級應(yīng)用場景的案例:
(1)多路視頻會議:聯(lián)想智能會議系統(tǒng)Lenovo SCH-900S搭載銳炫Pro B70,可實(shí)現(xiàn)20路多會議室并發(fā)接入與實(shí)時(shí)AI會議紀(jì)要的生成,顯著提升溝通效率與執(zhí)行落地速度。
(2)長上下文RAG解決方案:借助英特爾銳炫Pro B70多卡并發(fā)能力,飛致云面向企業(yè)級場景的長上下文RAG解決方案可支持LLM/VLM高效多卡并發(fā)推理。飛致云展示了基于MaxKB平臺的測試數(shù)據(jù),2卡銳炫Pro B70運(yùn)行14B模型可支持24路并發(fā),8卡運(yùn)行32B模型可支持60路并發(fā),且每路響應(yīng)速度保持在15TPS及以上。
![]()
(3)電子病歷智能體方案:東華醫(yī)為在8卡B70服務(wù)器上部署電子病歷智能體,病歷輔助生成性能較B60提升至8倍,病歷內(nèi)涵質(zhì)控提升67%,2-3臺8卡B70可滿足一家中等規(guī)模三甲醫(yī)院的需求,可助力醫(yī)療機(jī)構(gòu)提升診療質(zhì)量和效率。
此外,英特爾與火山引擎共同打造了AgentSphere一體機(jī)聯(lián)合方案。借助英特爾至強(qiáng)600與銳炫Pro B70,AgentSphere具備了更高并發(fā)、更低時(shí)延、更少抖動(dòng)的多智能體協(xié)同能力,同時(shí)開箱即用的標(biāo)準(zhǔn)一體機(jī)方案降低了AI落地企業(yè)的使用門檻與維護(hù)成本,能夠更便捷地幫助企業(yè)打造AI員工管理平臺,提升生產(chǎn)效率。
![]()
針對工業(yè)界AI軟件棧迭代速度快、軟件復(fù)雜度高、性能優(yōu)化繁瑣等問題,英特爾采用了容器化交付全棧軟件的方式,最大程度保證用戶安裝即可用。
![]()
英特爾會持續(xù)分階段發(fā)布和更新組件中的升級包,對全新模型和全新kernel的第一時(shí)間支持。
結(jié)語:智能體需求爆發(fā),工作站成企業(yè)級剛需平臺
作為企業(yè)級智能體和大模型推理落地的必要平臺之一,工作站憑借就近部署、靈活高效、高性價(jià)比、隱私安全、更加輕量的IT運(yùn)維要求、服務(wù)器級別的性能穩(wěn)定保證等優(yōu)勢,正成為AI算力基礎(chǔ)設(shè)施中不可或缺的一層。
英特爾AI工作站的核心價(jià)值源于開放協(xié)同的產(chǎn)業(yè)生態(tài)。英特爾聯(lián)合全體生態(tài)伙伴,打造從底層算力到行業(yè)場景的完整價(jià)值鏈路,既聯(lián)動(dòng)協(xié)同軟件與模型合作伙伴,又與行業(yè)伙伴共同探索在金融、制造、科研、創(chuàng)意等領(lǐng)域的創(chuàng)新解決方案,以幫助各行各業(yè)切實(shí)應(yīng)對大模型部署成本高、數(shù)據(jù)安全與響應(yīng)效率等現(xiàn)實(shí)挑戰(zhàn),將技術(shù)創(chuàng)新轉(zhuǎn)化為生產(chǎn)力。
在更宏觀的市場層面,CPU缺貨仍將持續(xù)。高宇坦言,受智能體需求爆發(fā)影響,內(nèi)存需求與CPU需求都在上漲,CPU需求增速已超越業(yè)內(nèi)幾乎所有人原來的預(yù)判,預(yù)計(jì)要等大量擴(kuò)產(chǎn)和需求下滑后才能緩解供需缺口。
在工作站形態(tài)方面,英特爾正推動(dòng)液冷、超靜音和小型化:單卡方案目標(biāo)機(jī)箱做到8L以內(nèi)、噪音35dB以下,雙卡機(jī)箱做到14L以內(nèi)、噪音40dB以下,4卡機(jī)箱做到35L以內(nèi)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.