網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

讓80只“龍蝦”并排干活，AI工作站需要什么樣的芯片？

2026-04-29 16:24:38　來源: 芯東西

北京舉報(bào)

分享至

芯東西（公眾號：aichip001）
作者 ZeR0
編輯漠影

隨著各類智能體應(yīng)用需求爆發(fā)，本地工作站成為比云端部署速度更快、成本更低、靈活高效、安全可控的選擇。

對于云邊端如何協(xié)同支撐算力需求，英特爾提出了企業(yè)AI三層部署架構(gòu)：

（1）中央級AI服務(wù)器集群：提供規(guī)模化算力底座，支撐多智能體高效協(xié)同與全尺寸大模型推理規(guī)模化推理。

（2）個(gè)人級AI PC：支撐端側(cè)小模型及輕量化智能體運(yùn)行。

（3）部門級/邊緣域AI工作站/服務(wù)器：承載靠近業(yè)務(wù)一線的智能體應(yīng)用與大模型推理，兼顧性能、成本與易用性。

IDC數(shù)據(jù)顯示，AI驅(qū)動(dòng)工作站呈現(xiàn)端側(cè)AI算力快速增強(qiáng)、多元專業(yè)場景全面適配、端云協(xié)同高效聯(lián)動(dòng)、本地?cái)?shù)據(jù)安全持續(xù)強(qiáng)化四大趨勢，預(yù)計(jì)2026年中國AI工作站出貨量同比增長65.2%，占整體工作站市場51.7%。

工作站如何既支撐科學(xué)計(jì)算、金融分析、影像渲染等傳統(tǒng)重負(fù)載工作流運(yùn)轉(zhuǎn)，又能滿足大模型推理、智能體部署、內(nèi)容創(chuàng)作及專業(yè)圖形處理的需求？

近日，英特爾給出了它的答案——面向新一代AI工作站的至強(qiáng)600工作站處理器和銳炫Pro B70、B65 GPU顯卡。

現(xiàn)場演示了基于1顆至強(qiáng)698X處理器，接入云端大模型，容器化部署80只“龍蝦”智能體，幫助企業(yè)實(shí)現(xiàn)本地高密度智能體的中心化托管。這些“龍蝦”能并行運(yùn)行多輪問答任務(wù)，共同完成一個(gè)復(fù)雜的智能體任務(wù)。

如果在至強(qiáng)698X的基礎(chǔ)上，額外引入4張銳炫Pro B70顯卡，容器化部署高密度智能體及擁有800億參數(shù)的本地大模型，可以讓24只“龍蝦”智能體通過本地“蝦腦”并行監(jiān)控24只個(gè)股，每隔10秒完成一輪迭代，這樣只需小時(shí)級別的時(shí)間，就能分析完所有個(gè)股。

至此，英特爾銳炫Pro B系列已集齊4款產(chǎn)品：半高單槽的B50（16GB）、主力B60（24GB）、進(jìn)階B65（32GB/20 Xe核心）和旗艦B70（32GB/32 Xe核心）。

英特爾市場營銷集團(tuán)副總裁、中國區(qū)總經(jīng)理郭威談道，AI落地路徑正走向多元，不再局限于云端服務(wù)等單一模式，大量高算力、重負(fù)載的AI生產(chǎn)力工作發(fā)生在企業(yè)部門的一線場景，高性能工作站正是這類用戶的理想平臺，讓AI從概念走向桌面生產(chǎn)力。

英特爾中國區(qū)技術(shù)部總經(jīng)理高宇分享說，工作站市場是一個(gè)持續(xù)成長的藍(lán)海，英特爾看到近兩年工作站市場呈現(xiàn)爆發(fā)式成長的勢頭。至強(qiáng)600HR和銳炫Pro B70共同為新一代AI工作站構(gòu)筑了更完整、更穩(wěn)固的底座。

▲英特爾中國區(qū)技術(shù)部總經(jīng)理高宇展示新品

一、至強(qiáng)600：性能、擴(kuò)展、AI、管理四管齊下

通過至強(qiáng)600系列，英特爾將數(shù)據(jù)中心級至強(qiáng)6家族的架構(gòu)能力完整下放至工作站平臺。

英特爾至強(qiáng)600工作站處理器采用模塊化Chiplet架構(gòu)，兩個(gè)IO Chiplet和多個(gè)計(jì)算Die組成一個(gè)完整CPU，主要特點(diǎn)包括：

（1）性能：最高配備86個(gè)性能核，最高支持4TB內(nèi)存，相比上一代旗艦處理器，多線程性能較上代提升高達(dá)61%，單線程性能提升9%，睿頻最高可達(dá)4.8GHz。

（2）擴(kuò)展：支持128條PCIe 5.0通道，配合W890芯片組，提供豐富靈活的擴(kuò)展能力；8通道DDR5內(nèi)存，支持6400MT/s DDR5RDIMM、8000MT/sMRDIMM內(nèi)存；首次將CXL 2.0服務(wù)器技術(shù)引入工作站，可快擴(kuò)CXL內(nèi)存池，實(shí)現(xiàn)更高效的KV cache的off loading，加速AI推理。

（3）AI：每核內(nèi)置英特爾AMX引擎，新增FP16原生支持，AI與機(jī)器學(xué)習(xí)性能提升最高達(dá)17%，圖像降噪等典型影像處理場景速度提升高達(dá)4至5倍，可有效降低企業(yè)本地AI部署的門檻與TCO。

（4）管理：依托英特爾vPro技術(shù)體系，支持多種管理特性、多密鑰內(nèi)存加密與一鍵恢復(fù)等企業(yè)級功能，適配塔式、機(jī)架式及邊緣等多種部署形態(tài)，滿足企業(yè)靈活運(yùn)維的需求。

該平臺還繼承了英特爾高可用的基因，通過4大類48項(xiàng)RAS功能加固了平臺的穩(wěn)定性，為關(guān)鍵任務(wù)保駕護(hù)航。

據(jù)英特爾披露，對比上一代至強(qiáng)W3595X工作站，新一代至強(qiáng)698X工作站在運(yùn)行中尺度氣象研究和預(yù)測模型WRF時(shí)加速87%，運(yùn)行AlphaFold 3蛋白質(zhì)預(yù)測時(shí)加速44%，運(yùn)行由英特爾開源的AI圖像降噪庫Open Image Denoise（OIDN）時(shí)加速400%。

“得益于AMX和AVX512指令集加持，以及英特爾提供的OpenVINO和OneAPI工具套件，可以實(shí)現(xiàn)CPU對AI的直接推理加速，再配合上這個(gè)平臺可以直接支持8張PCIe 5.0 x16的GPU的能力，至強(qiáng)600平臺是目前AI工作站的最佳選擇。”高宇說。

他在會后的媒體采訪期間透露，后續(xù)至強(qiáng)還將支持?jǐn)?shù)據(jù)傳輸速率達(dá)到12800MT/s的MRDIMM，這對AI及HPC（高性能計(jì)算）工作負(fù)載都很重要。

英特爾中國區(qū)顯卡和AI高級產(chǎn)品總監(jiān)徐金平補(bǔ)充說，銳炫Pro B70的價(jià)格也很有競爭力，同時(shí)英特爾正持續(xù)加大對新模型、新生態(tài)的投入。

二、銳炫Pro B70：大顯存、長窗口、高并發(fā)

英特爾銳炫Pro B70顯卡基于第二代Xe2架構(gòu)，配備32GB顯存，AI算力峰值高達(dá)367TOPS，對圖形渲染、通用并行計(jì)算與AI加速計(jì)算等專業(yè)工作負(fù)載都進(jìn)行了專項(xiàng)優(yōu)化。

銳炫Pro B65同樣搭載32GB顯存，提供197TOPS算力，價(jià)格更親民，面向?qū)︼@存敏感但算力需求適中的用戶群。

銳炫Pro B70的架構(gòu)設(shè)計(jì)有如下重點(diǎn)：

搭載32個(gè)Xe核心，每個(gè)Xe核心有8個(gè)向量處理核心（XVE）和8個(gè)矩陣計(jì)算核心（XMX），延續(xù)了Xe架構(gòu)在通用并行計(jì)算上的能力，并對數(shù)據(jù)吞吐和執(zhí)行效率做了提升。
32個(gè)光線追蹤單元，通過物理引擎處理實(shí)時(shí)光追計(jì)算。
強(qiáng)大的視頻編解碼和后處理單元，對很多最新視頻格式都實(shí)現(xiàn)了硬編硬解。

面向AI推理需求，銳炫Pro B70在AI推理場景中支持更大規(guī)模的AI模型與更長的上下文窗口，可在多用戶并發(fā)場景下支持高吞吐量與快速響應(yīng)。

面向多樣化部署需求，該顯卡支持SR-IOV虛擬化與50余家ISV軟件認(rèn)證，可靈活擴(kuò)展多卡配置，配合完整的Linux軟件棧（含vLLM、oneAPI、PyTorch）。

銳炫Pro B70運(yùn)行11款專業(yè)GPU應(yīng)用上的表現(xiàn)如下圖所示，對比B60提升顯著，并完成了針對這些專業(yè)軟件的適配和認(rèn)證，確保長期跑得穩(wěn)、結(jié)果可信、功能完整且與實(shí)際工作流高度兼容。

現(xiàn)場演示了基于銳炫Pro B70的多項(xiàng)本地AI應(yīng)用效果：

（1）文生圖：一臺本地筆記本連接到Demo區(qū)的一臺4卡銳炫Pro B70工作站，在ComfyUI工作區(qū)上，僅用3.9秒，就生成了一張1024×1024的高清圖片。單張銳炫Pro B70顯卡僅需不到30秒，就能生成一張4K分辨率的高清圖。

（2）圖生圖：基于單卡銳炫Pro B70，亦心科技AI閃繪應(yīng)用能將手繪草圖近乎實(shí)時(shí)地繪制成高清設(shè)計(jì)大作。

（3）圖生視頻：使用單張銳炫Pro B70，在本地運(yùn)行Wan 2.2 I2V-18B FP8開源模型，92秒生成一段5秒480P視頻。

（4）“龍蝦”智能體：基于酷睿Ultra加單張銳炫Pro B70的個(gè)人龍蝦工作站方案，運(yùn)行本地Qwen 3.5-35B A3B量化模型，去模擬小說續(xù)寫場景，可輕松支撐128K或256K滿上下文推理。

知名車評人、旅行家韓路重點(diǎn)夸了銳炫Pro B70的視頻編解碼性能。對于重型視頻節(jié)目，大概有10-20軌4K 60的素材并行，如果顯卡解碼能力不行，拖拽時(shí)會特別慢，使用銳炫Pro B70后提效顯著，剪輯同事反饋說拖拽很流暢。

還有一些面向企業(yè)級應(yīng)用場景的案例：

（1）多路視頻會議：聯(lián)想智能會議系統(tǒng)Lenovo SCH-900S搭載銳炫Pro B70，可實(shí)現(xiàn)20路多會議室并發(fā)接入與實(shí)時(shí)AI會議紀(jì)要的生成，顯著提升溝通效率與執(zhí)行落地速度。

（2）長上下文RAG解決方案：借助英特爾銳炫Pro B70多卡并發(fā)能力，飛致云面向企業(yè)級場景的長上下文RAG解決方案可支持LLM/VLM高效多卡并發(fā)推理。飛致云展示了基于MaxKB平臺的測試數(shù)據(jù)，2卡銳炫Pro B70運(yùn)行14B模型可支持24路并發(fā)，8卡運(yùn)行32B模型可支持60路并發(fā)，且每路響應(yīng)速度保持在15TPS及以上。

（3）電子病歷智能體方案：東華醫(yī)為在8卡B70服務(wù)器上部署電子病歷智能體，病歷輔助生成性能較B60提升至8倍，病歷內(nèi)涵質(zhì)控提升67%，2-3臺8卡B70可滿足一家中等規(guī)模三甲醫(yī)院的需求，可助力醫(yī)療機(jī)構(gòu)提升診療質(zhì)量和效率。

此外，英特爾與火山引擎共同打造了AgentSphere一體機(jī)聯(lián)合方案。借助英特爾至強(qiáng)600與銳炫Pro B70，AgentSphere具備了更高并發(fā)、更低時(shí)延、更少抖動(dòng)的多智能體協(xié)同能力，同時(shí)開箱即用的標(biāo)準(zhǔn)一體機(jī)方案降低了AI落地企業(yè)的使用門檻與維護(hù)成本，能夠更便捷地幫助企業(yè)打造AI員工管理平臺，提升生產(chǎn)效率。

針對工業(yè)界AI軟件棧迭代速度快、軟件復(fù)雜度高、性能優(yōu)化繁瑣等問題，英特爾采用了容器化交付全棧軟件的方式，最大程度保證用戶安裝即可用。

英特爾會持續(xù)分階段發(fā)布和更新組件中的升級包，對全新模型和全新kernel的第一時(shí)間支持。

結(jié)語：智能體需求爆發(fā)，工作站成企業(yè)級剛需平臺

作為企業(yè)級智能體和大模型推理落地的必要平臺之一，工作站憑借就近部署、靈活高效、高性價(jià)比、隱私安全、更加輕量的IT運(yùn)維要求、服務(wù)器級別的性能穩(wěn)定保證等優(yōu)勢，正成為AI算力基礎(chǔ)設(shè)施中不可或缺的一層。

英特爾AI工作站的核心價(jià)值源于開放協(xié)同的產(chǎn)業(yè)生態(tài)。英特爾聯(lián)合全體生態(tài)伙伴，打造從底層算力到行業(yè)場景的完整價(jià)值鏈路，既聯(lián)動(dòng)協(xié)同軟件與模型合作伙伴，又與行業(yè)伙伴共同探索在金融、制造、科研、創(chuàng)意等領(lǐng)域的創(chuàng)新解決方案，以幫助各行各業(yè)切實(shí)應(yīng)對大模型部署成本高、數(shù)據(jù)安全與響應(yīng)效率等現(xiàn)實(shí)挑戰(zhàn)，將技術(shù)創(chuàng)新轉(zhuǎn)化為生產(chǎn)力。

在更宏觀的市場層面，CPU缺貨仍將持續(xù)。高宇坦言，受智能體需求爆發(fā)影響，內(nèi)存需求與CPU需求都在上漲，CPU需求增速已超越業(yè)內(nèi)幾乎所有人原來的預(yù)判，預(yù)計(jì)要等大量擴(kuò)產(chǎn)和需求下滑后才能緩解供需缺口。

在工作站形態(tài)方面，英特爾正推動(dòng)液冷、超靜音和小型化：單卡方案目標(biāo)機(jī)箱做到8L以內(nèi)、噪音35dB以下，雙卡機(jī)箱做到14L以內(nèi)、噪音40dB以下，4卡機(jī)箱做到35L以內(nèi)。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.