![]()
回望人類信息技術發展 史,通信與計算是兩條并行奔涌的河流。通信行業以香農定律為指引,在有限的頻譜中求索比特的極限;計算行業則在這四十年間沿著摩爾定律的陡峭曲線,將晶體管密度推向物理邊緣。
長期以來,這兩大領域雖然通過數據產生交集,但在基礎設施層面卻涇渭分明。通信運營商追求“電信級”可靠的系統,構建了一個由專用硬件組成的封閉帝國,穿越這個帝國,抵達的卻是由通用服務器構建的信息世界。
為打破這種藩籬,近年來基于通用服務器的虛擬化無線接入網(vRAN)開始出現。然而由于成本、功耗、生態等各種問題,vRAN的發展始終舉步維艱。如今,隨著AI的高歌猛進,AI和RAN的加速融合,并被認為是6G的核心技術之一。
RAN的發展歷程:從專用到通用
在 2G 到 4G 的漫長歲月里,基站一直是以“黑盒”形態存在的。在基站的核心設備BBU(基帶處理單元)內部,運行著基于專用芯片(ASIC)的傳統算法。設備的硬件、軟件只能用于特定功能,并且和供應商高度綁定。
ASIC 是為通信協議量身定做的,其優勢在于極致的效率和功耗控制。然而,這種極致的專用性也是其最大的弱點:系統極度封閉,缺少靈活性。白天上網的人多了可能擁塞,到了深夜又太閑了需要關閉設備來省電;技術升級了,設備就要隨著更新換代;供應商換了,全套設備也都得跟著替換。
為了解決這個痼疾,業界近年來提出了 vRAN的概念。vRAN 的理想是用通用的 COTS(商用現貨)服務器取代專用的BBU,即通過軟硬件解耦件來實現基站的功能。然而這一理想卻在實施的過程中撞上了“算力墻”。
這是因為通用 CPU 擅長的是邏輯控制,面對 5G 物理層(又叫層1或者L1)那海量的并行信號處理任務時,表現得捉襟見肘。為了彌補CPU的不足,vRAN 不得不引入 FPGA或者ASIC加速卡來處理物理層任務。
FPGA因其可編程,是一種半專用硬件;ASIC則是純純的專用硬件。也就是說,vRAN是一種不徹底的軟硬件解耦,雖然服務器通用了,但還得插一塊專用的加速卡,物理層軟件和加速卡深度綁定,依然采用的是傳統算法。
在這種架構下,數據要在 CPU 和加速卡之間頻繁搬運,使 vRAN的性能始終難以跟傳統基站抗衡。雖然后續vRAN方案幾經更新,性能有了很大提升,但加速卡依然是高度專用的,這違背了“通用算力”的初衷,只是把“黑盒子”變小了塞進了服務器里。
正是在這種形勢下,英偉達提出了采用GPU加速的AI-RAN。
通信物理層的本質是大規模的線性代數計算,這與 AI 深度學習的范式驚人地一致。如果能用擅長并行計算的 GPU來作為加速卡,不僅能將AI引入通信物理層處理,處性能更好,還能利用 GPU 的通用性來對外提供AI服務,徹底改變基站的商業模式。
英偉達的GPU 內部擁有數千個 CUDA 核心,以及專門為矩陣運算設計的 Tensor Core(張量核心)。在 AI-RAN 架構中,當海量的數據涌入時,GPU 能夠啟動成千上萬個線程,以 單指令多數據的方式,在同一時鐘周期內對所有數據進行并行處理。特別是 Tensor Core 的引入,使得本來需要消耗大量時鐘周期的矩陣乘累加運算能夠在瞬間完成。
就這樣,上層由CPU進行管理調度,下層由GPU進行密集計算,形成了CPU+GPU的異構計算架構。GPU 在作為加速器處理 5G L1 層算法時,展現出了比 CPU 高出數個數量級的能效比和計算密度。并且,由于GPU是通用硬件,也同時帶來了無與倫比的靈活性。
在英偉達的構想中,未來的基站在網絡繁忙時是高性能的6G 基站,而在網絡空閑時,則搖身一變成為 AI 推理節點,為自動駕駛、智慧城市或云游戲提供算力。這種“一魚多吃”的資源復用模式,有可能從根本上重構電信基礎設施的投資回報模型。
英偉達的AI-RAN:從理想到現實
在無線網絡中,為了達到覆蓋效果,基站塔頂的射頻單元(即RRU)必須散布在各個角落,方便提供無縫覆蓋。跟射頻相連的基帶部分(即BBU)則有兩種選擇,如果跟RRU一樣放在鐵塔下方的機柜里,則為分布式部署(即D-RAN);如果把多個BBU放在中心機房里,用光纖分別接到多個基站上,則為集中式部署(即C-RAN)。
在2024年10月,英偉達推出了第一代產品:面向C-RAN部署場景的ARC-1。ARC-1的能力很強,可支持36個100 MHz 64T64R載波,功耗高達3500瓦。英偉達強調,它可以同時用于RAN和AI服務,并且算力可以靈活調配。
![]()
英偉達 ARC-1
![]()
英偉達 ARC-1系統架構
2025年5月,英偉達發布了面向D-RAN的低成本產品:ARC-Compact。ARC-Compact 由英偉達的Grace CPU 配合L4 GPU 構成。 L4 GPU的尺寸為單槽、半高半長,體積小, 功耗低,適合處理單站數據。 ARC-Compact支持5G,并且 可軟件升級至6G。
![]()
英偉達 ARC-Compact
![]()
英偉達 ARC-Compact系統架構
2025年10月,英偉達發布了ARC-Compact的升級版:ARC-Pro。ARC-Pro的CPU和ARC-Compact相同,GPU則升級到了Blackwell架構的GPU,引入了FP4 (4位浮點)和FP6精度,推理速度更快,內存占用更少。ARC-Pro可以支持6G新頻段以及更高階的Massive MIMO,比如256TR等。
![]()
英偉達 ARC-Pro
![]()
英偉達 ARC-Pro系統架構
英偉達產品AI-RAN產品一覽表
ARC-1ARC-CompactAC-Pro發布時間
2024年10月
2025年5月
2025年10月
平臺
GB200 NVL2: 2x Grace CPU (144 ARMv9 cores) + 2x Blackwell dual-die GPU (40 PFLOPS FP4)
Grace C1 CPU (72 Arm Neoverse V2 cores) + L4 GPU (485 TFLOPS FP8)
Grace CPU (72 Arm Neoverse V2 cores) +
Blackwell RTX PRO GPPU (1 PFLOPS/1000 TOPS FP4)
容量
~36個100 MHz 64T64R載波 ;
170 Gbps
最大30個載波;
25 Gbps
未公開
功耗
~3,500 W (全節點)
GPU: 72W;
系統: < 300 W
~300 W (系統)
場景
高密度AI數據中心
(C-RAN聚合)
站點(D-RAN邊緣)
站點(D-RAN/6G升級)
AI應用
AI訓練及推理
邊緣AI推理;
RAN優化
邊緣AI推理;
RAN優化(含6G感知)
從ARC-1到ARC-Compact和ARC-Pro,可以看出英偉達推廣AI-RAN策略的轉向:從最初的“在云端用大GPU跑C-RAN”轉向了“在塔下用小GPU跑D-RAN”。它不再強求運營商重構網絡架構,而是提供一個可以直接塞進現有機柜的“低功耗”產品。這大大降低了 AI-RAN 的部署門檻。
為什么英偉達要做出這樣的妥協,或者說是戰略的調整撤退?這應該與AI-RAN發展面臨的風險有關。
AI-RAN能否成功:商業模式的隱憂
當我們把視線從微觀的產品層面拉升到宏觀的產業架構層面,會發現AI-RAN的推廣之路荊棘密布。我們從AI for RAN和AI on RAN這兩個維度分析。
在AI for RAN方面,無論是在標準和還是落地實踐層面,業界對此都非常看好,泛在AI也是6G的基石之一。然而問題在于,AI-RAN是否就一定要基于通用GPU?
回顧vRAN的歷史,雖然通用 CPU 很靈活,但算不動、太貴、太費電,最后不得不使用專用的ASIC加速卡。AI-RAN使用GPU作為加速卡理論上可以提升網絡性能,但依然面臨“通用 vs 專用”的成本和功耗挑戰。
對于背負著沉重電費壓力的運營商而言,如果 AI-RAN 僅僅用作基站,那么其高昂的運營成本將是難以接受的。因此,AI-RAN 的商業邏輯必須依賴于“算力變現”,即通過發揮GPU的通用性優勢,出租閑置算力來抵消電費差價。這也是AI-RAN聯盟從誕生之初就在講的AI and RAN和AI on RAN故事。
為什么基站有可能實現算力變現?
基站可提供高溢價的邊側實時推理服務。比如,在未來的車路協同與自動駕駛場景中,基站可以作為路側的“大腦”,直接處理傳感器數據并下發指令,實現超低延遲。
基站還可以實現閑時算力套利。凌晨時分,運營商可以將成千上萬個基站閑置的 GPU 算力匯聚成一個巨大的資源池,以低于公有云的價格出售給需要海量算力的客戶。
然而,運營商若想從“賣流量”成功轉型為“賣算力”,必須克服幾座難以逾越的大山。
能效比的悖論是首要挑戰。商業競爭的本質是成本競爭,而邊緣計算在成本上天生處于劣勢。超大規模的云數據中心通過集約化管理,可以將 PUE(電源使用效率)降至極低。而基站的BBU則分散在路邊、樓頂的機房,很難把能效降下來。除非客戶對延遲有絕對的剛需,否則在純粹的算力價格戰中,基站很難有勝算。
運維復雜度的指數級上升也是不容忽視的問題。管理一個集中了十萬張GPU的數據中心,與管理十萬個分布在野外、只有一塊GPU的基站,其難度有著天壤之別。硬盤故障、光纖中斷、散熱失效,這些在數據中心里輕而易舉解決的問題,在邊緣側都需要高昂的人力或極其復雜的自動化系統來處理。如果運維成本失控,算力變現微薄的利潤將被瞬間吞噬。
更為嚴峻的是技術調度與安全風險。基站的首要任務永遠是保障通信。如果一個租戶運行的 AI 程序出現 Bug,導致正常的 5G 通信中斷,這是運營商絕對無法接受的特大事故。雖然技術上存在隔離機制,但在極端工況下,如何確保通信業務擁有絕對的資源搶占權,同時又不讓 AI 客戶覺得服務不穩定,是一個極高難度的平衡藝術。
綜上所述,基站算力變現是一個漫長的過程。最近的三到五年,可能會處于商業模式探索階段。我們大概率只能看到運營商在核心城區的關鍵節點進行小規模試點,主要用于內部網絡的 AI 優化降本,并嘗試算力租賃。
隨著 6G 時代的到來,以及 AI 智能體和機器人的普及,云端的算力和帶寬可能將無法支撐數以億計終端的實時交互需求。屆時,算力必須下沉,基站以其分布式特點,坐擁連接和算力兩大優勢,將成為萬智互聯的底座。
然而,運營商能否透過時代發展的迷霧,在現階段就下定決心重構技術棧、深度擁抱AI并向算力服務商轉型,通過AI-RAN吃到這一波時代的紅利,仍是一個巨大的未知數。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.