網易首頁 > 網易號 > 正文申請入駐

AI-RAN大撤退？深度復盤英偉達的通信入局之戰

2026-01-17 19:38:50　來源: 無線深海

陜西舉報

分享至

回望人類信息技術發展史，通信與計算是兩條并行奔涌的河流。通信行業以香農定律為指引，在有限的頻譜中求索比特的極限；計算行業則在這四十年間沿著摩爾定律的陡峭曲線，將晶體管密度推向物理邊緣。

長期以來，這兩大領域雖然通過數據產生交集，但在基礎設施層面卻涇渭分明。通信運營商追求“電信級”可靠的系統，構建了一個由專用硬件組成的封閉帝國，穿越這個帝國，抵達的卻是由通用服務器構建的信息世界。

為打破這種藩籬，近年來基于通用服務器的虛擬化無線接入網（vRAN）開始出現。然而由于成本、功耗、生態等各種問題，vRAN的發展始終舉步維艱。如今，隨著AI的高歌猛進，AI和RAN的加速融合，并被認為是6G的核心技術之一。

RAN的發展歷程：從專用到通用

在 2G 到 4G 的漫長歲月里，基站一直是以“黑盒”形態存在的。在基站的核心設備BBU（基帶處理單元）內部，運行著基于專用芯片（ASIC）的傳統算法。設備的硬件、軟件只能用于特定功能，并且和供應商高度綁定。

ASIC 是為通信協議量身定做的，其優勢在于極致的效率和功耗控制。然而，這種極致的專用性也是其最大的弱點：系統極度封閉，缺少靈活性。白天上網的人多了可能擁塞，到了深夜又太閑了需要關閉設備來省電；技術升級了，設備就要隨著更新換代；供應商換了，全套設備也都得跟著替換。

為了解決這個痼疾，業界近年來提出了 vRAN的概念。vRAN 的理想是用通用的 COTS（商用現貨）服務器取代專用的BBU，即通過軟硬件解耦件來實現基站的功能。然而這一理想卻在實施的過程中撞上了“算力墻”。

這是因為通用 CPU 擅長的是邏輯控制，面對 5G 物理層（又叫層1或者L1）那海量的并行信號處理任務時，表現得捉襟見肘。為了彌補CPU的不足，vRAN 不得不引入 FPGA或者ASIC加速卡來處理物理層任務。

FPGA因其可編程，是一種半專用硬件；ASIC則是純純的專用硬件。也就是說，vRAN是一種不徹底的軟硬件解耦，雖然服務器通用了，但還得插一塊專用的加速卡，物理層軟件和加速卡深度綁定，依然采用的是傳統算法。

在這種架構下，數據要在 CPU 和加速卡之間頻繁搬運，使 vRAN的性能始終難以跟傳統基站抗衡。雖然后續vRAN方案幾經更新，性能有了很大提升，但加速卡依然是高度專用的，這違背了“通用算力”的初衷，只是把“黑盒子”變小了塞進了服務器里。

正是在這種形勢下，英偉達提出了采用GPU加速的AI-RAN。

通信物理層的本質是大規模的線性代數計算，這與 AI 深度學習的范式驚人地一致。如果能用擅長并行計算的 GPU來作為加速卡，不僅能將AI引入通信物理層處理，處性能更好，還能利用 GPU 的通用性來對外提供AI服務，徹底改變基站的商業模式。

英偉達的GPU 內部擁有數千個 CUDA 核心，以及專門為矩陣運算設計的 Tensor Core（張量核心）。在 AI-RAN 架構中，當海量的數據涌入時，GPU 能夠啟動成千上萬個線程，以單指令多數據的方式，在同一時鐘周期內對所有數據進行并行處理。特別是 Tensor Core 的引入，使得本來需要消耗大量時鐘周期的矩陣乘累加運算能夠在瞬間完成。

就這樣，上層由CPU進行管理調度，下層由GPU進行密集計算，形成了CPU+GPU的異構計算架構。GPU 在作為加速器處理 5G L1 層算法時，展現出了比 CPU 高出數個數量級的能效比和計算密度。并且，由于GPU是通用硬件，也同時帶來了無與倫比的靈活性。

在英偉達的構想中，未來的基站在網絡繁忙時是高性能的6G 基站，而在網絡空閑時，則搖身一變成為 AI 推理節點，為自動駕駛、智慧城市或云游戲提供算力。這種“一魚多吃”的資源復用模式，有可能從根本上重構電信基礎設施的投資回報模型。

英偉達的AI-RAN：從理想到現實

在無線網絡中，為了達到覆蓋效果，基站塔頂的射頻單元（即RRU）必須散布在各個角落，方便提供無縫覆蓋。跟射頻相連的基帶部分（即BBU）則有兩種選擇，如果跟RRU一樣放在鐵塔下方的機柜里，則為分布式部署（即D-RAN）；如果把多個BBU放在中心機房里，用光纖分別接到多個基站上，則為集中式部署（即C-RAN）。

在2024年10月，英偉達推出了第一代產品：面向C-RAN部署場景的ARC-1。ARC-1的能力很強，可支持36個100 MHz 64T64R載波，功耗高達3500瓦。英偉達強調，它可以同時用于RAN和AI服務，并且算力可以靈活調配。

英偉達 ARC-1

英偉達 ARC-1系統架構

2025年5月，英偉達發布了面向D-RAN的低成本產品：ARC-Compact。ARC-Compact 由英偉達的Grace CPU 配合L4 GPU 構成。 L4 GPU的尺寸為單槽、半高半長，體積小，功耗低，適合處理單站數據。 ARC-Compact支持5G，并且可軟件升級至6G。

英偉達 ARC-Compact

英偉達 ARC-Compact系統架構

2025年10月，英偉達發布了ARC-Compact的升級版：ARC-Pro。ARC-Pro的CPU和ARC-Compact相同，GPU則升級到了Blackwell架構的GPU，引入了FP4 (4位浮點)和FP6精度，推理速度更快，內存占用更少。ARC-Pro可以支持6G新頻段以及更高階的Massive MIMO，比如256TR等。

英偉達 ARC-Pro

英偉達 ARC-Pro系統架構

英偉達產品AI-RAN產品一覽表

ARC-1ARC-CompactAC-Pro發布時間

2024年10月

2025年5月

2025年10月

平臺

GB200 NVL2: 2x Grace CPU (144 ARMv9 cores) + 2x Blackwell dual-die GPU (40 PFLOPS FP4)

Grace C1 CPU (72 Arm Neoverse V2 cores) + L4 GPU (485 TFLOPS FP8)

Grace CPU (72 Arm Neoverse V2 cores) +
Blackwell RTX PRO GPPU (1 PFLOPS/1000 TOPS FP4)

容量

~36個100 MHz 64T64R載波 ;

170 Gbps

最大30個載波;

25 Gbps

未公開

功耗

~3,500 W (全節點)

GPU: 72W;

系統: < 300 W

~300 W (系統)

場景

高密度AI數據中心

(C-RAN聚合)

站點(D-RAN邊緣)

站點(D-RAN/6G升級)

AI應用

AI訓練及推理

邊緣AI推理；

RAN優化

邊緣AI推理；

RAN優化（含6G感知）

從ARC-1到ARC-Compact和ARC-Pro，可以看出英偉達推廣AI-RAN策略的轉向：從最初的“在云端用大GPU跑C-RAN”轉向了“在塔下用小GPU跑D-RAN”。它不再強求運營商重構網絡架構，而是提供一個可以直接塞進現有機柜的“低功耗”產品。這大大降低了 AI-RAN 的部署門檻。

為什么英偉達要做出這樣的妥協，或者說是戰略的調整撤退？這應該與AI-RAN發展面臨的風險有關。

AI-RAN能否成功：商業模式的隱憂

當我們把視線從微觀的產品層面拉升到宏觀的產業架構層面，會發現AI-RAN的推廣之路荊棘密布。我們從AI for RAN和AI on RAN這兩個維度分析。

在AI for RAN方面，無論是在標準和還是落地實踐層面，業界對此都非常看好，泛在AI也是6G的基石之一。然而問題在于，AI-RAN是否就一定要基于通用GPU？

回顧vRAN的歷史，雖然通用 CPU 很靈活，但算不動、太貴、太費電，最后不得不使用專用的ASIC加速卡。AI-RAN使用GPU作為加速卡理論上可以提升網絡性能，但依然面臨“通用 vs 專用”的成本和功耗挑戰。

對于背負著沉重電費壓力的運營商而言，如果 AI-RAN 僅僅用作基站，那么其高昂的運營成本將是難以接受的。因此，AI-RAN 的商業邏輯必須依賴于“算力變現”，即通過發揮GPU的通用性優勢，出租閑置算力來抵消電費差價。這也是AI-RAN聯盟從誕生之初就在講的AI and RAN和AI on RAN故事。

為什么基站有可能實現算力變現？

基站可提供高溢價的邊側實時推理服務。比如，在未來的車路協同與自動駕駛場景中，基站可以作為路側的“大腦”，直接處理傳感器數據并下發指令，實現超低延遲。

基站還可以實現閑時算力套利。凌晨時分，運營商可以將成千上萬個基站閑置的 GPU 算力匯聚成一個巨大的資源池，以低于公有云的價格出售給需要海量算力的客戶。

然而，運營商若想從“賣流量”成功轉型為“賣算力”，必須克服幾座難以逾越的大山。

能效比的悖論是首要挑戰。商業競爭的本質是成本競爭，而邊緣計算在成本上天生處于劣勢。超大規模的云數據中心通過集約化管理，可以將 PUE（電源使用效率）降至極低。而基站的BBU則分散在路邊、樓頂的機房，很難把能效降下來。除非客戶對延遲有絕對的剛需，否則在純粹的算力價格戰中，基站很難有勝算。

運維復雜度的指數級上升也是不容忽視的問題。管理一個集中了十萬張GPU的數據中心，與管理十萬個分布在野外、只有一塊GPU的基站，其難度有著天壤之別。硬盤故障、光纖中斷、散熱失效，這些在數據中心里輕而易舉解決的問題，在邊緣側都需要高昂的人力或極其復雜的自動化系統來處理。如果運維成本失控，算力變現微薄的利潤將被瞬間吞噬。

更為嚴峻的是技術調度與安全風險。基站的首要任務永遠是保障通信。如果一個租戶運行的 AI 程序出現 Bug，導致正常的 5G 通信中斷，這是運營商絕對無法接受的特大事故。雖然技術上存在隔離機制，但在極端工況下，如何確保通信業務擁有絕對的資源搶占權，同時又不讓 AI 客戶覺得服務不穩定，是一個極高難度的平衡藝術。

綜上所述，基站算力變現是一個漫長的過程。最近的三到五年，可能會處于商業模式探索階段。我們大概率只能看到運營商在核心城區的關鍵節點進行小規模試點，主要用于內部網絡的 AI 優化降本，并嘗試算力租賃。

隨著 6G 時代的到來，以及 AI 智能體和機器人的普及，云端的算力和帶寬可能將無法支撐數以億計終端的實時交互需求。屆時，算力必須下沉，基站以其分布式特點，坐擁連接和算力兩大優勢，將成為萬智互聯的底座。

然而，運營商能否透過時代發展的迷霧，在現階段就下定決心重構技術棧、深度擁抱AI并向算力服務商轉型，通過AI-RAN吃到這一波時代的紅利，仍是一個巨大的未知數。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.