![]()
![]()
更深刻了解汽車產業變革
出品: 電動星球
作者:毓肥
頭圖由 AI 生成
過去一周,圍繞智能駕駛芯片、圍繞蔚小理英偉達華為特斯拉等等智能汽車企業的論戰,再起硝煙。
一方面依然圍繞最顯而易見、消費者感知最強的算力本身——「稀疏算力」、「稠密算力」和「加倍稀疏算力」的彎彎繞繞,一石激起千層浪。
另一方面,則是有關算力以外的邊緣參數,比如內存位寬、內存容量、ISP 性能,等等。一如汽油機時代除了馬力,大家還會爭論襯套、懸架、防傾桿、方向盤手感一樣,各種參數堆疊之下,方能完整映照性能。
作為消費者,如何在廠商的銷售話術體系內,精準判斷什么才是自己想要的,什么又是霧里看花的數據?
2026 年的智駕芯片仍未有定式,但我們可以根據目前的戰局,簡單聊聊大家該如何看待現階段智能駕駛的硬件「斗蛐蛐」。
首先,我們簡單總結了蔚小理最新一代自研智駕芯片的具體參數,大家可以簡單參考,然后開啟今天的文章。
![]()
本周專屬福利: 公眾號 后臺回復 【好運來 】
免費參與活動抽取現金紅包
![]()
算力迷霧
首先當然是算力本身,聚焦 2026 年,中高端智能駕駛系統的算力已經邁向四位數,也就是超過 1000TOPS。
遙想 2017 年,全球最先進的量產輔助駕駛芯片 Mobileye EyeQ4H,單芯片算力只有 5TOPS,9 年時間智能汽車已經以近百倍速度發展。
但算力與算力之間也有鴻溝,此 1000TOPS 不一定比彼 500TOPS 強。
譬如「精度」,就應該是最關鍵的,配平各家算力的前綴。
首先,所謂的「算力」是怎么得出的?它可以簡單理解為「一顆芯片跑特定難度的軟件有多快」。
舉個例子,英偉達向個人 AI 開發者出售的套件 Jetson Thor,它的官方頁面就標注了「2070 TFLOPS」算力,但同時有后綴「FP4-Sparse」(FP4 稀疏)。
這意味著 Jetson Thor 的 2070T 算力,是在跑 FP4 精度的軟件時得到的「速度值」,如果它跑 int8、FP16 等等更高精度的軟件,就會得到一個更慢的速度,以一個更小的數字呈現。
而智能汽車上使用的 Thor-U 芯片,目前傳播的 700TOPS 算力,則是在 int8 精度下推理得到的結果。
同樣地,蔚來神璣的「一顆頂四顆」、理想馬赫的 1280TOPS、小鵬圖靈的 750TOPS,甚至特斯拉、華為、地平線們,如果脫離了具體的推理精度,是無法一起比較的。
我們同時詢問了蔚小理的官方人士,蔚來方面表示,神璣的推理算力是基于 int8 精度得到的。
小鵬方面則表示,目前還沒有對外公布圖靈芯片的實際推理精度。而截止發稿,理想汽車并未明確向我們回復馬赫 100 芯片的實際推理精度。
![]()
內存瓶頸
如果說峰值算力代表著一顆芯片的理論天花板,那么廠商給智駕芯片配備的運行內存總量,則代表著芯片可以實際發揮多少性能的「木桶最短板」。
我們可以把運行內存簡單理解為「一條流水線可以容納的工人總量」,而算力則代表著「你請了多少工人」。
假設我請了 100 萬工人,興高采烈地宣布,我要建成全世界工人總數最多的工廠。
但實際上,我手里只有一條可以同時容納 1000 人同時工作的流水線,那么我實際的產出,并不會比請了 1000 名工人,同時流水線上有 1000 個工位的工廠高。
理解了這個概念之后,我們可以代入智駕芯片的實際工況中。比如,理想馬赫、小鵬圖靈、英偉達 Thor-U,內存帶寬都是 273GB/s。
目前業內主流的輔助駕駛大模型參數量,其實還遠低于豆包千問們的 lite 小模型,只有 3-5B 的大小。
我們取平均值,一個 4B 參數量的大模型,以 int8 精度推理,那么在 273GB/s 的內存帶寬下,它將會實現每個 token 14.65ms 的時延。
對于輔助駕駛推理來說,每個 token 就可以簡單理解為輸出到方向盤/踏板上的「結果」。
1 秒鐘有 1000 毫秒,也就是每秒鐘足夠這樣一個大模型運行 68 次,也就是 68HZ 的「刷新率」,如果每次推理結果都可用,那么已經遠超30HZ 的車規級推理刷新率要求了。
也正因如此,Orin X 205GB/s 的帶寬,承擔目前 4B 左右的大模型參數量,已經摸到它的內存帶寬瓶頸了,曾經的廉頗也吃不下越來越大碗的飯。
然后我們可以反過來,同樣滿足 30HZ 車規級要求的情況下,也可以推斷出,特定的內存帶寬,可以滿足多大參數量的模型。
比如,如果用同樣的位寬、int8 精度反算,那么馬赫、圖靈、Thor-U 都可以實現車端跑 9B 參數量大模型的要求,比 4B 還是大了一倍多。
![]()
至于蔚來神璣,因為它是目前量產內存帶寬極高的智能駕駛芯片(546GB/s),所以第一,同樣參數量的推理時延更低,其次,它理論上可以承載的模型更大。
按照上面同樣的算法,4B 參數+int8 精度推理,神璣 9031 的內存系統理論上可以實現 7.325ms 的推理時延,可以承載 18B 的大模型參數量。
大家應該注意到,我們聊寫內存的篇幅明顯更長。
因為對于智能駕駛推理來說,內存明顯會比算力更早遇到瓶頸,業界稱這種現象為「memory wall 內存墻」。
再舉個例子,上面算出來神璣 9031 的帶寬,足以承受最高 18B 參數的大模型以車規級刷新率進行數據傳輸。
那么倒過來,同樣級別的數據傳輸,按照 int8 精度計算,實際只需要起步 276TOPS 的算力,就可以支撐計算需求。
當然實際上在不同傳感器融合的過程中,算力不能簡單理解為一根筋或者兩頭堵,但這也足以說明,算力已經遠不是一套智能駕駛的瓶頸了,內存問題比算力更緊急。
而像這樣有點反直覺的事實,智駕芯片里面還有很多。
![]()
ISP?這是啥?
除了內存,還有一個非常影響智駕芯片性能發揮的部件,甚至重要性完全不比推理算力差——ISP。
ISP 全稱 image signal processor 圖像信號處理器,攝像頭感光元件 CMOS 將物理世界信息記錄成原生 RAW 數據,ISP 則將原生數據進行降噪、調色、調節動態范圍、編碼,輸出成我們人眼可以識別的圖像信息。
熟悉特斯拉的朋友一定記得,馬斯克是個堅決的「反 ISP」人士。
馬斯克一直認為,ISP 本身會導致數據傳遞的延遲和失真。所以在目前特斯拉車型使用的 AI 4 方案上,他已經大刀闊斧地砍掉了攝像頭端的 ISP,僅保留 AI 4 芯片內置的 ISP,盡可能減少視覺數據傳遞過程中的損失。
![]()
到了下一代 AI 5,馬斯克更是宣稱徹底干掉 ISP,直接讓 AI 5 2500TOPS 算力的強大 NPU「硬算」原始圖像數據的色彩變換,徹底實現「從光子到踏板」的無縫端到端。
但回到蔚小理英偉達們,ISP 依然是目前的主力,甚至正在不斷成長。
![]()
譬如神璣 9031,就擁有算力極高的智駕芯片 ISP,6.5G Pixel/s 相當于每秒處理 65 億像素的視頻數據,拆成 3840x2160 的 4K 畫幅,也相當于 26 個攝像頭的 30HZ 視頻流。
另一方面,英偉達 Thor-U 的 ISP 算力,也從 Orin X 的 1.8G 翻倍至3.5G Pixel/s ,所以大家可以看到,搭載 Thor 方案的車型們,普遍都擁有更高像素的車內外攝像頭。
![]()
小鵬也在圖靈芯片中針對優化了 ISP 能力,盡管沒有公布實際像素算力,但雙獨立 ISP 的設計,以及 24 路攝像頭的接入能力,也可以看出小鵬依然走在優化極限場景兜底能力的道路上。
聊到極限場景,除了像素量,「bit」色彩位深也是至關重要的 corner case 兜底利器。
我們以「從黑到白」的色彩變化過程,來理解「色彩位深」的概念。
假設某家芯片廠宣傳他們的 ISP 擁有 8bit 位深,那就意味著從純黑到純白,他們的 ISP 可以實現 2 的 8 次方,也就是 256 個等級的「位深」,可以理解為過渡了 256 個臺階,才從純黑到純白。
譬如蔚來神璣 9031 的 ISP 色彩位深是 26bit,這意味著黑白之間可以理論上分離出 67108864 個「階梯」,色彩過度更細膩,分離出的細節也會越多。
這就意味著,隧道夜晚這樣的極限場景下,色彩位深更高的 ISP,可以準確分離出環境的不同色彩要素,比如車牌、車燈、車身。
![]()
芯片宣傳戰的號角
聊到現在,可能也只是智駕芯片的冰山一角。
首先,對于個人消費者來說,影響購買決策和使用體驗的芯片參數并不多,算力、帶寬、ISP、內存大小,這些都是很直觀的數字,更深層的功耗、擴展能力,理解門檻相對高,其次對于日常開車影響不大。
其次,我們正在見證中國車企、供應商的第一次芯片大爆發。產品層出不窮,宣傳方式這正在摸索中。
可以預見地,中國智駕芯片的宣傳戰才剛剛開始。一些參數并不是某家廠商不愿意說,而可能是還沒想好怎么說更勁爆。
而在紛繁的數字游戲中,消費者需要保持知情權的,不僅是不同領域的參數,更是統一的對比標準。
(完)
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.