![]()
文:308
編輯:周易
「我覺得,我們能夠看到,到達(dá) L4 或者完全自動(dòng)駕駛的這條路,已經(jīng)比較清晰了」。
近日,恰逢北京車展,在英偉達(dá)舉行的一場別開生面的媒體溝通會(huì)上,英偉達(dá)全球副總裁、汽車事業(yè)部負(fù)責(zé)人吳新宙,談到了他本人對于當(dāng)前自動(dòng)駕駛發(fā)展的判斷。他也引用英偉達(dá) CEO 黃仁勛的話說:自動(dòng)駕駛的 ChatGPT 時(shí)刻已經(jīng)到來。
![]()
那么,在這個(gè)關(guān)鍵節(jié)點(diǎn),英偉達(dá)希望扮演什么樣的角色?
對于這個(gè)問題,吳新宙表示,英偉達(dá)長期以來布局自動(dòng)駕駛,已經(jīng)超過十年的時(shí)間;而如今,英偉達(dá)的目標(biāo)是在全球范圍內(nèi)推動(dòng)整個(gè)行業(yè)面向 L4 進(jìn)行演進(jìn)和落地,這也是英偉達(dá)汽車事業(yè)部的核心目標(biāo)。
實(shí)際上,圍繞著自動(dòng)駕駛,英偉達(dá)已經(jīng)構(gòu)建了一整套全棧的系統(tǒng),其中包括底層的硬件 DRIVE Hyperion、操作系統(tǒng)和平臺(tái)軟件 Halos OS、開源模型 Alpamayo、應(yīng)用 DRIVE AV 和包括 Cosmos 與 Omniverse NuRec 在內(nèi)的基礎(chǔ)設(shè)施。
值得一提的是,伴隨著 L4 的到來,英偉達(dá)已經(jīng)推出了面向 L4 的統(tǒng)一車輛參考架構(gòu) DRIVE Hyperion 10,其中包括基于英偉達(dá) DRVIE Thor 的算力平臺(tái),也包括預(yù)驗(yàn)證傳感器供應(yīng)商的通用傳感器套件,還有相關(guān)符合安全認(rèn)證要求的構(gòu)建模塊。
在本次溝通會(huì)中,吳新宙表示,基于Hyperion 10 的合作,英偉達(dá)會(huì)與包括 Uber 在內(nèi)一系列合作伙伴采集上百萬個(gè)小時(shí)的數(shù)據(jù),從而開放給整個(gè)自動(dòng)駕駛開發(fā)生態(tài),從而降低整個(gè)行業(yè)面向 L4 邁進(jìn)的門檻。
另外,在談到英偉達(dá)的開源自動(dòng)駕駛模型 Alpamayo 時(shí),吳新宙表示,Alpamayo 也在不斷進(jìn)化中,目前已經(jīng)進(jìn)化到 1.5 版本;預(yù)計(jì)到 2026 年 6 月份的 Computex 大會(huì)上,Alpamayo 會(huì)迎來 2.0 版本。
吳新宙強(qiáng)調(diào),Alpamayo 2.0 將會(huì)是一個(gè)更加強(qiáng)大的版本。
談到下一步的發(fā)展,吳新宙表示,未來十年,對于包括英偉達(dá)在內(nèi)的整個(gè)行業(yè)來說,最核心的挑戰(zhàn)將會(huì)是物理 AI——而自動(dòng)駕駛將會(huì)是物理 AI 最大規(guī)模的能夠量產(chǎn)落地的一個(gè)場景。
值得一提的是,伴隨著本次北京車展的帶來,英偉達(dá)也宣布了一系列與 L4 落地相關(guān)的合作,并且這一合作也在不斷面向物理 AI 進(jìn)行延伸。
其中,德賽西威正在基于英偉達(dá) DRIVE Hyperion 中的 DRIVE Thor 開發(fā)面向量產(chǎn)的智駕解決方案。同時(shí),小馬智行發(fā)布的全新一代自動(dòng)駕駛域控制器也集成了 DRIVE Thor。
除此之外,英偉達(dá)在車端業(yè)務(wù)的布局,也延伸到座艙 AI 領(lǐng)域。比如,阿里巴巴將千問-Omni 全模態(tài)大模型運(yùn)行于英偉達(dá) DRIVE 平臺(tái)。而聯(lián)想車計(jì)算則推出搭載了基于 DRIVE AGX Thor 的智算平臺(tái) AI Box,目標(biāo)是賦能座艙 AI 助力汽車制造商部署大模型與智能體。
值得一提的是,在本次車展期間,在以往雙方已有合作的基礎(chǔ)上,英偉達(dá)還宣布與奇瑞汽車合作布局物理 AI,發(fā)力輔助駕駛、座艙 AI 與機(jī)器人賽道。
總體可見,在當(dāng)前整個(gè)自動(dòng)駕駛行業(yè)正在面向 L4 的大背景下,英偉達(dá)正持續(xù)在與自動(dòng)駕駛行業(yè)相關(guān)的技術(shù)演技和生態(tài)建設(shè)等方面積極布局——而英偉達(dá)也早已經(jīng)將長遠(yuǎn)的目標(biāo),瞄準(zhǔn)了物理 AI 的發(fā)展。
![]()
本次溝通會(huì)期間,吳新宙以英偉達(dá)全球副總裁、英偉達(dá)汽車事業(yè)部負(fù)責(zé)人的身份也與包括時(shí)間線 Timelines 在內(nèi)的眾多中國媒體進(jìn)行了深入交流,其中涉及到的話題包括 L4 自動(dòng)駕駛、物理 AI、下一代車載計(jì)算平臺(tái)等。
以下是這次溝通會(huì)談及的主要內(nèi)容,我們做了不改變原意的編輯。
提問:
英偉達(dá)如何看待自動(dòng)駕駛行業(yè)里關(guān)于純視覺和激光雷達(dá)的不同選擇?
吳新宙:
我覺得,對于 L2++ 來說,激光雷達(dá)是否必要,永遠(yuǎn)是一個(gè)見仁見智的問題——你可以證明它的充分性,但無法證明它的必要性。
不管是特斯拉,還是一些其他的車廠,都有選擇純視覺。大家知道,我曾經(jīng)在小鵬任職,雖然小鵬是第一家引入激光雷達(dá)的車企,但我自己一直是一個(gè)比較堅(jiān)定的視覺派。因?yàn)橐曈X的能力是非常強(qiáng)的,它的像素密度也比激光雷達(dá)高很多,尤其是視覺模型的上限也是非常非常高的。
對于海外 L2++ 來說,也有車企是采用激光雷達(dá)的。從英偉達(dá)作為生態(tài)推動(dòng)者的角度,我們不會(huì)說一定要采用或者不采用激光雷達(dá),但是,在英偉達(dá)對于 Hyperion 的定義中,我們是不帶激光雷達(dá)的。
另外我們也堅(jiān)定地認(rèn)為,從 L3 或者 L4 的角度,激光雷達(dá)還是非常重要的一環(huán),它可以提供傳感器層面的重要冗余部分。我們也在與歐美玩家一起在尋找一個(gè)比較穩(wěn)定的、在歐美能夠落地的激光雷達(dá)供應(yīng)商,這對于我們來說也是非常重要的。
提問:
英偉達(dá)如何看待一些車企自研芯片?
吳新宙:
我們并不反對車企自研芯片。比如特斯拉當(dāng)年也在與英偉達(dá)進(jìn)行了 Parker 的合作之后,就選擇了自研芯片——但我們也保持了與特斯拉之間的合作。對于我們來說,更重要的是能夠推動(dòng)整個(gè)生態(tài)往前發(fā)展。
我們不期待你們買我們所有的東西,但是我們不希望的是,你什么東西都不要我們的。我們提供了整體「三個(gè)計(jì)算機(jī)」和「五層蛋糕」的服務(wù)。我們希望所有的車廠都能夠從我們的服務(wù)中受益,如果車廠受益,我們自然也會(huì)受益。
在中國市場,一些新能源車企在自研芯片,那么我們也持續(xù)保持與這些車企的良好溝通。目前不管是訓(xùn)練,還是仿真,還是開源模型,甚至是數(shù)據(jù),我們都有一些比較好的合作。對于我們來說,最重要的是希望看到整個(gè)業(yè)界面向 L4 前進(jìn),而不是說一定要用我們的車載芯片。
提問:
你如何評價(jià)你在英偉達(dá)的工作?
吳新宙:
我在英偉達(dá)的官方職責(zé)是負(fù)責(zé)整體的汽車事業(yè)部,汽車事業(yè)部的業(yè)務(wù)非常廣泛。大家可能都多少看到一些報(bào)道,講到是 Jensen(黃仁勛)如何管理下屬,我也看到了一些,至少我看到的寫得都是真的。英偉達(dá)是一個(gè)非常扁平的組織。
目前我的最主要的職責(zé)是兩件事情,第一是推動(dòng)整個(gè)業(yè)界向 L4 的進(jìn)展。第二個(gè),就是推動(dòng)我們的端到端的「給鑰匙方案」整體方案的落地。我覺得這兩件事情都非常非常重要。
從我個(gè)人的體感來說,在英偉達(dá)工作,還是一個(gè)非常累、但是很有意思的事情。大家對我的過去可能都比較了解,也算是推動(dòng)了中國自動(dòng)駕駛往前發(fā)展。那么現(xiàn)在我有機(jī)會(huì)能夠把中國的經(jīng)驗(yàn)通過英偉達(dá)的平臺(tái)去進(jìn)行放大,真正有機(jī)會(huì)推動(dòng)所有的車廠走向 L4。
這對我來說,可能說是個(gè)人職業(yè)生涯的一個(gè)最好的助腳了,所以我在這是非常開心的。至于干得怎么樣呢,我覺得還有點(diǎn)言之過早,可以再過一兩年再看。
提問:
對于其他玩家也在英偉達(dá)平臺(tái)部署自己的算法,你怎么看?
吳新宙:
英偉達(dá)是一個(gè)生態(tài)玩家,我們會(huì)盡量幫助所有里的參與者走向全自動(dòng)駕駛。對于英偉達(dá)說,首先我們不可能、也沒有這樣的野心去把控所有東西。我覺得這個(gè)不是生態(tài)玩家的一個(gè)好的方法。我們也希望在這條路上有更多的成功者。
剛才提到,我們有三個(gè)計(jì)算機(jī)的說法。一個(gè)玩家,哪怕不用我們的車端推理計(jì)算機(jī),也還是要用我們云端的訓(xùn)練計(jì)算機(jī)和仿真計(jì)算機(jī)。除了推動(dòng)自動(dòng)駕駛發(fā)展之外,對于英偉達(dá)整個(gè)公司來說,我們也是整個(gè)世界的 AI 基礎(chǔ)設(shè)施企業(yè)。
我們希望 AI 能夠盡快發(fā)展,AI 走得越遠(yuǎn),玩家越多,英偉達(dá)的收益就越大。這兩者并不矛盾。
提問:
業(yè)內(nèi)有人認(rèn)為未來需要 5000 TOPS 的算力,英偉達(dá)對于下一代車端算力的思考是什么?
吳新宙:
很多事情能夠證明它的充分性,但是很難證明它的必要性。從英偉達(dá)的角度,我們對大算力是樂見其成的,當(dāng)然也很難去判斷未來到底需要什么樣的算力,但其實(shí),我們對下一代芯片的設(shè)計(jì)也在往這個(gè)量級去走。
從車端的角度,有很多方面對算力都有倍增的要求。
第一個(gè)是傳感器的像素和分辨率,現(xiàn)在大家用 800 萬像素的,未來的話可能還有更高像素的攝像頭出來。為什么要更高像素?可以看得更遠(yuǎn)、更安全。
第二是幀率,目前業(yè)內(nèi)常用的是 10 幀,對于一個(gè)好的系統(tǒng)體驗(yàn)來說,這是勉勉強(qiáng)強(qiáng)的,要把安全率做得更好的話,希望能夠有更高的幀率,30 幀可能會(huì)更好。
第三個(gè)就是在推理里有多少幀數(shù),幀數(shù)越長,說明長時(shí)序推理、長期記憶的能力更強(qiáng),這對于長尾問題的理解還是非常有幫助的。
這三個(gè)維度都決定了算力倍增的需求,我們現(xiàn)在的算力還是在一個(gè)勉勉強(qiáng)強(qiáng)的狀態(tài)。但是從市場角度來說,要控制成本,而且目前車端還現(xiàn)在沒有一個(gè) 5000 TOPS 的芯片。
接下來就是希望通過我們的能力,在不增加成本、不提升功耗的情況下,能夠把算力能夠往上提,從而讓車的能力越來越強(qiáng)——這個(gè)過程會(huì)在什么時(shí)候結(jié)束,我并不確定。我只能告訴你的是,我們下一代的芯片正在往那個(gè)方向去,而 Elon(馬斯克)也是在往那個(gè)方向走去。
提問:
黃仁勛對于自動(dòng)駕駛的執(zhí)念和目標(biāo)是什么?
吳新宙:
在 Jensen 的藍(lán)圖里,物理 AI 是非常重要的。
未來,我相信 AI 和物理 AI 它一定可以推動(dòng) GDP 十倍百倍的增長。我在不同場合說過,生成式 AI、后面的 Agentic AI 和物理 AI 一定會(huì)推動(dòng)第四次工業(yè)革命,它會(huì)導(dǎo)致整個(gè)的生產(chǎn)力進(jìn)行一個(gè)指數(shù)級的增長,對人類社會(huì)會(huì)產(chǎn)生非常深刻的影響。
對于我們公司來說,在 Jensen 的整體戰(zhàn)略布局中,下一步整個(gè)公司就是要把物理 AI 做好。他很早就看到了自動(dòng)駕駛,恰恰是物理 AI 中可能相對來說是比較容易實(shí)現(xiàn)的一件事,也是真正可以大規(guī)模量產(chǎn)的一件事。
所以 Jensen 的執(zhí)念來自于他對未來的非常清晰的理解,這也是 Jensen 最強(qiáng)的地方,能夠把 英偉達(dá)從從一個(gè)顯卡公司一步一步做成今天作為整個(gè)世界 AI 發(fā)展的推手。所以我覺得,談到自動(dòng)駕駛和物理 AI,說是一個(gè)執(zhí)念我覺得是小看了 Jensen,本質(zhì)上是對他在十年前就對未來世界演進(jìn)的非常清晰的判斷。
提問:
到 2026 年,很多人都去做機(jī)器人了,那么自動(dòng)駕駛的實(shí)現(xiàn)還是一個(gè)非常值得追尋的目標(biāo)嗎?
吳新宙:
我覺得,不管機(jī)器人也好,無人駕駛也好,都是物理 AI 非常重要的一部分。很多事情,其實(shí)大家有可能會(huì)小看最后一步的的重要性,其實(shí)也很難講,現(xiàn)在是不是真的到最后一步了,其實(shí)現(xiàn)在只是覺得非常接近。
對我來說,能夠有機(jī)會(huì)在英偉達(dá)這樣一個(gè)平臺(tái)去推動(dòng)全球所有的車廠往這個(gè)方向走,這是一個(gè)非常非常有使命感的東西。我也希望將這種使命感至少再傳遞給我的團(tuán)隊(duì)。本質(zhì)上英偉達(dá)還是一個(gè)生態(tài)生態(tài)玩家,沒有誰是真正我們的競爭對手。說實(shí)話,我們還是希望大家一起成功。
目前只能說,自動(dòng)駕駛這個(gè)事情還非常有意義,但機(jī)器人也非常重要。目前機(jī)器人的發(fā)展,還是中國這邊更熱鬧一些,我覺得還是讓人非常激動(dòng)的。也可以理解,大家現(xiàn)在真的是感覺到像是回到了十年前新能源車企的狀態(tài)——現(xiàn)在做人形機(jī)器人的就 100 多家。
無論如何,這都是大家的選擇。當(dāng)然我們后面也有機(jī)器人,機(jī)器人對我們來說也是非常看好的一個(gè)方向,不管是做什么,大家都是在為第四次工業(yè)革命的發(fā)生做自己的貢獻(xiàn)。
提問:
你如何看待座艙大模型與自動(dòng)駕駛的融合?
吳新宙:
回到那個(gè)物理 AI 的話題,車本身就是機(jī)器人。未來,車?yán)镆膊惶枰袃蓚€(gè)大腦,不管是跟人的交互的部分,還是自動(dòng)駕駛的部分,未來的 AI 一定會(huì)往一個(gè)更加集成的方向去發(fā)展。
當(dāng)然,它并不一定是座艙和自動(dòng)駕駛會(huì)用一個(gè)芯片,但是 AI 部分可能會(huì)有一些包括硬件上的共享。為什么它們不一定是一個(gè)芯片呢?因?yàn)閷Π踩倪@個(gè)要求很不一樣,有時(shí)候的話可能會(huì)給開發(fā)帶來一些不便,這也是我們跟 MTK 合作的一個(gè)重要出發(fā)點(diǎn)。
未來來看,我相信雙方的能力上會(huì)有一些共享,甚至對于大模型來說,它可能是跑在自動(dòng)駕駛這個(gè)芯片上,它有個(gè)人交互能力,有大語言模型能力,跟云端的更大模型的配合的能力。我覺得今年,大家已經(jīng)看到了一些方向,也在往這個(gè)方向走,接下來可能還是非常值得期待的。
提問:
你如何看待世界模型與自動(dòng)駕駛的結(jié)合點(diǎn)?
吳新宙:
其實(shí)在 Alpamayo 2.0 里,接下來感知的演進(jìn)會(huì)往世界模型的方向去走。
世界模型可能也是自動(dòng)駕駛最本質(zhì)的一環(huán),它會(huì)通過物理世界的演進(jìn)來決定接下來怎么做。特別是在 L3、L4 的架構(gòu)里,我覺得 VLA 和世界模型可能是并存的,會(huì)把兩邊的能力都能夠用起來,真正做好冗余,把類人的價(jià)值感和最高的安全性都能夠做好。
提問:
業(yè)內(nèi)有人說可以直接跳過 L3 奔向 L4,你怎么看?
吳新宙:
目前,從技術(shù)瓶頸上來說,我覺得現(xiàn)在看不到 L3 和 L4 之間一個(gè)很大的技術(shù)卡點(diǎn)——這也是機(jī)器人能夠起來的原因,機(jī)器人當(dāng)然比汽車復(fù)雜很多,但隨著大模型,不管是大語言模型或推理能力的產(chǎn)生,基本上把原來大的技術(shù)問題都解決了。
對于自動(dòng)駕駛來說,它是一個(gè)系統(tǒng)工程,需要軟硬件支持,也需要很高的安全性,它更多是一個(gè)工程量很大的東西。這也是去年推理型的大模型出來之后我們要說「自動(dòng)駕駛的 ChatGPT 時(shí)刻已經(jīng)到來」的原因。
我們看到,不管是中國還是美國,整體相當(dāng)于 L4 的這種能力已經(jīng)出現(xiàn)了,Waymo 已經(jīng)在那里。所以,從某種角度上來講,技術(shù)上并沒有看到卡點(diǎn)。
那么 L3 是不是要跳過,我覺得也是見仁見智的問題。剛才我也提到,L3 和 L4 之間的技術(shù)難度差別并不大。因?yàn)?L3 要求駕駛員在十秒鐘接管,十秒鐘會(huì)發(fā)生很多事情,車輛在出現(xiàn)問題的 10 秒鐘內(nèi)也是需要承擔(dān)責(zé)任的,所以十秒與六十秒并沒有一個(gè)巨大的差別。
對于普通用戶來說,提供 L3 的能力,并不是一個(gè)壞的選擇,尤其是在高速上。因?yàn)樵?L3 狀態(tài)下,司機(jī)不能睡覺,不能打瞌睡,但是可以玩手機(jī)。而對于很多人來說,玩手機(jī)是剛需的。所以我覺得如果出現(xiàn)一個(gè)中間型產(chǎn)品,不管是在中國還是美國,都有車廠在往 L3 方向走,比如先解決高速 L3 的問題。這其實(shí)是對人類時(shí)間的解放,也是蠻好的一個(gè)能力。
但是對于一個(gè) L4 汽車來說,它還是需要運(yùn)營的東西。為什么?
因?yàn)?L4 有時(shí)候還是會(huì)卡住,所以在云端的遠(yuǎn)程操控能力還是很重要的。對于普通消費(fèi)者的車輛來說,每輛車配上遠(yuǎn)程操控其實(shí)并不是一件很簡單的事情,相反,對于 Robotaxi 來說,比如說 Uber 或者 Waymo,它們來做這個(gè)事情,然后在一些 ODD 范圍內(nèi),我覺得可能性更高。
因此,至少比較短的時(shí)間線來說,L3 是有價(jià)值的,而 L4 也沒有那么容易實(shí)現(xiàn);它們二者有可能還是并存的狀態(tài)——所以到底會(huì)發(fā)生什么,時(shí)間會(huì)告訴我們答案。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.