<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      黃仁勛GTC演講核心觀點(diǎn):AI推理時(shí)代到來(lái),Agent終結(jié)傳統(tǒng)SaaS,龍蝦就是新操作系統(tǒng)

      0
      分享至


      親愛的讀者,受微信推送規(guī)則影響,僅“關(guān)注”很可能無(wú)法收到推送。按以下圖示將“長(zhǎng)江商學(xué)院”設(shè)為星標(biāo),不錯(cuò)過(guò)每一篇精彩文章!



      在剛剛舉行的2026GTC(英偉達(dá)全球技術(shù)大會(huì))上,黃仁勛以“推理時(shí)代”宣告AI新紀(jì)元:2027年英偉達(dá)營(yíng)收將達(dá)萬(wàn)億美元,Token工廠經(jīng)濟(jì)學(xué)重構(gòu)算力價(jià)值。為何他敢斷言“萬(wàn)億需求僅是起點(diǎn)”?從Vera Rubin系統(tǒng)350倍性能躍升到OpenClaw成為“智能體操作系統(tǒng)”,英偉達(dá)如何將數(shù)據(jù)中心轉(zhuǎn)化為“Token生產(chǎn)工廠”?這場(chǎng)演講不僅揭示了AI算力革命的底層邏輯,更預(yù)演了企業(yè)IT全面向AaaS轉(zhuǎn)型的未來(lái)圖景。

      CKGSB

      作者 | 鮑奕龍

      來(lái)源 | 華爾街見聞

      2026年3月16日,英偉達(dá)GTC 2026大會(huì)正式開幕,英偉達(dá)創(chuàng)始人兼CEO黃仁勛發(fā)表了主題演講。

      在這場(chǎng)被視為“AI行業(yè)年度朝圣”的大會(huì)上,黃仁勛闡述了英偉達(dá)從一家“芯片公司”向“AI基礎(chǔ)設(shè)施和工廠公司”的蛻變。面對(duì)市場(chǎng)最關(guān)心的業(yè)績(jī)持續(xù)性與增長(zhǎng)空間問(wèn)題,黃仁勛詳細(xì)拆解了驅(qū)動(dòng)未來(lái)增長(zhǎng)的底層商業(yè)邏輯——“Token工廠經(jīng)濟(jì)學(xué)”。

      業(yè)績(jī)指引極度樂(lè)觀,

      “2027年至少1萬(wàn)億美元的需求”

      過(guò)去兩年,全球AI計(jì)算需求呈指數(shù)級(jí)爆炸。隨著大模型從“感知”、“生成”進(jìn)化到“推理”與“行動(dòng)(執(zhí)行任務(wù))”,算力的消耗量急劇攀升。針對(duì)市場(chǎng)高度關(guān)注的訂單與營(yíng)收天花板,黃仁勛給出了極為強(qiáng)勁的預(yù)期。

      黃仁勛在演講中直言:

      去年這個(gè)時(shí)候,我說(shuō)過(guò),我們看到了5000億美元的高確信度需求,覆蓋Blackwell和Rubin直到2026年。現(xiàn)在,就在此時(shí)此地,我看到到2027年至少有1萬(wàn)億美元的需求(at least $1 trillion)。

      黃仁勛的萬(wàn)億預(yù)期一度推動(dòng)英偉達(dá)股價(jià)漲超4.3%。

      不僅如此,他更是對(duì)這一數(shù)字做出了補(bǔ)充:

      這合理嗎?這就是我接下來(lái)要講的。事實(shí)上,我們甚至?xí)┎粦?yīng)求。我確定,實(shí)際的計(jì)算需求會(huì)比這高得多。

      黃仁勛指出,如今的英偉達(dá)系統(tǒng)已經(jīng)證明了自己是全球“成本最低的基礎(chǔ)設(shè)施”。由于英偉達(dá)能運(yùn)行幾乎所有領(lǐng)域的AI模型,這種通用性使得客戶投入的這1萬(wàn)億美元能夠被充分利用并保持長(zhǎng)久的生命周期。

      目前,英偉達(dá)60%的業(yè)務(wù)來(lái)自排名前五的超大型云服務(wù)商,而另外40%的業(yè)務(wù)則廣泛分布于主權(quán)云、企業(yè)、工業(yè)、機(jī)器人和邊緣計(jì)算等各個(gè)領(lǐng)域。

      Token工廠經(jīng)濟(jì)學(xué),每瓦性能決定商業(yè)命脈

      為了解釋這1萬(wàn)億需求的合理性,黃仁勛向全球企業(yè)CEO展示了一套全新的商業(yè)思維。他指出,未來(lái)的數(shù)據(jù)中心不再是存儲(chǔ)文件的倉(cāng)庫(kù),而是生產(chǎn)Token(AI生成的基本單位)的“工廠”。

      黃仁勛強(qiáng)調(diào):

      每一座數(shù)據(jù)中心、每一座工廠,從定義上來(lái)說(shuō)都是受電力限制的。一座1GW(吉瓦)的工廠永遠(yuǎn)不會(huì)變成2GW,這是物理和原子的定律。在固定的功率下,誰(shuí)的每瓦Token吞吐量最高,誰(shuí)的生產(chǎn)成本就最低。

      黃仁勛將未來(lái)的AI服務(wù)分為以下商業(yè)層級(jí):

      免費(fèi)層(高吞吐、低速度)

      中級(jí)層(~每百萬(wàn)token 3美元)

      高級(jí)層(~每百萬(wàn)token 6美元)

      高速層(~每百萬(wàn)token 45美元)

      超高速層(~每百萬(wàn)token 150美元)

      他指出,隨著模型越來(lái)越大、上下文越來(lái)越長(zhǎng),AI會(huì)變得更聰明,但Token的生成速率會(huì)降低。黃仁勛表示:

      在這個(gè)Token工廠里,你的吞吐量和Token生成速度,將直接轉(zhuǎn)化為你明年的精確收入。

      黃仁勛強(qiáng)調(diào)英偉達(dá)的架構(gòu)能夠讓客戶在免費(fèi)層實(shí)現(xiàn)極高的吞吐量,同時(shí)在最高價(jià)值的推理層級(jí)上,將性能提升驚人的35倍。

      Vera Rubin兩年實(shí)現(xiàn)350倍加速,

      Groq填補(bǔ)極速推理

      在這個(gè)物理極限的約束下,英偉達(dá)介紹其有史以來(lái)最復(fù)雜的AI計(jì)算系統(tǒng),Vera Rubin。黃仁勛表示:

      過(guò)去提到Hopper,我會(huì)舉起一塊芯片,那很可愛。但提到Vera Rubin,大家想到的是整個(gè)系統(tǒng)。在這個(gè)100%液冷、完全消滅了傳統(tǒng)線纜的系統(tǒng)中,過(guò)去需要兩天安裝的機(jī)架,現(xiàn)在只需兩小時(shí)。

      黃仁勛指出,通過(guò)極致的端到端軟硬件協(xié)同設(shè)計(jì),Vera Rubin在同一座1GW數(shù)據(jù)中心里創(chuàng)造了驚人的數(shù)據(jù)跨越:

      在短短兩年時(shí)間內(nèi),我們將Token的生成速率從2200萬(wàn)提升到了7億,實(shí)現(xiàn)了350倍的增長(zhǎng)。摩爾定律在同時(shí)期僅能帶來(lái)約1.5倍的提升。

      為了解決極速推理(如1000 Tokens/秒)條件下的帶寬瓶頸,英偉達(dá)給出了整合被收購(gòu)公司Groq的最終方案:非對(duì)稱式的分離推理。黃仁勛解釋:

      這兩款處理器的特點(diǎn)截然不同。Groq芯片擁有500MB的SRAM,而一顆Rubin芯片擁有288GB的內(nèi)存。

      黃仁勛指出,英偉達(dá)通過(guò)Dynamo軟件系統(tǒng),將需要海量計(jì)算和顯存的“預(yù)填充(Pre-fill)”階段交給Vera Rubin,將對(duì)延遲極度敏感的“解碼”階段交給Groq。黃仁勛還對(duì)企業(yè)算力配置給出了建議:

      如果你的工作主要是高吞吐,100%使用Vera Rubin;如果你有大量高價(jià)值的編程級(jí)別的Token生成需求,拿出25%的數(shù)據(jù)中心規(guī)模給Groq。

      據(jù)透露,由三星代工的Groq LP30芯片已在量產(chǎn),預(yù)計(jì)第三季度出貨,而首個(gè)Vera Rubin機(jī)架已在微軟Azure云上運(yùn)行。

      此外,針對(duì)光互聯(lián)技術(shù),黃仁勛展示了全球首款量產(chǎn)的共封裝光學(xué)(CPO)交換機(jī)Spectrum X,并平息了市場(chǎng)對(duì)于“銅退光進(jìn)”的路線之爭(zhēng):

      我們需要更多的銅纜產(chǎn)能,更多的光芯片產(chǎn)能,更多的CPO產(chǎn)能。

      Agent終結(jié)傳統(tǒng)SaaS,

      “年薪+Token”成硅谷標(biāo)配

      除了硬件壁壘,黃仁勛把大量篇幅留給了AI軟件和生態(tài)的革命,特別是Agent(智能體)的爆發(fā)。

      他將開源項(xiàng)目OpenClaw形容為“人類歷史上最受歡迎的開源項(xiàng)目”,稱其僅用幾周時(shí)間就超越了Linux在過(guò)去30年取得的成就。黃仁勛直言,OpenClaw本質(zhì)上就是Agent計(jì)算機(jī)的“操作系統(tǒng)”。

      黃仁勛斷言:

      每一個(gè)SaaS(軟件即服務(wù))公司都將變成AaaS(Agent-as-a-Service,智能體即服務(wù))公司。毫無(wú)疑問(wèn),為了讓這種具備訪問(wèn)敏感數(shù)據(jù)和執(zhí)行代碼能力的智能體安全落地,英偉達(dá)推出了企業(yè)級(jí)的NeMo Claw參考設(shè)計(jì),增加了策略引擎和隱私路由器。

      對(duì)于普通職場(chǎng)人,這場(chǎng)變革同樣近在咫尺。黃仁勛描繪了未來(lái)的職場(chǎng)新形態(tài):

      在未來(lái),我們公司的每一位工程師都需要一個(gè)年度Token預(yù)算。他們的基礎(chǔ)年薪可能是幾十萬(wàn)美元,我會(huì)在此基礎(chǔ)上再拿出大約一半的金額作為Token額度給他們,讓他們實(shí)現(xiàn)10x的效率提升。這已經(jīng)是硅谷的新招聘籌碼了:你的offer里帶多少Token?

      演講最后,黃仁勛還“劇透”了下一代計(jì)算架構(gòu)Feynman,它將首次實(shí)現(xiàn)銅線與CPO的共同水平擴(kuò)展。更引人遐想的是,英偉達(dá)正在研發(fā)部署在太空的數(shù)據(jù)中心計(jì)算機(jī)“Vera Rubin Space-1”,徹底打開了AI算力向地球之外延伸的想象空間。

      黃仁勛GTC 2026演講全文,全文翻譯如下(AI工具輔助):

      主持人: 歡迎英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛上臺(tái)。

      黃仁勛,創(chuàng)始人兼首席執(zhí)行官:

      歡迎來(lái)到GTC。我想提醒大家,這是一場(chǎng)技術(shù)大會(huì)。能看到這么多人一大早排隊(duì)入場(chǎng),能看到在座的各位,我感到非常高興。

      在GTC,我們將聚焦三大主題:技術(shù)、平臺(tái)和生態(tài)系統(tǒng)。英偉達(dá)目前擁有三大平臺(tái):CUDA-X平臺(tái)、系統(tǒng)平臺(tái),以及我們最新推出的AI工廠平臺(tái)。

      在正式開始之前,我要感謝我們的預(yù)熱環(huán)節(jié)主持人——Conviction的Sarah Guo、紅杉資本的Alfred Lin(英偉達(dá)的第一位風(fēng)險(xiǎn)投資人),以及英偉達(dá)的第一位主要機(jī)構(gòu)投資人Gavin Baker。這三位對(duì)技術(shù)有深刻的洞見,在整個(gè)技術(shù)生態(tài)系統(tǒng)中擁有極廣的影響力。當(dāng)然,我還要感謝今天所有我親自邀請(qǐng)出席的貴賓們。感謝這支全明星團(tuán)隊(duì)。

      我同樣要感謝今天到場(chǎng)的所有企業(yè)。英偉達(dá)是一家平臺(tái)公司,我們擁有技術(shù)、平臺(tái)和豐富的生態(tài)系統(tǒng)。今天到場(chǎng)的企業(yè)代表了價(jià)值100萬(wàn)億美元行業(yè)中幾乎全部的參與者,共有450家公司贊助了本次活動(dòng),在此深表感謝。

      本次大會(huì)共設(shè)有1,000場(chǎng)技術(shù)論壇、2,000位演講嘉賓,將覆蓋人工智能"五層蛋糕"架構(gòu)的每一個(gè)層級(jí)——從土地、電力與機(jī)房等基礎(chǔ)設(shè)施,到芯片、平臺(tái)、模型,以及最終推動(dòng)整個(gè)行業(yè)騰飛的各類應(yīng)用。

      CUDA:二十年的技術(shù)積淀

      一切的起點(diǎn),就在這里。今年是CUDA誕生二十周年。

      二十年來(lái),我們始終致力于這一架構(gòu)的研發(fā)。CUDA是一項(xiàng)革命性的發(fā)明——SIMT(單指令多線程)技術(shù)允許開發(fā)者以標(biāo)量代碼編寫程序,并將其擴(kuò)展為多線程應(yīng)用,其編程難度遠(yuǎn)低于此前的SIMD架構(gòu)。

      我們最近還新增了Tiles功能,幫助開發(fā)者更便捷地編程張量核心(Tensor Core),以及當(dāng)今人工智能所依賴的各類數(shù)學(xué)運(yùn)算結(jié)構(gòu)。目前,CUDA已擁有數(shù)千種工具、編譯器、框架和庫(kù),在開源社區(qū)中存在數(shù)十萬(wàn)個(gè)公開項(xiàng)目,并已深度集成到每一個(gè)技術(shù)生態(tài)系統(tǒng)之中。

      這張圖表揭示了英偉達(dá)100%的戰(zhàn)略邏輯,我從最初就一直在講這張幻燈片。其中最難實(shí)現(xiàn)、也是最核心的要素,是圖表底部的"裝機(jī)量"。歷經(jīng)二十年,我們已在全球范圍內(nèi)積累了數(shù)億塊運(yùn)行CUDA的GPU和計(jì)算系統(tǒng)。

      我們的GPU覆蓋所有云平臺(tái),服務(wù)于幾乎所有計(jì)算機(jī)廠商和行業(yè)。CUDA龐大的裝機(jī)量,正是這個(gè)飛輪不斷加速的根本原因。裝機(jī)量吸引開發(fā)者,開發(fā)者創(chuàng)造新算法并取得突破,突破催生全新市場(chǎng),新市場(chǎng)形成新生態(tài)并吸引更多企業(yè)加入,進(jìn)而擴(kuò)大裝機(jī)量——這個(gè)飛輪正在持續(xù)加速。

      英偉達(dá)庫(kù)的下載量正以驚人的速度增長(zhǎng),規(guī)模龐大且增速不斷提升。這個(gè)飛輪使我們的計(jì)算平臺(tái)能夠支撐海量應(yīng)用和層出不窮的新突破。

      更重要的是,它還賦予了這些基礎(chǔ)設(shè)施極長(zhǎng)的使用壽命。原因顯而易見:NVIDIA CUDA上可運(yùn)行的應(yīng)用極為豐富,涵蓋AI生命周期的每個(gè)階段、各類數(shù)據(jù)處理平臺(tái),以及各種科學(xué)原理求解器。因此,一旦安裝了英偉達(dá)GPU,其實(shí)際使用價(jià)值極高。這也是為何我們六年前發(fā)布的Ampere架構(gòu)GPU,其云端價(jià)格反而在上漲。

      這一切的根本原因在于:裝機(jī)量龐大,飛輪強(qiáng)勁,開發(fā)者生態(tài)廣泛。當(dāng)這些因素共同發(fā)揮作用,加之我們持續(xù)更新軟件,計(jì)算成本便會(huì)不斷下降。加速計(jì)算在大幅提升應(yīng)用性能的同時(shí),隨著我們長(zhǎng)期維護(hù)和迭代軟件,用戶不僅能在初期獲得性能躍升,還能持續(xù)享受計(jì)算成本的下降。

      我們?cè)敢鉃槿蛎恳粔KGPU提供長(zhǎng)期支持,因?yàn)樗鼈冊(cè)诩軜?gòu)上完全兼容。

      我們之所以愿意這樣做,是因?yàn)檠b機(jī)量如此龐大——每發(fā)布一次新的優(yōu)化,便能惠及數(shù)百萬(wàn)用戶。這種動(dòng)態(tài)組合,使得英偉達(dá)架構(gòu)在持續(xù)擴(kuò)大覆蓋范圍、加速自身成長(zhǎng)的同時(shí),不斷壓低計(jì)算成本,最終刺激新的增長(zhǎng)。CUDA是這一切的核心。

      從GeForce到CUDA:二十五年的演進(jìn)之路

      而我們與CUDA的旅程,實(shí)際上早在二十五年前就已開始。

      GeForce——相信在座有很多人是伴隨著GeForce長(zhǎng)大的。GeForce是英偉達(dá)最成功的市場(chǎng)推廣項(xiàng)目。我們從你們還買不起產(chǎn)品的時(shí)候就開始培養(yǎng)未來(lái)的客戶——是你們的父母代替你們成為了英偉達(dá)最早的用戶,年復(fù)一年地購(gòu)買我們的產(chǎn)品,直到有一天,你們成長(zhǎng)為優(yōu)秀的計(jì)算機(jī)科學(xué)家,成為真正意義上的客戶和開發(fā)者。

      這是二十五年前GeForce奠定的基業(yè)。二十五年前,我們發(fā)明了可編程著色器——這是讓加速器實(shí)現(xiàn)可編程化的一項(xiàng)顯而易見卻意義深遠(yuǎn)的發(fā)明,也是世界上第一款可編程加速器,即像素著色器。

      這五年后,我們創(chuàng)造了CUDA——這是我們有史以來(lái)最重要的投資之一。當(dāng)時(shí)公司財(cái)力有限,但我們將絕大部分利潤(rùn)押注于此,致力于將CUDA從GeForce延伸到每一臺(tái)計(jì)算機(jī)。我們之所以如此堅(jiān)定,是因?yàn)槲覀兩钚牌錆摿?。盡管初期歷經(jīng)艱辛,公司堅(jiān)守這一信念長(zhǎng)達(dá)13代、整整二十年,如今CUDA已無(wú)處不在。

      正是像素著色器推動(dòng)了GeForce的革命。而大約八年前,我們推出了RTX——為現(xiàn)代計(jì)算機(jī)圖形時(shí)代對(duì)架構(gòu)進(jìn)行了全面革新。GeForce將CUDA帶給了全世界,也正因如此,讓Alex Krizhevsky、Ilya Sutskever、Geoffrey Hinton、Andrew Ng等眾多學(xué)者發(fā)現(xiàn),GPU可以成為加速深度學(xué)習(xí)的利器,由此點(diǎn)燃了十年前人工智能的大爆炸。

      十年前,我們決定將可編程著色與兩個(gè)全新理念相融合:一是硬件光線追蹤(Ray Tracing),這在技術(shù)上極具挑戰(zhàn);二是一個(gè)當(dāng)時(shí)頗具前瞻性的想法——大約十年前,我們就預(yù)見到AI將徹底變革計(jì)算機(jī)圖形。正如GeForce將AI帶給了全世界,AI如今也將反過(guò)來(lái)重塑整個(gè)計(jì)算機(jī)圖形的實(shí)現(xiàn)方式。

      今天,我要向大家展示未來(lái)。這是我們的下一代圖形技術(shù),我們稱之為神經(jīng)渲染(Neural Rendering)——3D圖形與人工智能的深度融合。這就是DLSS 5,請(qǐng)看。

      神經(jīng)渲染:結(jié)構(gòu)化數(shù)據(jù)與生成式AI的融合

      這是不是令人嘆為觀止?計(jì)算機(jī)圖形就此煥發(fā)生機(jī)。

      我們做了什么?我們將可控的3D圖形(虛擬世界的真實(shí)基礎(chǔ))與其結(jié)構(gòu)化數(shù)據(jù)相結(jié)合,再融入生成式AI和概率計(jì)算。一個(gè)完全確定性,另一個(gè)概率性卻高度逼真——我們將這兩種理念融為一體,通過(guò)結(jié)構(gòu)化數(shù)據(jù)實(shí)現(xiàn)精準(zhǔn)可控,同時(shí)進(jìn)行實(shí)時(shí)生成。最終,內(nèi)容既美觀驚艷,又完全可控。

      結(jié)構(gòu)化信息與生成式AI融合這一理念,將在一個(gè)又一個(gè)行業(yè)中不斷復(fù)現(xiàn)。結(jié)構(gòu)化數(shù)據(jù)是可信AI的基石。

      結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)的加速平臺(tái)

      現(xiàn)在我要帶大家看一張技術(shù)架構(gòu)圖。

      結(jié)構(gòu)化數(shù)據(jù)——大家熟悉的SQL、Spark、Pandas、Velox,以及Snowflake、Databricks、Amazon EMR、Azure Fabric、Google BigQuery等重要平臺(tái),都在處理數(shù)據(jù)框(Data Frame)。這些數(shù)據(jù)框就像巨型電子表格,承載著商業(yè)世界的全部信息,是企業(yè)計(jì)算的基本事實(shí)(Ground Truth)。

      在AI時(shí)代,我們需要讓AI來(lái)使用結(jié)構(gòu)化數(shù)據(jù),并對(duì)其實(shí)現(xiàn)極致加速。過(guò)去,加速結(jié)構(gòu)化數(shù)據(jù)處理是為了讓企業(yè)更高效地運(yùn)轉(zhuǎn)。而未來(lái),AI將以遠(yuǎn)超人類的速度使用這些數(shù)據(jù)結(jié)構(gòu),AI智能體也將大量調(diào)用結(jié)構(gòu)化數(shù)據(jù)庫(kù)。

      非結(jié)構(gòu)化數(shù)據(jù)方面,向量數(shù)據(jù)庫(kù)、PDF、視頻、音頻等構(gòu)成了世界上絕大多數(shù)的數(shù)據(jù)形態(tài)——每年生成的數(shù)據(jù)中,約90%是非結(jié)構(gòu)化數(shù)據(jù)。

      過(guò)去,這些數(shù)據(jù)幾乎完全無(wú)法被利用:我們讀取它們,存入文件系統(tǒng),僅此而已。我們無(wú)法查詢,也難以檢索,原因在于非結(jié)構(gòu)化數(shù)據(jù)缺乏簡(jiǎn)單的索引方式,必須理解其含義與語(yǔ)境。而現(xiàn)在,AI可以做到這一點(diǎn)——借助多模態(tài)感知與理解技術(shù),AI能夠讀取PDF文檔、理解其含義,并將其嵌入可供查詢的更大結(jié)構(gòu)之中。

      英偉達(dá)為此創(chuàng)建了兩個(gè)基礎(chǔ)庫(kù):

      ● cuDF:用于數(shù)據(jù)框、結(jié)構(gòu)化數(shù)據(jù)的加速處理

      ● cuVS:用于向量存儲(chǔ)、語(yǔ)義數(shù)據(jù)和非結(jié)構(gòu)化AI數(shù)據(jù)的處理

      這兩個(gè)平臺(tái)將成為未來(lái)最重要的基礎(chǔ)平臺(tái)之一。

      今天,我們宣布與多家企業(yè)達(dá)成合作。IBM——SQL語(yǔ)言的發(fā)明者,將使用cuDF加速其WatsonX Data平臺(tái)。Dell與我們聯(lián)合打造了Dell AI數(shù)據(jù)平臺(tái),整合cuDF與cuVS,并在NTT Data的實(shí)際項(xiàng)目中實(shí)現(xiàn)了大幅性能提升。Google Cloud方面,我們現(xiàn)在不僅加速Vertex AI,還加速BigQuery,并與Snapchat合作將其計(jì)算成本降低了近80%。

      加速計(jì)算帶來(lái)的好處是三位一體的:速度、規(guī)模、成本。這與摩爾定律的邏輯一脈相承——通過(guò)加速計(jì)算實(shí)現(xiàn)性能飛躍,同時(shí)持續(xù)優(yōu)化算法,讓所有人都能享受到持續(xù)下降的計(jì)算成本。

      英偉達(dá)構(gòu)建了加速計(jì)算平臺(tái),其上匯聚了眾多庫(kù):RTX、cuDF、cuVS等等。這些庫(kù)整合進(jìn)全球云服務(wù)和OEM體系,共同觸達(dá)全球用戶。

      與云服務(wù)商的深度合作

      與主要云服務(wù)商的合作

      Google Cloud:

      我們加速Vertex AI和BigQuery,與JAX/XLA深度集成,同時(shí)在PyTorch上表現(xiàn)卓越——英偉達(dá)是全球唯一一家在PyTorch和JAX/XLA上均表現(xiàn)出色的加速器。我們將Base10、CrowdStrike、Puma、Salesforce等客戶引入Google Cloud生態(tài)。

      AWS:

      我們加速EMR、SageMaker和Bedrock,與AWS有著深度集成。今年令我格外興奮的是,我們將把OpenAI引入AWS,這將大幅推動(dòng)AWS云計(jì)算的消耗增長(zhǎng),幫助OpenAI擴(kuò)展區(qū)域部署和計(jì)算規(guī)模。

      Microsoft Azure:

      英偉達(dá)100 PFLOPS超算是我們構(gòu)建的第一臺(tái)超級(jí)計(jì)算機(jī),也是第一臺(tái)部署在Azure上的超算,這奠定了與OpenAI合作的重要基礎(chǔ)。我們加速Azure云服務(wù)和AI Foundry,合作推進(jìn)Azure區(qū)域擴(kuò)展,并在Bing搜索上深度協(xié)作。

      值得一提的是,我們的**保密計(jì)算(Confidential Computing)**能力——確保即便是運(yùn)營(yíng)商也無(wú)法查看用戶數(shù)據(jù)和模型——英偉達(dá)GPU是全球首批支持保密計(jì)算的GPU,可支持OpenAI和Anthropic模型在全球各地區(qū)云環(huán)境中的保密部署。以Synopsys為例,我們加速其全部EDA和CAD工作流,并部署于Microsoft Azure。

      Oracle:

      我們是Oracle的第一個(gè)AI客戶,我為能夠第一次向Oracle解釋AI云的概念感到自豪。此后他們發(fā)展迅猛,我們也為其引入了Cohere、Fireworks、OpenAI等眾多合作伙伴。

      CoreWeave:

      全球第一家AI原生云,專為GPU托管和AI云服務(wù)而生,擁有出色的客戶群,增長(zhǎng)勢(shì)頭強(qiáng)勁。

      Palantir + Dell:

      三方聯(lián)合打造了全新的AI平臺(tái),基于Palantir的本體論平臺(tái)(Ontology Platform)和AI平臺(tái),可在任何國(guó)家、任何氣隙隔離環(huán)境下、完全本地化地部署AI——從數(shù)據(jù)處理(向量化或結(jié)構(gòu)化)到AI的完整加速計(jì)算棧,無(wú)所不包。

      英偉達(dá)與全球云服務(wù)商建立了這種特殊的合作關(guān)系——我們將客戶引入云端,這是一種互利共贏的生態(tài)。

      垂直整合,橫向開放:英偉達(dá)的核心戰(zhàn)略

      英偉達(dá)是全球第一家垂直整合、橫向開放的公司。

      這一模式的必要性非常簡(jiǎn)單:加速計(jì)算不是芯片問(wèn)題,也不是系統(tǒng)問(wèn)題,其完整表述應(yīng)為應(yīng)用加速。CPU可以讓計(jì)算機(jī)整體運(yùn)行得更快,但這條路已走到瓶頸。未來(lái),唯有通過(guò)應(yīng)用或領(lǐng)域特定的加速,才能持續(xù)帶來(lái)性能飛躍和成本下降。

      這正是英偉達(dá)必須深耕一個(gè)又一個(gè)庫(kù)、一個(gè)又一個(gè)領(lǐng)域、一個(gè)又一個(gè)垂直行業(yè)的原因。我們是一家垂直整合的計(jì)算公司,沒(méi)有其他路可走。我們必須理解應(yīng)用,理解領(lǐng)域,深刻理解算法,并能夠?qū)⑵洳渴鹪谌魏螆?chǎng)景下——數(shù)據(jù)中心、云端、本地、邊緣乃至機(jī)器人系統(tǒng)。

      同時(shí),英偉達(dá)保持橫向開放,愿意將技術(shù)整合進(jìn)任何合作伙伴的平臺(tái),讓全世界都能享受到加速計(jì)算的紅利。

      本屆GTC的參會(huì)者結(jié)構(gòu)充分體現(xiàn)了這一點(diǎn)。本次參會(huì)者中,金融服務(wù)行業(yè)的比例最高——希望來(lái)的是開發(fā)者,不是交易員。我們的生態(tài)系統(tǒng)覆蓋了上游和下游供應(yīng)鏈。無(wú)論是成立50年、70年還是150年的企業(yè),去年都迎來(lái)了歷史最佳年份。我們正處于某件非常、非常重大的事情的起點(diǎn)。

      CUDA-X:各行業(yè)的加速計(jì)算引擎

      在各個(gè)垂直領(lǐng)域,英偉達(dá)均已深度布局:

      ● 自動(dòng)駕駛:覆蓋范圍廣泛,影響深遠(yuǎn)

      ● 金融服務(wù):量化投資正從人工特征工程轉(zhuǎn)向超級(jí)計(jì)算機(jī)驅(qū)動(dòng)的深度學(xué)習(xí),迎來(lái)其"Transformer時(shí)刻"

      ● 醫(yī)療健康:正在迎來(lái)屬于自己的"ChatGPT時(shí)刻",涵蓋AI輔助藥物發(fā)現(xiàn)、AI智能體支持診斷、醫(yī)療客服等方向

      ● 工業(yè):全球規(guī)模最大的建設(shè)浪潮正在展開,AI工廠、芯片廠、數(shù)據(jù)中心廠紛紛落地

      ● 娛樂(lè)與游戲:實(shí)時(shí)AI平臺(tái)支持翻譯、直播、游戲互動(dòng),以及智能購(gòu)物代理

      ● 機(jī)器人:深耕十余年,三大計(jì)算機(jī)架構(gòu)(訓(xùn)練計(jì)算機(jī)、仿真計(jì)算機(jī)、機(jī)載計(jì)算機(jī))齊備,本次展會(huì)共有110款機(jī)器人亮相

      ● 電信:約2萬(wàn)億美元規(guī)模的行業(yè),基站將從單一通信功能演進(jìn)為AI基礎(chǔ)設(shè)施平臺(tái),相關(guān)平臺(tái)名為Aerial,與諾基亞、T-Mobile等企業(yè)均有深度合作

      以上所有領(lǐng)域的核心,正是我們的CUDA-X庫(kù)——這是英偉達(dá)作為算法公司的根本所在。這些庫(kù)是公司最核心的資產(chǎn),讓計(jì)算平臺(tái)得以在各個(gè)行業(yè)發(fā)揮實(shí)際價(jià)值。

      其中最重要的庫(kù)之一,是cuDNN(CUDA深度神經(jīng)網(wǎng)絡(luò)庫(kù)),它徹底革新了人工智能,引發(fā)了現(xiàn)代AI的大爆炸。

      大家剛才看到的一切都是仿真——包括基于物理原理的求解器、AI代理物理模型,以及物理AI機(jī)器人模型。一切均為仿真,沒(méi)有任何手工動(dòng)畫或關(guān)節(jié)綁定。這正是英偉達(dá)的核心能力所在:通過(guò)對(duì)算法的深刻理解與計(jì)算平臺(tái)的有機(jī)結(jié)合,解鎖這些機(jī)遇。

      AI原生企業(yè)與新計(jì)算時(shí)代

      你們剛才看到了沃爾瑪、歐萊雅、摩根大通、羅氏、豐田等定義當(dāng)今社會(huì)的行業(yè)巨頭,也有一大批大家從未聽說(shuō)過(guò)的公司——我們稱之為AI原生企業(yè)。這份名單極為龐大,里面有OpenAI、Anthropic,以及眾多服務(wù)于不同垂直領(lǐng)域的新興企業(yè)。

      過(guò)去兩年,這一行業(yè)經(jīng)歷了驚人的騰飛。風(fēng)險(xiǎn)投資流入初創(chuàng)企業(yè)的資金規(guī)模達(dá)到1,500億美元,創(chuàng)人類歷史之最。

      更重要的是,單筆投資規(guī)模首次從數(shù)百萬(wàn)美元躍升至數(shù)億乃至數(shù)十億美元。原因只有一個(gè):這是史上第一次,每一家此類公司都需要大量計(jì)算資源和大量token。這個(gè)行業(yè)正在創(chuàng)造、生成token,或者為來(lái)自Anthropic、OpenAI等機(jī)構(gòu)的token增值。

      正如PC革命、互聯(lián)網(wǎng)革命、移動(dòng)云革命各自孕育出一批劃時(shí)代的企業(yè),這一代計(jì)算平臺(tái)變革同樣將誕生一批極具影響力的公司,成為未來(lái)世界的重要力量。

      推動(dòng)這一切的三大歷史性突破

      過(guò)去兩年究竟發(fā)生了什么?三件大事。

      第一:ChatGPT,開啟生成式AI時(shí)代(2022年底至2023年)

      它不僅能感知和理解,還能生成獨(dú)特內(nèi)容。我展示了生成式AI與計(jì)算機(jī)圖形的融合。生成式AI從根本上改變了計(jì)算的方式——計(jì)算從檢索式轉(zhuǎn)變?yōu)樯墒?,這深刻影響著計(jì)算機(jī)架構(gòu)、部署方式和整體意義。

      第二:推理AI(Reasoning AI),以o1為代表

      推理能力使AI能夠自我反思、規(guī)劃、分解問(wèn)題——將它無(wú)法直接理解的問(wèn)題拆解為可處理的步驟。o1讓生成式AI變得可信,能夠依據(jù)真實(shí)信息進(jìn)行推理。為此,輸入context的token量和用于思考的輸出token量大幅增加,計(jì)算量隨之顯著提升。

      第三:Claude Code,首個(gè)智能體模型

      它能讀取文件、編寫代碼、編譯、測(cè)試、評(píng)估并迭代。Claude Code徹底革新了軟件工程——英偉達(dá)100%的工程師都在使用Claude Code、Codex和Cursor中的一種或多種,沒(méi)有一位軟件工程師不借助AI助力。

      這是一個(gè)全新的拐點(diǎn)——你不再是詢問(wèn)AI"是什么、在哪里、怎么做",而是讓它"創(chuàng)建、執(zhí)行、構(gòu)建",讓它主動(dòng)使用工具、讀取文件、分解問(wèn)題、付諸行動(dòng)。AI從感知,到生成,到推理,再到如今真正能夠完成工作。

      過(guò)去兩年,推理所需的計(jì)算量增長(zhǎng)了約10,000倍,使用量增長(zhǎng)了約100倍。我一直認(rèn)為,過(guò)去兩年計(jì)算需求增長(zhǎng)了100萬(wàn)倍——這是所有人的共同感受,是OpenAI的感受,是Anthropic的感受。如果能獲得更多算力,就能生成更多token,收入就會(huì)提升,AI就會(huì)變得更智能。推理拐點(diǎn)已然到來(lái)。

      萬(wàn)億美元的AI基礎(chǔ)設(shè)施時(shí)代

      去年此時(shí),我在這里表示,我們對(duì)Blackwell和Rubin在2026年之前的需求和采購(gòu)訂單有高度信心,規(guī)模約為5,000億美元。今天,在GTC一年之后,我站在這里告訴大家:展望到2027年,我看到的數(shù)字至少是1萬(wàn)億美元。而且我確信,實(shí)際的計(jì)算需求將遠(yuǎn)不止于此。

      2025:英偉達(dá)推理年

      2025年是英偉達(dá)的推理年(Year of Inference)。我們希望確保,在訓(xùn)練和后訓(xùn)練之外,也能在AI生命周期的每個(gè)階段都保持卓越,使已投資的基礎(chǔ)設(shè)施能夠持續(xù)高效運(yùn)轉(zhuǎn),且有效使用壽命越長(zhǎng),單位成本越低。

      與此同時(shí),Anthropic和Meta正式加入NVIDIA平臺(tái),與此共同代表了全球三分之一的AI算力需求。開源模型已接近前沿水平,無(wú)處不在。

      英偉達(dá)是目前全球唯一一個(gè)能夠運(yùn)行所有AI領(lǐng)域——語(yǔ)言、生物學(xué)、計(jì)算機(jī)圖形、計(jì)算機(jī)視覺(jué)、語(yǔ)音、蛋白質(zhì)與化學(xué)、機(jī)器人等——所有AI模型的平臺(tái),無(wú)論邊緣還是云端,無(wú)論何種語(yǔ)言。英偉達(dá)架構(gòu)對(duì)所有這些場(chǎng)景均具備通用性,這使我們成為成本最低、置信度最高的平臺(tái)。

      目前,英偉達(dá)60%的業(yè)務(wù)來(lái)自全球前五大超大規(guī)模云服務(wù)商,剩余40%遍布區(qū)域云、主權(quán)云、企業(yè)、工業(yè)、機(jī)器人、邊緣計(jì)算等各個(gè)領(lǐng)域。AI的覆蓋廣度本身就是其韌性所在——這毫無(wú)疑問(wèn)是一次全新的計(jì)算平臺(tái)變革。

      Grace Blackwell與NVLink 72:大膽的架構(gòu)革新

      在Hopper架構(gòu)還處于鼎盛時(shí)期,我們就決定徹底重新架構(gòu)系統(tǒng),將NVLink從8路擴(kuò)展為NVLink 72,對(duì)計(jì)算系統(tǒng)進(jìn)行全面分解重構(gòu)。Grace Blackwell NVLink 72是一次巨大的技術(shù)押注,對(duì)所有合作伙伴而言都不容易,在此向所有人表示誠(chéng)摯感謝。

      同時(shí),我們推出了NVFP4——不只是普通的FP4,而是一種全新類型的張量核心和計(jì)算單元。

      我們已經(jīng)證明,NVFP4可以在無(wú)精度損失的情況下實(shí)現(xiàn)推理,同時(shí)帶來(lái)巨大的性能提升和能效提升,并且同樣適用于訓(xùn)練。此外,Dynamo和TensorRT-LLM等一系列新算法相繼問(wèn)世,我們甚至為優(yōu)化內(nèi)核而專門投入數(shù)十億美元建造了一臺(tái)超級(jí)計(jì)算機(jī),稱之為DGX Cloud。

      結(jié)果證明,我們的推理性能令人矚目。來(lái)自Semi Analysis的數(shù)據(jù)——這是迄今為止最全面的AI推理性能評(píng)測(cè)——顯示英偉達(dá)在每瓦token數(shù)和每token成本兩個(gè)維度上均遙遙領(lǐng)先。原本摩爾定律可能給H200帶來(lái)1.5倍的性能提升,但我們做到了35倍。

      Semi Analysis的Dylan Patel甚至說(shuō):"黃仁勛保守了,實(shí)際上是50倍。"他說(shuō)得沒(méi)錯(cuò)。

      我在此援引他的話:"Jensen sandbagged(黃仁勛保守報(bào)數(shù))。"

      英偉達(dá)的每token成本是全球最低,目前無(wú)人能及。原因正在于極致協(xié)同設(shè)計(jì)(Extreme Co-design)。

      以Fireworks為例,在英偉達(dá)更新全套軟件和算法之前,其平均token速度約為每秒700個(gè);更新后接近每秒5,000個(gè),提升約7倍。這就是極致協(xié)同設(shè)計(jì)的力量。

      AI工廠:從數(shù)據(jù)中心到token工廠

      數(shù)據(jù)中心過(guò)去是存儲(chǔ)文件的地方,現(xiàn)在它是生產(chǎn)token的工廠。每一家云服務(wù)商、每一家AI公司,未來(lái)都將以"token工廠效率"作為核心經(jīng)營(yíng)指標(biāo)。

      這是我的核心論點(diǎn):

      ● 縱軸:吞吐量(Throughput)——在固定功率下每秒生成的token數(shù)

      ● 橫軸:交互速度(Token Speed)——每次推理的響應(yīng)速度,速度越快,可使用的模型越大、context越長(zhǎng),AI越智能

      token是新的大宗商品,一旦成熟,將分層定價(jià):

      ● 免費(fèi)層(高吞吐、低速度)

      ● 中級(jí)層(~每百萬(wàn)token 3美元)

      ● 高級(jí)層(~每百萬(wàn)token 6美元)

      ● 高速層(~每百萬(wàn)token 45美元)

      ● 超高速層(~每百萬(wàn)token 150美元)

      與Hopper相比,Grace Blackwell在最高價(jià)值層提升了35倍吞吐量,并引入全新層級(jí)。以簡(jiǎn)化模型估算,將25%功率分別分配給四個(gè)層級(jí),Grace Blackwell可比Hopper多產(chǎn)生5倍的收入。

      Vera Rubin:下一代AI計(jì)算系統(tǒng)

      Vera Rubin是一個(gè)完整的、端到端優(yōu)化的系統(tǒng),專為智能體(Agentic)工作負(fù)載設(shè)計(jì):

      ● 大型語(yǔ)言模型計(jì)算核心:NVLink 72 GPU集群,處理前填充(Prefill)和KV Cache

      ● 全新Vera CPU:專為極高單線程性能設(shè)計(jì),采用LPDDR5內(nèi)存,兼具卓越能效,是全球唯一使用LPDDR5的數(shù)據(jù)中心CPU,適合AI智能體工具調(diào)用

      存儲(chǔ)系統(tǒng):BlueField 4 + CX 9,面向AI時(shí)代的全新存儲(chǔ)平臺(tái),全球存儲(chǔ)行業(yè)100%加入

      ● CPO Spectrum X交換機(jī):全球首款共封裝光學(xué)以太網(wǎng)交換機(jī),已全面量產(chǎn)

      ● Kyber機(jī)架:全新機(jī)架系統(tǒng),支持144塊GPU組成單一NVLink域,前端計(jì)算、后端NVLink交換,形成一臺(tái)巨型計(jì)算機(jī)

      ● Rubin Ultra:下一代超算節(jié)點(diǎn),豎插式設(shè)計(jì),配合Kyber機(jī)架,支持更大規(guī)模NVLink互聯(lián)

      Vera Rubin已100%液冷,安裝時(shí)間從兩天縮短至兩小時(shí),采用45°C熱水冷卻,大幅降低數(shù)據(jù)中心冷卻壓力。這次Satya(納德拉)已發(fā)文確認(rèn),首臺(tái)Vera Rubin機(jī)架已在微軟Azure上線運(yùn)行,我為此深感振奮。

      Groq整合:推理性能的極致延伸

      我們收購(gòu)了Groq團(tuán)隊(duì)并獲得其技術(shù)授權(quán)。Groq是一種確定性數(shù)據(jù)流處理器(Deterministic Dataflow Processor),采用靜態(tài)編譯和編譯器調(diào)度,擁有大量SRAM,專為推理單一工作負(fù)載優(yōu)化,具備極低延遲和極高token生成速度。

      然而,Groq的內(nèi)存容量有限(500MB片上SRAM),難以獨(dú)立承載大模型的參數(shù)和KV Cache,限制了其大規(guī)模應(yīng)用。

      解決方案正是Dynamo——一套推理調(diào)度軟件。我們通過(guò)Dynamo將推理管線解聚(Disaggregate):

      **前填充(Prefill)及注意力機(jī)制的解碼(Decode)**在Vera Rubin上完成(需要大量算力和KV Cache存儲(chǔ))

      **前饋網(wǎng)絡(luò)解碼(Feed-Forward Network Decode)**即token生成部分,在Groq上完成(需要極高帶寬和低延遲)

      兩者通過(guò)以太網(wǎng)緊密耦合,借助特殊模式將延遲減少約一半。在Dynamo這一"AI工廠操作系統(tǒng)"的統(tǒng)一調(diào)度下,整體性能提升35倍,并開辟了NVLink 72此前無(wú)法觸及的全新推理性能層級(jí)。

      Groq與Vera Rubin的組合建議:

      若工作負(fù)載以高吞吐為主,使用100% Vera Rubin

      若大量工作負(fù)載為代碼生成等高價(jià)值token生成,可引入Groq,建議比例約為25% Groq + 75% Vera Rubin

      Groq LP30由三星代工,目前已進(jìn)入量產(chǎn),預(yù)計(jì)Q3開始出貨。感謝三星的全力配合。

      推理性能的歷史性飛躍

      將此前技術(shù)進(jìn)步量化:在2年時(shí)間內(nèi),1吉瓦AI工廠的token生成速率將從2,200萬(wàn)token/秒提升至7億token/秒,提升350倍。這就是極致協(xié)同設(shè)計(jì)的力量。

      技術(shù)路線圖

      Blackwell:當(dāng)前在產(chǎn),Oberon標(biāo)準(zhǔn)機(jī)架系統(tǒng),銅纜擴(kuò)展至NVLink 72,可選光學(xué)擴(kuò)展至NVLink 576

      Vera Rubin(當(dāng)前):Kyber機(jī)架,NVLink 144(銅纜);Oberon機(jī)架,NVLink 72 + 光學(xué),擴(kuò)展至NVLink 576;Spectrum 6,全球首款CPO交換機(jī)

      Vera Rubin Ultra(即將推出):新一代Rubin Ultra GPU,LP35芯片(首次集成NVFP4),進(jìn)一步提升數(shù)倍性能

      Feynman(下一代):全新GPU,LP40芯片(由英偉達(dá)與Groq團(tuán)隊(duì)聯(lián)合打造,集成NVFP4);全新CPU——Rosa(Rosalyn);BlueField 5;CX 10;同時(shí)支持銅纜和CPO兩種擴(kuò)展方式的Kyber機(jī)架

      路線圖明確:銅纜擴(kuò)展、光學(xué)擴(kuò)展(Scale-Up)、光學(xué)擴(kuò)展(Scale-Out)三條路線并行推進(jìn),我們需要所有合作伙伴在銅纜、光纖和CPO方面持續(xù)擴(kuò)產(chǎn)。

      NVIDIA DSX:AI工廠的數(shù)字孿生平臺(tái)

      AI工廠越來(lái)越復(fù)雜,但組成它的各類技術(shù)供應(yīng)商過(guò)去從未在設(shè)計(jì)階段相互協(xié)作,直到在數(shù)據(jù)中心才"相遇"——這顯然不夠。

      為此,我們創(chuàng)建了Omniverse,以及基于其上的NVIDIA DSX平臺(tái)——一個(gè)供所有合作伙伴在虛擬世界中共同設(shè)計(jì)和運(yùn)營(yíng)吉瓦級(jí)AI工廠的平臺(tái)。DSX提供:

      ● 機(jī)架級(jí)機(jī)械、熱學(xué)、電氣、網(wǎng)絡(luò)仿真系統(tǒng)理

      ● 與電網(wǎng)的連接,實(shí)現(xiàn)協(xié)同節(jié)能調(diào)度

      ● 數(shù)據(jù)中心內(nèi)基于Max-Q的動(dòng)態(tài)功耗和冷卻優(yōu)化

      保守估計(jì),這套系統(tǒng)可將能源利用效率提升約2倍,在我們談?wù)摰囊?guī)模上,這是非??捎^的收益。Omniverse從數(shù)字地球開始,將承載各種規(guī)模的數(shù)字孿生,我們正與全球合作伙伴共同構(gòu)建人類歷史上最大的計(jì)算機(jī)。

      此外,英偉達(dá)正在進(jìn)軍太空。Thor芯片已通過(guò)輻射認(rèn)證,正在衛(wèi)星中運(yùn)行。我們正與合作伙伴開發(fā)Vera Rubin Space-1,用于建設(shè)太空數(shù)據(jù)中心。在太空中只能依靠輻射散熱,熱管理是核心挑戰(zhàn),我們正集結(jié)頂尖工程師攻關(guān)。

      OpenClaw:智能體時(shí)代的操作系統(tǒng)

      Peter Steinberger開發(fā)了一款名為OpenClaw的軟件。這是人類歷史上最受歡迎的開源項(xiàng)目,在短短幾周內(nèi)便超越了Linux三十年的成就。

      OpenClaw本質(zhì)上是一個(gè)智能體系統(tǒng)(Agentic System),能夠:

      管理資源,訪問(wèn)工具、文件系統(tǒng)和大型語(yǔ)言模型;執(zhí)行調(diào)度、定時(shí)任務(wù);將問(wèn)題逐步分解,并調(diào)用子智能體;支持任意模態(tài)的輸入輸出(語(yǔ)音、視頻、文字、郵件等)。

      用操作系統(tǒng)的語(yǔ)法來(lái)描述,它確實(shí)就是一個(gè)操作系統(tǒng)——智能體計(jì)算機(jī)的操作系統(tǒng)。Windows讓個(gè)人計(jì)算機(jī)成為可能,OpenClaw讓個(gè)人智能體成為可能。

      每一家企業(yè)都需要制定自己的OpenClaw戰(zhàn)略,正如我們都需要Linux策略、HTML策略、Kubernetes策略一樣。

      企業(yè)IT的全面重塑

      OpenClaw之前的企業(yè)IT:數(shù)據(jù)和文件進(jìn)入系統(tǒng),流經(jīng)工具和工作流,最終變成供人類使用的工具。軟件公司創(chuàng)建工具,系統(tǒng)集成商(GSI)和咨詢公司幫助企業(yè)使用這些工具。

      OpenClaw之后的企業(yè)IT:每一家SaaS公司都將轉(zhuǎn)變?yōu)锳aaS(Agentic as a Service,智能體即服務(wù))公司——不只是提供工具,而是提供專精特定領(lǐng)域的AI智能體。

      但這里有一個(gè)關(guān)鍵挑戰(zhàn):企業(yè)內(nèi)部的智能體可以訪問(wèn)敏感數(shù)據(jù)、執(zhí)行代碼、與外部通信。這在企業(yè)環(huán)境中必須得到嚴(yán)格管控。

      為此,我們與Peter合作,將安全性融入企業(yè)級(jí)版本,推出了:

      ● NeMo Claw(參考設(shè)計(jì)):基于OpenClaw的企業(yè)級(jí)參考框架,集成NVIDIA的全套智能體AI工具包

      ● Open Shield(安全層):已集成至OpenClaw,提供策略引擎、網(wǎng)絡(luò)護(hù)欄、隱私路由,確保企業(yè)數(shù)據(jù)安全

      ● NeMo Cloud:可下載使用,并與所有SaaS企業(yè)的策略引擎對(duì)接

      這是企業(yè)IT的文藝復(fù)興,一個(gè)原本2萬(wàn)億美元規(guī)模的產(chǎn)業(yè),即將成長(zhǎng)為數(shù)萬(wàn)億美元規(guī)模,從提供工具轉(zhuǎn)向提供專業(yè)化的AI智能體服務(wù)。

      我完全可以預(yù)見:未來(lái),公司里的每一位工程師都將擁有年度token預(yù)算。他們年薪可能是幾十萬(wàn)美元,我會(huì)額外給他們相當(dāng)于薪資一半的token配額,讓他們的產(chǎn)出放大10倍。"入職附帶多少token配額"已經(jīng)成為硅谷的新晉招聘話題。

      每一家企業(yè)未來(lái)都將既是token的使用者(供工程師使用),也是token的生產(chǎn)者(為其客戶提供服務(wù))。OpenClaw的意義不可低估,它和HTML、Linux一樣重要。

      NVIDIA開放模型倡議

      在自定義智能體(Custom Claw)方面,我們提供了NVIDIA自研的前沿模型:

      模型領(lǐng)域Nemotron大型語(yǔ)言模型Cosmos世界基礎(chǔ)模型(World Foundation Model)GROOT通用人形機(jī)器人模型Alpamayo自動(dòng)駕駛BioNeMo數(shù)字生物學(xué)Phys-AIAI物理

      我們?cè)诿恳粋€(gè)領(lǐng)域都處于技術(shù)前沿,并承諾持續(xù)迭代——Nemotron 3之后有Nemotron 4,Cosmos 1之后有Cosmos 2,Groq也將迭代到第二代。

      Nemotron 3在OpenClaw中名列全球三大最佳模型之列,處于前沿水平。Nemotron 3 Ultra將成為有史以來(lái)最強(qiáng)的基礎(chǔ)模型,支持各國(guó)構(gòu)建主權(quán)AI。

      今天,我們宣布成立Nemotron聯(lián)盟,投資數(shù)十億美元推進(jìn)AI基礎(chǔ)模型研發(fā)。聯(lián)盟成員包括:BlackForest Labs、Cursor、LangChain、Mistral、Perplexity、Reflection、Sarvam(印度)、Thinking Machines(Mira Murati的實(shí)驗(yàn)室)等。一個(gè)又一個(gè)企業(yè)軟件公司加入,將NeMo Claw參考設(shè)計(jì)和NVIDIA智能體AI工具包整合到自身產(chǎn)品中。

      物理AI與機(jī)器人

      數(shù)字智能體在數(shù)字世界中行動(dòng)——撰寫代碼、分析數(shù)據(jù);而物理AI則是具身化的智能體,也就是機(jī)器人。

      本次GTC共有110款機(jī)器人亮相,幾乎囊括了全球所有機(jī)器人研發(fā)企業(yè)。英偉達(dá)提供三臺(tái)計(jì)算機(jī)(訓(xùn)練計(jì)算機(jī)、仿真計(jì)算機(jī)、機(jī)載計(jì)算機(jī))和完整的軟件棧及AI模型。

      自動(dòng)駕駛方面

      自動(dòng)駕駛的"ChatGPT時(shí)刻"已經(jīng)到來(lái)。今天,我們宣布四家新合作伙伴加入英偉達(dá)RoboTaxi Ready平臺(tái):比亞迪、現(xiàn)代、日產(chǎn)、吉利,合計(jì)年產(chǎn)量1,800萬(wàn)輛。加上此前的奔馳、豐田、通用,陣容進(jìn)一步壯大。我們同時(shí)宣布與Uber達(dá)成重大合作,將在多個(gè)城市部署并接入RoboTaxi Ready車輛。

      工業(yè)機(jī)器人方面

      ABB、Universal Robotics、KUKA等眾多機(jī)器人企業(yè)與我們合作,將物理AI模型與仿真系統(tǒng)相結(jié)合,推動(dòng)機(jī)器人在全球制造產(chǎn)線的落地。

      電信方面

      卡特彼勒(Caterpillar)和T-Mobile也在其列。未來(lái),無(wú)線基站將不再只是一個(gè)通信節(jié)點(diǎn),而是一個(gè)NVIDIA Aerial AI RAN——能夠?qū)崟r(shí)感知流量、調(diào)整波束成形,實(shí)現(xiàn)節(jié)能增效的智能化邊緣計(jì)算平臺(tái)。

      特別環(huán)節(jié):Olaf機(jī)器人亮相

      黃仁勛: 雪人登場(chǎng)!Newton運(yùn)行正常!Omniverse也運(yùn)行正常!Olaf,你好嗎?

      Olaf: 見到你我真的太開心了。

      黃仁勛: 是的,因?yàn)槭俏医o了你計(jì)算機(jī)——Jetson!

      Olaf: 那是什么?

      黃仁勛: 就在你的肚子里。

      Olaf: 太神奇了。

      黃仁勛: 你是在Omniverse里學(xué)會(huì)走路的。

      Olaf: 我喜歡走路。這比騎馴鹿仰望美麗的天空好多了。

      黃仁勛: 這正是因?yàn)槲锢矸抡妗贜VIDIA Warp運(yùn)行的Newton求解器,這是我們與Disney和DeepMind聯(lián)合開發(fā)的,讓你能夠適應(yīng)真實(shí)的物理世界。

      Olaf: 我正想說(shuō)這個(gè)。

      黃仁勛: 這就是你聰明的地方。我是雪人,不是雪球。

      黃仁勛: 你能想象嗎?未來(lái)的迪士尼樂(lè)園——所有這些機(jī)器人角色在園區(qū)里自由漫步。不過(guò)說(shuō)實(shí)話,我以為你會(huì)更高一些。我從沒(méi)見過(guò)這么矮的雪人。

      Olaf: (不置可否)

      黃仁勛: 來(lái)幫我結(jié)束今天的演講好嗎?

      Olaf: 太棒啦!

      主題演講總結(jié)

      今天,我們共同探討了以下核心主題:

      ● 推理拐點(diǎn)的到來(lái):推理已成為AI最核心的工作負(fù)載,token是新的大宗商品,推理性能直接決定收入

      ● AI工廠時(shí)代:數(shù)據(jù)中心已從文件存儲(chǔ)設(shè)施演變?yōu)閠oken生產(chǎn)工廠,未來(lái)每家公司都將以"AI工廠效率"來(lái)衡量自身競(jìng)爭(zhēng)力

      ● OpenClaw智能體革命:OpenClaw開啟了智能體計(jì)算時(shí)代,企業(yè)IT正在從工具時(shí)代走向智能體時(shí)代,每家企業(yè)都需要制定OpenClaw戰(zhàn)略

      ● 物理AI與機(jī)器人:具身智能正在規(guī)模化落地,自動(dòng)駕駛、工業(yè)機(jī)器人、人形機(jī)器人共同構(gòu)成物理AI的下一個(gè)重大機(jī)遇

      感謝大家,GTC愉快!

      全球布局· 科技驅(qū)動(dòng)· 數(shù)智升級(jí)· 金融創(chuàng)新

      長(zhǎng)江CEO21期以遠(yuǎn)見致新局

      點(diǎn)擊下方卡片,關(guān)注長(zhǎng)江商學(xué)院


      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      中央氣象臺(tái):23日夜間至27日,陜西、重慶、河南、安徽、湖南、湖北、江蘇、江西等地有大到暴雨,江南北部將有雷暴大風(fēng)或冰雹等強(qiáng)對(duì)流天氣

      中央氣象臺(tái):23日夜間至27日,陜西、重慶、河南、安徽、湖南、湖北、江蘇、江西等地有大到暴雨,江南北部將有雷暴大風(fēng)或冰雹等強(qiáng)對(duì)流天氣

      魯中晨報(bào)
      2026-05-22 17:46:13
      NOAA發(fā)布2026大西洋颶風(fēng)季預(yù)測(cè):厄爾尼諾或致風(fēng)暴減少

      NOAA發(fā)布2026大西洋颶風(fēng)季預(yù)測(cè):厄爾尼諾或致風(fēng)暴減少

      硬核玩家2哈
      2026-05-22 01:00:27
      內(nèi)蒙古女籃行賄細(xì)節(jié):總決賽G2裁判收錢后反手舉報(bào)

      內(nèi)蒙古女籃行賄細(xì)節(jié):總決賽G2裁判收錢后反手舉報(bào)

      體壇周報(bào)
      2026-05-22 17:33:58
      炒美股的天塌了

      炒美股的天塌了

      販財(cái)局
      2026-05-22 17:24:40
      炸穿內(nèi)娛!景甜被曝簽海外代孕協(xié)議,3000萬(wàn)轉(zhuǎn)賬+5000萬(wàn)坐地起價(jià)

      炸穿內(nèi)娛!景甜被曝簽海外代孕協(xié)議,3000萬(wàn)轉(zhuǎn)賬+5000萬(wàn)坐地起價(jià)

      草莓解說(shuō)體育
      2026-05-22 14:58:18
      震驚!網(wǎng)傳天津一女顧客在試衣間,將新衣服扔在地上當(dāng)作墊腳布

      震驚!網(wǎng)傳天津一女顧客在試衣間,將新衣服扔在地上當(dāng)作墊腳布

      火山詩(shī)話
      2026-05-22 08:19:33
      我國(guó)為何難以造出頂尖芯片?

      我國(guó)為何難以造出頂尖芯片?

      史政先鋒
      2026-05-22 16:05:37
      侄子在我家吃住8年,得知我給女兒陪嫁房,他問(wèn):我結(jié)婚用什么?

      侄子在我家吃住8年,得知我給女兒陪嫁房,他問(wèn):我結(jié)婚用什么?

      悠悠我心情感集
      2026-05-19 14:32:34
      香港演員黃百鳴,內(nèi)幕交易罪名成立

      香港演員黃百鳴,內(nèi)幕交易罪名成立

      新浪財(cái)經(jīng)
      2026-05-22 18:32:04
      徹底封神!尼克斯簽下布倫森堪稱史詩(shī)級(jí)簽約,獨(dú)行俠追悔莫及!

      徹底封神!尼克斯簽下布倫森堪稱史詩(shī)級(jí)簽約,獨(dú)行俠追悔莫及!

      田先生籃球
      2026-05-22 17:44:07
      騰訊承諾:不再與《附加限制性條件承諾方案》中定義的版權(quán)方達(dá)成或變相達(dá)成版權(quán)獨(dú)家授權(quán)合同

      騰訊承諾:不再與《附加限制性條件承諾方案》中定義的版權(quán)方達(dá)成或變相達(dá)成版權(quán)獨(dú)家授權(quán)合同

      界面新聞
      2026-05-22 16:07:00
      招商局集團(tuán)黨委:堅(jiān)決擁護(hù)黨中央決定

      招商局集團(tuán)黨委:堅(jiān)決擁護(hù)黨中央決定

      環(huán)球網(wǎng)資訊
      2026-05-22 19:56:21
      數(shù)據(jù)證明:妻子失業(yè),丈夫會(huì)養(yǎng)活妻子;丈夫失業(yè),妻子會(huì)提出離婚

      數(shù)據(jù)證明:妻子失業(yè),丈夫會(huì)養(yǎng)活妻子;丈夫失業(yè),妻子會(huì)提出離婚

      舒山有鹿
      2026-05-21 11:06:33
      太子集團(tuán)陳志幕后大佬身份揭秘:10多年前公安部掛牌督辦案件頭目之一

      太子集團(tuán)陳志幕后大佬身份揭秘:10多年前公安部掛牌督辦案件頭目之一

      紅星新聞
      2026-05-22 19:30:14
      “目前為止,看過(guò)最好的民國(guó)史!”

      “目前為止,看過(guò)最好的民國(guó)史!”

      尚曦讀史
      2026-05-21 07:06:34
      請(qǐng)5萬(wàn)員工帶薪玩迪士尼,預(yù)計(jì)花費(fèi)八千萬(wàn)!老板豪氣回應(yīng):公司掙了錢就是要跟員工一起花

      請(qǐng)5萬(wàn)員工帶薪玩迪士尼,預(yù)計(jì)花費(fèi)八千萬(wàn)!老板豪氣回應(yīng):公司掙了錢就是要跟員工一起花

      新浪財(cái)經(jīng)
      2026-05-22 21:20:17
      教育部:擬設(shè)34所本科高等學(xué)校

      教育部:擬設(shè)34所本科高等學(xué)校

      界面新聞
      2026-05-22 21:01:51
      北京出局揪出最大膿包!應(yīng)變能力太差,末節(jié)用錯(cuò)2人,京蜜:快滾

      北京出局揪出最大膿包!應(yīng)變能力太差,末節(jié)用錯(cuò)2人,京蜜:快滾

      南海浪花
      2026-05-22 22:37:22
      偽不物質(zhì)的擰巴!鄭州相親大會(huì)32歲女士發(fā)言引爭(zhēng)議:霸道總愛上我

      偽不物質(zhì)的擰巴!鄭州相親大會(huì)32歲女士發(fā)言引爭(zhēng)議:霸道總愛上我

      火山詩(shī)話
      2026-05-22 15:31:50
      形勢(shì)有多嚴(yán)峻?網(wǎng)傳2026年520舔狗經(jīng)濟(jì)崩潰了,評(píng)論區(qū)炸鍋…

      形勢(shì)有多嚴(yán)峻?網(wǎng)傳2026年520舔狗經(jīng)濟(jì)崩潰了,評(píng)論區(qū)炸鍋…

      慧翔百科
      2026-05-22 17:32:34
      2026-05-23 04:43:00
       長(zhǎng)江商學(xué)院
      長(zhǎng)江商學(xué)院
      長(zhǎng)江商學(xué)院
      1710文章數(shù) 7845關(guān)注度
      往期回顧 全部

      科技要聞

      雷軍:輸給特斯拉不丟人

      頭條要聞

      伊朗前總統(tǒng)內(nèi)賈德被指是"最大內(nèi)鬼" 其目前下落不明

      頭條要聞

      伊朗前總統(tǒng)內(nèi)賈德被指是"最大內(nèi)鬼" 其目前下落不明

      體育要聞

      最糟糕裁判?他想要退役當(dāng)市長(zhǎng)

      娛樂(lè)要聞

      周也戀情曝光!對(duì)象身份不簡(jiǎn)單

      財(cái)經(jīng)要聞

      富途擬被罰18.5億元 老虎 長(zhǎng)橋也回應(yīng)了

      汽車要聞

      11萬(wàn)級(jí)直接上四驅(qū) 銀河星耀7限時(shí)權(quán)益價(jià)9.88萬(wàn)起

      態(tài)度原創(chuàng)

      游戲
      家居
      房產(chǎn)
      親子
      公開課

      《黑旗重制》確認(rèn)支持PS5 Pro神技!畫質(zhì)性能要起飛

      家居要聞

      低調(diào)傳承 溫潤(rùn)沉靜

      房產(chǎn)要聞

      瘋搶511輪!今年海南最魔幻的地塊,被福建能源企業(yè)搶了!

      親子要聞

      家長(zhǎng)一定要注意,千萬(wàn)別讓孩子獨(dú)自一人到處亂跑!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 人人操网| 久久伊人中文字幕| 狠狠色噜噜狠狠狠狠AV| 亚洲日韩?国产丝袜?在线精品| 国产精品福利一级久久| 欧美在线精品怡红院| 国产蜜臀av在线一区尤物| 91精品国产91久无码网站| 少妇系列在线观看| 草裙社区精品视频播放| 久久国产精品偷任你爽任你 | 欧美喷白浆| 俺也来国产精品欧美在线观看| 91精品国产91久无码网站| 免费大片黄国产在线观看| 中文字幕有码无码av| 欧美成人免费| 天天爽夜夜爽夜夜爽精品视频| 久热国产精品视频一区二区三区| 99热门精品一区二区三区无码| 午夜大片免费男女爽爽影院| 先锋影音最新色资源站| 精品无码一区二区三区电影| 成在线人午夜剧场免费无码 | 大地资源高清免费观看| 911行情蘑菇5秒跳转| 久久久久亚洲AV成人网毛片| 亚洲欧美人成网站在线观看看| 3Pav图| 婷婷丁香六月激情综合啪| 2025av在线| 97人妻碰免费视频| 国产极品艳情生活视频在线观看免费| 亚洲性猛交xxxx| 男女猛烈激情XX00免费视频| 浴室人妻的情欲hd三级| 人妻av中文字幕久久| 亚洲中文字幕伊人久久无码 | 中文字幕久区久久中文字幕| 亚洲国产一区二区三区| 久久青青草原精品国产app|