![]()
“Why not?”
在號稱“云計算”春晚的2025年亞馬遜云科技re:Invent大會上,亞馬遜云科技CEO Matt Garman演講中就拋出一連串問題:“為什么開發者不能專注于構建而非基礎設施?為什么實驗時間與成本不能趨近于零?為什么不能讓每一個想法都成為可能?”
事實上,Matt Garman以上提問,都直指近年AI Agent火熱浪潮中,一直困擾企業群體如何真正釋放生產力的核心命題。歷年來,全球企業核心訴求需求沒有根本改變,本質仍在于提高效率(SaveTime)。這也是多年來,亞馬遜云科技這家業務規模已達1320億美元的全球云巨頭一直聚焦的工作。
Agentic AI時代,AI Agent不是手段也不是目的,而成為生產力本身,不過前提還在于,需要讓Agent安全合理地落地并實現高效運轉。亞馬遜云科技 CEO Matt Garman 在 Keynote 上就談到:“Put Agent into Work。”
事實上,過去數年AI正在從Copilot向Autopilot加速轉化過程中,不少企業已經為“聊天機器人”支付了昂貴的學費,然而實際操作下來,卻發現輔助式、被動化的問答模式,很難真正讓公司實現業績實質性增長。因此,Matt Garman強調的“Put Agent into Work”,或許也指向了AI核心定位的變化,即從一種“咨詢顧問”轉變為“數字工人”,需要以一種工作更加主動、細節更加精準、安全更加可控的行為模式,為企業切實創造價值。
如果細看2025年re:Invent大會上關鍵人物的發言傾向,不難發現,從亞馬遜云科技首席執行官Matt Garman到亞馬遜云科技Agentic AI副總裁Swami Sivasubramanian,再到亞馬遜云科技高級副總裁Peter DeSantis,均用了大量篇幅講述AI Agent究竟如何有序、有效、有用地落地。
“未來數十億Agent將滲透各行各業,助力企業實現10倍效率躍遷。”Matt Garman在開篇演講中激昂談到。
值得注意的是,近二十年來亞馬遜云科技一直通過推動云計算和生成式AI普及在各行各業“搭臺唱戲”,成為全球企業群中效能放大器的典范,“利他戰略”也讓企業實現了二次成長,僅僅在過去一年,亞馬遜云科技新增營收就達220億美元。
一、利他思維如何更好地“搭臺唱戲”
沒有一個真正的戰略家是對戰術細節不熟悉的,一個真正的戰略家也不會將戰略眼界聚焦短期勝敗上。
亞馬遜科技2025年re:Invent大會首日,公司CEO Matt Garman兩個多小時主題演講聚焦與發散并進,實際上也是以上定論的集中反映。
![]()
一方面,Matt Garman全場兩個多小時的Keynote就發布新品接近40個,集中展現了亞馬遜云全新一代自研芯片、前沿基礎模型及企業級模型定制框架等一系列重磅產品,在算力層、模型層和應用層持續突破,令人有一種應接不暇的感覺。
另一方面,Matt Garman的絕大多數時間,實際聚焦在了AI基礎設施和全新Agent產品的講解上。對此,Matt Garman直截了當地指出:“AI Agent正在把我們帶到AI發展的關鍵拐點。未來每家公司,每一個可以想象的領域中都會運行數十億個Agent!”
什么讓亞馬遜云科技有了這樣的判斷?這與近些行業在AI浪潮中所處的一個尷尬境遇密不可分:僅從目前來看,AI浪潮助力下的企業仍無法實現投入產出比的均衡,巨額投入什么時候才能轉化為企業實實在在的業績反映,也成為困擾眾多企業CEO的難題。
為了破局,為了讓AI從Assistant加速質變成能主動干活、充分釋放生產力的Agent,并且讓Agent更可信、更好用、更可控、成本更低,亞馬遜云開出了自己完整的解決方案,即算力基礎設施、推理平臺、數據、還有實現Agent 的一系列工具鏈。
貫穿亞馬遜云科技以上解決方案的核心思路則在于,向下自研芯片,以性價比夯實算力底座,中間擴充模型,提供給客戶更多、更厚的選擇,向上則樹立規則,嚴格把控Agent實際操作風險,從而真正達成一整套可用、可信、可控的技術閉環。
比如說,當下Agent對Token消耗量,已經達到了較為簡單AI對話的十倍以上。為此,如何更直接地降低Token成本,為企業提供性價比算力基礎設施配套,就成為亞馬遜云科技的一大發力點。
在備受期待的算力基礎設施構建上,亞馬遜云科技一方面作為運行NVIDIA GPU的核心場所之一,積累了大規模的GPU運行經驗,由此,本次大會公司例舉P6e GB200 超級服務器就相比上一代 P5e,計算性能提升超過20 倍。
此外,亞馬遜云科技始終沒有減緩自身底層芯片布局。本次大會上,Matt Garman宣布正式推出了最新Trainium3,并且發布Amazon Trainium3 UltraServers,這也成為亞馬遜云科技首款搭載3納米工藝AI芯片的服務器。
相較Amazon Trainium2,不僅計算能力提升4.4倍、內存帶寬提升3.9倍,每兆瓦算力可處理的AI token數量達成了5倍增長,為大規模 AI 訓練與推理帶來顯著的效率與能效優勢。并且,新一代服務器在運行OpenAI的GPT-OSS-120B模型時,每兆瓦輸出token數是Amazon Trainium2的5倍以上,可實現更極致的能耗比。
大會上,Matt Garman還首次披露了Amazon Trainium4芯片,承諾將實現較Amazon Trainium3 UltraServers六倍的FP4計算性能、四倍內存帶寬和兩倍高內存容量,繼續堅守亞馬遜云科技在AI芯片領域的長期投入的戰略定力。
![]()
值得注意的是,基礎算力的底座夯實上亞馬遜云科技常年持續投入,如今已完成超100萬個Amazon Trainium2芯片規模化部署,為Amazon Bedrock中大部分推理工作提供了穩定可靠的算力支持,并且已為公司帶來了幾十億美元可觀收入。
某種程度上說,也正式由于亞馬遜云科技對自研芯片持續的投入,也讓公司在當下越發復雜的競爭環境中擁有了更多主動權。尤其是在算力即權力的當下,一旦企業的核心利潤被上游硬件廠商大幅拿走,那么云廠商在博弈中占據主動。
從這點上說,亞馬遜云科技自研芯片構建發力點不僅僅是技術壁壘,更是一種構建自身UE的必然:尤其是當Agent時代來臨,Token消耗量呈現出指數級增長時,要想實現商業更長久健康的盈利,基礎算力上的“自研”與“降本”必不可少。
除了算力,第三方模型引用上Amazon Bedrock也持續豐富著客戶模型選擇權,在“利他戰略”下持續開源、繼續“搭臺唱戲”。大會現場,亞馬遜云科技展現出一種更為開放姿態,Matt Garman則向世人宣布,公司收錄了更多開源、通用、專用等多種類型的模型。其中,Amazon Bedrock就收錄了包括谷歌的 Gemma、NVIDIA的Nemotron,Kimi和Minimax 廠商的最新模型,真正為亞馬遜云科技的客戶提供了模型運用上更廣闊的空間。
與此同時,亞馬遜云科技也在讓自身大模型繼續進化,大會現場同步了Amazon Nova迭代到了Amazon Nova 2的最新進展。該大模型包含Amazon Nova 2 Lite、Amazon Nova 2 Pro、Amazon Nova 2 Sonic、Amazon 2 Omni四個版本可供客戶在不同場景中調用,延續了強大智能能力同時,也持續將成本效率與低延遲表現大幅提升。
并且,Amazon Nova 2實際測試中各個版本性能表現也都可圈可點。例如,Amazon Nova 2 Lite 性能就可比肩 GPT-5 Mini、Claude Haiku 4.5等業界先鋒模型。此外,Amazon Nova 2 Pro 在指令遵循、Agentic工具使用等基準上超越 GPT-5.1、Gemini 3 Pro Preview 以及 Claude Sonnet 4.5,進步顯著。
而在數據層面, Amazon AI Factories的推出,則更能反映公司的“利他戰略”:對于某些特殊客戶來說,數據處境與安全始終擺在第一性,為此,Amazon AI Factories一經推出,就可將全套的 AI 算力集群、網絡架構、存儲設施,直接打包運到客戶的本地數據中心里,實現了安全與算力的平衡統一。
事實上,Amazon AI Factories的推出,也在某種程度上揭示了一種云計算敘事邏輯的改變:過去多年,企業大趨勢是“上云”,可到AI時代后,由于數據主權、隱私和安全問題左右,如何讓“云下來”,則成為一種維護數據資產的必然選擇。
二、怎么讓Agent可信、可靠、可用?
除了基礎算力與模型擴展,亞馬遜云科技2025 re:Invent大會上,還創造性提出了如何幫助客戶“調教”出一個可控、可用、可信的Agent。某種程度上說,以上技術路線上展現的切實性,也是亞馬遜云科技核心競爭力的一種外化。
例如,當大多數平臺還在比拼Agent框架靈活性、推理速度時,亞馬遜云科技則更為敏銳又貼切地意識到,或許企業需要的不是一個能聊天的機器人,而是一個能干活的員工。
![]()
為此,亞馬遜云科技圍繞如何讓Agent安全合理地高效落地,去解決企業種種核心痛點,大會上就推出了Agentic AI平臺Amazon Bedrock AgentCore。在該平臺“約束”下,Agent 的日常使用、行為秩序得到了更好的秩序,由此公司則可大規模地安全構建、部署和運行高性能的Agent。
為了確保Agent運行過程中的安全性與合規性,亞馬遜云科技則開放了AgentCore Policy、AgentCore Evaluations 功能。此舉的啟迪意義,或許不止于幫助客戶規避失序風險,更在于亞馬遜云科技嘗試著定義出Agent時代下一種全新的治理范式。
這已經不是一種簡單的程序約束,而是給Agent制定出了一套行事準則,甚至說“法律法規”。由此一來,用戶在Agent運行過程中,就可以從人類行事的邏輯去規勸、約束AI,只有這樣,企業的更多核心業務或許才會讓Agent落地產生可能。
這也觸及到了Agent大規模落地的真正痛點。某種程度上說,大模型有一定概率性,可回到企業業務流程中,尤其涉及到財務層面,需要的必須是100%的確定性。事實上,企業群體頭疼的往往不是AI不夠聰明,而是AI“一本正經地胡說八道”或“違規”越權操作。從這點上說,Amazon Bedrock AgentCore的核心價值或許就在于,給相對不可控的Agent加上確定性“枷鎖”后,很多風險將會被隔絕。
事實上,Agent興起的潮流下,圍繞“風險”衍生出大量核心的討論:比如在企業核心業務的使用場景下,一個不可控的Agent會展現出如何巨大的破壞力?這樣的猜想在不少科幻電影中已經出現了大量發人深省的故事。
正因如此,除了Amazon Bedrock AgentCore,如何更快、更安全地將Agent加入到日常工作中來,亞馬遜云科技也提出自己一系列方案。比如,Amazon Quick 作為一款面向企業的智能 Agent 應用,不僅能夠幫助用戶進行深度分析、數據可視化和工作流自動化,還可以通過企業級的安全與隱私標準確保信息的可靠性與合規性。
除此之外,在備受關注的AI 編程領域,亞馬遜云科技在大會現場,也提出了三大Agent——比如,Kiro autonomous agent,可以作為虛擬開發者,持續分擔人類工作,并且能夠獨立完成各項任務,并在工作中持續學習拓展能力邊界。再比如,Amazon Security Agent則可以承擔虛擬安全工程師的角色,在應用設計、代碼審查與滲透測試等環節充當起企業的安全顧問,極大降低安全風險。還有可以幫助開發者,尤其是負責值班的工程師,主動發現系統故障或潛在缺陷的Amazon DevOps Agent。
從這點上說,鑒于亞馬遜云科技在服務行業二十年來積累的大量經驗,無疑不在證明,各行各業、不同規模的組織面臨的需求痛點,都讓這家企業能在第一時間準確捕捉,由此根據企業現實存在的痛點。
并且,此次大會基于底層算力、推理平臺、數據再到Agent產品鏈路,亞馬遜云科技在今年 re:Invent 上展現出的,或許是自身一步步地把早期具有“玩樂”屬性、技術噱頭的Agent ,由此正式推向商業實戰中。
三、在Agent時代,找回丟失的創造力
過去兩年,我們無不見證了大模型帶來的顛覆,同時也看到了其呈現的局限性。
比如,大模型或許能寫詩作畫,卻很難替用戶解決更多實際問題,比如買一張機票:從這點上說,Agent與傳統大模型助手的核心區隔,或許就在于分自主行動力。
在這一視角下,Agent需要擔負起的責任,則更加精細化,是一個能夠主動執行任務、在復雜環境中實現動態推理、并讓工作流程自動化的“數字員工”,也是一種未來生產力的集中釋放。
亞馬遜云科技2025 re:Invent 大會上,亞馬遜云科技Agentic AI高級副總裁Swami Sivasubramanian的Keynote上,就圍繞Agent如何重塑商業世界的可能展開了核心推論。
![]()
比如,AI Agent 如何才能實現真正的大規模生產落地,從而將概念性變為真切的生產力提升?
Swami Sivasubramanian的Keynote上提到了一個生動案例:當我們最早寫下第一行代碼時是怎樣的感覺?這樣一種類似造物者、仿佛能做到任何事的創作自由,在Agent 時代又該如何找回?
事實上,以往用戶無拘無束、無所不能的創作欲表現,到了現在,卻隨著 AI 系統的日益復雜,變得更加難以實現:尤其是那些概念驗證階段看似表現良好的AI,一旦進入大規模應用,卻往往因為邏輯脆弱、缺乏模塊化,從而對用戶想象力、生產力的激發產生了一種反作用。
為了解決以上痛點,亞馬遜云科技則將發力點聚焦到了“簡潔性”上。比如,一個Agent往往由基礎模型、代碼和工具三大組件構成,協同編排這些組件往往比較繁瑣,為此,亞馬遜云科技則發布并開源了Amazon Strands Agents SDK。
這一框架也被引入了TypeScript 平臺,今后,開發者則能夠利用熟悉的工具棧構建完整出Agent 堆棧。更關鍵的是,Strands 還新增了對邊緣設備的支持。這意味著,未來Agent將不再局限于云端服務器,而是可以運行在汽車、游戲機甚至機器人終端上。值得注意的是,短短數月,該SDK 下載量突破 500 萬次,再次證明了開發者對“簡潔性”的青睞。
另一個制約生產力解放的直接命題,也被Swami關注到了。比如,為了解決當下AI普遍存在的“健忘癥”、即無法在長期交互中沉淀經驗,Amazon Bedrock AgentCore Memory推出后,則接入了全新的情景式記憶功能,能夠讓Agent從過往的上下文、推理過程、操作結果中持續學習,并將這些信息應用于后續交互。
在幫助Agent解決了“聰明”的能力后,亞馬遜云科技也對其效率提升,集中下手。Swami 更是直言:“效率關乎成本、規模與敏捷性。”
![]()
事實上,盡管通用的基礎模型雖然“智商高”,但在處理特定任務時,往往伴隨著高昂的成本和延遲。由此,企業特定使用場景中,“小而美”的高質量定制模型已漸成主流。
這也是AI開發模式一種必然的“祛魅”過程。以往,行業迷信“參數至上”,不過,Swami的觀點則強調專用性一定程度、一定場景下,無疑將會優于通用性。類似一家企業不需要一個樣樣稀松的通才,相反,去打造成百上千個精通業務細節的專才,或許才能真正釋放生產力。
基于此,亞馬遜云科技也打出了一套組合拳。比如,RFT可讓定制模型的準確率相比基礎模型提升 66%。再加上Amazon Nova Forge開創了“開放式訓練”的先河,允許企業在訓練各階段注入專有數據,讓模型不僅懂通用知識,更懂企業的“行話”。
以上這一切,也讓定制化實現效率大幅提升成為一種未來的趨勢。并且,在讓Agent變得更聰明、更具效率的同時,如何確保成百上千個Agent 被部署在生產鏈條的風險把控,也成為了一大重點。
對此,Swami則進一步將失序把控的解決方案細化給出。除了先前介紹的Amazon Bedrock AgentCore,為了進一步提升可靠性,亞馬遜云科技還推出Amazon Nova Act。這是一套用于構建可靠 UI 工作流程的全新服務,由定制版的 Amazon Nova 2 Lite 模型驅動。它結合了自動推理(Automated Reasoning)的數學邏輯驗證,在早期測試中實現了高達 90%的可靠性。
甚至,在現場演示的“反電詐”場景中,Agent 不僅能檢查信用卡交易、合理提出懷疑,甚至能收集證據并協助報警。這種基于邏輯驗證的嚴謹性,讓“人機信任”不再是一句空話。
四、一條實實在在的道路
大會最后一天,亞馬遜云科技發布了自身迄今為止性能最強、能效最高的Amazon Graviton5處理器。與上一代相比,基于Graviton5的全新EC2 M9g實例性能提升高達25%,實現了單封裝 192 核心的突破,并將 L3 緩存提升了 5 倍。一個直觀的使用案例是,Apple在遷移核心服務后,實現了成本降低 30%、性能提升 40%的不錯效益。
值得注意的是,目前亞馬遜云科技新增CPU容量中連續第三年有超半數由Graviton驅動,EC2頭部1000家客戶中已有98%受益于其顯著的性價比優勢,包括Adobe、Airbnb、Atlassian、Epic Games、Formula 1等。
不僅如此,在亞馬遜云科技re:Invent 2025 最終日,公司從Amazon Graviton5 和Amazon Trainium3 UltraServers的極致能效展示,到Amazon S3 Vectors和Amazon Lambda Managed Instances重新定義了數據和無服務器的邊界,并最終通過Project Mantle的系統級創新,再次完整地收束了過去數天公司想要強調的AI時代核心理念。
事實上,亞馬遜云科技2025 re:Invent 大會臨近尾聲時,公司則用大量基礎設施產品的密集發布,重申了一個公司發展的核心命題:即AI不會顛覆基礎設施,反而會讓基礎設施的安全性、成本和敏捷性等變得更加顯著。
從這點上說,再次回顧亞馬遜云科技2025年re:Invent大會,真正留下的或許不是一串令人眼花繚亂的產品清單,而是一張清晰、實用、貼切的企業發展藍圖。
從Nitro到Graviton再到Trainium的完整自研芯片堆棧,以及Apple、Anthropic等重量級客戶背書,亞馬遜云科技的企業競爭力壁壘中,一直有特殊且務實的底座:即當其他云廠商仍在試圖證明自身“能做 AI”時,亞馬遜云科技則已經將視野聚焦到了用“安全性、可用性、成本可控”等,能直達商業核心的解決辦法,再次證明了自己在AI規模化、可持續發展、盈利實現等方面,于行業內扮演了一個重要且不可或缺的角色。
![]()
值得注意的是,大會最后一天,亞馬遜CTO Dr. Werner Vogels也完成了他在re:Invent的最后一場主題演講,并談到:AI不會取代開發者,但停止進化的開發者則會被時代淘汰。
從這點上說,亞馬遜云科技在AI 的聚光燈下,或許選擇了一條最不性感、最不顯眼的道路。從過去到未來,亞馬遜云科技始終在做的事情,核心仍在于為AI時代去“修筑鐵路、鋪設電網”,這樣看似“重資產、硬科技”的路徑,表面顯得笨重,內在則是在規模效應作用上去打造自身難以撼動的競爭壁壘。
2025 亞馬遜云科技re:Invent 中國行即將啟幕:12月18日開始,北京、上海、深圳、成都四城線下巡演及線上專場將同步開啟,無論你是云計算新手還是技術老兵,都將從高階演講、實戰內容、技術分享和專家互動中受益。點擊【閱讀原文】立即注冊,搶占席位,把握Agentic AI時代的新機遇!
--THE END--
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.