網易首頁 > 網易號 > 正文申請入駐

亞馬遜云科技，如何拒絕讓Agent淪為玩具？

2025-12-05 21:39:04　來源: 銀杏科技

北京舉報

分享至

“Why not？”

在號稱“云計算”春晚的2025年亞馬遜云科技re:Invent大會上，亞馬遜云科技CEO Matt Garman演講中就拋出一連串問題：“為什么開發者不能專注于構建而非基礎設施？為什么實驗時間與成本不能趨近于零？為什么不能讓每一個想法都成為可能？”

事實上，Matt Garman以上提問，都直指近年AI Agent火熱浪潮中，一直困擾企業群體如何真正釋放生產力的核心命題。歷年來，全球企業核心訴求需求沒有根本改變，本質仍在于提高效率（SaveTime）。這也是多年來，亞馬遜云科技這家業務規模已達1320億美元的全球云巨頭一直聚焦的工作。

Agentic AI時代，AI Agent不是手段也不是目的，而成為生產力本身，不過前提還在于，需要讓Agent安全合理地落地并實現高效運轉。亞馬遜云科技 CEO Matt Garman 在 Keynote 上就談到：“Put Agent into Work。”

事實上，過去數年AI正在從Copilot向Autopilot加速轉化過程中，不少企業已經為“聊天機器人”支付了昂貴的學費，然而實際操作下來，卻發現輔助式、被動化的問答模式，很難真正讓公司實現業績實質性增長。因此，Matt Garman強調的“Put Agent into Work”，或許也指向了AI核心定位的變化，即從一種“咨詢顧問”轉變為“數字工人”，需要以一種工作更加主動、細節更加精準、安全更加可控的行為模式，為企業切實創造價值。

如果細看2025年re:Invent大會上關鍵人物的發言傾向，不難發現，從亞馬遜云科技首席執行官Matt Garman到亞馬遜云科技Agentic AI副總裁Swami Sivasubramanian，再到亞馬遜云科技高級副總裁Peter DeSantis，均用了大量篇幅講述AI Agent究竟如何有序、有效、有用地落地。

“未來數十億Agent將滲透各行各業，助力企業實現10倍效率躍遷。”Matt Garman在開篇演講中激昂談到。

值得注意的是，近二十年來亞馬遜云科技一直通過推動云計算和生成式AI普及在各行各業“搭臺唱戲”，成為全球企業群中效能放大器的典范，“利他戰略”也讓企業實現了二次成長，僅僅在過去一年，亞馬遜云科技新增營收就達220億美元。

一、利他思維如何更好地“搭臺唱戲”

沒有一個真正的戰略家是對戰術細節不熟悉的，一個真正的戰略家也不會將戰略眼界聚焦短期勝敗上。

亞馬遜科技2025年re:Invent大會首日，公司CEO Matt Garman兩個多小時主題演講聚焦與發散并進，實際上也是以上定論的集中反映。

一方面，Matt Garman全場兩個多小時的Keynote就發布新品接近40個，集中展現了亞馬遜云全新一代自研芯片、前沿基礎模型及企業級模型定制框架等一系列重磅產品，在算力層、模型層和應用層持續突破，令人有一種應接不暇的感覺。

另一方面，Matt Garman的絕大多數時間，實際聚焦在了AI基礎設施和全新Agent產品的講解上。對此，Matt Garman直截了當地指出：“AI Agent正在把我們帶到AI發展的關鍵拐點。未來每家公司，每一個可以想象的領域中都會運行數十億個Agent！”

什么讓亞馬遜云科技有了這樣的判斷？這與近些行業在AI浪潮中所處的一個尷尬境遇密不可分：僅從目前來看，AI浪潮助力下的企業仍無法實現投入產出比的均衡，巨額投入什么時候才能轉化為企業實實在在的業績反映，也成為困擾眾多企業CEO的難題。

為了破局，為了讓AI從Assistant加速質變成能主動干活、充分釋放生產力的Agent，并且讓Agent更可信、更好用、更可控、成本更低，亞馬遜云開出了自己完整的解決方案，即算力基礎設施、推理平臺、數據、還有實現Agent 的一系列工具鏈。

貫穿亞馬遜云科技以上解決方案的核心思路則在于，向下自研芯片，以性價比夯實算力底座，中間擴充模型，提供給客戶更多、更厚的選擇，向上則樹立規則，嚴格把控Agent實際操作風險，從而真正達成一整套可用、可信、可控的技術閉環。

比如說，當下Agent對Token消耗量，已經達到了較為簡單AI對話的十倍以上。為此，如何更直接地降低Token成本，為企業提供性價比算力基礎設施配套，就成為亞馬遜云科技的一大發力點。

在備受期待的算力基礎設施構建上，亞馬遜云科技一方面作為運行NVIDIA GPU的核心場所之一，積累了大規模的GPU運行經驗，由此，本次大會公司例舉P6e GB200 超級服務器就相比上一代 P5e，計算性能提升超過20 倍。

此外，亞馬遜云科技始終沒有減緩自身底層芯片布局。本次大會上，Matt Garman宣布正式推出了最新Trainium3，并且發布Amazon Trainium3 UltraServers，這也成為亞馬遜云科技首款搭載3納米工藝AI芯片的服務器。

相較Amazon Trainium2，不僅計算能力提升4.4倍、內存帶寬提升3.9倍，每兆瓦算力可處理的AI token數量達成了5倍增長，為大規模 AI 訓練與推理帶來顯著的效率與能效優勢。并且，新一代服務器在運行OpenAI的GPT-OSS-120B模型時，每兆瓦輸出token數是Amazon Trainium2的5倍以上，可實現更極致的能耗比。

大會上，Matt Garman還首次披露了Amazon Trainium4芯片，承諾將實現較Amazon Trainium3 UltraServers六倍的FP4計算性能、四倍內存帶寬和兩倍高內存容量，繼續堅守亞馬遜云科技在AI芯片領域的長期投入的戰略定力。

值得注意的是，基礎算力的底座夯實上亞馬遜云科技常年持續投入，如今已完成超100萬個Amazon Trainium2芯片規模化部署，為Amazon Bedrock中大部分推理工作提供了穩定可靠的算力支持，并且已為公司帶來了幾十億美元可觀收入。

某種程度上說，也正式由于亞馬遜云科技對自研芯片持續的投入，也讓公司在當下越發復雜的競爭環境中擁有了更多主動權。尤其是在算力即權力的當下，一旦企業的核心利潤被上游硬件廠商大幅拿走，那么云廠商在博弈中占據主動。

從這點上說，亞馬遜云科技自研芯片構建發力點不僅僅是技術壁壘，更是一種構建自身UE的必然：尤其是當Agent時代來臨，Token消耗量呈現出指數級增長時，要想實現商業更長久健康的盈利，基礎算力上的“自研”與“降本”必不可少。

除了算力，第三方模型引用上Amazon Bedrock也持續豐富著客戶模型選擇權，在“利他戰略”下持續開源、繼續“搭臺唱戲”。大會現場，亞馬遜云科技展現出一種更為開放姿態，Matt Garman則向世人宣布，公司收錄了更多開源、通用、專用等多種類型的模型。其中，Amazon Bedrock就收錄了包括谷歌的 Gemma、NVIDIA的Nemotron，Kimi和Minimax 廠商的最新模型，真正為亞馬遜云科技的客戶提供了模型運用上更廣闊的空間。

與此同時，亞馬遜云科技也在讓自身大模型繼續進化，大會現場同步了Amazon Nova迭代到了Amazon Nova 2的最新進展。該大模型包含Amazon Nova 2 Lite、Amazon Nova 2 Pro、Amazon Nova 2 Sonic、Amazon 2 Omni四個版本可供客戶在不同場景中調用，延續了強大智能能力同時，也持續將成本效率與低延遲表現大幅提升。

并且，Amazon Nova 2實際測試中各個版本性能表現也都可圈可點。例如，Amazon Nova 2 Lite 性能就可比肩 GPT-5 Mini、Claude Haiku 4.5等業界先鋒模型。此外，Amazon Nova 2 Pro 在指令遵循、Agentic工具使用等基準上超越 GPT-5.1、Gemini 3 Pro Preview 以及 Claude Sonnet 4.5，進步顯著。

而在數據層面， Amazon AI Factories的推出，則更能反映公司的“利他戰略”：對于某些特殊客戶來說，數據處境與安全始終擺在第一性，為此，Amazon AI Factories一經推出，就可將全套的 AI 算力集群、網絡架構、存儲設施，直接打包運到客戶的本地數據中心里，實現了安全與算力的平衡統一。

事實上，Amazon AI Factories的推出，也在某種程度上揭示了一種云計算敘事邏輯的改變：過去多年，企業大趨勢是“上云”，可到AI時代后，由于數據主權、隱私和安全問題左右，如何讓“云下來”，則成為一種維護數據資產的必然選擇。

二、怎么讓Agent可信、可靠、可用？

除了基礎算力與模型擴展，亞馬遜云科技2025 re:Invent大會上，還創造性提出了如何幫助客戶“調教”出一個可控、可用、可信的Agent。某種程度上說，以上技術路線上展現的切實性，也是亞馬遜云科技核心競爭力的一種外化。

例如，當大多數平臺還在比拼Agent框架靈活性、推理速度時，亞馬遜云科技則更為敏銳又貼切地意識到，或許企業需要的不是一個能聊天的機器人，而是一個能干活的員工。

為此，亞馬遜云科技圍繞如何讓Agent安全合理地高效落地，去解決企業種種核心痛點，大會上就推出了Agentic AI平臺Amazon Bedrock AgentCore。在該平臺“約束”下，Agent 的日常使用、行為秩序得到了更好的秩序，由此公司則可大規模地安全構建、部署和運行高性能的Agent。

為了確保Agent運行過程中的安全性與合規性，亞馬遜云科技則開放了AgentCore Policy、AgentCore Evaluations 功能。此舉的啟迪意義，或許不止于幫助客戶規避失序風險，更在于亞馬遜云科技嘗試著定義出Agent時代下一種全新的治理范式。

這已經不是一種簡單的程序約束，而是給Agent制定出了一套行事準則，甚至說“法律法規”。由此一來，用戶在Agent運行過程中，就可以從人類行事的邏輯去規勸、約束AI，只有這樣，企業的更多核心業務或許才會讓Agent落地產生可能。

這也觸及到了Agent大規模落地的真正痛點。某種程度上說，大模型有一定概率性，可回到企業業務流程中，尤其涉及到財務層面，需要的必須是100%的確定性。事實上，企業群體頭疼的往往不是AI不夠聰明，而是AI“一本正經地胡說八道”或“違規”越權操作。從這點上說，Amazon Bedrock AgentCore的核心價值或許就在于，給相對不可控的Agent加上確定性“枷鎖”后，很多風險將會被隔絕。

事實上，Agent興起的潮流下，圍繞“風險”衍生出大量核心的討論：比如在企業核心業務的使用場景下，一個不可控的Agent會展現出如何巨大的破壞力？這樣的猜想在不少科幻電影中已經出現了大量發人深省的故事。

正因如此，除了Amazon Bedrock AgentCore，如何更快、更安全地將Agent加入到日常工作中來，亞馬遜云科技也提出自己一系列方案。比如，Amazon Quick 作為一款面向企業的智能 Agent 應用，不僅能夠幫助用戶進行深度分析、數據可視化和工作流自動化，還可以通過企業級的安全與隱私標準確保信息的可靠性與合規性。

除此之外，在備受關注的AI 編程領域，亞馬遜云科技在大會現場，也提出了三大Agent——比如，Kiro autonomous agent，可以作為虛擬開發者，持續分擔人類工作，并且能夠獨立完成各項任務，并在工作中持續學習拓展能力邊界。再比如，Amazon Security Agent則可以承擔虛擬安全工程師的角色，在應用設計、代碼審查與滲透測試等環節充當起企業的安全顧問，極大降低安全風險。還有可以幫助開發者，尤其是負責值班的工程師，主動發現系統故障或潛在缺陷的Amazon DevOps Agent。

從這點上說，鑒于亞馬遜云科技在服務行業二十年來積累的大量經驗，無疑不在證明，各行各業、不同規模的組織面臨的需求痛點，都讓這家企業能在第一時間準確捕捉，由此根據企業現實存在的痛點。

并且，此次大會基于底層算力、推理平臺、數據再到Agent產品鏈路，亞馬遜云科技在今年 re:Invent 上展現出的，或許是自身一步步地把早期具有“玩樂”屬性、技術噱頭的Agent ，由此正式推向商業實戰中。

三、在Agent時代，找回丟失的創造力

過去兩年，我們無不見證了大模型帶來的顛覆，同時也看到了其呈現的局限性。

比如，大模型或許能寫詩作畫，卻很難替用戶解決更多實際問題，比如買一張機票：從這點上說，Agent與傳統大模型助手的核心區隔，或許就在于分自主行動力。

在這一視角下，Agent需要擔負起的責任，則更加精細化，是一個能夠主動執行任務、在復雜環境中實現動態推理、并讓工作流程自動化的“數字員工”，也是一種未來生產力的集中釋放。

亞馬遜云科技2025 re:Invent 大會上，亞馬遜云科技Agentic AI高級副總裁Swami Sivasubramanian的Keynote上，就圍繞Agent如何重塑商業世界的可能展開了核心推論。

比如，AI Agent 如何才能實現真正的大規模生產落地，從而將概念性變為真切的生產力提升？

Swami Sivasubramanian的Keynote上提到了一個生動案例：當我們最早寫下第一行代碼時是怎樣的感覺？這樣一種類似造物者、仿佛能做到任何事的創作自由，在Agent 時代又該如何找回？

事實上，以往用戶無拘無束、無所不能的創作欲表現，到了現在，卻隨著 AI 系統的日益復雜，變得更加難以實現：尤其是那些概念驗證階段看似表現良好的AI，一旦進入大規模應用，卻往往因為邏輯脆弱、缺乏模塊化，從而對用戶想象力、生產力的激發產生了一種反作用。

為了解決以上痛點，亞馬遜云科技則將發力點聚焦到了“簡潔性”上。比如，一個Agent往往由基礎模型、代碼和工具三大組件構成，協同編排這些組件往往比較繁瑣，為此，亞馬遜云科技則發布并開源了Amazon Strands Agents SDK。

這一框架也被引入了TypeScript 平臺，今后，開發者則能夠利用熟悉的工具棧構建完整出Agent 堆棧。更關鍵的是，Strands 還新增了對邊緣設備的支持。這意味著，未來Agent將不再局限于云端服務器，而是可以運行在汽車、游戲機甚至機器人終端上。值得注意的是，短短數月，該SDK 下載量突破 500 萬次，再次證明了開發者對“簡潔性”的青睞。

另一個制約生產力解放的直接命題，也被Swami關注到了。比如，為了解決當下AI普遍存在的“健忘癥”、即無法在長期交互中沉淀經驗，Amazon Bedrock AgentCore Memory推出后，則接入了全新的情景式記憶功能，能夠讓Agent從過往的上下文、推理過程、操作結果中持續學習，并將這些信息應用于后續交互。

在幫助Agent解決了“聰明”的能力后，亞馬遜云科技也對其效率提升，集中下手。Swami 更是直言：“效率關乎成本、規模與敏捷性。”

事實上，盡管通用的基礎模型雖然“智商高”，但在處理特定任務時，往往伴隨著高昂的成本和延遲。由此，企業特定使用場景中，“小而美”的高質量定制模型已漸成主流。

這也是AI開發模式一種必然的“祛魅”過程。以往，行業迷信“參數至上”，不過，Swami的觀點則強調專用性一定程度、一定場景下，無疑將會優于通用性。類似一家企業不需要一個樣樣稀松的通才，相反，去打造成百上千個精通業務細節的專才，或許才能真正釋放生產力。

基于此，亞馬遜云科技也打出了一套組合拳。比如，RFT可讓定制模型的準確率相比基礎模型提升 66%。再加上Amazon Nova Forge開創了“開放式訓練”的先河，允許企業在訓練各階段注入專有數據，讓模型不僅懂通用知識，更懂企業的“行話”。

以上這一切，也讓定制化實現效率大幅提升成為一種未來的趨勢。并且，在讓Agent變得更聰明、更具效率的同時，如何確保成百上千個Agent 被部署在生產鏈條的風險把控，也成為了一大重點。

對此，Swami則進一步將失序把控的解決方案細化給出。除了先前介紹的Amazon Bedrock AgentCore，為了進一步提升可靠性，亞馬遜云科技還推出Amazon Nova Act。這是一套用于構建可靠 UI 工作流程的全新服務，由定制版的 Amazon Nova 2 Lite 模型驅動。它結合了自動推理（Automated Reasoning）的數學邏輯驗證，在早期測試中實現了高達 90%的可靠性。

甚至，在現場演示的“反電詐”場景中，Agent 不僅能檢查信用卡交易、合理提出懷疑，甚至能收集證據并協助報警。這種基于邏輯驗證的嚴謹性，讓“人機信任”不再是一句空話。

四、一條實實在在的道路

大會最后一天，亞馬遜云科技發布了自身迄今為止性能最強、能效最高的Amazon Graviton5處理器。與上一代相比，基于Graviton5的全新EC2 M9g實例性能提升高達25%，實現了單封裝 192 核心的突破，并將 L3 緩存提升了 5 倍。一個直觀的使用案例是，Apple在遷移核心服務后，實現了成本降低 30%、性能提升 40%的不錯效益。

值得注意的是，目前亞馬遜云科技新增CPU容量中連續第三年有超半數由Graviton驅動，EC2頭部1000家客戶中已有98%受益于其顯著的性價比優勢，包括Adobe、Airbnb、Atlassian、Epic Games、Formula 1等。

不僅如此，在亞馬遜云科技re:Invent 2025 最終日，公司從Amazon Graviton5 和Amazon Trainium3 UltraServers的極致能效展示，到Amazon S3 Vectors和Amazon Lambda Managed Instances重新定義了數據和無服務器的邊界，并最終通過Project Mantle的系統級創新，再次完整地收束了過去數天公司想要強調的AI時代核心理念。

事實上，亞馬遜云科技2025 re:Invent 大會臨近尾聲時，公司則用大量基礎設施產品的密集發布，重申了一個公司發展的核心命題：即AI不會顛覆基礎設施，反而會讓基礎設施的安全性、成本和敏捷性等變得更加顯著。

從這點上說，再次回顧亞馬遜云科技2025年re:Invent大會，真正留下的或許不是一串令人眼花繚亂的產品清單，而是一張清晰、實用、貼切的企業發展藍圖。

從Nitro到Graviton再到Trainium的完整自研芯片堆棧，以及Apple、Anthropic等重量級客戶背書，亞馬遜云科技的企業競爭力壁壘中，一直有特殊且務實的底座：即當其他云廠商仍在試圖證明自身“能做 AI”時，亞馬遜云科技則已經將視野聚焦到了用“安全性、可用性、成本可控”等，能直達商業核心的解決辦法，再次證明了自己在AI規模化、可持續發展、盈利實現等方面，于行業內扮演了一個重要且不可或缺的角色。

值得注意的是，大會最后一天，亞馬遜CTO Dr. Werner Vogels也完成了他在re:Invent的最后一場主題演講，并談到：AI不會取代開發者，但停止進化的開發者則會被時代淘汰。

從這點上說，亞馬遜云科技在AI 的聚光燈下，或許選擇了一條最不性感、最不顯眼的道路。從過去到未來，亞馬遜云科技始終在做的事情，核心仍在于為AI時代去“修筑鐵路、鋪設電網”，這樣看似“重資產、硬科技”的路徑，表面顯得笨重，內在則是在規模效應作用上去打造自身難以撼動的競爭壁壘。

2025 亞馬遜云科技re:Invent 中國行即將啟幕：12月18日開始，北京、上海、深圳、成都四城線下巡演及線上專場將同步開啟，無論你是云計算新手還是技術老兵，都將從高階演講、實戰內容、技術分享和專家互動中受益。點擊【閱讀原文】立即注冊，搶占席位，把握Agentic AI時代的新機遇！

--THE END--

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.