【TechWeb】4月29日消息,2006年的Pi Day(3月14日,圓周率日),一個(gè)起初看似簡(jiǎn)單的“彈性存儲(chǔ)”概念被推向市場(chǎng),它允許開(kāi)發(fā)者以極低的成本存儲(chǔ)無(wú)限量的數(shù)據(jù)。20年后的今天,這個(gè)名為Amazon S3(Amazon Simple Storage Service)的服務(wù)不僅承載了超過(guò)500萬(wàn)億個(gè)對(duì)象,更在AI爆發(fā)的時(shí)代,悄然完成了從一個(gè)“被動(dòng)數(shù)據(jù)湖”向“主動(dòng)智能基礎(chǔ)設(shè)施”的蛻變。
在20周年之際,我們與亞馬遜云科技技術(shù)副總裁Mai-Lan Tomsen Bukovec進(jìn)行了一場(chǎng)深度對(duì)話。訪談剛一開(kāi)始,她就難掩興奮地分享了一個(gè)剛剛收到的喜訊:Amazon S3 Vectors在2026年NAB Show(全美廣播電視展)上榮獲了“年度產(chǎn)品獎(jiǎng)”。
![]()
亞馬遜云科技技術(shù)副總裁Mai-Lan Tomsen Bukovec
談及Amazon S3一路以來(lái)的創(chuàng)新發(fā)展,Mai-Lan總結(jié)道:“對(duì)每一個(gè)Byte(字節(jié))的承諾,無(wú)論那是非結(jié)構(gòu)化數(shù)據(jù)、Parquet文件,還是一個(gè)向量字節(jié),這是我們過(guò)去20年從未改變的準(zhǔn)則,也是未來(lái)20年不會(huì)改變的準(zhǔn)則。”
S3 Tables打破“只讀”:Iceberg與數(shù)據(jù)表的可編輯革命
回顧Amazon S3的演進(jìn),Mai-Lan認(rèn)為其產(chǎn)品定義是“彈性”的,這種彈性不僅在于容量,更在于產(chǎn)品形態(tài)。最初的S3是一個(gè)巨大的非結(jié)構(gòu)化數(shù)據(jù)倉(cāng)庫(kù),如果用戶想修改視頻或音頻文件中的一部分,必須替換整個(gè)對(duì)象。
然而,S3 Tables的推出徹底打破了這一邊界。通過(guò)原生支持Apache Iceberg格式,Amazon S3中的數(shù)據(jù)第一次變得“可編輯”。
“這是一個(gè)巨大的飛躍,意味著你可以用S3的價(jià)格優(yōu)勢(shì)直接操作數(shù)據(jù)表,”Mai-Lan解釋道。最令人興奮的并非僅是存儲(chǔ)本身的變革,而是由此催生的生態(tài)化學(xué)反應(yīng)。她觀察到,從Supabase的Postgres到Oracle的GoldenGate,數(shù)據(jù)庫(kù)的變更數(shù)據(jù)正被直接呈現(xiàn)在S3 Tables中。
這種變化在AI時(shí)代尤為關(guān)鍵。Mai-Lan指出,AI Agent極度依賴SQL和Iceberg格式。因?yàn)榇笳Z(yǔ)言模型(LLMs)在訓(xùn)練時(shí)就已經(jīng)對(duì)SQL和結(jié)構(gòu)化數(shù)據(jù)邏輯非常熟悉,將數(shù)據(jù)以Iceberg形式存放在S3中,等于為數(shù)以萬(wàn)計(jì)的AI Agent掃清了數(shù)據(jù)訪問(wèn)的障礙,讓Agent不必再去費(fèi)力學(xué)習(xí)復(fù)雜的API調(diào)用。
S3 Vectors和S3 Files構(gòu)建共享記憶:向量成為一種新語(yǔ)言
如果說(shuō)Iceberg解決了Agent“讀懂?dāng)?shù)據(jù)”的問(wèn)題,那么S3 Vectors則解決了Agent“記住狀態(tài)”的問(wèn)題。
在2026 NAB Show頒獎(jiǎng)典禮上的高光時(shí)刻并非偶然。Mai-Lan透露,自S3 Vectors發(fā)布以來(lái)的五個(gè)月里,市場(chǎng)需求經(jīng)歷了顯著的增長(zhǎng)。起初,團(tuán)隊(duì)預(yù)期的主要用例是通過(guò)嵌入模型為數(shù)據(jù)添加上下文,用于RAG或語(yǔ)義搜索。但實(shí)際增長(zhǎng)的爆發(fā)點(diǎn)在于Agent系統(tǒng)的共享記憶。
“LLMs在記憶能力上的飛躍非常顯著。無(wú)論是Agent之間、人機(jī)之間還是Agent與數(shù)據(jù)之間,都在引入更深層次的對(duì)話上下文。而向量,就像是為AI交互體驗(yàn)注入的‘狀態(tài)’。”Mai-Lan將S3 Files和S3 Vectors的組合形容為Agent的“共享記憶空間”。
隨著S3 Files的發(fā)布,這種交互變得更加自然。S3 Files在物理存儲(chǔ)上是對(duì)象,但在邏輯接口上是符合POSIX標(biāo)準(zhǔn)的文件系統(tǒng)。
Mai-Lan還分享了一個(gè)非常細(xì)膩的產(chǎn)品洞見(jiàn),她認(rèn)為:“由于LLMs在訓(xùn)練中接觸了大量的Python庫(kù)和Shell腳本,AI Agent天生就習(xí)慣將文件作為數(shù)據(jù)接口。”這種底層邏輯的契合,使得開(kāi)發(fā)者無(wú)需重構(gòu)代碼,就能讓AI直接通過(guò)文件目錄與海量數(shù)據(jù)交互。
延遲與成本的經(jīng)濟(jì)學(xué)權(quán)衡
盡管AI追求極致的低延遲,但Mai-Lan坦率地承認(rèn),S3的架構(gòu)延遲確實(shí)高于數(shù)據(jù)庫(kù)。向量數(shù)據(jù)庫(kù)能在幾毫秒內(nèi)完成查詢,而S3 Vectors大約需要100毫秒。然而,她認(rèn)為這并非缺陷,而是一種設(shè)計(jì)上的權(quán)衡。
“并非所有的AI應(yīng)用都追求亞毫秒級(jí)響應(yīng)。很多科研分析、大范圍的產(chǎn)品相似度搜索,甚至生成報(bào)告的Agent,完全可以在100毫秒的延遲下運(yùn)行得極其完美。”她類比道,就像2006年時(shí),人們雖然會(huì)為極致性能選擇數(shù)據(jù)庫(kù),但絕大多數(shù)工作負(fù)載依然會(huì)流向更具成本效益的S3。
進(jìn)入Agent時(shí)代,這種成本考量變得更加殘酷且現(xiàn)實(shí)。Mai-Lan指出,人類工程師通常一次只跑一個(gè)查詢,而AI Agent為了尋找最佳路徑,往往會(huì)瞬時(shí)發(fā)起數(shù)十甚至數(shù)百個(gè)并行查詢,是極其激進(jìn)的數(shù)據(jù)消費(fèi)者。在這種情況下,底層存儲(chǔ)和分析服務(wù)的成本效率,可能直接決定了一個(gè)Agent應(yīng)用能否盈利。這種肉眼可見(jiàn)的大規(guī)模消耗,讓S3的性價(jià)比優(yōu)勢(shì)在AI時(shí)代反而成了一種護(hù)城河。
跨越20年的工程承諾:數(shù)學(xué)般的嚴(yán)謹(jǐn)
在長(zhǎng)達(dá)20年的服務(wù)中,S3最令Mai-Lan感慨的并非某個(gè)新功能,而是一次對(duì)底層的重構(gòu),即引入“強(qiáng)一致性”。
“在發(fā)布強(qiáng)一致性之前,我們絕對(duì)無(wú)法通過(guò)寫(xiě)測(cè)試用例來(lái)覆蓋所有場(chǎng)景,S3太龐大了。如果無(wú)法證明它是絕對(duì)一致的,我們就絕不能上線。”Mai-Lan向TechWeb回憶道。為此,團(tuán)隊(duì)引入了一種極端的工程方法“形式化驗(yàn)證”。他們構(gòu)建了一套數(shù)學(xué)證明體系,任何新的代碼變更,都必須先通過(guò)數(shù)學(xué)邏輯的證明校驗(yàn),確保不會(huì)破壞系統(tǒng)的一致性,才能被合并入庫(kù)。
這種“對(duì)每一個(gè)字節(jié)負(fù)責(zé)”的執(zhí)著,體現(xiàn)在S3底層的300個(gè)微服務(wù)中,其中大量服務(wù)每天都在默默充當(dāng)“審計(jì)員”的角色,反復(fù)校驗(yàn)數(shù)據(jù)完整性。正是這種極致的工程追求,才構(gòu)筑了S3標(biāo)志性的11個(gè)9持久性。
“產(chǎn)品形態(tài)的演進(jìn)必須是連貫的,新能力必須與原有服務(wù)邏輯完美契合。”Mai-Lan強(qiáng)調(diào),“S3 Vector將持久性原則貫徹到向量中,S3 Tables讓表格的操作感與原有數(shù)據(jù)類型保持一致,讓表格數(shù)據(jù)像存儲(chǔ)桶一樣,可以輕松同步。這種在擴(kuò)展邊界的同時(shí)保持內(nèi)核連貫性的思路,是我們過(guò)去20年、乃至未來(lái)20年進(jìn)化的核心邏輯”
訪談接近尾聲時(shí),Mai-Lan提到了亞馬遜的一句領(lǐng)導(dǎo)力準(zhǔn)則——“Are Right, A Lot”決策正確。要做到這一點(diǎn)的關(guān)鍵是:領(lǐng)導(dǎo)者要不斷證偽自己的信念,即不斷推翻“我們構(gòu)建的一切都運(yùn)行良好”這種念頭。在AI技術(shù)每隔幾個(gè)月就顛覆一次認(rèn)知的2026年,Amazon S3的這條成功經(jīng)驗(yàn)反而顯得格外清醒,這種時(shí)刻尋找改進(jìn)現(xiàn)有系統(tǒng)或構(gòu)建新能力機(jī)會(huì)的執(zhí)著,可能才是其成為AI時(shí)代兼具數(shù)據(jù)韌性與技術(shù)創(chuàng)新能力的標(biāo)桿的底層邏輯,同時(shí)能夠敏銳響應(yīng)每一次技術(shù)浪潮變化背后潛藏的真實(shí)客戶需求。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.