公眾號記得加星標??,第一時間看推送不會錯過。
人工智能時代的到來讓硬件炙手可熱,無論從字面意義還是比喻意義上來說都是如此。不幸的是,對基礎設施的巨大需求徹底擾亂了芯片、內存和磁盤的供應鏈,使得人們幾乎不可能在不傾家蕩產的情況下獲得運行企業IT工作負載(更不用說高性能計算或人工智能作業)所需的硬件。那么,普通人該如何在這個充滿機遇卻又價格不菲的新世界中生存下去呢?
這是一個非同尋常的時代。人工智能(GenAI)的蓬勃發展帶動了全國乃至全球數據中心建設的激增。在美國,目前約有3000個數據中心項目正在建設或規劃中,這將進一步壯大現有的4000個數據中心。這些“人工智能工廠”大多由超大規模數據中心運營商和人工智能巨頭打造,其占地面積可達百萬平方英尺,耗電量高達1吉瓦。
除了建造數據中心本身所需的混凝土、鋼材和銅管(更不用說供電和冷卻用水了),還需要服務器、內存和存儲設備來填充數據中心內部。問題是,云計算巨頭和人工智能巨頭幾乎已經搶購一空了所有可用的資源。
好消息是供求規律依然有效。壞消息是,這條規律意味著處理器、存儲設備和內存的價格飆升。
已取消的訂單
以普通DDR內存為例。隨著高帶寬內存(HBM)需求的飆升,三大內存芯片制造商——SK海力士、三星和美光——都削減了普通DDR內存的產量。結果是,過去六個月里,普通DDR內存的價格上漲了數百個百分點。
這給下游技術用戶帶來了一系列問題,其中包括Cox Communications旗下的云服務提供商RapidScale。RapidScale通常每年都會為其不斷增長的云業務采購一定數量的服務器,但今年的采購流程卻異常異常。
RapidScale總裁杜安·巴恩斯表示:“去年12月,一臺配備2TB內存的服務器售價約為3萬美元。而如今,同樣的服務器售價已達8萬美元。”
成本上漲迫使原始設備制造商 (OEM) 不得不做出艱難的商業決策。今年早些時候,RapidScale 向一家大型 OEM 供應商訂購了價值 120 萬美元的新服務器。Barnes 表示,這家計算機制造商不僅沒有按約定價格交付服務器,反而違背了協議,并試圖將價格提高 300%。
“我們當然不是唯一一家被他們拒付訂單的客戶,”巴恩斯在一次采訪中說道。“如果我以低于市場價的價格把東西賣給客戶,我仍然會履行訂單,并在下一個訂單和下一個客戶那里彌補損失,就像任何正常的商家都會做的那樣。他們選擇了另一條路,這是他們的決定,他們的生意。但歸根結底,我認為這不是處理生意的好方法。”
共同負擔
其他供應商則采取了更為開放的態度來應對這一前所未有的局面。4月23日,存儲供應商Everpure(前身為Pure Storage)的首席執行官兼董事長查理·詹卡洛(Charlie Giancarlo)發表了一封公開信,就年初以來平均70%的價格上漲向客戶致歉。更重要的是,他還詳細解釋了此次漲價的原因和理由。
“70%的漲幅乍看之下似乎難以接受,但了解背后的真相后,便會明白其中的道理,”Giancarlo在博文中寫道。“Everpure公司許多大批量半導體元件的原材料成本已經飆升了300%。”
自 2025 年年中以來,漲幅高達 900%(4 倍至 10 倍)。在某些情況下,由于需求激增,供應商無法按承諾的數量供貨,迫使我們尋找替代貨源(價格更高)以滿足承諾的交貨時間。
正如詹卡洛所指出的,價格從2025年第三季度中期開始上漲。隨后,價格從12月到1月幾乎翻了一番,并在2月到3月間再次翻了一番甚至兩番。盡管1月份成本持續上漲,Everpure仍信守承諾,按照60至90天的付款期限向客戶提供報價。
該公司還告知其客戶和渠道合作伙伴,新財年(始于2月1日)將提價。Everpure 也已將付款期限改為 30 天,以最大限度地減少其因零部件成本持續上漲而面臨的風險,其他供應商也在采取同樣的做法。
“我們將價格漲幅控制在遠低于實際供應鏈成本漲幅的水平,”詹卡洛寫道。“我們不會從這場危機中牟利……我們選擇與客戶共同承擔責任。”
這對顧客意味著什么
現實情況是,數據中心的所有成本都上漲了。每個客戶的情況都不一樣,但他們仍然有選擇。
一種選擇是從云端獲取更多計算能力,而不是擴展本地部署。畢竟,超大規模數據中心運營商正在大量采購處理器、內存芯片和NVMe固態硬盤,以應對預期中人工智能工作負載需求的激增。
正如存儲供應商Qumulo 的高級副總裁兼產品負責人 Brandon Whitelaw在最近一篇BigDATAwire 的報道中指出的那樣,大型云公司今年已在基礎設施方面投入了 7000 億美元,幾乎壟斷了市場。如果原始設備制造商 (OEM) 難以采購設備,那么與云服務提供商達成交易的可能性就很大。
“早在2021年,排名前五的超大規模云服務商的支出約為1000億美元,與七大企業硬件供應商的支出相當,”懷特勞在《云計算已經搶占了你的硬件市場份額》一文中寫道。 “到2025年,前五大云服務商的支出已躍升至4100億美元,同比增長至7000億美元——是七大企業硬件供應商總支出(1450億美元)的兩倍。”
Whitelaw建議客戶花時間構建統一的數據架構,以此作為降低存儲成本的一種方法。通過消除單一架構中的數據孤島,可以降低總存儲需求并提高效率。統一的數據架構還能幫助客戶更高效地利用跨本地和云端的混合云存儲環境,并允許客戶根據價格信號靈活調整存儲。
RapidScale總裁Barnes建議客戶采用FinOps實踐,以降低云環境支出并提高現有投資的利用率。RapidScale在其云產品中提供FinOps服務,但任何客戶都可以采用FinOps,無論是在云端還是本地環境中。
“我已經有了基礎設施。我覺得我需要更多,但我真的需要更多嗎?”巴恩斯說。“我們可以向您展示優化基礎設施的現代技術,然后制定一個更經濟合理的方案,分階段實施,幫助您度過未來幾年的混亂時期。”
對于許多需求穩定且可預測的工作負載(包括部分高性能計算和人工智能工作負載),云計算因其成本高于本地部署而備受詬病。如需了解財務運營 (FinOps) 降低成本的三種主要方法,請參閱BigDATAwire于 2025 年 4 月發表的這篇文章。
最后一個選擇就是靜觀其變,希望這場風暴在一兩年內過去。巴恩斯說,他與許多首席信息官和副總裁交談過,他們都把服務器升級項目推遲到了2026年。“他們希望明年價格能降下來,”他說。“這有點像能源危機。如果我不需要休假,我就不會開車去佛羅里達,然后花六美元一加侖的油錢。”
遺憾的是,芯片價格似乎短期內不會下降。新的芯片制造廠正在建設中,但短期內無法投產。例如,美光科技正在紐約州北部建設一座新工廠,但要到2028年才能開始生產DDR或HBM內存。
毋庸置疑,這是一個激動人心的時代。人工智能淘金熱可能會讓少數幾家成功發家致富的公司一夜暴富,而工具提供商也只是略有斬獲。然而,不幸的是,人工智能的蓬勃發展也擾亂了供應鏈,影響到所有需要電腦的人。那些能夠制定應對這些沖擊的計劃的客戶,很可能比那些沒有計劃的客戶在這次熱潮中獲益更多。
(來源:編譯自HPCwired)
*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯系半導體行業觀察。
今天是《半導體行業觀察》為您分享的第4406內容,歡迎關注。
加星標??第一時間看推送
求推薦
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.