![]()
隨著AI基礎設施建設持續推進,運營商不斷將高功率密度系統部署到已受電網限制、水資源緊張和能源成本上升多重壓力的設施中,冷卻問題已成為這一進程中最核心的挑戰之一。初創公司Ferveret正是在這一背景下應運而生,其定位是將冷卻技術從成本負擔轉變為在固定功耗預算內釋放更多算力的關鍵杠桿。
近幾個月來,該公司憑借其"自適應相變冷卻"技術的基準測試結果引發業界關注,相關數據顯示服務器層面的算力效率提升約15%,若結合更低的設施運營開銷,整體收益還將進一步擴大。需要指出的是,上述數據來源于測試和建模場景,而非完整的生產環境部署。
Ferveret的技術路線借鑒了核反應堆熱工程領域的技術,旨在提升熱傳導效率,同時減少對冷水機組和高耗水系統等傳統基礎設施的依賴。該公司將自身方案定義為數據中心層面的"無水"冷卻。
在更宏觀的視角下,CEO Reza Azizian指出,單純改善冷卻可能還不夠,硅基計算本身的效率局限才是更深層的長期挑戰。
目前,Ferveret仍處于試點階段,正與客戶在機架層面開展合作,并通過OEM和ODM合作伙伴關系推進更大規模的部署。
以下是Ferveret CEO Azizian與Data Center Knowledge的對話內容,經整理編輯。
Data Center Knowledge:Ferveret目前的產品是什么?
Azizian:我們發明了一種名為"自適應相變冷卻"的全新冷卻技術。這項技術的優勢在于它是機架式安裝的,能夠適配現有數據中心的基礎設施,讓用戶非常便捷地試用并部署我們的方案。通過使用我們的解決方案,客戶可以在相同的功耗范圍內獲得更多算力,因為冷卻效率大幅提升了。
DCK:客戶最看重的是什么?
Azizian:性能。隨著數據中心越來越受到功耗限制——現在想獲取更多電力簡直是噩夢——客戶希望在相同的功耗范圍內獲得更多算力,而這正是我們能提供的。
DCK:您提到服務器層面提升了約15%,背后的原理是什么?
Azizian:這15%的提升,大部分來自于一個事實:即便是直接液冷方案,服務器內仍然有風扇。我們的系統沒有任何運動部件,去掉風扇后,同等算力所需的功耗大幅降低。具體來說,15%中大約4%到5%來自于芯片運行溫度更低,漏電流減少,芯片運行速度略有提升;另外約10%則來自于去除風扇本身。
DCK:您還提到在數據中心層面有更顯著的收益,這是如何實現的?
Azizian:我們能夠將PUE(電能使用效率)降至約1.03到1.04,這意味著數據中心的運營開銷大幅壓縮。將這一PUE改善與服務器層面15%的提升疊加,總體上可以在相同功耗范圍內獲得約35%的額外算力。
DCK:目前這項技術部署在哪里?
Azizian:我們已經在服務器層面完成了大量測試,目前正在與不同客戶進行機架層面的試點。我們在數據中心環境中運行試點項目,但尚未進入完整的生產部署階段。
DCK:這對在固定功耗預算內運營的數據中心意味著什么?
Azizian:在典型的數據中心中,大約20%到30%的電力消耗在冷卻上。使用我們的方案后,這一比例會大幅下降。因此,在固定功耗范圍內,由于更多的總功率能夠真正到達機架,運營商可以部署更多服務器。
DCK:與直接液冷方案相比,成本競爭力如何?
Azizian:我們的基礎成本與直接液冷方案非常接近,差距不大。而且根據部署情況,我們不需要傳統冷卻方案通常所需的冷水機組和冷卻塔,這在資本支出方面可以節省相當可觀的費用。
DCK:運營風險由誰承擔?系統維護復雜嗎?
Azizian:機架式安裝的特點使維護更加便捷。如果出現問題,可以將某個單元取出單獨維修,與運營商目前的操作方式類似。在類似技術的早期部署中,我們曾遇到系統漏液的情況,但即便如此,溫度也是逐漸上升的,不會突然發生故障,運營人員有足夠的時間發現問題并進行修復。
DCK:部署流程是怎樣的?
Azizian:在試點階段,我們通常在幾周內完成部署,主要工作是將服務器重新封裝集成到我們的方案中。在規模化方面,我們正在與OEM和ODM廠商合作,因為他們具備超大規模集成和部署的能力。
DCK:您認為目前AI部署中存在哪些普遍誤區?
Azizian:我真心認為,很多人覺得必須建設超大規模數據中心才能完成工作。但實際上,有大量5到10兆瓦的小型數據中心處于閑置狀態。我認為存在一條路徑,可以讓算力更加分布式,無論規模大小,都能接入更廣泛的算力網絡并貢獻算力。
DCK:展望未來,我們現在普遍忽視了什么?
Azizian:當前數據中心的運營方式根本不可持續。如果將人腦的效率與硅基計算相比,差距是天壤之別。硅基計算所需的能耗和產生的熱量,從長遠來看是不可持續的。
總結
Ferveret正在將其冷卻技術定位為降低運營開銷、在受限功耗預算內釋放更多算力的關鍵手段。其核心方案——去除服務器風扇并提升熱效率——在服務器層面已展現出可量化的收益,而更大范圍的數據中心改善目前仍基于建模結果。隨著部署仍處于試點階段,下一個關鍵考驗是這些收益能否在規模化部署中得到驗證。
盡管如此,Azizian將冷卻技術定位為更大挑戰的一部分——這一挑戰最終可能需要從根本上重新審視硅基計算本身的效率極限。
Q&A
Q1:Ferveret的自適應相變冷卻技術是如何提升算力效率的?
A:Ferveret的自適應相變冷卻技術通過兩個主要途徑提升效率:一是去除服務器風扇(無運動部件),節省約10%的功耗;二是讓芯片在更低溫度下運行,減少漏電流并提升運行速度,貢獻約4%到5%的提升。兩者合計在服務器層面實現約15%的算力效率提升。若再結合數據中心PUE降至1.03至1.04的改善,整體算力提升可達約35%。
Q2:Ferveret的冷卻方案為什么被稱為"無水"冷卻?
A:Ferveret將其方案定義為數據中心層面的"無水"冷卻,原因在于其技術不依賴傳統冷卻基礎設施中的冷水機組和高耗水冷卻塔。該技術借鑒了核反應堆熱工程領域的熱傳導原理,在提升散熱效率的同時,大幅減少了對水資源的消耗,從而降低了數據中心在水資源緊張地區的運營壓力。
Q3:Ferveret目前的技術成熟度如何,是否已大規模商用?
A:目前Ferveret仍處于試點階段,尚未進入完整的生產部署。該公司已在服務器層面完成大量測試,并正在與不同客戶進行機架層面的試點。在規模化路徑上,Ferveret正與OEM和ODM廠商合作,借助其超大規模集成和部署能力推進商業化落地。文章中提到的15%和35%效率提升數據,目前仍基于測試和建模場景,而非完整生產環境的驗證結果。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.