你肯定在科幻片里見過那種離譜操作,一堆計算機主機泡在透明液體里,還能嗖嗖跑。當時估計你跟我一樣,覺得這就是導演瞎編的,現實里電器沾水不就直接短路報廢?萬萬沒想到,現在國內數據中心都這么玩了。中國移動慶陽數據中心早就把整臺服務器泡進“水”里工作,不僅沒壞,用著比風冷還穩。這到底是什么黑科技?今天就嘮明白這里頭的門道。
![]()
很多人第一反應都是,電器碰水哪有不壞的道理,這原理說破了其實很簡單。泡服務器的不是咱們日常接觸的自來水,是專門的電子氟化絕緣冷卻液。它是人工合成的有機材料,無色無味不導電,化學性質穩得一般,沸點還超過110攝氏度。
早年試過油冷,那體驗真的一言難盡。油的黏度大,帶熱速度慢,用久了還會氧化變質,保養起來麻煩到爆炸。硅油這類方案也不行,性能根本撐不住現在的高密度算力場景。這種氟化冷卻液剛好把這些老問題都繞過去了。
服務器日常運行溫度大多在七八十攝氏度,遠低于它的沸點,所以不會輕易揮發,不用三天兩頭補液體。工信部做過耐久性測試,服務器泡在里頭十年,內部元器件還能完好無損。說白了就是材料科學改寫了咱們的常識,原來液體不一定是電器的敵人,還能當散熱保鏢。
![]()
液體導熱能力是空氣的25倍,單位體積攜熱能力差不多是空氣的一千倍。這個差距啥概念,就好比用小推車拉貨和用貨運火車拉貨,壓根不在一個量級。風冷最怕熱量堆在某個角落散不出去,液冷最擅長的就是直接把這些發熱點給按住。
還有個實打實的好處,機房能安靜好多。去過風冷機房的都知道,幾十上百個風扇加上空調一起轉,那動靜就跟一堆吹風機同時開著似的,說話都得扯嗓子。浸沒式液冷根本不用風扇拼命轉,噪聲直接降下來,還能把灰塵濕氣這些容易搞壞機器的玩意兒全隔開。
機器故障率低了,壽命也能拉長,運維人員也少掉點頭發。這東西不是完美無缺的,工程上還有不少硬骨頭要啃。最頭疼的就是密封,液槽、管道還有各種線路穿過去的位置都得做特殊處理,真漏液了,設備損失可不小。
![]()
檢修也比風冷麻煩多了。風冷機器出問題,打開機箱就能查。浸沒式液冷得先排液才能檢修,折騰起來動靜大很多。還有不少硬件,比如部分硬盤和光模塊,天生不適合泡在液體里,得跟著重新升級換代。
再加上專用冷卻液和配套設施都不便宜,前期投入比風冷要高兩成左右。大企業能算明白長期賬,中小企業一看首筆投入這么多,難免要猶豫一下。液冷這兩年突然從冷門可選項變成熱門選項,真不是行業趕時髦,是風冷真的快撞南墻了。
十年前,服務器單顆CPU功耗也就幾十瓦,一個散熱片加個風扇就完全夠用。現在AI訓練用的GPU,單卡功耗都突破700瓦了,最高超過一千瓦都不稀奇。一個機柜塞幾十張卡,功率沖到三五十千瓦都不算啥,不少高密度場景都往一百多千瓦走了。
![]()
國產芯片現在更新迭代越來越快,高密度算力堆得越來越滿,熱量也跟著水漲船高。問題不只是熱得厲害,是空氣本身的物理屬性就有天花板。它比熱容低,導熱能力弱,天生就不是搬大量熱量的料。
機柜功率一旦超過30千瓦,哪怕風扇轉滿負荷,空調開最冷,熱量還是容易積在局部。芯片一熱就會降頻,再熱一點直接保護性宕機,賬面上算力看著很高,真跑起來就容易掉鏈子。這就像買了頂級超跑,結果路太窄,根本踩不滿油門,太憋屈。
![]()
風冷還有個老毛病,特別費電。數據中心常說PUE這個指標,數值越接近1越好,說明電都用在計算上,不是浪費在降溫這類輔助環節。傳統風冷數據中心PUE大多在1.4到1.6之間,工況最好的也就剛摸到1.2。也就是說,一大半電都被空調風扇分走了,根本沒用到計算上。
AI時代最受不了的就是這種,忙了半天電全花在降溫上。算力漲得飛快,散熱跟不上,就好比給高鐵配了個自行車剎車,早晚會出效率問題。現在散熱早就不是機房里的后勤小事,已經變成影響整個產業發展的大問題了。
現在行業里主流的液冷路線大概分三種。冷板式液冷最成熟,改造成本低,安全性也高,適合三十到五十千瓦的機柜。就好比在原來的路上拓寬,對傳統數據中心很友好,是過渡期最容易落地的方案。
![]()
不過它還得搭配一部分風冷用,散熱效率還是有上限。噴淋式液冷散熱能力比冷板式強,可設備結構更復雜,噴頭堵塞就是常碰到的問題,工程難度大,用的地方也就少了。浸沒式液冷散熱能力最強,幾乎沒有散熱死角,特別適合五十千瓦以上甚至一百千瓦級的高密度集群,是高端AI訓練場景的剛需。
實際落地的時候,根本不用一刀切,分級用就最合適。三十千瓦以下,風冷還夠用,沒必要小題大做。中等功率機柜,冷板式液冷就是最穩妥的選擇。碰到超高功率的高密度訓練集群,浸沒式液冷才能顯出真正的價值。
中國移動慶陽數據中心的經驗,剛好驗證了這個邏輯。選技術不是比誰更潮,是看哪個更適合自己的情況。浸沒式液冷能從實驗室走到商用,其實是多股力量推著走的。最直接的就是芯片功耗倒逼,高端AI芯片的功耗已經把風冷和部分冷板方案逼到墻角了。
![]()
想要超密集算力長時間滿負荷工作,浸沒式液冷幾乎成了必選項。業務場景不一樣,選擇也不一樣,AI訓練要的就是長時間高負載穩定輸出,剛好撞上浸沒式液冷的長板。推理場景算力波動大,風冷和冷板依舊有很大的用武之地。
慶陽數據中心的意義,也不只是用了新技術這么簡單。它靠著低價綠電和本身比較低的環境溫度,把液冷規模化落地的賬算明白了。前期投入雖然高,但是靠省下來的電費,四年左右就能收回多投入的成本。
這筆賬算通了之后,液冷就不再是廠商用來炫技的黑科技,而是實打實能賺錢的經營方案。風冷不會馬上退出歷史舞臺,風扇和空調還會繼續用,但是算力時代已經換了新的劇本。服務器泡在“水”里工作,早就不是科幻片逗觀眾的橋段,是現實改寫了咱們的固有常識。
熱量從來不講情面,物理定律也不會給誰讓步。能把散熱問題解決明白,才有資格把算力盤子做得更大。
![]()
藍鯨新聞 算力狂飆逼瘋風冷!液冷服務器:滲透率破37%,玩家搶灘千億賽道
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.