機房隨著數字化轉型進程的推進,各行業龍頭企業,將加速應用5G、AI、云等數字技術,推動數據總量呈爆發式增長,對數據計算、傳輸和應用需求也將大幅度提升。作為支撐各行業數字化轉型基礎設施底座的數據中心,必將迎來新一輪增長。
“十四五”規劃和2035目標綱要提出,加快構建全國一體化大數據中心體系,強化算力統籌智能調度,建設若干國家樞紐節點和大數據中心集群。今年2月國家發展改革委等部門正式發布通知,同意在京津冀、長三角、成渝、內蒙古等8地啟動建設國家算力樞紐節點,并規劃10個國家數據中心集群?!皷|數西算”工程正式啟動,這為數據中心帶來新機遇。 一 未來數據中心的四個關鍵特征 未來的數據中心可以被看作是一個智能生命體。人工智能技術建模,實時監測,通過智能模型時刻關注可用空間、電力與網絡,保證資源得到最合理利用?;诖?華為攜同全球數據中心行業領袖和技術專家展開廣泛深入研討,提煉出下一代數據中心應具備的四大特征:低碳共生、融合極簡、自動駕駛、安全可靠。 二 滿足未來需求的供電系統 未來,數據中心將呈現高密化、規?;l展態勢。供電系統作為數據中心的“心臟”,如繼續采用傳統方式,占地面積將會擠占IT系統空間,二者比值接近1:1。同樣,鏈路的增加也產生了更多的消耗和損耗。而且,交付現場的情況也變得更加復雜:現場人工作業時間延長、安全隱患突出、運維成本的居高不下。通過不斷摸索、實踐與改進,華為研發出了滿足下一代數據中心需求的重磅武器——電力模塊3.0。通過核心技術的創新和部件融合,優化布局,打造更為省地、省電、省時、省心的數據中心供電系統。 三 基于實踐創造未來 長期服務數據中心行業需要企業擁有長技術鏈,同時對產品集成的能力要求也高。多年來,華為一直投入創新,以產品和解決方案滲透不同行業,積累了豐厚的實踐經驗,也使之對行業有了深刻理解。 技術創新是引領數據中心行業發展和變革的關鍵力量。面向未來,華為將通過持續的創新投入,不斷突破,與行業客戶、生態伙伴、產業組織、標準組織開展全方位合作,共同邁向數據中心發展新時代。正如楊友桂在發布會上所闡述的那樣:當所有人在預測未來的時候,華為在創造未來。
那么,究竟什么樣的數據中心才能迎接來自未來的挑戰?2022年5月26日,華為在東莞松山湖面向全球發布了下一代數據中心理念和滿足下一代數據中心需求的重磅武器——全新供電解決方案電力模塊3.0。
1.低碳共生:下一代數據中心將是全綠色、全高效、全回收的數據中心。面對高能耗、高資源消耗的挑戰,通過資源源頭(電力輸入、水、土地、氣候)的綠色化,實現數據中心與自然的和諧共生。大規模使用綠電,就近消納本地光電、風電、水電等綠色電力,減少火電使用,“解綁”石化能源依賴。同時,在數據中心園區部署分布式光伏,充分利用園區屋頂及土地資源,可降低數據中心碳排放1%-2%。通過使用回收水及替代方式,減少清潔水的消耗。集約化利用土地資源,增加每平方米土地算力產出。通過選址或者技術手段,更大程度使用自然冷源。通過熱回收技術,利用數據中心運行過程中產生的熱量。通過推廣新型裝配式綠色建筑,采用綠色建筑材料,材料回收率力爭超過80%。采用無鉛無鹵的綠色可回收新材料,提高材料回收利用率,促進數據中心低碳循環可持續發展。
2.融合極簡:為應對傳統數據中心建設慢、運維難等問題,在數據中心不斷升級發展的道路上,對“簡單”的持續追求將驅動部件、設備、系統和數據中心架構的融合極簡(數據中心建筑和機房形態、供電系統、溫控系統)。采用預制模塊化建設模式,將數據中心化整為零,改變建筑形態,從傳統的“鋼筋混凝土+現場施工”轉變成“裝配式鋼結構建筑+工廠預制”。通過全模塊化架構設計,改變機房形態,集成機柜、溫控、供電、監控、消防等子系統,縮短交付周期縮短,降低運維難度,提升能效水平。將數據中心建設從串行走向并行,實現快速交付,按需部署,滿足云數據中心時代的業務快速上線訴求。在不改變供電鏈路的情況下,對大型數據中心的供電系統的部件進行技術創新和融合,優化系統空間布局。利用拓撲池化、器件優化等技術,提升UPS模塊功率密度,從而有效減少占地面積。在供電鏈路上進行創新,從全鏈路全方位進行設計,使其達到最簡,降低鏈路復雜度。將溫控系統多部件融合成一個模塊,實現“一模塊一系統”,簡化冷鏈,有效縮短安裝交付周期和運維難度。直接利用自然冷源為數據中心降溫,從多次熱交換變成一次熱交換,縮短制冷鏈路,從而提升制冷效率。未來,對于機柜功率20kW以上的場景,以液冷為主、風冷為輔,風液結合的制冷方式將成為主流。
3.自動駕駛:“運維自動、能效自優、運營自治”重構數據中心運營和運維管理模式。通過運維自動,5分鐘完成2000機柜巡檢;通過能效自優,1分鐘內從140萬個算法組合中推斷出最佳冷卻策略,實現從制冷到“智”冷;通過運營自治,最大化挖掘資源價值?;贏I的iCooling數據中心能效優化解決方案,可在給定的氣候、業務等條件下,通過深度神經網絡訓練得出PUE預測模型。根據實時的氣象條件、IT負載等參數推理,iCooling不僅能在1分鐘內,從17萬種組合中找出在當前室外環境、IT負載下的最優參數組合,并能根據業務要求進行多層過濾,最后得出最合適的指令,下發執行并反饋效果,實現數據中心能效最優。
4.安全可靠:“主動安全、架構安全”保障數據中心的高質量、可持續發展。通過AI預測性維護,實現從“治病”到“治未病”。通過系統自動化故障響應,實現“1分鐘發現,3分鐘分析,5分鐘業務恢復”,故障快速閉環;部件支持熱插拔,整個設備采用冗余設計,單點發生故障的時候,0毫秒切換至冗余模塊,大大增加了穩定性。從器件到DC,三重防護構筑安全防線,系統可用性達到99.999%。
下一代數據中心在以上四個方面將會產生出許多突破性的技術、產品與解決方案,這些技術、產品和解決方案將引領整個數據中心行業走向綠色、安全、智能、高效。
1.省地:占地面積節省40%。通過采用創新的融合架構和業界超高密的UPS5000-H,提高單柜功率密度,優化供電系統的空間布局,22柜變11柜,大幅節省占地面積。以12MW的數據中心為例,與傳統攢機供電方案相比,采用電力模塊3.0方案所節省的占地面積,可多部署170多個機柜。大量新的底層技術和撲翼式復合隔離開關,把原本橫向的空間變成了縱向空間,內部元器件也進行了重新開發。在UPS功能模塊中,整流模塊和充放電模塊融合成一個電路,整個切換模式變得更加安全可靠。在滿足兩個電路工作的情況下,將整個占地面積降低到50%,可以在600K機柜的固定空間里,兼容三個負荷隔離開關。
2.省電:電能損耗降低70%。傳統供電方案鏈路效率通常不高于94.5%,而電力模塊3.0縮短了鏈路,全鏈路效率達97.8%。UPS5000-H智能在線模式效率高達99.1%,可有效降低電能損耗。以12MW數據中心為例,電力模塊3.0可以將整體效率提升3.3%,相當于損耗降低70%、PUE值降低0.03,這就意味著每年可以節省電費200萬元。
3.省時:交付時間縮短75%。電力模塊3.0內部連接采用預制廊橋式母排,且在工廠完成預制和調測,交付周期從2月縮短至2周。
4.省心:SLA故障降低38%?;凇白詣玉{駛”的理念,結合AI技術,電力模塊3.0配置了iPower智能特性,具備全鏈可視,以及AI溫度預測、關鍵部件壽命預測、智能整定等雙層可靠設計,實現運維從“被動響應”到“自動自預”的轉變。在硬件配置上實現了獨立的熱備份單元和濾波單元。在市電的工作模式下,在硬件上增加一個獨立濾波單元,同時逆變部分處于7×24小時的熱備份狀態。當市電出現異常,可以做到0毫秒切換。此時,整個熱備份的功率降到最低,卻依然可以維持99.1%的效率。當前數據中心,供應鏈系統都是獨立的孤島,給運維帶來了極大困難,也帶來了極大的安全隱患。尤其是供配電系統出現故障后,結果經常是災難性的。華為利用AI技術,通過大量傳感器和中央控制器,打造全程可視、預測性維護的雙重安全運維模式,故障率下降38%。
多年來,華為一直堅持源頭綠色化,以盡可能地使用綠色能源。同時,華為還在思考,如何充分利用自然冷源進行制冷,降低對能動系統的依賴。從算力的角度,華為選擇充分挖掘每一平方米土地的價值,使之承載更多算力。目前,華為已經將評價數據中心綠色的標準從PUE轉向集PUE、WUE、CUE、SUE等在內的綜合評價體系,全生命周期考量能源供應、利用與回收,并從技術可行性與經濟效益兩個維度持續探索,希望可以通過技術手段實現余熱回收再利用。
而實際上,數據中心一直都存在技術超前的問題。一個數據中心需要承擔10年以上的生命周期,但是服務器一般3年就需要更換。因此就需要在數據中心設計之初規劃好未來3-5代的服務器裝載需求,才能做到向下一代兼容。同時,技術的不斷發展,數據中心在未來還會遇到很多不可知的挑戰,因此需要一個靈活和富于彈性的架構。電力模塊3.0就采用了全模塊化設計,可以按照1.6兆瓦、2兆瓦、2.5兆瓦靈活擴容。這就是華為在面對不確定的需求和挑戰時,依然可以從容應對的底氣。也正因為如此,“東數西算”所帶來的機遇也會被華為緊緊抓住。
華為高級副總裁、華為數據中心能源軍團CEO楊友桂認為,“東數西算”是對未來數據中心的一個整體的規劃和引導,將中國東部發達地區的算力需求與西部地區在綠色能源和土地方面的優勢資源實現有機結合。隨著“東數西算”工程的正式啟動,數據中心集約化發展,需要進一步解放運維人力,因此華為選擇通過人工智能技術和架構來支撐數據中心的智能運維與自動駕駛。
而提到智能運維,就不得不提下一代數據中心構想中頻繁被提及的AI。對此,華為數字能源首席營銷官方良周表示,傳統數據中心的檢測是由人工定期巡檢的方式來進行的,一個2000機柜的日常巡檢人工大約需要2小時,當AI技術應用到數據中心日常檢測中,5分鐘就可以巡檢完畢。AI技術大大地提升了運維效率。不僅如此,AI技術應用到能效提升方面也同樣出色。一個4000機柜的數據中心,在采用AI提升能效之前PUE值是1.42,經過兩次大規模數據輸入和AI優化,PUE值降到了1.25。這意味著,對于一個4000機柜的數據中心來說,每年節電可達3000萬度,折合成電費約為2000萬元。而一個大型的數據中心長期運行后,制冷容量和供電容量的實際使用率可能只有60%,通過AI技術可以使其使用率提升到80%左右。然而,AI技術最杰出的優勢體現在安全上。以往數據中心的維護主要是被動響應告警,事后處理;現在則可以通過AI算法實現主動預防,數據中心的安全性得到大幅提升。