麥肯錫全球研究院在最新發布的分析中也提到, AI對全球GDP的增長貢獻將達到1.2%,在2030年人工智能將為全球經濟活動帶來13萬億美元的額外增長,它的貢獻率不亞于蒸汽機。該分析同時表明,未來十年內全世界將有大約70%的公司至少使用一種AI技術,超過50%的公司將會應用全部的AI技術。AI技術將作為一種構建萬物智能互聯世界的通用技術,全面影響人類的經濟與生活,諸如無人駕駛、人臉識別、智能音箱等應用將會融入到日常生活之中。
基于此,我們可以預見,AI將成為第四次工業革命的核心驅動力,它牽引并加速世界發生深刻且顛覆性的變化。
但是AI引起的變化,尤其是智能變革并不會憑空出現,一方面它只有與各行各業以及價值鏈的各個環節進行深度融合,才能發揮最大效用;另一方面AI自身的發展也需要強大的基礎設施來支撐。這里的基礎設施并不單指算法、數據和計算力等核心要素,也包括作為AI技術生根發芽的土壤——信息與通信技術(ICT)基礎設施,尤其是作為底層設施的數據中心基礎設施。
在工業4.0時代,數據中心已經成為企業生產和管理系統的關鍵組成部分,并且在上升成為一個可以提升企業競爭力的有效工具。基于此,在AI 全面浸潤人類生活之際,我們要抓住AI賦予的機遇,將數據中心基礎設施價值最大化,反之,更強大的數據中心基礎設施可對AI進行反哺,將AI應用推向極致,兩者相得益彰、相輔相成。
抓住AI賦予的機遇,使能數據基礎設施價值最大化
我們不禁要問,AI賦予數據中心的機遇究竟是什么?利用機遇我們能做什么?或許我們可以從以下三點看出端倪。
重點機遇1:主動預防,數據中心做到更安全可靠
安全運行對數據中心的重要性不言而喻,保證數據中心高可靠運行是對數據中心的核心訴求。業界AI技術在提升數據中心可靠性和可用性方面已經有一些實踐,例如收集供配電系統設備信息,對即將發生故障的設備和部件提前發出預警,為運維人員運維活動提供決策支撐,但是如何利用機器的自我學習能力,做到供配電系統整體運行的安全可靠,是我們要思考的重點問題。要實現更高程度的智能化以及主動避錯,這對AI技術應用或許是個很好的契機。
華為對數據中心智能化進行深入研究,融入AI性能的iPower技術可提升數據中心可用性,借助智能化硬件,實現智能故障定位與預警管理,引入大數據技術,智能分析每日海量的運維數據,識別機房潛在隱患,保障數據中心的可靠運行。
iPower智能供配電技術以模塊化UPS為核心,主要通過供電全鏈路監測、預警和故障自動隔離等手段,提高數據中心能源基礎設施可用性,繼而通過AI技術的應用,最終實現預測性維護。
iPower通過供電全鏈路監測,可實現毫秒級的故障檢測,毫秒級的故障隔離,分鐘級的故障恢復,可消除火災隱患,大大提高數據中心能源基礎設施可靠性和可用性;
以電池管理為例,在預防電池失效方面,iPower通過AI技術,可以精確預測電池的壽命和健康度,為用戶提前提供維護決策依據,及時排除有失效隱患的電池組,變事后補救為事前預防,變被動響應為主動維護,大大提高數據中心供配電安全等級。華為的模塊化UPS結合iPower技術,可以在電池出現溫度快速升高等極端情況下,自動切斷該組電池,從而避免出現起火等惡性事件。
重點機遇2:智能營維,數據中心做到更自動高效
數據中心傳統的維護方法是靠人,而靠人維護,失誤率大、漏錯率高、失效排查時間長,小小的人為失誤會對數據中心造成極大的損失。傳統運維方式無法解決人為誤操作帶來的業務中斷問題。
融入AI性能的 iManager,可看作是數據中心的大腦,借助智能化硬件和傳感器,實現精準感知。通過自動化手段,逐步減少人工巡檢等例行重復性工作,池化專家資源和能力,并固化于運維流程中。再加上全流程的電子運維,包括巡檢的操作、維保的操作、應急演練的操作,把所有的流程以及操作指導全部做到線上,實現了運維質量從原來靠人的責任心到現在靠流程管理的轉變。通過全流程電子化的運維跟蹤,量化原來沒有辦法量化的信息,比如通過電子運維提升巡檢的執行力和運維活動的質量、實現故障的預測等。這將大幅提高人均運維效率和運維水平,提升數據中心的可靠性。
此外,在市場出現了越來越多由邊緣計算產生的邊緣數據中心機房,就近提供服務和處理計算。面對日益增長的邊緣數據中心數量,分行、支行、網點等數據中心無法統一集中管理,數據中心故障響應速度慢,運維效率低等挑戰。
華為iManager全網管理功能,實現對多網點數據中心基礎設施進行集中監控,統一管理,實現預防性維護,通過GIS定位技術提高故障定位響應速度,提升數據中心運維效率;移動APP監控,從內到外簡化管理,輕松知曉海量網點數據中心運行情況,擺脫傳統人工的運維檢修方式,降低維護下站次數和節省開支,讓數據中心管理變得更加簡單、高效。
在運營方面,管理好數據中心資產也尤為重要。華為iManager還能對資產進行盤查,保證設備的完整性,保護重要數據。另外,還可以對資產匹配最適宜的供電、制冷、空間、帶寬等資源,實現資源的最佳利用,利用AI技術,可協助對資產上下架和運營進行智能化的管理,提升運營效率和效益。
重點機遇3:降耗增效,數據中心做到更綠色節能
能耗問題一直是數據中心關注的焦點,傳統數據中心年平均PUE高于1.8,隨著越來越多AI應用的落地,業界對高速計算的需求日漸增多,GPU計算服務器的規模和需求將持續增長,加速計算服務器產生的熱能是傳統CPU的數倍,如何解決服務器的散熱問題將是未來的重要考量。目前已有的智能DC節能技術可以通過傳感器獲取關鍵節點數據,進而優化所有系統和設備的整體能耗,降低PUE。
而AI能否深入數據中心內核,帶來更低PUE?華為作為ICT行業的領導者,在數據中心熱管理技術方面走在行業前端,致力于帶給客戶更低的PUE。華為將基于AI的iCooling智能熱管理解決方案融入數據中心基礎設施,針對數據中心制冷效率提升瓶頸,通過深度學習,打通精密空調末端、冷水機組、冷卻塔、水泵等制冷系統以及IT負載、環境變量等大數據之間的聯動,對大量的歷史數據進行分析,探索影響能耗的關鍵因素,獲取PUE的預測模型。利用尋優算法,獲取調優參數組,下發到控制系統,實現制冷系統的最優控制。最終通過規范化的實踐引導和目標導向評測,不斷調整優化,獲取最佳PUE。
iCooling@AI解決方案目前已在華為云廊坊數據中心成功部署,全年PUE可降低超過0.1,年平均值達到1.3以下,年節約電費數百萬元。
創新技術聯接綠色未來
華為作為全球領先的ICT解決方案供應商,在關注業務發展的同時,更加關注運營的可持續性,致力于為社會的可持續發展做出貢獻,助力建設綠色智能的全聯接世界。根據華為GIV2025產業愿景報告,預計到2025年,通過ICT及基礎設施節能技術的持續創新,全球ICT行業平均到每聯接的碳排放量有望降至15kg,比2015年(75kg)下降80%。數據中心基礎設施作為全聯接世界基礎的基礎,通過融合AI、電力電子技術、熱力學技術、數字信息技術、通信技術與物聯網等創新性技術,可以獲得更好的能效指標,以此促進環境的持續改善。目前華為已在全球部署了800+大型數據中心,提供低PUE的數據中心能源解決方案,減少耗電量和碳排放。