運營數據中心必須提供更細粒度的實時數據,以保持數據中心的運營彈性、響應性和在線性,盡管存在潛在的安全和中斷威脅。不可預測的供應鏈、長期的勞動力短缺、螺旋式上升的通貨膨脹和能源成本等,是企業CIO和高級管理團隊在優化數據中心時面臨的一些挑戰。
EkkoSense公司美洲副總裁特Tracy Collins表示,“從現在到2025年,工作量將繼續以每年20%左右的速度增長,數據中心正在努力滿足這些不斷升級的需求。”
戴爾公司人工智能戰略主管Brons Larson表示,“數據中心可以利用人工智能和機器學習來提高性能,優化配置和部署。”
阿里云智能高級總監兼首席工程師Wendy Zhao補充說:“人工智能和機器學習繼續在它們的發展中取得巨大進步,它們現在對數據中心運營和IT管理產生了切實的影響。”
根據IDC公司發布的數據,由于嵌入式人工智能功能,數據中心50%的IT資產將自主運行。該公司表示,對于投資人工智能以實現IT基礎設施自動化的企業來說,提高客戶滿意度、自動化決策和重復任務是企業獲得的最大好處。
人工智能和機器學習獲得采用
去年,一半以上(57%)的數據中心運營商表示,他們相信人工智能可以做出日常運營決策,高于2021年的49%。考慮到數據中心的許多任務都是人工密集型的,人工智能和機器學習可以顯著降低成本,并提高效率。
一些CIO表示,他們對應用基于人工智能和機器學習的解決方案感興趣的領域是,解決諸如減少停機、加強多站點彈性、優化直接液體冷卻以及改進容量規劃以及安全性等具有挑戰性的問題。
數據中心的能源成本正在飆升,這意味著運營商在預算范圍內運營數據中心更具挑戰性。數據中心運營商和企業CIO正專注于評估軟件設計的電源和人工智能如何幫助企業以指數方式降低能源和冷卻成本。
Equinix公司是一家為許多全球領先企業提供數據中心服務和網絡基礎設施的全球供應商,該公司的CIO Milind Wagle表示,Equinix公司在全球26個國家運營著220多個數據中心,他們正在使用人工智能來估算他們的數據中心將消耗多少電力和空間,進而調整他們的互聯網“引擎”。
人工智能可以在哪些方面幫助優化數據中心性能
利用人工智能技術,CIO和數據中心運營商可以優化功耗并提高能源使用效率,以實現未來的效率提升。隨著整個行業可持續性壓力的增加,許多數據中心運營商還沒有做好滿足碳排放報告要求的準備。
此外,數據中心中斷仍然是代價高昂且頻繁的,云計算應用程序尤其容易受到影響。人工智能有可能通過提高效率、減少中斷和簡化操作來幫助解決許多這些問題。以下是人工智能可以幫助優化數據中心性能的關鍵領域:
(1)改進容量規劃和資源分配
實時數據對于任何數據中心的容量規劃和資源分配都至關重要。實時數據可以讓人們了解需要優化的地方、方式和內容,以提高數據中心性能。一個關鍵領域是確定容量規劃和負載平衡中的瓶頸。這些都是基于約束的問題,監督機器學習算法擅長解決這些問題。正確進行容量規劃和資源分配對于在預算范圍內運行蓬勃發展的數據中心至關重要。
(2)可以幫助提高數據中心的安全性
通過學習網絡的正常行為并檢測異常和偏差,人工智能可以幫助防止大規模數據泄露和黑客攻擊。人工智能網絡安全工具可以徹底篩選和分析所有傳入和傳出的安全威脅數據。
“永遠不要信任并始終驗證”是企業實現零信任安全的原則,這種方法不信任任何用戶、應用程序或設備,除非安全策略明確允許。企業可以提高混合環境的可見性、安全性和遵從性,同時通過采用零信任的策略來降低成本。
(3)減少碳足跡
人工智能擅長識別不同的數據模式,并幫助企業建立適合數據隨時間變化的模型。事實證明,監督式機器學習在解決復雜的基于約束的碳減排問題方面是有效的,這些問題涉及數百個影響碳排放的潛在變量和因素。
實現可持續發展意味著將人工智能和機器學習的優勢結合起來,在減少碳足跡方面表現出色。它太重要了,不能聽憑運氣,它對企業有重大影響。CIO們表示,他們看到同行的薪酬計劃與ESG目標掛鉤,將可持續發展作為減少碳足跡的重中之重,并將其作為工作的核心。
(4)隨著時間的推移,提高正常運行時間維護水平和基準數據中心性能
企業需要了解特定類型的服務器比其他類型的服務器更需要重建的原因,確定導致電源管理系統中斷的原因,以及排除資源平衡不起作用的原因,這些都是機器學習可以幫助解決的問題類型。關鍵是實現實時數據監控,并構建一個可以跟蹤所有可用變量以排除性能瓶頸的數據集。
監督機器學習模型在預測準確性方面表現出色。挖掘機器數據并構建模型來預測給定服務器何時需要預防性維護,可以節省時間和成本。將數據中心中每個資產生成的實時數據視為跟蹤性能所需的智能,并找到改進的新方法。
(5)結合人工智能和機器學習的優勢,實現冷卻、電力、電力和安全系統的自動化
數據中心運營商的目標是建立一個能夠自主運行的數據中心。通過捕獲實時數據,跟蹤空氣溫度、冷卻、電力負載、內部氣壓、資源負載和服務器性能,可以實現這一目標。促使CIO和數據中心運營商合作實現這一目標的原因是,需要根據高級管理層設定的可持續性和ESG目標來衡量數據中心的績效。
使用機器學習來解釋和創建基于環境監測和控制的模型對于衡量ESG目標的進展至關重要。人工智能和機器學習需要廣泛用于跟蹤電源和冷卻消耗,這是運行數據中心成本最高的兩個領域。
識別數據中心中的人工智能用例
確定人工智能可以在哪些方面為保護和優化數據中心做出最大貢獻,必須從運營成本和安全性風險最大的地方開始。一些CIO表示,尋求新的方法來減少能源消耗,以實現碳減排和可持續發展的目標,這一挑戰需要與他們持續面臨的員工短缺相平衡。
正確進行冷卻、空間、電源和服務器優化是保持數據中心在預算范圍內運行和避免潛在停機的核心。據估計,數據中心僅冷卻基礎設施就消耗了35%的能源。根據Uptime Institute公司發布的《2022年全球數據中心調查》報告,優化數據中心冷卻、選擇更多可再生能源和提高IT利用率可以將可持續性收益提高57%。
在數據中心使用人工智能的新用例包括效率風險分析、容量規劃、安全和預算影響預測。在網絡安全領域,使用人工智能來縮小IT和OT系統之間的差距是既定的,為每個數據中心和系統定義最低特權訪問和身份管理也是如此。
關于企業網D1net(hfnxjk.com):
國內主流的to B IT門戶,同時在運營國內最大的甲方CIO專家庫和智力輸出及社交平臺-信眾智(www.cioall.com)。同時運營19個IT行業公眾號(微信搜索D1net即可關注)
版權聲明:本文為企業網D1Net編譯,轉載需在文章開頭注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。