楊明川稱,智能化的數據中心的發展要分為三個階段。當前階段,人工智能能做到驅動數據中心節能;驅動服務器、存儲網絡的自動優化;驅動DCIM智慧運營,同時還能驅動自動巡檢機器人;驅動NFV故障預測、自動編排以及5G網絡優化。
第二階段,人工智能能在數據中心中實現邊緣與核心統一;實現AI各系統融合;實現AI產品標準化;實現全面物聯網化。終極階段是數據中心能在AI的參與下做到自我管理、自我修復、自我優化和無人值守。
“也就是說,數據中心為AI提供必需的計算能力,而AI應用改進數據中心自身。” 楊明川表示。
眾所周知,運營商擁有大量的數據中心,但是要想智能化這些數據中心,面臨的挑戰也將非常巨大。人工智能是電信運營商在其網絡從物理網絡演進到基于數據中心的虛擬化基礎構架NFV/SDN時必需整合的部分。
楊明川指出,對于運營商來說,智慧化數據中心主要面臨以下五大挑戰。第一基礎設施改造。機架改造,異構兼容以及云管平臺改造。第二,訓練數據集,噪聲龐大。第三,模型更新周期,訓練迭代周期長。第四,通用人工智能平臺,API接口與流程尚不規范。第五,智能化NFV編排器,尚難以替代人工決策。
“在智能化的數據中心方面的探索方面,中國電信主要依托于北京研究院的云計算實驗室,中國電信以實驗室的研究為基礎,開展了智能化數據中心技術體系的探索,包括從底層芯片的架構到加速用SDK,從人工智能計算框架到不同業務的AI算法。” 楊明川介紹稱。
中國電信首次引入基于人工智能的數據中心節能解決方案。基于深度學習網絡建模數據中心不同業務的負載特征,發掘節能潛質高效合理地重組數據中心資源,以滿足峰值時段和非峰時代,在非峰負荷期,觸發業務遷移,將服務器置成“睡眠”,實現綠色節能。
“數據中心默認是按照峰值時段設計的,服務器是100%加電運行的,每個業務在一定的時間段內都有自己的使用類型,中國電信學習每個業務并發現綠色區域,這是業務的非峰時段。” 楊明川表示。
同時,基于深度學習網絡建模數據中心不同業務的負載特征,基于數據中心業務層,物理基礎設施層,機房環境層的歷史數據自動學習與訓練權重和偏置系數,將學習到的關聯關系以及知識應用到數據中心控制調度器上。
另外,基于學習模型,負載服務器負荷,高效合理的重組數據中心資源,模型預測機制并能夠根據過往業務波動規律,啟動喚醒服務器處理峰值業務,預留20%的緩沖以應對無可預測的突發流量。
楊明川稱,中國電信數據中心智能化節能是通過“純軟件+漸進式部署”,在保障業務質量的同時實現有效技能。此外,中國電信還發布了定制化服務器,2013年—2014年,根據網發部要求啟動中國電信定制化服務器設計,測試驗證與規模引入。2015年—2016年發布超融合定制化服務器和低功耗定制化服務器。2017年,新增NFV定制化服務器、新增GPU定制化服務器。2018年國產CPU服務器,發布邊緣定制化服務器。