網絡容量規劃旨在保證提供足夠的帶寬,從而可以可靠地滿足網絡SLA目標,例如延遲、抖動、丟包和可用性。這是一個復雜的、容易出錯的工作,涉及嚴重的財務負擔。直到最近,可提供有洞察力的容量規劃所需的網絡數據才基本上可通過靜態、歷史和事后報告獲得。這種情況現在正在迅速改變。
“通過將先進的數據科學和認知技術(如人工智能和機器學習)結合起來,IT可以推動產生新的、更智能的預測性見解,從而提高網絡容量規劃的準確性,”德勤咨詢公司負責認知分析的執行董事Ashish Verma說。“這有助于組織釋放數據潛力,以制定更靈活的決策,提高運營智慧,避免停機,并創造更好的用戶體驗。”
盡管AI支持的網絡容量規劃仍處于初期階段,但大多數容量規劃供應商,包括Cisco、NetBrain、Aria Networks、Flowmon和SolarWinds等大型和小型企業,已經開始將某種形式的AI技術融入其產品中,或計劃在不久的將來這樣做。與此同時,如IBM Watson 等技術供應商,也在尋求進入這一市場。
AI技術可支持傳統的網絡監控
商業咨詢公司畢馬威(KPMG)美國首席信息官咨詢業務經理弗雷德里克•林斯特羅姆(Fredrik Lindstrom)指出,利用人工智能分析多個來源的數據,可提供比嚴格關注鏈路利用率的傳統網絡監控工具有更高的準確性。“AI還可以對不同性能場景進行建模,并將網絡性能與應用程序性能聯系起來,以確定應用程序在不同性能場景中受影響的程度。”
將AI驅動的機器學習技術應用于網絡性能中,可以使網絡控制器在增強網絡性能的同時從經驗中學習。
“隨著其不斷學習,它用于決策的分析模型得到了優化,可以更好地代表網絡的真實意圖及其業務目標,”思科公司(Cisco)分析和機器學習學科專家杜瓦爾•耶格爾(Duval Yeager)表示。“隨著網絡的發展、變化以及應用程序和用戶的增加,無論是本地還是云端,這都能提供準確的容量規劃。”
人工智能和機器學習方法可以有效地應用于流量預報/預測、流量模式檢測、在線學習和自動決策,卡內基梅隆大學(Carnegie Mellon University)泰珀商學院(Tepper School of Business)商業技術助理教授黃燕(Yan Huang)說道。
“高級機器學習算法可以將大規模和高度精細的網絡數據作為輸入,為網絡中的每個節點生成精確的需求預測,并檢測網絡流量和利用率的跨期模式/趨勢,”黃燕解釋說。“流量和需求預測的改善將能夠更準確地評估網絡容量需求,并減少資源過度供應的需求。”
早期檢測和發現跨期模式或網絡流量的變化,可使組織能夠采取主動措施來確保網絡性能。 “復雜的預測模型可以與優化和/或模擬技術相結合,自動生成最佳的網絡結構或其他結構以及相應的容量和資源規劃,”黃燕說道。然后,可以根據組織最關心的特定性能指標來調整此類規劃。
AI技術還可以根據實時網絡狀況處理實時流量數據,并動態制定路由和分配決策。“它還支持增量容量配置的按需模型,”黃燕解釋道。所有這些因素都可以顯著降低與網絡發展、維護和改進相關的資本支出和運營支出,同時降低IT專業人員管理此類活動所需的工作量。
一旦安裝并正確配置后,網絡AI技術就可以自動進行網絡容量規劃,同時考慮組織的財務和風險偏好。“人工智能可以實時或接近實時地分析許多不同的數據點,這對于企業遷移到涉及數據中心、云環境和廣域網的虛擬化網絡是至關重要的,”林斯特羅姆說。
AI還可用于以各種方式分析網絡流量模式,幫助組織深入了解網絡中正在運行的內容以及整體網絡負載。
“這一細節對短期和長期容量規劃都非常有用,”勞動力管理軟件和服務提供商Kronos的首席架構師兼網絡和安全高級總監Doug Tamasanis解釋道。
從短期來看,AI可以在極精細級別上來預測每日流量突發,例如應用程序、位置、技術和協議等。然后可以使用這些發現結果來防止高峰期的網絡性能下降。“從長遠來看,人工智能系統可以執行最佳容量規劃,預測何時無法滿足短期的流量突發,以及(何時)需要進行全面升級,”Tamasanis指出。
基于AI的容量規劃:入門
IT資產和服務管理軟件提供商Ivanti的聯邦系統工程師馬塞爾•肖(Marcel Shaw)表示,開始使用基于AI的容量規劃技術的最佳方式是獲得一個成熟的技術,并且該技術已經取得一定程度的成功且得到企業的認可。
“同時,管理員應謹慎對待AI學習算法所提供的建議,”他說。“AI學習算法將在未來幾年內得到大幅改善,因此客戶在完全信任AI解決方案所推薦的容量需求之前,需要有耐心并允許AI技術逐漸成熟,這將是非常重要的。”
林斯特羅姆建議,在數據源和監控范圍方面,從小規模著手。“至關重要的是,數據源可靠且一致,并且(AI)系統能夠在至少一個完整的商業周期內生成基線,”他解釋道。
Tamasanis指出,將網絡端口進行復制,并部署到關鍵網絡設備,這是提供數據流的最佳方式,該數據流能夠為分析平臺提供數據。可以將特定系統(例如無線控制器、VPN集中器和防火墻)直接配置為流數據。“任何人工智能系統都需要這些類型的數據供應,而且網絡的覆蓋范圍越大越好,”Tamasanis說。“關鍵是要將最大量的數據提供給(AI)平臺。”
在適當的環境中提供正確的數據也很重要。云計算平臺開發商OpsRamp的工程總監Murthy Garikiparthi表示:“準備好數據,以便輕松獲取解決方案,并確保該方案提供與您的目標相關的網絡容量視圖。”一旦建立了數據管道,并且速度和數據供應保持一致,該(AI)解決方案就可以開始監視特定行為的數據。“最后,一旦AI開始提出建議,IT運營團隊就可以依據這些見解來制定自動化策略,”Garikiparthi建議道。
Tamasanis強調了選擇合適的AI平臺的重要性。“有些平臺更適合某些公司,”他指出。“這種自然的差異既是人工智能分析的一個吸引人的特征,也是一個有害的特征。”Tamasanis還建議避免使用自動化配置。“雖然從反應時間上很有吸引力,但數據的錯誤解讀可能會帶來降低性能的效果,”他警告說。
對AI資源和準確性的誤解
關于使用AI進行網絡容量規劃的最大誤解可能是,該技術并不是特別耗費資源,特別是在人機交互方面。林斯特羅姆說,這種錯覺“是由一些供應商所導致并加深的,他們會讓你覺得,只要你安裝這個工具,它就能完成所有工作,無需任何人管理。”
另一個誤解是,基于AI的網絡容量規劃是一種全有或全無的游戲。耶格爾(Yeager)建議,企業應該以分階段的方式與供應商合作,以模塊化的方式部署解決方案,并專注于價值最大的用例。鑒于許多未來的網絡元素將基于云端并且依賴于訂閱,這種方法尤其重要。“以分階段的用例方式部署將保證IT經理不會為尚未部署的服務和解決方案支付云訂閱費用,”耶格爾解釋說。
肖(Shaw)說,關于使用AI進行容量規劃的最大誤解是,AI解決方案始終是準確的。“在AI解決方案成熟之前,管理員必須驗證并質疑由AI驅動的容量規劃解決方案所提供的建議,這是極為重要的。”
AI容量規劃的缺陷
與任何新興技術一樣,AI容量規劃也伴隨著一些隱患,隨時會摧毀那些無知和粗心大意的人。林斯特羅姆說,那些急于使用該技術的組織往往會做得過大、過快,并期望在系統沒有進行任何精細調節的情況下立即獲得結果。“如果系統沒有足夠的數據進行分析,或者數據不可靠或不一致,則這些工具將無法生成準確的網絡狀態或網絡性能情況,”他警告說。
遠離那些只提供不完整產品或服務的供應商,這也很重要。“當今市場上大多數解決方案只能為網絡的一小部分提供巨大優勢,卻無法為有線、無線、設備、客戶端、應用程序、安全、策略、跨域、廣域網、云和數據中心提供完整的網絡解決方案,”耶格爾指出。
使用不基于開放平臺的AI產品和服務,將使面向智能的服務難以擴展到組織的其他部分。 “未來的運營將不再是相互孤立,各個部門將共享網絡、服務、運營和使用數據,以增強企業范圍內所有部門的能力,”耶格爾說。
由于人工智能是一項相對較新的技術,因此采用該技術的人經常會遇到來自保守管理者和員工的抵制,他們意圖保護組織內的知識、舊的工作流程和自己的工作。“舊的做事方式不能過于僵化,以至于拒絕人工智能的好處。”Garikiparthi警告說。
Tamasanis說,AI只是提供了一個意見,而不是一個結論性的陳述。“將這樣的工具與現有的網絡設備和工程師整合起來,這將是一個漸進的過程。”