人工智能(AI)和機器學習(ML)是新興領域,將會以前所未有的速度改變企業的發展。在數字時代,可以使用分析技術發現大量數據中的關鍵見解。
在以往,這些見解是用人工密集型的分析方法發現的。如今,由于數據量繼續增長以及數據的復雜性,這不會起到更大的作用。人工智能(AI)和機器學習(ML)是數據科學家的最新工具,使他們能夠更快地將數據轉化為價值。
數據爆炸需要人工智能(AI)和機器學習(ML)
從歷史上看,企業使用大型記錄系統生成的一小組數據進行操作。如今的環境完全不同,其中有更多的設備和系統生成他們自己的數據,可用于分析。企業面臨的挑戰是需要分析的數據太多,而在日益數字化的世界中競爭的唯一方法是使用人工智能(AI)和機器學習(ML)。
人工智能(AI)和機器學習(ML)用例因垂直領域而不同
雖然沒有通用的“殺手級應用程序”,但人工智能(AI)和機器學習(ML)適用于大多數垂直領域。因此有許多適用于各種行業的關鍵用例。常見用例包括:
醫療保健——快速診斷MRI掃描的異常檢測
汽車——分類用于識別道路中的物體
零售——可以準確預測未來的銷售額
聯絡中心——翻譯使坐席能夠用不同的語言與人類交談
基礎設施所需的高質量數據
無論用例如何,人工智能(AI)和機器學習(ML)的成功取決于在基礎設施方面的正確選擇,這需要了解數據的作用。人工智能(AI)和機器學習(ML)的成功很大程度上取決于輸入系統的數據質量。人工智能行業有一個公理,即“糟糕的數據會導致糟糕的推論”,這意味著企業應該關注如何管理數據。因此可以將這個公理擴展到“良好的數據導致良好的推論”,而在此強調的是,需要采用正確的基礎設施來確保數據“良好”。
盡管使用的數據類型可能不同,但數據在人工智能(AI)的每個用例中都起著關鍵作用。例如,通過讓機器學習在企業生成的大數據湖中找到見解,可以推動創新。事實上,企業可以在數據科學的基礎上培養組織內部的新思維。關鍵是要了解數據在人工智能(AI)和機器學習(ML)工作流程的每個步驟中所起的作用。
人工智能(AI)和機器學習(ML)工作流程具有以下組件:
數據收集:數據聚合、數據準備、數據轉換和存儲
數據科學/工程:數據分析、數據處理、安全和治理
訓練:模型開發、驗證和數據分類
部署:執行推斷
數據面臨的最大挑戰之一是實時構建數據管道。使用新數據源進行探索和發現工作的數據科學家需要收集、準備、建模、推斷。因此,IT需要在每個階段進行更改,并且從更多來源收集更多數據。
同樣重要的是,工作流是一個迭代循環,其中部署階段的輸出成為數據收集的輸入,并改進模型。通過這些階段移動數據的成功在很大程度上取決于擁有適合的基礎設施。
支持人工智能(AI)和機器學習(ML)的基礎設施的關鍵考慮因素
位置:人工智能(AI)和機器學習(ML)并不只在云平臺中進行,也不只在現場處理。這些舉措應該在給定輸出最有意義的位置執行。例如,機場安檢的面部識別系統應該在本地進行分析,因為將信息發送到云平臺并返回所花費的時間會增加該過程的延遲。因此,組織需要確保將基礎設施部署在云端、本地數據中心以及邊緣,而優化人工智能計劃的性能是至關重要的。
高性能基礎設施的廣度:如前所述,人工智能性能高度依賴于基礎設施。例如,與傳統的中央處理單元(CPU)相比,圖形處理單元(GPU)可以將深度學習的速度提高100倍。服務器供電不足將導致流程延遲,而過度供電則會浪費電力成本。無論策略是端到端還是最佳策略,都要確保計算硬件具有正確的計算處理能力以及高速存儲設備。這需要組織選擇具有廣泛產品組合的供應商,其產品組合可以解決任何階段人工智能流程中出現的問題。
經過驗證的設計:基礎設施顯然非常重要,但運行的軟件也是如此。一旦安裝了軟件,可能需要幾個月的時間來調整和優化以適應底層硬件。組織需要選擇預先安裝軟件并具有經過驗證的設計的供應商,以便縮短部署時間,并確保性能得到優化。
數據中心的擴展:人工智能基礎設施并不是孤立存在的,應被視為當前數據中心的一種擴展。在理想情況下,企業應該尋找可以使用現有工具進行管理的解決方案。
端到端管理:沒有單一的人工智能技術可以投入,并開啟采用人工智能過程。它由若干移動部件組成,其中包括服務器、存儲、網絡和軟件,并且在位置方面有多種選擇。最好的解決方案應該是整體解決方案,它包含可以通過單一界面管理的所有或大多數組件。
網絡基礎設施:在部署人工智能時,組織需要將重點放在支持GPU的服務器、閃存存儲和其他計算基礎設施上。這是有道理的,因為人工智能處理器和存儲設備部署非常密集。但是,必須為存儲系統和服務器提供遍歷網絡的數據。人工智能的基礎設施應被視為一個“三足凳”,其中的三條腿分別是網絡、服務器和存儲。每個組件的進步都必須快速地相互跟進。任何一個組件的滯后都會影響性能。因此,組織應該對網絡實施與服務器和存儲設備相同的盡職調查。
安全性:人工智能通常涉及極其敏感的數據,如患者記錄、財務信息和個人數據。泄露這些數據可能對組織造成災難性后果。此外,輸入不良數據可能會導致人工智能系統做出錯誤的推斷,從而導致有缺陷的決策。必須使用先進的技術從頭到尾保護人工智能基礎設施。
專業服務:專業服務應該是基礎設施決策的一部分。大多數組織,尤其是缺乏經驗的組織,在人工智能方面都沒有必要的技能。服務合作伙伴可以在人工智能生命周期內提供必要的培訓、咨詢、實施和優化服務,并且應該是部署的核心組件。
廣泛的生態系統:人工智能供應商與具有廣泛生態系統的供應商進行合作至關重要,并且可以將人工智能的所有組件結合在一起,以提供完整、交鑰匙的端到端解決方案。而拼湊這些組件可能會導致業務延遲甚至失敗。因此,選擇具有強大生態系統的供應商可以快速實現成功。
從歷史上看,人工智能(AI)和機器學習(ML)項目由數據科學專家負責運營,但隨著這些技術進入應用主流,它們正在迅速向IT專業人員過渡。隨著正在發生的轉變,以及人工智能(AI)計劃變得更加普及,IT組織應該更廣泛地考慮支持人工智能(AI)的基礎設施。而不是為特定項目購買服務器、網絡基礎設施和其他組件,組織目標應該是更廣泛地考慮當前和未來的業務需求,類似于當今數據中心的運行方式。