現如今的企業組織機構正在大規模的采用AI人工智能應用程序來解析不斷呈指數級增長的龐大數據量,這不僅要求極高,并且需要具備強大的并行處理功能,因此原來的標準化CPU已然無法充分執行許多AI解析任務了。有鑒于此,當企業數據中心在接近或達到服務器性能的瓶頸局限時,究竟應該相應的采取哪些有效的應對措施呢?
在本文中,我們將幫助您企業數據中心準備并應對由AI應用程序為企業本地部署環境和云基礎架構所帶來的限制。同時,我們還采訪了數據中心業界的同行們,邀請他們提供了相關的指導性建議,其中包括著重強調了企業數據中心與服務器供應商密切合作的重要性,這些服務器供應商可以為您的企業從早期階段盡快過渡到穩步的高級生產階段,進而充分利用AI功能提供相應的指導。
當前的企業組織機構正在積極努力的應對眾多的變數,以確定他們對使用由深度學習時帶來的能夠提供新的洞察見解的人工智能(AI)應用程序到底應該采取怎樣的立場。而這一領域在當下可以說是充滿了無限的商機,不采取積極的行動可能會演變成商業災難,因為企業的競爭對手們正在收集并分析處理海量以前無法獲得的數據信息,來擴大其客戶群。大多數企業組織都已然意識到了這一嚴峻的挑戰,故而他們的業務部門、IT員工、數據科學家和開發人員們都在共同努力,以確定企業的人工智能戰略。
在某種程度上,采用AI戰略的企業將逐步體驗到在利用AI應用程序方面更為先進的領軍企業們過往的經歷:他們的服務器性能將遭遇到瓶頸局限問題。人工智能應用程序,特別是深度學習系統可以對當下呈指數級不斷增長的海量數據信息進行分析,但這些系統要求非常高,并且需要具備強大的并行處理能力,故而越來越多的標準化CPU已然無法充分執行這些AI任務了。早期階段和高級階段的AI用戶在某些時候將不得不徹底改造其服務器基礎設施以實現所需的相關性能。
因此,IDC建議正在開發AI功能或擴展現有AI功能的企業組織機構應以嚴格控制的方式解決這一服務器性能瓶頸問題。務必要在充分掌握相關細節的前提下實施下一步的基礎設施遷移。此外,我們建議他們務必要與其服務器供應商密切合作,這些服務器供應商可以為企業客戶從早期階段盡快過渡到穩步的高級生產階段,進而充分利用AI功能提供相應的指導。
打破在數據中心服務器基礎設施上運行AI的瓶頸
IDC發現,大多數處于概念驗證(POC)測試或生產模式的人工智能和深度學習應用程序的企業在某種程度上已經達到了 “服務器基礎設施瓶頸限制”的水平——有時在這些企業遷移到不同的服務器基礎設施后,會不止一次的出現基礎設施瓶頸局限性的問題。
IDC采訪了相關的企業組織當他們在其現有的企業內部部署服務器基礎架構上開始運行AI應用程序時所經歷的情況。77.1%的受訪者表示他們在內部服務器部署基礎設施上運行AI遇到了一個或多個限制。在采用了認知軟件的云用戶中,90.3%的企業遇到了這種限制。下表1列出了在企業內部部署服務器環境和云基礎架構中運行AI應用程序的相關限制。
表1:基礎架構運行AI應用程序的瓶頸限制(排名分主次順序)
資料來源:《認知服務器基礎架構調查》2017年6月,IDC
正是由于這些基礎設施的瓶頸局限問題的出現,很多企業很快經歷了代際轉變。盡管人工智能應用程序和深度學習的興起僅僅只有幾年時間,但IDC發現,已有22.8%的企業在采用第三代服務器基礎設施來運行其人工智能應用程序了,而37.6%的企業在使用第二代服務器基礎設施,39.6%的企業則在使用第一代的服務器基礎設施。上述這些調查百分比表明了當下的企業客戶正在尋找合適的基礎設施。而下表2則列出了AI服務器基礎架構最常出現的代際。
表2:人工智能服務器基礎設施最常見的代際(排名分順序)
資料來源:《認知服務器基礎架構調查》2017年6月,IDC
轉向具有更高處理器性能(通常所采取的最常見的措施)、更大的I / O帶寬和加速器的系統是一個合理的決定。但是這些數據也表明了理想配置所存在的不確定性。一些企業已經嘗試了橫向規模化擴展,并縱向擴展;而另外一些企業則采取了相反的方案。其他某些遷移從虛擬機開始,然后轉移到專用服務器,而其他一些同行卻與此相反。
這些矛盾的舉措其實并不像其看起來那么奇怪。當前的企業組織不僅在AI軟件上進行試驗,而且同時也在基礎設施上進行試運行。一些企業已經開始采用橫向的規模化擴展配置,并且隨著解決方案的日趨成熟,他們決定需要更高的性能,而這些性能能夠在數據中心的現有擴展系統中獲得。其他一些企業則在擴展系統的一個分區上啟動了POC,并在解決方案進入下一階段時決定將其轉移到一個單插槽或雙插槽的服務器集群。同樣的,一款解決方案可能已經在虛擬機中開發出來,然后被遷移到專用的服務器上,以便在有些絕緣隔熱的的環境中進一步開發(很多企業更傾向于在早期階段如此進行)。
IDC認為,對于早期的實驗和開發而言,所有這些遷移的舉措都是有道理的。利用現有的環境意味著延遲投資于新的服務器基礎設施,直到企業明確了什么是最為恰當的配置為止。但是,一旦應用程序接近運行并準備投入生產,就需要及時的做出合理的基礎架構方面的決策了,以避免觸及基礎設施的瓶頸。
根據來自已經運行了AI應用程序的企業用戶們的反饋,我們認為:認知應用程序的理想基礎架構配置是一組具有加速器的單路或雙路服務器,不過,企業也還可以根據實際業務需要在稍后階段添加加速器。中型系統集群也是可行的,但只有在工作負載迅速的規模化擴展的情況下才是相關的。其他配置可能也是可行的。從對于企業用戶的研究中可以清楚地看出,超融合系統和虛擬機已被證明對認知應用的影響較小。