企業是否準備在容器中運行人工智能和機器學習工作負載?專家表示,在采用之前需要提解決一些基本問題。
人工智能/機器學習和容器是當今的兩個主要IT趨勢,如今已成為許多企業的主要話題。隨著企業尋找更好的方法來管理他們的人工智能和機器學習工作負載,它們越來越多地結合在一起,這是通過越來越多的商業和開源技術來實現的。
ISG公司的企業技術分析師Blair Hanley Frank表示:“對于IT領導者來說,最好的消息是在容器中大規模運行機器學習的工具和流程在過去幾年中得到了顯著改善?,F在有很多可用的開源工具、商業產品和教程來幫助數據科學家和IT團隊啟動和運行這些系統。”
在容器中運行人工智能/機器學習工作負載:6個關鍵事實
在IT領導者及其團隊開始深入研究容器化人工智能/機器學習工作負載的基本技術方面之前,需要考慮一些原則。以下是六個要考慮的要點:
1.人工智能/機器學習工作負載代表工作流
Red Hat公司首席技術官Gordon Haff表示,與許多其他工作負載類型一樣,人工智能/機器學習工作負載也可以被描述為工作流。從工作流的角度思考有助于闡明有關在容器中運行人工智能/機器學習的一些基本概念。
使用人工智能/機器學習,工作流程需要從數據的收集和準備開始。Haff說,“在數據被收集、清理和處理之后,接下來是訓練模型的時候了,根據訓練數據調整參數。在模型得到訓練后,工作流程的下一步是部署到生產。最后,數據科學家需要監控模型在生產中的性能、跟蹤預測和性能指標。”
Haff描述了這個工作流程,但并未低估在人員、流程和環境方面可能涉及的工作量。容器化可以通過帶來更高的一致性和可重復性來簡化這項工作。
Haff說,“傳統上,這個工作流程可能涉及到使用不同環境的不同人員兩到三次的切換。然而,基于容器平臺的工作流支持自助服務,越來越多地允許數據科學家負責開發模型和集成到應用程序中。”
2.類似于其他容器化工作負載的好處
Autify公司人工智能和機器學習業務負責人Nauman Mustafa認為,容器化在人工智能/機器學習工作流背景下具有以下三個優勢:
•模塊化:它使工作流的重要組成部分(例如模型訓練和部署)實現模塊化。這類似于容器化如何在更廣泛的軟件開發世界中啟用更多模塊化架構,即微服務。
•速度:容器化加快了開發/部署和發布周期。
•人員管理:容器化還可以更容易通過減少跨團隊依賴性來管理團隊。與其他IT領域一樣,隨著工作從一個功能組轉移到另一個功能組,容器化可以幫助減少“交接并忘記”的可能性。
雖然機器學習模型可能與其他應用程序或服務有著不同的技術要求和考慮因素,但容器化的潛在好處非常相似。
Red Hat公司的數據科學家Audrey Reznik以提高人工智能/機器學習工作負載或解決方案的可遷移性和可擴展性(例如混合云)為例。Reznik說,“容器使用的系統資源比裸機或虛擬機系統更少,這有助于加快部署速度。我喜歡使用‘你的編碼速度有多快’這句話,因為一旦完成編碼,就可以使用容器部署解決方案。”
3.團隊需要保持一致
只是因為使工作流程更加模塊化并不意味著一切,團隊成員再需要協同工作。
ISG公司的Frank說,“確保在容器化環境中參與構建和操作機器學習工作負載的團隊成員協同合作。例如,運維工程師可能熟悉運行Kubernetes,但可能不了解數據科學工作負載的具體需求。與此同時,數據科學家熟悉構建和部署機器學習模型的過程,但在將它們轉移到容器或繼續運行時可能需要他人的幫助。”
容器化應該提高一致性和協作性,但不要將這種好處視為理所當然的。
Red Hat公司全球軟件工程總監Sherard Griffin說: “在結果的可重復性至關重要的世界中,企業可以使用容器來普及人工智能/機器學習技術的訪問,并允許數據科學家輕松共享和復制實驗,同時符合最新的IT和信息安全標準。”
4.關注點并沒有真正改變
正如容器化的許多好處對于人工智能/機器學習與其他工作負載類型大致相同一樣,運營重點的重要領域也是如此。以下是需要注意的三個操作要求示例,就像其他容器化應用程序一樣:
•資源分配:Mustafa指出,隨著時間的推移,適當的資源分配對于優化成本和性能仍然至關重要。如果資源分配過多,那么隨著時間的推移,將會浪費更多的費用;而資源分配太少,將會遇到性能問題。
•可觀察性:僅僅因為看不到問題并不意味著不存在問題。Frank說,“確保擁有必要的可觀察性軟件,以了解多容器應用程序的行為方式。”
•安全性:Positive Technologies公司機器學習工程師Alexandra Murzina說,“從安全性的角度來看,啟動人工智能/機器學習解決方案與在容器中啟動其他解決方案沒有什么不同。”這意味著諸如應用最小特權原則(對人員和容器本身)、僅使用受信任的、經過驗證的容器映像、運行時漏洞掃描和其他安全層等策略應始終放在關注事項的首位。
5.容器不會解決所有潛在問題
正如自動化不會改善具有缺陷的流程一樣(只會幫助有缺陷的流程更快、更頻繁地運行),容器化不會解決企業的人工智能/機器學習工作負載的根本問題。
例如,如果在機器學習模型中加入偏見,在容器中運行它們將無助于解決這個潛在的嚴重問題。
而容器化有著顯著的優勢。這些優勢不應該讓任何人誤以為容器化可以解決所有問題。這也不僅僅是錯誤數據或偏見的問題。容器可以加快工作流程的各個方面,但它們實際上并沒有完成所有的工作。
凱捷公司工程技術總監Raghu Kishore Vempati說。“容器對于運行人工智能/機器學習工作負載非常有益。但是只是采用人工智能/機器學習工作的負載實現容器化并不能提高模型的效率。它只是提供了一種提高與訓練模型和推斷模型相關的生產力的方法。”
6.在構建與購買之間進行明智的選擇
與大多數技術選擇一樣,還有一個“應該還是不應該?”的問題,在容器化人工智能/機器學習工作負載方面的決策方面也是如此。與大多數重要的技術選擇一樣,選擇將會付出代價。
Autifly公司的Mustafa說:“容器化機器學習工作流程會產生一些成本,這對于小型團隊來說可能是難以承受的,但對于大型團隊來說,其收益大于成本。”
IT領導者和他們的團隊應該帶著明確的目標或理由來做這件事,而只是因為能夠做到成為其唯一理由。
ISG公司的Frank說,“不要讓已經很復雜的情況變得過于復雜。確保容器化機器學習工作負載將提供超出智力活動的業務價值。”
如果企業走商業或開源路線,需要確保擁有未來的靈活性,因為圍繞人工智能/機器學習的生態系統正在迅速發展——企業自己的戰略也可能會發生變化。
Reznik建議說,“企業不要將自己的業務依賴于某一家供應商,他們需要使用各種開源解決方案,而不僅僅是其供應商提供的解決方案。各種各樣的開源解決方案將為企業的團隊提供更多創新的可能性。”
版權聲明:本文為企業網D1Net編譯,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。