很多企業對于機器學習在業務中的應用可能會有一些不切實際的期望。行業專家為此分享了企業在投入生產時通常會感受到的5個硬道理。
在商業世界中,機器學習(ML)應用程序的持續宣傳和炒作有其合理的原因。機器學習(ML)可能是當今最為普及的人工智能(AI)領域。雖然人工智能和機器學習緊密相關,但并不是可以互換的術語。機器學習已經融入到許多業務應用程序以及面向客戶的服務中,并且可以自我學習的機器聽起來很酷。
企業在機器學習應用中需要吸取的經驗和教訓
但是,正如許多IT主管說的那樣,采用新技術可能會導致一些不切實際的期望。為此,一些機器學習和數據科學專家分享了企業和團隊在采用機器學習技術時需要吸取的經驗和教訓。
1.沒有建立合適的團隊
企業可能擁有足夠的數據量和計算能力,但是如果團隊中沒有適合的人才,也會對業務發展造成影響。
Very公司數據科學業務負責人Jenn Gamble博士說:“我經常強調的一件事是,企業需要建立密切合作的跨學科團隊來構建機器學習產品。而數據科學家很少自己做到這一點。”
機器學習(ML)的成功應用需要具備更多的能力和技能,Gamble指出以下是關鍵的技能:
•機器學習建模
•數據管道開發
•后端/API開發
•前端開發
•用戶界面(UI)和用戶體驗(UX)
•產品管理
Gamble說:“沒有人在這些領域中擁有所有技能,因此有必要將擁有不同技能的人集中在一起,并鼓勵他們在整個過程中緊密合作。”
2.沒有在業務期望和技術現實之間架起橋梁
Gamble還建議負責實施機器學習(ML)計劃的團隊還要納入與行業專家和最終用戶緊密合作的工作人員,這些人并不一定是技術人員。
Gamble說,“重要的是要有人擔任人工智能產品經理,與傳統的產品經理一樣,他們的工作將集中在如何使用最終機器學習技術上:最終用戶是誰,他們的工作流程是什么,以及他們將根據所提供的信息做出什么決定。”
大多數IT專業人員都可以理解這個問題,無論他們擁有什么特殊的技能:在業務上期望機器學習(ML)能做什么和實現之間可能會有一些差距(或者是巨大的差距)。
Gamble說:“從機器學習建模的角度來看,將業務理解、數據理解、可能實現的功能結合在一起也增加了復雜性。正如許多優秀的產品經理都是軟件工程師一樣,我認為很多優秀的人工智能產品經理也是數據科學家,盡管這是一個新興領域,走上這條路的人并不多,但我們將看到,對這一角色的需求將會繼續增長。”
3.對真相有太多的版本
機器學習的一個基本現實:模型或算法只取決于所提供的數據。
Indico公司首席執行官Tom Wilde說,“對于人工智能和機器學習來說,人們最好把它想像成一只非常聰明的鸚鵡,它對于為學習預期任務而提供的培訓輸入數據非常敏感。”
但這導致了不同的學習方式:人們(甚至是同一團隊中的成員)如何感知特定業務流程或服務的現實可能存在很大的差異。
Indico公司使客戶可以讓多個人參與為模型建模而對培訓數據進行標記的過程。他認為這就像投票一樣:每個利益相關者在流程或任務中都有發言權。最近,該公司的一家客戶有六個人參加了數據標記過程,雖然在短期內最終失敗,但獲得了長期利益。
Wilde說:“一旦建立了模型,他們發現模型的性能非常差,經過進一步調查,他們發現這六個人對如何標記訓練樣本有完全不同的看法。這反過來迫使他們就特定任務進行了非常有價值的對話,并使他們能夠更好地對特定用例的‘基本事實'有著深入的理解。”
4.認為訓練數據才是終點
在生產過程中,企業可能會發現對最初的訓練數據有點過于自信,并最終還是回到了起點。SigOpt公司工程主管Jim Blomo認為,即使是很好的訓練數據也不一定更好執行。
Blomo說:“不能只是訓練模型并相信它會執行。需要運行一個高度迭代的、科學的過程來使其正確執行,即使到那時,也可能仍會看到生產的高度可變性。模擬和驗證過程以及持續的性能評估也是如此。”
企業通常會發現,用于預測生產模型性能的基準實際上需要在模型開發過程中進行更改和調整。建模者首先了解到的一點是,定義正確的度量標準是最重要的任務之一,并且在通常情況下,跟蹤多個度量標準對于理解更完整的模型行為至關重要。
5.重復傳統的軟件開發錯誤
機器學習也容易遇到困擾其他IT部門的同樣問題。企業是否在無法協同工作的功能孤島中建立了人工智能/機器學習團隊?這將產生許多與傳統軟件項目相同的問題:考慮范圍的擴大、期限的延長、工具的損壞,以及對企業文化的不利影響。
Algorithmia公司創始人Kenny Daniel說:“很多企業花費數年時間收集大量數據,雇傭了數據科學家團隊,盡管投入大量人力和物力,卻未能使任何模型投入生產。其錯誤的做法是讓數據科學家讓實施團隊編寫程序代碼,期望數據科學家成為DevOps專家也是錯誤的。”
那么正確的做法是什么?采用與現代化和優化用于機器學習的軟件管道相同的思維方式(例如DevOps思維方式)。
Daniel說,“建議企業學習傳統軟件世界中的DevOps經驗和教訓:創建自動化的、可重復的管道和工具,將底層的實現細節實現容器化和抽象化。”
Gamble說:“企業在構建機器學習產品時,仍然需要從軟件開發中汲取的所有相同的原則和經驗教訓,例如DevOps原則、以用戶為中心的設計等。許多數據科學家花費很多時間來學習機器學習,但是他們可能并不像軟件工程師、產品經理或設計師那樣精通這些主題。”
正如DevOps可以被看作是對傳統軟件開發面臨問題的一種廣泛響應,在機器學習和人工智能的其他方面已經出現了新方法。
Gamble說:“由于將機器學習納入傳統產品開發組合時還需要考慮其他因素,一些新領域如MLops、DataOps、DataViz和MLUX(機器學習用戶體驗)正在蓬勃發展,試圖填補這一空白。”
版權聲明:本文為企業網D1Net編譯,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。