很多首席技術(shù)官都強(qiáng)調(diào)機(jī)器學(xué)習(xí)是一種顛覆其行業(yè)并帶來(lái)創(chuàng)新的技術(shù)。但是,他們?nèi)绾斡行У貙C(jī)器學(xué)習(xí)模型投入生產(chǎn)以獲得競(jìng)爭(zhēng)優(yōu)勢(shì)?
企業(yè)如何才能更快地將機(jī)器學(xué)習(xí)模型投入生產(chǎn)
對(duì)于一些企業(yè)來(lái)說(shuō),采用機(jī)器學(xué)習(xí)技術(shù)是一場(chǎng)競(jìng)賽。首先,那些能夠大規(guī)模將機(jī)器學(xué)習(xí)模型投入生產(chǎn)的企業(yè),將獲得超過(guò)競(jìng)爭(zhēng)對(duì)手的巨大優(yōu)勢(shì),并獲得大量收入。但是,機(jī)器學(xué)習(xí)的可用性存在一個(gè)巨大的問(wèn)題,那就是將機(jī)器學(xué)習(xí)模型大規(guī)模投入生產(chǎn)面臨巨大的挑戰(zhàn)。
組織可以創(chuàng)建極其復(fù)雜的機(jī)器學(xué)習(xí)模型,但是要獲取龐大的數(shù)據(jù)集,將其應(yīng)用于機(jī)器學(xué)習(xí)模型的不同迭代,然后將這些成功的迭代部署到生產(chǎn)中將面臨一些問(wèn)題。
機(jī)器學(xué)習(xí)領(lǐng)域發(fā)揮作用的地方
機(jī)器學(xué)習(xí)平臺(tái)Valohai公司首席執(zhí)行官Eero Laaksonen解釋說(shuō),“由于數(shù)據(jù)雜亂無(wú)章,很少有人能夠了解這些數(shù)據(jù)的相關(guān)性。”
這就是機(jī)器學(xué)習(xí)和深度學(xué)習(xí)發(fā)揮重要作用的地方;它充當(dāng)起點(diǎn)和終點(diǎn)之間的橋梁。機(jī)器學(xué)習(xí)構(gòu)建功能,其結(jié)果就是模型。Laaksonen繼續(xù)說(shuō)道,“這與軟件開發(fā)不同,因?yàn)殚_發(fā)人員只是編寫功能。使用機(jī)器學(xué)習(xí),它將代碼與數(shù)據(jù)結(jié)合起來(lái)以定義模型。”
如今,使用機(jī)器學(xué)習(xí)的工作方法與20世紀(jì)90年代軟件開發(fā)時(shí)的情況非常相似——開發(fā)人員面臨著更大的壓力,需要更快地將成功的機(jī)器學(xué)習(xí)算法部署到生產(chǎn)中。
為什么很難將機(jī)器學(xué)習(xí)模型投入生產(chǎn)?
機(jī)器學(xué)習(xí)模型難以投入生產(chǎn)的原因有很多:
1.實(shí)驗(yàn)的可重復(fù)性:代碼和數(shù)據(jù)的組合很難復(fù)制。
2.合規(guī)性:Laaksonen說(shuō):“機(jī)器學(xué)習(xí)不能無(wú)序發(fā)展,組織和監(jiān)管機(jī)構(gòu)需要找出有關(guān)決策的法律,從人類的角度來(lái)看,這是更可靠的方法。歐洲一直在通過(guò)GDPR法規(guī)對(duì)此采取積極行動(dòng),這是一個(gè)正確方向,但很難將法規(guī)納入機(jī)器學(xué)習(xí)生產(chǎn)中。例如金融機(jī)構(gòu)必須能夠解釋他們六個(gè)月做出的自動(dòng)決策,而這是數(shù)據(jù)和模型的輸出。如果機(jī)器學(xué)習(xí)模型正在生產(chǎn)中運(yùn)行,則目前尚無(wú)法確定是什么原因?qū)е滤龀鲈摏Q定,而這需要改變。組織需要可追溯性,因此,機(jī)器學(xué)習(xí)中的版本控制非常重要。”
3. 快速加入團(tuán)隊(duì):組織希望提高開發(fā)人員和機(jī)器學(xué)習(xí)團(tuán)隊(duì)的水平,對(duì)于組織管理人員來(lái)說(shuō),很難參與到其開發(fā)項(xiàng)目中去了解開發(fā)人員和機(jī)器學(xué)習(xí)團(tuán)隊(duì)在做什么,并確定數(shù)據(jù)在哪里。Laaksonen繼續(xù)說(shuō),“此外,還有雇用科學(xué)家的問(wèn)題。組織需要能夠跟蹤他們?cè)谧鍪裁矗麄冮_發(fā)的項(xiàng)目和管道等。”
4.快速實(shí)驗(yàn):速度是關(guān)鍵,但是對(duì)于機(jī)器學(xué)習(xí)來(lái)說(shuō),這是一種反復(fù)試驗(yàn)的方法。嘗試使用機(jī)器學(xué)習(xí)進(jìn)行更多操作的唯一方法是在其上面安裝更多硬件,這非常具有挑戰(zhàn)性——每一個(gè)更改都必須用大量的數(shù)據(jù)進(jìn)行測(cè)試。
加快機(jī)器學(xué)習(xí)模型的生產(chǎn)
Valohai平臺(tái)作為一種機(jī)器學(xué)習(xí)平臺(tái)即服務(wù)解決了這些問(wèn)題,它闡明了深度學(xué)習(xí)和機(jī)器學(xué)習(xí)。該平臺(tái)將保存已用于運(yùn)行不同機(jī)器學(xué)習(xí)模型的數(shù)據(jù)集,并顯示了負(fù)責(zé)人、實(shí)驗(yàn)成本以及使用的數(shù)據(jù)類型等指標(biāo)。該平臺(tái)通過(guò)將數(shù)據(jù)管道生成新的模型,可以有效地快速跟蹤機(jī)器學(xué)習(xí)所需的試錯(cuò)模型。
Laaksonen解釋說(shuō),“開發(fā)人員在云端運(yùn)行時(shí),無(wú)法監(jiān)控機(jī)器學(xué)習(xí)的處理能力。使用我們的平臺(tái),可以保存輸出,并在數(shù)據(jù)存儲(chǔ)上查看結(jié)果。組織可以在來(lái)自不同來(lái)源的已保存數(shù)據(jù)集中測(cè)試不同的機(jī)器學(xué)習(xí)模型。”其目的是更快地從原始數(shù)據(jù)遷移到生產(chǎn)環(huán)境,該平臺(tái)使組織能夠重新運(yùn)行數(shù)據(jù)管道,重新訓(xùn)練模型并進(jìn)行部署。
用例
Laaksonen表示還有很多用例。他提到了Valohai平臺(tái)的客戶之一TwoHat Security公司,該公司正在建立一種模型來(lái)阻止網(wǎng)站散布不良內(nèi)容。TwoHat Security公司正在與加拿大的執(zhí)法部門和大學(xué)合作,建立一種機(jī)器視覺模型,以檢測(cè)來(lái)自Valohai平臺(tái)上的暗網(wǎng)和一些網(wǎng)站發(fā)布的不良內(nèi)容。
還有一些應(yīng)用程序用于預(yù)測(cè)性維護(hù),例如預(yù)測(cè)金融服務(wù)風(fēng)險(xiǎn),以及電信公司采用應(yīng)用程序預(yù)測(cè)未來(lái)通信塔臺(tái)部署的位置。
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。