在IT圈中,云機(jī)器學(xué)習(xí)仍然是一個(gè)熱點(diǎn)話題,因?yàn)楣?yīng)商們正試圖讓這項(xiàng)技術(shù)更適合地為主流企業(yè)所用。
谷歌公司的母公司Alphabet的主席Eric Schmidt在一年前召開的首屆谷歌云大會(huì)上曾預(yù)測(cè)說,機(jī)器學(xué)習(xí)將在五年內(nèi)成為每一家主流IPO的基本功能。
這是一個(gè)比較大膽的預(yù)言,因?yàn)槿狈?shù)據(jù)科學(xué)家的企業(yè)基本不會(huì)考慮實(shí)施這項(xiàng)技術(shù)。它也表明了,谷歌公司是如何計(jì)劃使用人工智能技術(shù)來硬生生擠入公共云市場(chǎng)的。
一年時(shí)光轉(zhuǎn)瞬飛逝,云機(jī)器學(xué)習(xí)和“AI大眾化”已成為了同期會(huì)議上最受關(guān)注的話題之一——無論是臺(tái)上臺(tái)下皆是如此。
“毫無疑問,機(jī)器學(xué)習(xí)是一個(gè)我非常感興趣的主題,”API管理公司Mashery的產(chǎn)品經(jīng)理Jeremy Pollock說。“每一個(gè)小玩意,或者說大多數(shù)演示都包含了機(jī)器學(xué)習(xí)的某些方面。”
與本月早些時(shí)候在舊金山參加谷歌下一代云大會(huì)的萬余名與會(huì)者一樣,Pollock也對(duì)云機(jī)器學(xué)習(xí)服務(wù)的潛力產(chǎn)生了濃厚的興趣,但是仍然無法確定他的業(yè)務(wù)部門可以如何來使用它們,或者說他們的注意力只是簡(jiǎn)單地在于IT專業(yè)人士是否對(duì)最新炒作感到震驚。
“我還不確定,現(xiàn)在的人工智能是平民大眾的AI,”Pollack說。“我懷疑在實(shí)際應(yīng)用中使用者要花好多功夫來思考他需要回答何種類型的問題、需要解決什么樣問題以及那種機(jī)器學(xué)習(xí)算法更適合具體問題等。”
而在這方面,繼續(xù)在機(jī)器學(xué)習(xí)技術(shù)上投大注的公共云供應(yīng)商們則直接面對(duì)著一些障礙。亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)、谷歌以及微軟Azure都急于讓客戶能夠更容易地使用那些能夠有可能將大量數(shù)據(jù)投放到他們平臺(tái)上的服務(wù),但是問題仍然是企業(yè)用戶如何才能夠輕松地使用這些方法,以及公共云是否是執(zhí)行這些功能最合適的所在。
企業(yè)來吧
公共云供應(yīng)商們從多個(gè)角度在試水人工智能。其中一些得到了希望開發(fā)復(fù)雜系統(tǒng)的企業(yè)的認(rèn)可,而另一些則旨在通過打包軟件來讓企業(yè)的發(fā)展之路變得更為通暢。近來,后者已經(jīng)通過機(jī)器學(xué)習(xí)算法、建模工具包、以及諸如語音與視覺識(shí)別的應(yīng)用API成為了焦點(diǎn)。
數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)是非常復(fù)雜的,在整個(gè)過程中也是很容易出錯(cuò)的,紐約數(shù)據(jù)科學(xué)研究院的創(chuàng)始人兼CTO Vivian Zhang說。隨著企業(yè)用戶逐漸深入使用這些原本由云供應(yīng)商承擔(dān)的技術(shù),他們可能會(huì)感受到難以置信的巨大壓力。
“交叉驗(yàn)證,他們?nèi)绾巫鼋#绾巫龅侥P妥詣?dòng)調(diào)試以達(dá)到最佳性能——這些都是具有最高優(yōu)先級(jí)的任務(wù),”Zhang說。“這就是為什么我看到AWS、Azure和谷歌正在為企業(yè)用戶提供機(jī)器學(xué)習(xí)工具包的原因所在。”
在某些方面,公共云供應(yīng)商們非常適合干需要花上數(shù)百小時(shí)用于模型訓(xùn)練的基礎(chǔ)性工作。三家主要供應(yīng)商都擁有著多年的機(jī)器學(xué)習(xí)應(yīng)用經(jīng)驗(yàn),無論是亞馬遜的零售業(yè)務(wù)、或者谷歌的搜索引擎或者微軟的Office套件和Xbox都是他們各自具有突出成績(jī)的業(yè)務(wù)領(lǐng)域。
“這種機(jī)器學(xué)習(xí),鑒于其規(guī)模與復(fù)雜性,總是會(huì)成為某個(gè)大公司能夠交付的一個(gè)服務(wù),”總部位于倫敦主營(yíng)Ubuntu開發(fā)的Canonical公司執(zhí)行副總裁兼云總經(jīng)理Anand Krishnan說。
推動(dòng)機(jī)器學(xué)習(xí)服務(wù)也是云供應(yīng)商們?cè)诔缴唐坊A(chǔ)設(shè)施即服務(wù)競(jìng)賽中勝出的一部分,他們需要提供盡可能多的服務(wù),美國(guó)總部設(shè)在紐約的全球性企業(yè)Capgemini的首席云負(fù)責(zé)人Charlie Li說。
“這樣做能夠鼓勵(lì)更多的企業(yè)把他們的工作負(fù)載遷移至公共云,”Li說。“無論是機(jī)器學(xué)習(xí)還是物聯(lián)網(wǎng),這些都恰好是人們所需要的最新服務(wù),而這些越來越多的服務(wù)也成為了業(yè)內(nèi)競(jìng)爭(zhēng)者們?cè)诿髅嫔系母?jìng)爭(zhēng)籌碼。”
現(xiàn)在說某一家供應(yīng)商已經(jīng)在這個(gè)市場(chǎng)上遙遙領(lǐng)先還為時(shí)尚早,而且很多創(chuàng)新點(diǎn)還沒有真正落地。但是,毋庸置疑的是機(jī)器學(xué)習(xí)已經(jīng)有了較大發(fā)展,特別是在依賴分析技術(shù)來獲得競(jìng)爭(zhēng)優(yōu)勢(shì)的媒體業(yè)和零售行業(yè)更是如此, Krishnan說。
“這絕對(duì)是一大熱門,但在未來三到六個(gè)月內(nèi)還不會(huì)形成大面積生產(chǎn)規(guī)模,”他說。“需要花費(fèi)時(shí)間來深入發(fā)展,在兩年前機(jī)器學(xué)習(xí)還屬于學(xué)術(shù)界的話題,而今天它已成為了產(chǎn)業(yè)界的關(guān)注焦點(diǎn)。”
機(jī)器學(xué)習(xí),現(xiàn)狀是怎樣?
當(dāng)這些供應(yīng)商們推動(dòng)機(jī)器學(xué)習(xí)服務(wù)時(shí),他們所面臨挑戰(zhàn)的一部分是他們可能會(huì)回答企業(yè)還沒有提出的問題。熟悉程度已有所提高,廠商紛紛推出更多的現(xiàn)實(shí)應(yīng)用案例,但是顯然用戶還需要更多的專項(xiàng)培訓(xùn)。
“對(duì)于那些新手或剛?cè)腴T的用戶,應(yīng)當(dāng)讓他們弄清楚如何使用機(jī)器學(xué)習(xí)服務(wù)來解決現(xiàn)實(shí)問題,或者更重要的是如何區(qū)分出哪些是可以用這項(xiàng)技術(shù)來找到答案的問題?”總部設(shè)在英格蘭Richmond的初創(chuàng)企業(yè)Skipjaq公司的 CEO Rob Harrop這樣問道,這家公司主要是在AWS的機(jī)器學(xué)習(xí)服務(wù)基礎(chǔ)上開發(fā)一個(gè)性能優(yōu)化服務(wù)。“在知道與不知道之間,存在著一個(gè)巨大的差距。”
Skipjaq公司使用機(jī)器學(xué)習(xí)作為其服務(wù)的一部分,但是由于客戶已經(jīng)有了認(rèn)知疲勞,該企業(yè)低估了其產(chǎn)品所能發(fā)揮的作用,Harrop說。
與IBM Watson相關(guān)的一些機(jī)器學(xué)習(xí)產(chǎn)品的設(shè)計(jì)目的是旨在解決具體問題,但是在大多數(shù)情況下公共云供應(yīng)商們所作出的努力仍然處于初期階段。
Capgemini的客戶已經(jīng)開始測(cè)試簡(jiǎn)單的功能,主要是使用機(jī)器學(xué)習(xí)來實(shí)現(xiàn)某些任務(wù)的自動(dòng)執(zhí)行,例如當(dāng)關(guān)閉服務(wù)器時(shí),或?qū)嗰R遜的Alexa整合至運(yùn)營(yíng)中,Li說。
公共云的復(fù)雜性與問題
公共云供應(yīng)商們一直都在追逐更高級(jí)的用戶,即使那些企業(yè)用戶都是業(yè)內(nèi)新兵。他們已經(jīng)增加了為深度學(xué)習(xí)量身定做使用GPU的虛擬機(jī),并采用了諸如TensorFlow和MXNet之類的開源項(xiàng)目。還有越來越多的初創(chuàng)企業(yè)基于公共云及其內(nèi)置機(jī)器學(xué)習(xí)功能來開發(fā)相關(guān)服務(wù)。
Qubit是一家總部設(shè)在英國(guó)倫敦的營(yíng)銷分析公司,該企業(yè)就將其部分工作負(fù)載從AWS遷往谷歌以便使用Dataflow、Pub/Sub和BigQuery來開發(fā)企業(yè)自己的機(jī)器學(xué)習(xí)平臺(tái)。在云中大規(guī)模整合機(jī)器學(xué)習(xí)模型的最困難部分在于獲得正確的數(shù)據(jù)流水線,這意味著要利用到更高級(jí)的服務(wù)。對(duì)于仍然使用傳統(tǒng)系統(tǒng)的企業(yè)來說,使用這些高級(jí)別服務(wù)是一個(gè)巨大的飛躍,Qubit公司產(chǎn)品經(jīng)理Alex Olivier說。
“如果你關(guān)注過擁有傳統(tǒng)系統(tǒng)的大型企業(yè),那么你就會(huì)發(fā)現(xiàn)當(dāng)他們談及云時(shí)他們會(huì)擔(dān)憂擴(kuò)張和遷移,”Olivier說。“我們的目標(biāo)是如同我們自身這樣的小微企業(yè),他們將會(huì)愿意使用云所提供他們使用的原生API設(shè)計(jì)方式。”
但是,根據(jù)客戶使用的不同服務(wù)類型,他們可能會(huì)將一些預(yù)包裝服務(wù)視為非啟動(dòng)機(jī)器。這些工具可以輕松地幫助用戶將API指向數(shù)據(jù),或者將一些人工智能代碼加入到入門者的已有代碼中,但是對(duì)于那些真正想要通過機(jī)器學(xué)習(xí)來改變其業(yè)務(wù)模式的企業(yè)來說,這些工具是無法幫助他們走得更遠(yuǎn)的,Li說。
“為了做到這一點(diǎn) ,用戶可能需要建立一支數(shù)據(jù)科學(xué)團(tuán)隊(duì),這個(gè)團(tuán)隊(duì)可能需要擁有自行開發(fā)算法的能力,以便根據(jù)實(shí)際應(yīng)用情況進(jìn)行調(diào)整和自定義,而目前的公共云供應(yīng)商們?nèi)匀粵]有實(shí)現(xiàn)用戶所需的足夠強(qiáng)大功能和完全自定義,”Li說。
另一個(gè)主要的問題就是成本,至少對(duì)于那些在內(nèi)部擁有足夠多工作負(fù)載的用戶來說是這樣。機(jī)器學(xué)習(xí)在公共云的成本要比現(xiàn)有的內(nèi)部運(yùn)行方式高出四至五倍,尤其是在數(shù)據(jù)存儲(chǔ)在云中的情況更是如此,Zhang說。這是因?yàn)槟P陀?xùn)練所需的計(jì)算水平所致,因?yàn)槟P陀?xùn)練通常可能需要?dú)v經(jīng)數(shù)百小時(shí)的時(shí)間才能收斂。
Nuance通訊公司是一家總部位于馬薩諸塞州Burlington從事Dragon語音識(shí)別軟件產(chǎn)品開發(fā)的企業(yè),該公司在機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方面投入了巨資。公司已將其四分之一的工作負(fù)載遷移至Azure,并計(jì)劃在項(xiàng)目完成時(shí)將至少完成一半工作負(fù)載的遷移。
Nuance使用Azure來提供一些依賴于機(jī)器學(xué)習(xí)的服務(wù),但它仍然在它的自有數(shù)據(jù)中心保留了實(shí)際處理。如何進(jìn)行工作負(fù)載的部署(是在本地還是在云)取決于存儲(chǔ)需求,Nuance公司工程高級(jí)副總裁Joe Petro說。
“如果用戶正試圖存儲(chǔ)和處理TB級(jí)的數(shù)據(jù)信息,那么這些數(shù)據(jù)的膨脹速度是非常驚人的,很快就會(huì)讓你的工作不得不暫停下來,”Petro說。“但是,如果用戶在那里運(yùn)行一個(gè)算法,并通過它來進(jìn)行循環(huán)訓(xùn)練,這些都是與網(wǎng)絡(luò)、計(jì)算以及合適的存儲(chǔ)資源相關(guān)的,那才是有意義的。”安全性也是一個(gè)問題,特別是缺乏傳統(tǒng)的防火墻來確保其他企業(yè)不會(huì)使用相同的數(shù)據(jù)集合算法而出現(xiàn)競(jìng)爭(zhēng)對(duì)手。
當(dāng)公司詢問他們需如何將數(shù)據(jù)提供給云平臺(tái)進(jìn)行處理時(shí),對(duì)機(jī)器學(xué)習(xí)的大部分幻想就會(huì)隨之產(chǎn)生了,Skipjaq的Harrop說。所以,在谷歌大會(huì)上與會(huì)人員非常重視數(shù)據(jù)傳輸?shù)陌踩圆⒉皇菦]有原因的,例如用于數(shù)據(jù)準(zhǔn)備和集成的新工具,以及一個(gè)用于對(duì)敏感數(shù)據(jù)進(jìn)行分類和修改的防數(shù)據(jù)丟失API。
“一眾企業(yè)都感到非常興奮,但是為了工作用戶需要大量數(shù)據(jù)以正確的容量出現(xiàn)在正確的位置,如果用戶確實(shí)有大量的數(shù)據(jù),那么這就會(huì)成為安全漏洞的目標(biāo),”他說。
雖然有缺點(diǎn),但是供應(yīng)商們還是會(huì)讓他們的產(chǎn)品繼續(xù)成熟起來,因?yàn)樗麄冊(cè)噲D讓云機(jī)器學(xué)習(xí)服務(wù)更能為廣大用戶接受,并成為他們的新的賣點(diǎn)。大多數(shù)企業(yè)仍然會(huì)進(jìn)行基準(zhǔn)計(jì)算,但是一旦這些服務(wù)變得更加穩(wěn)定和可預(yù)測(cè),客戶們就很可能向云遷入更多的工作負(fù)載,Zhang說。
“有趣的是,我們一方面看到諸如谷歌和Facebook這樣的企業(yè)正在領(lǐng)導(dǎo)著云發(fā)展趨勢(shì)并真正地致力于推動(dòng)高水平的機(jī)器學(xué)習(xí)人工智能技術(shù),而市場(chǎng)的另一面還顯得如同嬰兒般稚嫩,”她說。“他們不知道如何更容易地匯集數(shù)據(jù),他們?nèi)匀辉诤艽蟪潭壬弦蕾囍④浀腅xcel電子表格。
“展望未來一到兩年,他們將從開始學(xué)步發(fā)展到開始奔跑,”Zhang說。