人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)不是什么靈丹妙藥。來看看一位首席信息官就投資人工智能之前每個(gè)企業(yè)應(yīng)該了解的東西現(xiàn)身說法。
每天都充斥著這么多炒作,你怎么知道一個(gè)像人工智能這樣的新興技術(shù)是否值得投入時(shí)間?我們都著迷于一些驚人的成果,比如AlphaGo擊敗了圍棋冠軍,自動(dòng)駕駛車輛的進(jìn)步,Alexa和小娜執(zhí)行的語音識別,以及由Google Photos、Amazon Rekognition和其它公司執(zhí)行的圖像識別,以及其它照片分享應(yīng)用程序。
當(dāng)像谷歌、亞馬遜、微軟、IBM和蘋果這樣的大型的,技術(shù)強(qiáng)悍的公司在新技術(shù)上取得成功并且媒體稱贊它們的時(shí)候,企業(yè)往往相信這些技術(shù)可以為其所用。但是這是真的嗎?如果是真的,又體現(xiàn)在什么地方呢?
每當(dāng)有新技術(shù)開始成為主流時(shí),下面這類問題是首席信息官們要思考的:
• 對于首席信息官來說,這是一種需要投資,研究,關(guān)注還是忽略的技術(shù)?我們?nèi)绾蜗驑I(yè)務(wù)領(lǐng)導(dǎo)者解釋技術(shù)是否適用于業(yè)務(wù),以及它是否具有競爭機(jī)會(huì)或潛在的威脅?
• 對于更多好奇的員工,我們?nèi)绾斡猛ㄋ滓锥脑拋砗喕夹g(shù)所做的工作,并將炒作、當(dāng)今的現(xiàn)實(shí)和未來的潛力區(qū)分開來?
• 當(dāng)一部分員工表現(xiàn)出對探索這些技術(shù)的興趣時(shí),我們是否應(yīng)該給予支持,我們應(yīng)該把他們引向什么問題,以及他們應(yīng)該在技術(shù)的什么方面投入學(xué)習(xí)時(shí)間?
• 當(dāng)供應(yīng)商展示這樣的營銷事實(shí)時(shí)——他們的能力是由新興技術(shù)驅(qū)動(dòng),而且他們的員工擁有專家博士幫助支持產(chǎn)品的開發(fā),那么我們?nèi)绾卧谡嬲哂猩虡I(yè)潛力的服務(wù)、炒作和實(shí)質(zhì)之間做出評估?
人工智能究竟是什么,以及它是如何獲得成就的
人工智能技術(shù)已經(jīng)出現(xiàn)有段時(shí)間了,但是對于我來說,在1968 - 1969年,當(dāng)SHRDLU自然語言處理(NLP)系統(tǒng)問世時(shí),發(fā)布了感知器和反向傳播的研究論文,全世界通過《2001太空漫游》里的HAL開始意識到人工智能的存在。接下來的重大突破可以鎖定在20世紀(jì)80年代后期,在學(xué)習(xí)算法中使用反向傳播,然后應(yīng)用于手寫識別等問題。人工智能在20世紀(jì)90年代后期以第一個(gè)聊天機(jī)器人(ALICE)以及打敗了國際象棋世界冠軍Garry Kasparov的深藍(lán)應(yīng)對了大規(guī)模的挑戰(zhàn)。
在20世紀(jì)90年代,我獲得了第一次人工智能的實(shí)踐經(jīng)驗(yàn)。在亞利桑那大學(xué)的研究生院,我們中有些人用C語言編神經(jīng)網(wǎng)絡(luò)來解決醫(yī)學(xué)、天文學(xué)和其它研究領(lǐng)域的圖像識別問題。我們嘗試了各種學(xué)習(xí)算法,解決優(yōu)化問題的技巧以及針對不精確的數(shù)據(jù)做決策的方法。
如果我們研究神經(jīng)網(wǎng)絡(luò)的話,我們會(huì)手工編程感知器的數(shù)學(xué)運(yùn)算,然后遍歷網(wǎng)絡(luò)層來產(chǎn)生輸出,然后反向遍歷來應(yīng)用反向傳播算法來調(diào)整網(wǎng)絡(luò)。然后,我們將漫長地等待系統(tǒng)穩(wěn)定其輸出。
當(dāng)早期的成果失敗的時(shí)候,我們無法確定是否應(yīng)用了錯(cuò)誤的學(xué)習(xí)算法,沒有針對我們試圖解決的問題優(yōu)化網(wǎng)絡(luò),或者只是在感知器或反向傳播算法中有編程錯(cuò)誤。
提前敘述今天的話,很容易看出為什么在過去幾年人工智能成果有一個(gè)指數(shù)級的飛躍,這要?dú)w功于幾個(gè)進(jìn)步。
首先是云計(jì)算,它可以在一組機(jī)器上運(yùn)行大型神經(jīng)網(wǎng)絡(luò)。計(jì)算分布在大量的計(jì)算節(jié)點(diǎn),而不是逐個(gè)遍歷感知器且只使用一個(gè)或兩個(gè)網(wǎng)絡(luò)層。這使深度學(xué)習(xí)算法成為可能,這種算法本質(zhì)上是具有大量節(jié)點(diǎn)和層次的神經(jīng)網(wǎng)絡(luò),能夠在合理的時(shí)間內(nèi)處理大規(guī)模問題。
其次,TensorFlow、Caffe、Apache MXNet等商業(yè)和開源庫和服務(wù)的出現(xiàn)為數(shù)據(jù)科學(xué)家和軟件開發(fā)人員提供了將機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法應(yīng)用于其數(shù)據(jù)集的工具,而無需編程底層數(shù)學(xué)或啟用并行計(jì)算。未來的人工智能應(yīng)用將由英偉達(dá)、英特爾、超微半導(dǎo)體(AMD)等公司的創(chuàng)新和競爭推動(dòng)的芯載或板載人工智能驅(qū)動(dòng)。
不要將人工智能炒作與人工智能現(xiàn)實(shí)混為一談
一旦了解了歷史和技術(shù),通過評估新興技術(shù)在其生命周期中的所處位置往往是很有用的。
Gartner在將機(jī)器學(xué)習(xí)和深度學(xué)習(xí)推向了其炒作周期的巔峰,并預(yù)測2020年之后將出現(xiàn)“通用人工智能”(人工智能應(yīng)用于任何智能問題)。Venture Scanner顯示,人工智能中約三分之二的啟動(dòng)資金將流向早期的幾輪融資(種子資本、A輪和B輪),這表明很多銷售或推廣人工智能解決方案的公司處在產(chǎn)品開發(fā)和銷售周期的早期階段。麥肯錫指出,只有20%的意識到人工智能的重要性的公司正在采用人工智能,超過50%的人工智能投資來自科技巨頭、初創(chuàng)公司,與碰巧使用該技術(shù)的企業(yè)相對。
這些統(tǒng)計(jì)數(shù)據(jù)應(yīng)該讓任何首席信息官或業(yè)務(wù)主管們在大力投資人工智能投資之前猶豫一下。雖然人工智能肯定前途無量,但對這些算法進(jìn)行大規(guī)模地商用還為時(shí)尚早。
早期的勝利者是大型科技公司和擁有人才、資金和有耐心試驗(yàn)新技術(shù)的初創(chuàng)公司。大多數(shù)企業(yè)和中型企業(yè)很難享受這樣的機(jī)會(huì),他們只是剛剛開始他們的人工智能之旅。
人工智能是一個(gè)具有高度顛覆性的技術(shù),所以你不應(yīng)該忽視它。要明智地進(jìn)行這項(xiàng)事業(yè),避免被人工智能炒作催眠。
例如,當(dāng)某些應(yīng)用程序的語音成為比屏幕和鍵盤更好的人機(jī)界面時(shí),或者當(dāng)聊天機(jī)器人變得比人類客戶服務(wù)代理更智能、更快時(shí),很多企業(yè)將不得不利用這些技術(shù)來升級他們的用戶體驗(yàn)。
同樣,當(dāng)深度學(xué)習(xí)算法在檢測欺詐、風(fēng)險(xiǎn)交易或安全威脅方面越來越好時(shí),企業(yè)將不得不使用這些方法。
而且,當(dāng)我們開始能夠用更多的非結(jié)構(gòu)化數(shù)據(jù)盡可能高效地從口語、音頻和視頻提取出智能時(shí),使用這些功能將為大量業(yè)務(wù)提供顯著的競爭優(yōu)勢。
“何時(shí)”才是關(guān)鍵詞。
大多數(shù)企業(yè)應(yīng)該瞄準(zhǔn)快速模仿者,而不是早期采用者。這意味著在早期關(guān)注甚至嘗試人工智能,但要一直等到人工智能足夠成熟、經(jīng)受足夠考驗(yàn)且能夠大規(guī)模地交付時(shí)才能依靠它。
當(dāng)你了解人工智能功能時(shí),請尋找工具和實(shí)例來幫助評估人工智能及其成熟度的應(yīng)用程序。例子包括:
• Forrester定義了九個(gè)基本的人工智能技術(shù),并提出了一個(gè)以假設(shè)和研究開始并以三個(gè)層面的實(shí)用化應(yīng)用結(jié)束的構(gòu)建模型。
• Workday發(fā)布了成熟度模型,將人工智能應(yīng)用于自動(dòng)化,并在發(fā)現(xiàn)和轉(zhuǎn)變應(yīng)用程序之前通知用戶。這是有道理的,因?yàn)楫?dāng)把它應(yīng)用于人們已經(jīng)解決的問題時(shí),更容易評估人工智能成果。
• 保險(xiǎn)、醫(yī)療、銀行、農(nóng)業(yè)、法律、廣告、建筑、慈善和媒體等行業(yè)都有很多例子。
以基本的商業(yè)目標(biāo)開始你的人工智能程序
人工智能和機(jī)器學(xué)習(xí)的炒作正在推動(dòng)一些技術(shù)和商業(yè)領(lǐng)導(dǎo)者開始采用技術(shù)優(yōu)先戰(zhàn)略。如果你正在試驗(yàn)機(jī)器學(xué)習(xí)庫或者追求正在大肆渲染人工智能的廠商,那么你就錯(cuò)過了一些關(guān)鍵的開始步驟。
恰恰相反,首先從研究有明顯優(yōu)勢來抵消研發(fā)成本的業(yè)務(wù)問題和機(jī)遇開始。這些機(jī)會(huì)應(yīng)該由你已經(jīng)擁有的超大數(shù)據(jù)集來支持,或者你可以輕松獲取并進(jìn)行整合數(shù)據(jù)的數(shù)據(jù)集。從其它非技術(shù)公司在其它行業(yè)所展示的成功中獲得啟發(fā)。
從明確的商業(yè)機(jī)會(huì)開始的一個(gè)原因是,你可能會(huì)找到不需要最新的人工智能技術(shù)的解決方案。如果你需要某種形式的人工智能,這種明確商業(yè)機(jī)會(huì)的方法可以讓你對解決方案的類型進(jìn)行分類,并評估人工智能所需的整體成熟度。
例如,如果你正試圖將一個(gè)高度手動(dòng)的業(yè)務(wù)流程自動(dòng)化,包括從流水線上下來的零件的視覺檢查,那么你可以將圖像識別和機(jī)器人流程自動(dòng)化結(jié)合起來,以此作為解決方案集的一部分。這兩個(gè)領(lǐng)域都是比較成熟的人工智能領(lǐng)域,該領(lǐng)域的各種成功案例和供應(yīng)商解決方案就證實(shí)了這一點(diǎn)。
另一方面,如果解決方案需要大量的認(rèn)知評估和思考,那么你正在進(jìn)入一個(gè)不成熟的人工智能空間。
評估人工智能成熟度的一種方法是查看人工智能初創(chuàng)公司發(fā)布的各種供應(yīng)商概況,例如來自Venture Scanner的供應(yīng)商概況、機(jī)器智能的當(dāng)前狀態(tài)、O'Reilly的機(jī)器人概況以及人工智能金融技術(shù)概況。回顧一下這些清單,你會(huì)發(fā)現(xiàn)很多初創(chuàng)公司都把注意力集中在離散的問題集而不是廣義的認(rèn)知解決方案上。
當(dāng)供應(yīng)商說“只要把你的數(shù)據(jù)放在我們的人工智能上”,就能期待專家智能的返回,不要被忽悠了。這是不可能發(fā)生的。
要真正發(fā)揮作用,你的人工智能需要大量的數(shù)據(jù)
這為成功啟動(dòng)人工智能帶來了第二個(gè)先決條件:你需要大量相對干凈的數(shù)據(jù)來訓(xùn)練人工智能解決方案并評估輸出的數(shù)據(jù)。
自動(dòng)駕駛汽車能夠?qū)崿F(xiàn)的一個(gè)原因是,從這些汽車在每小時(shí)的駕駛中由激光雷達(dá)(lidar)和其它傳感器產(chǎn)生的4000GB容量的數(shù)據(jù)。對于只是少數(shù)幾個(gè)關(guān)于汽車是否應(yīng)該轉(zhuǎn)向、加速、減速或完全停止的基本決定,這數(shù)據(jù)真的是很多。
很多成功的人工智能解決方案都屬于這種將大量數(shù)據(jù)轉(zhuǎn)化為有限決策的類別。例如,在圖像識別中,我在看一張里面有你的照片嗎?在協(xié)作過濾中,根據(jù)你過去的閱讀體驗(yàn)與其它閱讀選項(xiàng),最近發(fā)表的文章是否與你更相關(guān)?在評估交易時(shí),它是否與欺詐交易有類似的模式?
神經(jīng)元可以逼近高度復(fù)雜的曲線來區(qū)分結(jié)果。要開發(fā)這個(gè)網(wǎng)絡(luò),你需要一個(gè)大型的標(biāo)記的數(shù)據(jù)集,以便網(wǎng)絡(luò)就可以通過比較計(jì)算結(jié)果和標(biāo)記結(jié)果來得到想要的結(jié)果。然后使用反向傳播或其它學(xué)習(xí)算法對錯(cuò)誤進(jìn)行調(diào)整,并在所有標(biāo)記數(shù)據(jù)中重復(fù)多次練習(xí),直到網(wǎng)絡(luò)穩(wěn)定為最佳曲線。這些都是用培訓(xùn)集開發(fā)的監(jiān)督學(xué)習(xí)解決方案。
如果數(shù)據(jù)未被標(biāo)記,則網(wǎng)絡(luò)可以使用無監(jiān)督學(xué)習(xí)方法,這些方法依賴于評估結(jié)果的熵表達(dá)式。例如,當(dāng)谷歌的DeepMind被用來學(xué)習(xí)玩Atari游戲Breakout時(shí),它使用得分來評估結(jié)果。
除了數(shù)據(jù)集之外,貴組織還需要數(shù)據(jù)集成和自動(dòng)化功能,因此你可以將數(shù)據(jù)移入和移出任何人工智能處理引擎。如果你的組織習(xí)慣于讓人們手動(dòng)運(yùn)行腳本來推送數(shù)據(jù),我強(qiáng)烈建議你在投資人工智能解決方案前先投資自動(dòng)化。
你可以使用人工智能進(jìn)行實(shí)驗(yàn)
一旦你發(fā)現(xiàn)了商機(jī)和大量可用的清理過的數(shù)據(jù),你已經(jīng)準(zhǔn)備好考慮人工智能的旅程。這兩個(gè)步驟是為你的組織準(zhǔn)備人工智能的先決條件。接下來的主要步驟是考慮人工智能解決方案的類型和實(shí)施辦法。如果你有天賦,你可以試用TensorFlow或者其它的人工智能引擎。如果你沒有這方面的專業(yè)知識,慎重考慮一下招人吧。科技巨頭正在為稀有的人工智能人才付出巨額薪水,所以說進(jìn)入這個(gè)行業(yè)的成本是巨大的。
第二個(gè)選擇是使用在解決方案中嵌入了人工智能的供應(yīng)商。Salesforce Einstein就是一個(gè)例子,它是可以在Salesforce中存儲(chǔ)的CRM數(shù)據(jù)之上執(zhí)行預(yù)測和其他功能一個(gè)人工智能平臺(tái)。同樣,你可以看看行業(yè)特有的解決方案,如Synechron的金融科技(fintech)的Neo。
一旦你已經(jīng)選定了一兩種方法,重要的是與利益相關(guān)者建立切合實(shí)際的期望。投資人工智能需要對敏捷實(shí)驗(yàn)的投入,因?yàn)樵谀銉?yōu)化它們之前很可能會(huì)陷入很多僵局并遇到需要反復(fù)進(jìn)行的實(shí)驗(yàn)。預(yù)先建立對預(yù)算,計(jì)劃表和人才的預(yù)期。
Isaac Sacolick是《數(shù)字化驅(qū)動(dòng):通過技術(shù)進(jìn)行業(yè)務(wù)轉(zhuǎn)型的領(lǐng)導(dǎo)者指南》一書的作者,該書涵蓋了很多實(shí)踐,如敏捷、開發(fā)運(yùn)維和數(shù)據(jù)科學(xué),這些都是成功實(shí)施數(shù)字轉(zhuǎn)型計(jì)劃的關(guān)鍵。Sacolick是公認(rèn)的頂級社交領(lǐng)域的首席信息官,是社交、敏捷和轉(zhuǎn)型方面以及CIO.com的長期博主,兼StarCIO的總裁。
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。