你在Excel中幾乎所有的操作,以及梳理、編碼或者排序等操作,都是一種很好的聚類、分類和學(xué)習(xí)排序問題。任何可以歸納為一組可預(yù)測值的問題都是很好的機(jī)器學(xué)習(xí)問題。任何可以歸納為經(jīng)歷過的,“尋找”過的模式、形狀或者對象的問題,都是很好的深度學(xué)習(xí)問題。
業(yè)務(wù)領(lǐng)域也充斥著這些問題。就像這個世界處理器取代了打字機(jī)一樣,人工智能很快就會取代大批盯著Excel的辦公室工作人員,甚至取代一些分析師。
企業(yè)面對這種變革要做好準(zhǔn)備。正如那些沒有準(zhǔn)備好網(wǎng)絡(luò)和電子商務(wù)的企業(yè)最終會落伍一樣,那些不適應(yīng)人工智能和機(jī)器學(xué)習(xí)的企業(yè)也會陷入困境。如果不關(guān)注所處理的大量數(shù)據(jù)和所做出的決策,而是問:“自動化之后我是不是就能實(shí)現(xiàn)最后一英里?”,或者,由于不能“實(shí)時”做出決策而獲得優(yōu)勢,轉(zhuǎn)而去關(guān)注一些自己不擅長的東西——那么,你的企業(yè)很可能在幾年內(nèi)就會宣布倒閉。
面對變革,在可以開始業(yè)務(wù)轉(zhuǎn)型之前,要處理好五個先決條件。企業(yè)需要制定好戰(zhàn)略,從這五個先決條件開始,在整個企業(yè)中推廣人工智能。
人工智能的第一個先決條件:培訓(xùn)
企業(yè)里的每一名員工不可能都成為數(shù)據(jù)科學(xué)家。而且,有些數(shù)學(xué)運(yùn)算速度太快了,以至于我們普通人無法理解——人們這星期還認(rèn)為是最有效的某種算法過一星期就未必適用了。
然而,一些基本的東西是不會改變的。企業(yè)的每名員工都應(yīng)該掌握機(jī)器學(xué)習(xí)的一些基本功能,尤其是開發(fā)人員:
·聚類:將事物分組。
·分類:將事物分類,并進(jìn)行標(biāo)記。
·線性預(yù)測:如果能畫出一條直線,就可以預(yù)測它的值是多少。
·方差預(yù)測:無論是流動風(fēng)險,還是振動或者功率尖峰,如果有一組落在某一范圍內(nèi)的數(shù)值,就可以預(yù)測某一天的方差是多少。
·分類/排序/優(yōu)先級:我說的不是簡單的東西。無論是為了搜索還是進(jìn)行優(yōu)先級排序,以便指導(dǎo)銷售部門或者支持人員下一步的工作,這些都是可以處理的。
·模式識別:不管是形狀、聲音,還是一組數(shù)值或者事件,計算機(jī)都能學(xué)會找到它。
關(guān)鍵點(diǎn)在于有一批人,他們可以根據(jù)人們的技能水平進(jìn)行簡化。開發(fā)人員可能對具體的算法或者技術(shù)感興趣,但分析師和管理人員應(yīng)該了解基本業(yè)務(wù)問題和計算機(jī)技術(shù)。管理人員不一定需要知道聚類是怎樣工作的,但他們確實(shí)應(yīng)能夠識別出“看起來像”聚類的問題。
最后,由于功能在不斷擴(kuò)展,因此,企業(yè)應(yīng)該定期更新培訓(xùn),至少每年進(jìn)行一次。
人工智能的第二個先決條件:組件化
最近在組件化方面的一些工具是數(shù)據(jù)科學(xué)家的“筆記本(notebooks)”;很多其他工具都是從中衍生出來的。對于數(shù)據(jù)科學(xué)家及其合作者而言,這是非常好的工具。
問題是,當(dāng)涉及到產(chǎn)品的時候,會帶來不好的做法。分類算法的界面看起來與所有其他算法的大致相同。某種分類算法的實(shí)現(xiàn)不會隨著業(yè)務(wù)問題而改變。
正如很多企業(yè)必須弄清楚怎樣表示一名客戶一樣(并不是每一系統(tǒng)針對每個業(yè)務(wù)問題提供完全不同的表示),算法也是同樣的。這并不是說你想出了一個真正的聚類算法,而組件化實(shí)現(xiàn)的卻是完全不同的東西。
人工智能的第三個先決條件:系統(tǒng)化
盡管如此,大多數(shù)系統(tǒng)看起來還是一樣的。有一些過程把數(shù)據(jù)送入算法中,而一些過程則執(zhí)行算法,還需要存放輸出結(jié)果的地方。如果針對每一種算法反復(fù)定制設(shè)計所有這些東西,那就是在浪費(fèi)時間和金錢——給自己造成更大的問題。就像SOA改變了很多企業(yè)部署應(yīng)用軟件一樣,在部署人工智能的過程中也需要類似的技術(shù)。
你不需要運(yùn)行大量定制的Spark集群,到處部署定制“筆記本”和定制開發(fā)的ETL過程。不管業(yè)務(wù)問題如何,企業(yè)確實(shí)需要能夠完成繁重工作的人工智能系統(tǒng)。
人工智能的第四個先決條件:AI/UI組件化
在后端提供RESTful服務(wù)的java script/Web UI環(huán)境中,很多UI應(yīng)該能混合使用人工智能組件。無論是基于用戶行為的推薦者,還是完全虛擬的助理,企業(yè)都應(yīng)該構(gòu)建包含人工智能功能的UI庫,這些功能可以方便地嵌入到業(yè)務(wù)應(yīng)用程序中。
人工智能的第五個先決條件:配置
沒有數(shù)據(jù),所有這一切都不起作用。我們不應(yīng)該再回到過去,去創(chuàng)建大量臃腫的數(shù)據(jù),那樣的話,我們只是收集了一堆HDFS垃圾,希望總有一天會產(chǎn)生價值——正如一些廠商敦促你去做的那樣。相反,讓我們看看應(yīng)該配置什么。
如果你身處制造業(yè),有一些簡單的出發(fā)點(diǎn):任何手動進(jìn)行操作的人都是在浪費(fèi)時間。即使是在銷售和營銷領(lǐng)域,都有電子郵件和手機(jī)——可以自動從這些數(shù)據(jù)中收集顯然非常有用的數(shù)據(jù)。與其讓那些喋喋不休的銷售人員去完成他們的數(shù)據(jù)錄入,何不讓系統(tǒng)自己去做呢?
人工智能策略
總的來說,這五個關(guān)鍵的先決條件是:
·在整個企業(yè)中傳播人工智能知識。
·每個人都應(yīng)該了解機(jī)器能夠獨(dú)立完成的日常工作。
·為企業(yè)的人工智能構(gòu)建系統(tǒng)和組件。
·構(gòu)建AI/UI混合結(jié)構(gòu),方便地把人工智能添加到業(yè)務(wù)應(yīng)用中。
·配置系統(tǒng)來收集企業(yè)所需要的數(shù)據(jù),并將其送入算法,為企業(yè)做出決定。
如果能把這些先決條件放在一起,剩下的就應(yīng)該是從信息時代過渡到洞察時代了。