雖然埃隆·馬斯克(Elon Musk)和馬克·扎克伯格一直在爭(zhēng)論AGI(通用人工智能,又稱強(qiáng)人工智能)的危險(xiǎn),但初創(chuàng)公司只是將人工智能應(yīng)用于解決特定領(lǐng)域問題,例如提升銷售團(tuán)隊(duì)的績效以及提高生產(chǎn)線的運(yùn)營效率,這些創(chuàng)企逐漸成長為估值數(shù)十億美元的企業(yè)。然而,嚴(yán)格的定義問題只是找到有價(jià)值的人工智能商業(yè)應(yīng)用的第一步。
為找到構(gòu)建人工智能業(yè)務(wù)的合適機(jī)會(huì),初創(chuàng)公司必須在不同的維度上運(yùn)用“金發(fā)姑娘原則”,以找到“合適”開始的甜蜜點(diǎn)(sweet spot)——在不同維度之間注意平衡,切記不可過分專注一個(gè)維度。根據(jù)我們從與數(shù)千家AI創(chuàng)企合作中學(xué)到的知識(shí),以下是一些有抱負(fù)的創(chuàng)始人結(jié)合自己的人工智能策略尋找甜蜜點(diǎn)的一些方法。
“恰到好處”的預(yù)測(cè)時(shí)間范圍
與市面上其他智能軟件不同,人工智能會(huì)響應(yīng)其運(yùn)行的環(huán)境;算法接收數(shù)據(jù)并返回一個(gè)結(jié)果或預(yù)測(cè)。根據(jù)應(yīng)用程序的不同,可以對(duì)近期的情況進(jìn)行預(yù)測(cè),例如明天的天氣,也可預(yù)測(cè)出未來許多年的結(jié)果,比如患者是否會(huì)在20年內(nèi)患上癌癥。算法預(yù)測(cè)的范圍對(duì)其有效性以及是否提供構(gòu)建防御性的機(jī)會(huì)而言至關(guān)重要。
針對(duì)一個(gè)較長的時(shí)間段進(jìn)行預(yù)測(cè)的算法很難做出評(píng)估和改進(jìn)。例如,算法可以使用承包商之前項(xiàng)目的時(shí)間表預(yù)測(cè)某個(gè)建筑項(xiàng)目將比計(jì)劃落后6個(gè)月并超預(yù)算20%。在新項(xiàng)目完成之前,算法設(shè)計(jì)者和最終用戶很難對(duì)此預(yù)測(cè)做出評(píng)論,只能判斷預(yù)測(cè)內(nèi)容在方向上是否正確——即項(xiàng)目是否延遲完成或成本是否更高。
即使最終的項(xiàng)目編號(hào)最終非常接近預(yù)測(cè)的數(shù)字,也很難完成反饋循環(huán)并積極地加強(qiáng)算法。許多因素會(huì)影響到復(fù)雜的程序,如建筑項(xiàng)目,因此很難利用A/B測(cè)試預(yù)測(cè)來梳理未知混雜因素的輸入變量。系統(tǒng)越復(fù)雜,算法完成加固循環(huán)所需的時(shí)間越長,精確訓(xùn)練算法也就越困難。
雖然很多企業(yè)客戶對(duì)使用AI解決方案持開放態(tài)度,但為了完成銷售,初創(chuàng)公司必須能夠驗(yàn)證算法的性能。驗(yàn)證算法最有說服力的方法就是借助客戶的實(shí)時(shí)數(shù)據(jù),但這種方法在試點(diǎn)期間可能很難實(shí)現(xiàn)。如果創(chuàng)企可獲權(quán)訪問客戶的數(shù)據(jù),預(yù)測(cè)時(shí)限應(yīng)該盡量短一點(diǎn),以便在試驗(yàn)期間驗(yàn)證算法。
對(duì)于大多數(shù)AI創(chuàng)企而言,較慢的計(jì)算速度嚴(yán)重限制了應(yīng)用型人工智能的范圍。
歷史數(shù)據(jù)(若可用)可以作為訓(xùn)練算法的權(quán)宜之計(jì),并通過回溯測(cè)試暫時(shí)驗(yàn)證它。訓(xùn)練對(duì)歷史數(shù)據(jù)進(jìn)行長時(shí)間范圍預(yù)測(cè)的算法是有風(fēng)險(xiǎn)的,因?yàn)檫^程和環(huán)境更有可能改變你對(duì)歷史記錄的了解,從而使得歷史數(shù)據(jù)集對(duì)當(dāng)前條件的描述性減弱。
其他情況下,雖然描述結(jié)果的歷史數(shù)據(jù)可用于訓(xùn)練算法,但可能無法捕獲在考慮范圍之內(nèi)的輸入變量。舉個(gè)建筑行業(yè)實(shí)例,你發(fā)現(xiàn)使用藍(lán)色安全帽的建筑工地更有可能按時(shí)完成項(xiàng)目,但由于帽子的顏色在之前并沒有對(duì)管理項(xiàng)目帶來任何幫助,該信息未記錄到存檔文件中。所以必須從頭開始捕獲這些數(shù)據(jù),這將再度推遲企業(yè)的上市時(shí)間。
AI創(chuàng)企應(yīng)該建立多種算法,以較短的范圍進(jìn)行更小、更簡單的預(yù)測(cè),而不是在長時(shí)間范圍內(nèi)進(jìn)行單一的“hero”預(yù)測(cè)。將運(yùn)行環(huán)境分解為更簡單的子系統(tǒng)或在過程中限制數(shù)據(jù)的數(shù)量,使其更容易控制混雜因素。Autodesk的BIM 360項(xiàng)目IQ團(tuán)隊(duì)將這種小型預(yù)測(cè)方法應(yīng)用于建筑行業(yè),消除了施工過程中的眾多低效問題,并有助于消除潛在的設(shè)計(jì)與施工風(fēng)險(xiǎn)。其算法模型可預(yù)測(cè)安全性,并對(duì)供應(yīng)商和分包商的質(zhì)量/可靠性進(jìn)行評(píng)估,所有數(shù)據(jù)都可以項(xiàng)目進(jìn)行周期中進(jìn)行測(cè)量。
較短的時(shí)間范圍便于算法工程師監(jiān)控其性能變化并采取措施快速改進(jìn),而僅限于對(duì)歷史數(shù)據(jù)進(jìn)行回溯測(cè)試。時(shí)間范圍越短,算法的反饋回路越短。每個(gè)周期做出的反饋逐漸累加,可增強(qiáng)算法的性能,較短的反饋周期更有利于構(gòu)建防御性。
“恰到好處”的可操作窗口
大多數(shù)算法對(duì)動(dòng)態(tài)系統(tǒng)進(jìn)行建模并返回一個(gè)預(yù)測(cè)結(jié)果供人類采納。由于系統(tǒng)更改頻繁,算法的輸出很難在長時(shí)間內(nèi)保持有效性:很可能在用戶采取行動(dòng)之前,預(yù)測(cè)結(jié)果的有效性就大幅度“下降了”。為保證預(yù)測(cè)結(jié)果對(duì)最終用戶的有效性,必須設(shè)計(jì)算法以適機(jī)器與人類速度的限制。
在典型的人工智能工作流程中,人類將數(shù)據(jù)輸入算法中,算法運(yùn)行、計(jì)算輸入數(shù)據(jù),并輸出預(yù)測(cè)結(jié)果或建議行動(dòng)步驟;人類解釋該信息以決定行動(dòng)方案,然后采取行動(dòng)。算法計(jì)算結(jié)果所花費(fèi)的時(shí)間以及人類對(duì)輸出內(nèi)容進(jìn)行操作所花費(fèi)的時(shí)間是此工作流程中最大的兩個(gè)瓶頸。
對(duì)于大多數(shù)AI創(chuàng)企而言,較慢的計(jì)算速度嚴(yán)重限制了應(yīng)用型人工智能的應(yīng)用范圍。算法的預(yù)測(cè)取決于輸入數(shù)據(jù),輸入數(shù)據(jù)代表記錄過程的瞬時(shí)數(shù)據(jù)。如果數(shù)據(jù)描述的環(huán)境變化快于算法計(jì)算輸入數(shù)據(jù)的時(shí)間,則在算法完成其計(jì)算并返回預(yù)測(cè)時(shí),預(yù)測(cè)結(jié)果僅適用于過去的某個(gè)時(shí)刻,并且將不可操作。例如,音樂程序Shazam后臺(tái)的算法在首次“聽到”歌曲到識(shí)別這首歌,期間可能需要花費(fèi)好幾個(gè)小時(shí),且需借助Windows 95系統(tǒng)的計(jì)算能力。
云計(jì)算的興起以及專為人工智能計(jì)算而優(yōu)化的硬件開發(fā)極大地拓寬了應(yīng)用型人工智能可行且可負(fù)擔(dān)的領(lǐng)域。雖然宏觀技術(shù)的進(jìn)步極大地推進(jìn)了應(yīng)用型人工智能,但算法并不完全受制于當(dāng)前的計(jì)算限制;通過訓(xùn)練加強(qiáng)也可以改善算法的響應(yīng)時(shí)間。算法遇到的相同示例越多,就能越快地跳過計(jì)算過程得出預(yù)測(cè)結(jié)果。由于計(jì)算的加強(qiáng)與改善,如今Shazam僅用不到15秒的時(shí)間便可識(shí)別一首歌。
自動(dòng)化決策和操作還可以幫助用戶利用因過快失效而等不及人類做出回應(yīng)的預(yù)測(cè)。Opsani就是這樣一家企業(yè),它運(yùn)用人工智能來做出數(shù)量龐大、快速變化的決策,以便人類有效采用。與人類DevOps(DevOps,即Development和Operations,是一組過程、方法與系統(tǒng)的統(tǒng)稱,用于促進(jìn)開發(fā)應(yīng)用程序/軟件工程、技術(shù)運(yùn)營和質(zhì)量保障部門之間的溝通、協(xié)作與整合)不同,人類DevOps只是根據(jù)算法的建議快速地優(yōu)化性能,Opsani則是應(yīng)用人工智能來識(shí)別和自動(dòng)改進(jìn)應(yīng)用程序和云設(shè)施的操作,以便用戶享受到更好的性能。
然而,并非所有人工智能應(yīng)用都可以完全自動(dòng)化,如果感知風(fēng)險(xiǎn)對(duì)于最終用戶來說太高而無法接受,或者法規(guī)要求必須有人類來批準(zhǔn)該決策等情況下,人工智能應(yīng)用便無法完全自動(dòng)化。
“恰到好處”的性能最低限度
就像軟件創(chuàng)企會(huì)選擇在開發(fā)了最小可行產(chǎn)品(MVP)以便從初始客戶中收集可采取措施的反饋時(shí)進(jìn)入市場(chǎng),AI初創(chuàng)公司應(yīng)該在達(dá)到早期用戶所需的最低算法性能(MAP)時(shí)正式進(jìn)入時(shí)市場(chǎng),在市場(chǎng)的大環(huán)境下,算法可以接受更多樣化和新鮮數(shù)據(jù)集的培訓(xùn),也可避免過度訓(xùn)練變成數(shù)據(jù)集。
大多數(shù)應(yīng)用程序并不需要達(dá)到100%準(zhǔn)確,也會(huì)有一定價(jià)值。例如,欺詐檢測(cè)算法可能只會(huì)在發(fā)生故障后的24小時(shí)內(nèi)立即捕獲5%的欺詐案例,但詐騙調(diào)查人員經(jīng)過一個(gè)月的分析也僅能捕獲15%的案例。在這種情況下,MAP為0,因?yàn)槠墼p檢測(cè)算法可以用作第一過濾器,以減少調(diào)查人員必須經(jīng)手的案例數(shù)量。該創(chuàng)企可立即進(jìn)入市場(chǎng),以確保訪問用于培訓(xùn)其算法的大量欺詐數(shù)據(jù)。長此以往,算法的準(zhǔn)確性必將能提高并減輕調(diào)查人員的負(fù)擔(dān),使其能專注于更復(fù)雜的案例。
為0或較低的MAP應(yīng)用程序構(gòu)建算法的初創(chuàng)公司將能快速進(jìn)入市場(chǎng),但若是算法達(dá)到高水平性能之前出現(xiàn)這些副本,則可能需要不斷調(diào)查跟風(fēng)抄襲的企業(yè)。
將算法從研究實(shí)驗(yàn)室轉(zhuǎn)向市場(chǎng)并沒有通用的方法。
專攻較低MAP問題的初創(chuàng)公司也應(yīng)注意那些可通過非常小的訓(xùn)練集以近100%準(zhǔn)確度解決的問題,其中建模的問題相對(duì)簡單,跟蹤的維度少,結(jié)果可能出現(xiàn)的變動(dòng)也比較少。
基于AI的合同處理是算法性能迅速提升的應(yīng)用一個(gè)很好的例子。合同類型數(shù)以千計(jì),但大多數(shù)的關(guān)鍵板塊都是類似的:涉及的各方、交換價(jià)值的項(xiàng)目、時(shí)間框架等。抵押貸款申請(qǐng)或租賃協(xié)議等特定文件類型是高度標(biāo)準(zhǔn)化的,以符合監(jiān)管。在多個(gè)初創(chuàng)公司中,我們發(fā)現(xiàn)自動(dòng)處理這些文檔的算法在其他示例未幫助改進(jìn)之前,只需要幾百個(gè)示例就可訓(xùn)練到可接受的準(zhǔn)確度,從而使后來者更容易將現(xiàn)有企業(yè)和早期算法性能進(jìn)行匹配。
針對(duì)勞動(dòng)力低廉且能夠輕松達(dá)到高精度的應(yīng)用領(lǐng)域而設(shè)計(jì)的人工智能需要在找到早期用戶之前達(dá)到更高的MAP。例如,需要精細(xì)運(yùn)動(dòng)技能的任務(wù)尚未被機(jī)器人接替,人類的表現(xiàn)需要了非常高的MAP來克服。拾取物體時(shí),為機(jī)器人手提供動(dòng)力的人工智能必須以高精度測(cè)量物體的硬度和重量,否則機(jī)器人手會(huì)損壞被處理的物體。而對(duì)人類而言,無需任何訓(xùn)練,也能非常準(zhǔn)確地測(cè)量這些尺寸。攻擊高M(jìn)AP問題的創(chuàng)企必須投入更多時(shí)間和資金來獲取足夠的數(shù)據(jù),才能達(dá)到MAP并正式進(jìn)入市場(chǎng)。
克服困難
在研究實(shí)驗(yàn)室中,限制領(lǐng)域人工智能(Narrow AI)可以在廣泛的應(yīng)用中取得了重大進(jìn)展。此外,圍繞Narrow AI的應(yīng)用程序建立業(yè)務(wù)需要新的算法集。此過程很大程度上取決于所有維度的特定用例,算法的性能只是一個(gè)起點(diǎn)。將算法從研究實(shí)驗(yàn)室轉(zhuǎn)移到市場(chǎng)并沒有通用的方案,還得具體問題具體分析,但希望這些想法能夠?yàn)槟闾峁┮粋€(gè)擁有的藍(lán)圖。