誤區1:人工智能是魔術
多數主流媒體將人工智能描述為神奇而神秘的。我們只需為大魔術師般的公司,如Google,Facebook,Apple,Amazon和Microsoft等鼓掌歡呼即可。這樣的描述只是在幫倒忙。如果我們想要人工智能應用到商業活動中,至少需要讓公司的執行官們理解它。人工智能不是魔術。人工智能是數據、數學、模式和迭代。如果我們想要人工智能應用到商業活動中,我們必須更加透明,并解釋清楚人工智能的3個互相連鎖的關鍵概念。
1.訓練數據(TrainingData,TD)——
訓練數據是機器可以用來學習的起始數據集。訓練數據有輸入值和自帶答案的輸出值,這樣機器學習模型可以從答案中尋找模式。比如,輸入可以是客服單,帶有客戶和公司的客服代表之間的電子郵件。輸出可以是基于公司某個分類定義的從1到5的分類標簽。
2.機器學習(MachineLearning,ML)——
機器學習是軟件從訓練數據中學習到某種模式,并把它應用到新的輸入數據中。比如,一個新的客服單,帶有某位客戶和某位公司客服代表的郵件來了,機器學習模型可以預測出一個分類,告訴你它對該分類的把握有多大。機器學習的關鍵特征是,它不是通過固定的規則來學習。因此,當它消化新的數據后,它會調整其規則。
3.人機回圈(Human-in-the-Loop,HITL)——
人機回圈是人工智能的第三個核心成分。我們不能指望機器學習萬無一失。一個好的機器學習模型大概只有70%的準確性。因此你需要一個人機回圈流程,當模型的可信度低時,還可以依靠人。
因此,別被人工智能的神話愚弄了。現在,有了人工智能的公式,在此基礎上,你可以對人工智能有一個基本的理解了。AI = TD + ML + HITL
誤區2:人工智能是給科技精英用的
媒體報道似乎暗示,人工智能只是科技精英的菜——只有像Amazon,Apple,Facebook,Google,IBM,Microsoft,Salesforce,Tesla,Uber這些公司能斥上億美金巨資組建龐大的機器學習專家團隊。這個概念是錯的。
今天,十萬美元即可在商業過程中開始應用人工智能。因此,如果你的公司是全美營業額在5千萬美元以上的26,000家公司之一,你就可以投入營業額的0.2%,來啟動人工智能。
因此,人工智能不只屬于高科技公司。它屬于任何行業。
誤區3:人工智能只解決億萬美元級的大問題
主流媒體敘說的故事,通常是未來式的例子,比如無人駕駛汽車,無人機投遞包裹。Google,Tesla和Uber這些公司投入了數億美元爭奪無人駕駛汽車領域的領先地位,因為“贏者通吃”的想法在作怪。這樣的故事給人工智能打上了“花費億萬美元開拓創新領域”的烙印。但事實并非如此。
人工智能也可以用幾百萬美元來解決現有問題。讓我解釋一下。任何生意的一個核心任務都是了解客戶。這在最早的市場——古希臘的阿格拉如此,在古羅馬的競技場里面對面做買賣時如此,在網購盛行的今天也如此。許多公司坐擁非結構化的客戶數據寶庫,有電子郵件,也有Twitter評論。人工智能可以用于解決客服單分類或者理解推文情感這樣的難題。
因此人工智能不止是為了解決如無人駕駛汽車這樣的億萬美元級“讓人興奮”的新問題,它也可以解決百萬美元級的現有“**”問題,如通過客服單分類或者社交媒體情感分析來了解你的客戶。
誤區4:算法比數據更重要
主流媒體對人工智能的報道偏重于關注機器學習算法,將其視為最重要的部分。主流媒體似乎把算法與人腦等同了。他們隱約傳達著這樣一個信息:復雜的算法最終會超越人類的大腦并創造奇跡。媒體拿機器在國際象棋和圍棋比賽里擊敗人類的故事作為例子。而且他們主要關注“深度神經網絡”和“深度學習”,以及機器是如何做出決策。
這種報道給人的印象是,一個公司要想應用人工智能就需要聘請機器學習專家來建立完美的算法。但如果一個企業沒有思考如何獲得高質量的算法,即使機器學習模型經過大量的特定訓練數據學習之后,仍然會產生一個與期望(“我們有一個偉大的算法”)不匹配的結果(“我們的模型的準確率只有60%”)。
現如今,沒有計劃或訓練數據的預算就從微軟,亞馬遜和谷歌購買商業機器學習的服務,就像買一輛無法接近加油站的車,只是買了一塊昂貴的金屬。汽車和汽油的類比有些不貼切,因為如果你給機器學習模型的訓練數據越多,機器學習模型就會越準確。這就像不斷給汽車加油,汽車的燃料利用率會不斷提高。訓練數據對于機器學習模型的重要性比汽油對汽車的重要性更高。如果想深入了解對這類誤解性的報道的話,你可以閱讀我們以前的帖子《更多的數據擊敗更好的算法》。
所以關鍵就是訓練數據的質量和數量至少是和算法一樣重要的,要確保你部署人工智能的計劃和預算反映這一點。
誤區5:機器>人類
在過去的30年里,無論是施瓦辛格在《終結者》里扮演的電子人殺手,還是艾麗西亞·維坎德在《機械姬》里扮演的智能機器人伊娃,媒體一直喜歡把人工智能描繪成比人類更強大的機器。媒體想編寫一個機器對戰人類誰會成為贏家的故事,這是可以理解的。但卻歪曲了事實。
例如,最近谷歌DeepMind 的 alphago戰勝韓國棋手李世石的報道被簡單地描述成機器戰勝人類。這樣的表達不是對真實情況的準確描述。更準確的描述是機器加上一群人打敗了一個人。
消除這種誤解的主要理由是機器和人的技能是互補的。從上面的圖中我們可以看出機器在處理結構化計算方面有優勢。機器擅長“找到特征向量”的任務,不太擅長“找到豹紋裙”任務。人類在識別意義和背景上具有得天獨厚的優勢。人類很容易“找到豹紋裙”,但在“找到特征向量”方面跟機器相比不具有優勢。
因此,正確的框架是要意識到在商業情景下機器和人是互補的。人工智能是人和機器共同工作。
誤區6:人工智能是機器取代人類
主流媒體為了關注度喜歡描繪一個反烏托邦式的未來,這種情況可能會發生,但這種描述對正確理解人和機器如何共同工作產生了不利的影響。
例如,讓我們再思索下分類支持**的業務流程。現如今大多數企業都還是百分百人工操作的。結果就是不僅進度緩慢而且成本線性增長,限制了工作量。現在想象一下用模型分類10,000張支持票的準確度是70%。30%的錯誤是不能接受的,就需要人機回圈的參與。你可以設置可接受的置信閾值為95%并且只接受模型在置信水平不低于95%時的輸出。所以最初的機器學習模型可能只做了一小部分的工作,比如說5-10%。
但是,隨著新的人為標記的數據被創建,并且將其反饋到機器學習模型中,模型會不斷學習并提高。隨著時間的推移,該模型可以處理越來越多的客戶支持**分類工作,分類**的業務量可以顯著提高。
因此,人和機器共同協作可以增加業務量,保持質量,減少重要的業務流程的單位成本。
這就消除了人工智能是機器代替人類的誤解。事實是,人工智能是關于機器增強人類的能力。
誤區7:人工智能=機器學習
主流媒體帶給人們的最后一條根深蒂固的誤解就是人工智能和機器學習是等同的。這個誤解就導致了不切實際的管理期望—從微軟,亞馬遜或谷歌公司購買商業機器學習的服務就能神奇地將人工智能運用到生產中。
而除了機器學習之外還需要訓練數據和人機回圈才有可能找到可行的人工智能解決方案。
沒有訓練數據的機器學習就像一輛沒有汽油的汽車。既昂貴又無用。
沒有人機回圈的機器學習是不會有好的產出的。機器學習模型需要人的參與來去除低的置信度預測。二、真相是什么
真相1:人工智能=訓練數據+機器學習+人機回圈
真相2:人工智能屬于任何行業
真相3:人工智能可以用幾百萬美元來解決現有的商業問題
真相4:算法并沒有比訓練數據的數量和質量更重要
真相5:機器和人是互補的
真相6:人工智能是機器增強人的能力
真相7:人工智能=訓練數據+機器學習+人機回圈
對人工智能常見誤區的列舉,今天小編就先概括到這里啦。如果說你是一個想把人工智能應用到業務上的執行官,那么看到這里的你們應該對人工智能有一個認識的框架了。我們可以用上述所說的七個真相來代替這常見誤區。