如今,人工智能(AI)正處于一個日前流行的趨勢中,企業(yè)對于一種名為“深度學(xué)習(xí)”的人工智能形式越來越感興趣。
根據(jù)調(diào)研機(jī)構(gòu)Gartner的統(tǒng)計,2018年人工智能可能為企業(yè)創(chuàng)造1.2萬億美元的商業(yè)價值,將比去年增加70%。“由于計算能力、數(shù)量、速度和數(shù)據(jù)的多樣性,以及深度神經(jīng)網(wǎng)絡(luò)(DNNs)的進(jìn)步,人工智能在未來10年內(nèi)有望將成為最具顛覆性的技術(shù)類別。”Gartner公司研究副總裁John-David Lovelock說。
這些深度神經(jīng)網(wǎng)絡(luò)用于深度學(xué)習(xí),大多數(shù)企業(yè)認(rèn)為這對他們的組織很重要。 O'Reilly公司在2018年發(fā)表的題為“企業(yè)如何通過深度學(xué)習(xí)讓人工智能工作”的報告表明,接受調(diào)查的企業(yè)中只有28%在使用深度學(xué)習(xí)。然而,92%的受訪者認(rèn)為深度學(xué)習(xí)將在未來的項目中發(fā)揮作用,54%的受訪者認(rèn)為這種角色將是重要的或是必不可少的。
盡管深度學(xué)習(xí)似乎具有巨大的好處,但這種人工智能形式仍然還不成熟。如果深度學(xué)習(xí)技術(shù)要實現(xiàn)其早期的期望,研究人員和企業(yè)需要克服許多障礙。
什么是深度學(xué)習(xí)
要理解什么是深度學(xué)習(xí),人們首先需要理解它是更廣泛的人工智能領(lǐng)域的一部分。簡而言之,人工智能涉及教計算機(jī)思考人類的思維方式,其中包括各種不同的應(yīng)用,例如計算機(jī)視覺、自然語言處理和機(jī)器學(xué)習(xí)。
機(jī)器學(xué)習(xí)是人工智能的一個子集,它使計算機(jī)在沒有明確編程的情況下能夠更好地完成任務(wù)。企業(yè)使用機(jī)器學(xué)習(xí)來進(jìn)行欺騙欺詐檢測、推薦引擎、流分析、需求預(yù)測和許多其他類型的應(yīng)用。這些工具隨著時間的推移而不斷改進(jìn),因為它們攝取更多的數(shù)據(jù),并在數(shù)據(jù)中找到相關(guān)性和模式。
深度學(xué)習(xí)是一種特殊的機(jī)器學(xué)習(xí),在2012年,幾位計算機(jī)科學(xué)家就這個主題發(fā)表論文時表明機(jī)器學(xué)習(xí)將變得更加流行,其見解是“深刻的”,因為它通過許多不同的層來處理數(shù)據(jù)。例如,正在接受計算機(jī)視覺培訓(xùn)的深度學(xué)習(xí)系統(tǒng)可能會首先學(xué)會識別出現(xiàn)在圖像中的物體邊緣。這些信息被傳送到下一層,可能會學(xué)習(xí)識別角落或其他特征。它一遍又一遍地經(jīng)歷同樣的過程,直到系統(tǒng)最終開發(fā)識別物體甚至識別人臉的能力。
大多數(shù)深度學(xué)習(xí)系統(tǒng)都依賴于稱為深度神經(jīng)網(wǎng)絡(luò)(DNN)的一種計算機(jī)體系結(jié)構(gòu)。這些都是仿生的大腦生物模型,并使用所謂的“神經(jīng)元”的互連節(jié)點來處理他們的工作。
深度學(xué)習(xí)用例
目前很多行業(yè)廠商正在使用深度學(xué)習(xí)來為許多不同類型的應(yīng)用程序提供支持。一些最常見的包括:
•游戲:2015年,許多人開始對深度學(xué)習(xí)有所認(rèn)識,當(dāng)時AlphaGo公司的深度學(xué)習(xí)系統(tǒng)成為第一種在棋盤游戲AlphaGo中擊敗人類的人工智能系統(tǒng),并且多次重復(fù)這種壯舉。據(jù)AlphaGo網(wǎng)站稱,“人工智能系統(tǒng)的表現(xiàn)非常令人吃驚,顛覆了人類數(shù)百年來的棋盤游戲智慧,并且已經(jīng)被各級玩家廣泛檢驗。在獲勝的過程中,AlphaGo以某種方式向世人傳授了新的知識,也許是歷史上最需要研究和思考的游戲。”
•圖像識別:如前所述,深度學(xué)習(xí)對計算機(jī)視覺應(yīng)用特別有用。微軟、谷歌、Facebook、IBM等已成功地使用深度學(xué)習(xí)來訓(xùn)練計算機(jī)識別圖像內(nèi)容和/或識別人臉。
•語音處理:深度學(xué)習(xí)也有助于識別人類語言,將文本翻譯成語音并處理自然語言。它可以幫助從他們的場景中識別單詞的含義,并且使像Siri和Cortana這樣的聊天機(jī)器人和語音助理能夠與用戶進(jìn)行對話。
•翻譯:訓(xùn)練深度學(xué)習(xí)系統(tǒng)以理解一種語言之后的下一個邏輯步驟是教會它理解多種語言并進(jìn)行翻譯。幾家供應(yīng)商已經(jīng)做到了,現(xiàn)在提供具有深入的基于學(xué)習(xí)的翻譯功能的API。
•推薦引擎:用戶已經(jīng)習(xí)慣于像亞馬遜這樣的網(wǎng)站和Netflix等服務(wù),根據(jù)他們以前的活動提供推薦。這些推薦引擎中的很多都是通過深度學(xué)習(xí)提供支持,這使得他們能夠更好地隨著時間的推移進(jìn)行推薦,并使他們能夠找到程序人員可能錯過的偏好中的隱藏關(guān)聯(lián)。
•文本挖掘:文本挖掘是對文本進(jìn)行分析的過程。例如,它可以使人們確定撰寫文本的人員的感受和情緒,或者可以從文檔中提取主要想法,甚至撰寫摘要。
•分析:大數(shù)據(jù)分析已成為大多數(shù)企業(yè)開展業(yè)務(wù)的一個組成部分。機(jī)器學(xué)習(xí)(特別是深度學(xué)習(xí))有望使預(yù)測性和前瞻性分析甚至比現(xiàn)有的更好。
•預(yù)測:分析最常見的用途之一是預(yù)測即將發(fā)生的事件。企業(yè)正在使用深度學(xué)習(xí)來預(yù)測客戶需求、供應(yīng)鏈問題、未來收益等等。
•醫(yī)療:深度學(xué)習(xí)在醫(yī)療領(lǐng)域也有著無數(shù)的潛在用途。例如,它可能比放射科醫(yī)師閱讀掃描影像更好,并且可以為診斷引擎提供動力,從而增強(qiáng)人類醫(yī)生的能力。
在O'Reilly公司的調(diào)查中,受訪者表示他們最感興趣的是將深度學(xué)習(xí)用于計算機(jī)視覺、文本挖掘和分析。預(yù)計隨著研究人員找到應(yīng)用該技術(shù)的新方法時,其潛在的用例列表將會增長。
O'Reilly公司的“企業(yè)如何通過深度學(xué)習(xí)讓人工智能工作”調(diào)查結(jié)果
深度學(xué)習(xí)挑戰(zhàn)
雖然深度學(xué)習(xí)具有令人印象深刻的能力,但是一些障礙正在阻礙其廣泛采用。它們包括以下內(nèi)容:
•技能短缺:當(dāng)O'Reilly公司的調(diào)查詢問是什么阻礙人們采用深度學(xué)習(xí)時,受訪者的第一個反應(yīng)就是缺乏熟練的員工。2018年全球人工智能人才報告表明,“全世界大約有22,000名獲得博士學(xué)位的研究人員可以從事人工智能研究和應(yīng)用工作,目前只有3074名候選人正在尋找這樣的工作。”企業(yè)正試圖通過培訓(xùn)現(xiàn)有的IT人員來彌補(bǔ)這一缺口,但這一過程很慢。
•計算能力:深度神經(jīng)網(wǎng)絡(luò)(DNN)需要高度先進(jìn)的計算機(jī)基礎(chǔ)設(shè)施,通常是具有大量圖形處理單元(GPU)的高性能計算(HPC)系統(tǒng),這些系統(tǒng)尤其擅長深度學(xué)習(xí)所需的計算類型。在過去,這種水平的硬件對于大多數(shù)組織來說成本費用太高。然而,基于云計算的機(jī)器學(xué)習(xí)服務(wù)的增長意味著組織可以在沒有高昂的前期基礎(chǔ)設(shè)施成本的情況下訪問具有深度學(xué)習(xí)功能的系統(tǒng)。
•數(shù)據(jù)挑戰(zhàn):深度學(xué)習(xí)也會受到妨礙其他大數(shù)據(jù)項目的數(shù)據(jù)質(zhì)量和數(shù)據(jù)治理挑戰(zhàn)的阻礙。用不良數(shù)據(jù)訓(xùn)練深度學(xué)習(xí)模型會引發(fā)創(chuàng)建具有內(nèi)在偏見和不正確或令人反感的結(jié)果的系統(tǒng)的真實可能性。數(shù)據(jù)科學(xué)家需要注意他們用來訓(xùn)練模型的數(shù)據(jù)一定盡可能地準(zhǔn)確和公正。
•批評者:有人認(rèn)為深度學(xué)習(xí)本質(zhì)上是危險的,因為它會放大創(chuàng)建系統(tǒng)的人的內(nèi)在偏見。其他人則表示,雖然深度學(xué)習(xí)可以解決一些問題,但是該技術(shù)具有其根本的局限性,將會阻礙它在許多應(yīng)用中發(fā)揮作用。雖然這些反對的聲音不太可能阻止人們采用深度學(xué)習(xí),但它們確實似乎在一定程度上放緩了這一過程。
開源深度學(xué)習(xí)工具
許多最常見的深度學(xué)習(xí)和人工智能工具都可以通過開源許可證獲得。一些最受歡迎的工具包括以下內(nèi)容:
•在O'Reilly公司對TensorFlow的調(diào)查中,61%的受訪者表示他們使用的是TensorFlow,它很容易成為當(dāng)今最流行的深度學(xué)習(xí)框架。它由谷歌公司創(chuàng)建,是許多深度學(xué)習(xí)云計算服務(wù)的基礎(chǔ)。
•Keras這是O'Reilly公司研究中第二個最受歡迎的深度學(xué)習(xí)工具。這是一個基于Python的神經(jīng)網(wǎng)絡(luò)API,與TensorFlow、Theano和Microsoft Cognitive Toolkit集成。
•O'Reilly公司對PyTorch Number 3的調(diào)查中,PyTorch是一個基于Python的深度神經(jīng)網(wǎng)絡(luò)框架,它融合了Torch張量庫,它提供GPU加速、靈活性和速度等性能。
•Caffe由Berkeley AI Research(BAIR)創(chuàng)建,Caffe是一個開源的深度學(xué)習(xí)框架,擁有富有表現(xiàn)力的架構(gòu)、可擴(kuò)展的代碼、速度和強(qiáng)大的社區(qū)。據(jù)其網(wǎng)站稱,它每天可以用一個NVIDIA K40 GPU處理超過6000萬個圖像。
•Caffe2由Facebook公司開發(fā),Caffe2建立在原來的Caffe上,并承諾具有高度的可擴(kuò)展性。它是輕量級和模塊化的,網(wǎng)站上有大量預(yù)先訓(xùn)練好的模型,可加速應(yīng)用程序的開發(fā)和部署。
•MXNet這個Apache孵化項目旨在加快計算速度,尤其是深度學(xué)習(xí)期間DNN執(zhí)行的計算。它擁有高性能、干凈的代碼,可以訪問高級API和低級控制。
•Gluon項目由AWS公司和Microsoft公司提供,為MXNet提供接口。預(yù)計它也將包含在未來的Microsoft Cognitive Toolkit版本中。
•微軟認(rèn)知工具包(Microsoft Cognitive Toolkit)這個項目以前稱為CNTK,是一種免費、易用、開源、商業(yè)級的工具包,可以訓(xùn)練深度學(xué)習(xí)算法,以便像人腦一樣學(xué)習(xí)。它支持Python、C ++、BrainScript編程語言,以及強(qiáng)化學(xué)習(xí)、生成對抗網(wǎng)絡(luò)、有監(jiān)督和無監(jiān)督學(xué)習(xí)。
•H2O被諸如ADP、CapitalOne、思科、Progressive、Comcast、PayPal和Macy's等公司所使用,H2O聲稱它是面向企業(yè)的第一個開源機(jī)器學(xué)習(xí)平臺,它提供了高級算法和內(nèi)存處理以實現(xiàn)快速性能擁有大量的數(shù)據(jù)集,該公司提供基于開源項目的商業(yè)產(chǎn)品。
•Theano這個Python庫已被許多深度學(xué)習(xí)和人工智能應(yīng)用程序使用。它提供了與NumPy的緊密集成、GPU的透明使用、高效的符號差異化等功能。
•DeepDetect這款開源深度學(xué)習(xí)服務(wù)器基于Caffe,TensorFlow和DMLC XGBoost。其知名用戶包括空客和微軟。
云端人工智能/深度學(xué)習(xí)服務(wù)