上世紀(jì)40年代,人工智能的基本框架就已經(jīng)存在,自那以后,各種組織就一直在人工智能的發(fā)展上進(jìn)行創(chuàng)新。近年來,大數(shù)據(jù)和先進(jìn)的深度學(xué)習(xí)模型將人工智能的發(fā)展推向了前所未有的高度。這些新的技術(shù)成分最終會(huì)產(chǎn)生科幻小說中所設(shè)想的智能機(jī)器,還是維持目前的人工智能趨勢(shì),只是“把相同的酒裝在了更高檔的瓶子里”?
“這實(shí)際上是新酒,但有各種各樣的瓶子,而且有不同的年份,”James Kobielus說,他是Wikibon的數(shù)據(jù)科學(xué)、深度學(xué)習(xí)和應(yīng)用開發(fā)的首席分析師。
Kobielus補(bǔ)充說,實(shí)際上,大部分的舊酒仍然相當(dāng)可口;新一代的人工智能的使用了以前的方法并建立在這些方法之上。例如,Apache的大數(shù)據(jù)框架Hadoop所運(yùn)用的技術(shù)。
然而,如今關(guān)于人工智能的狂熱,是由于一些前人工智能候選者缺乏特定的發(fā)展。根據(jù)Kobielus的說法,現(xiàn)有的技術(shù)使我們更接近那些看起來像人類一樣“思考”的機(jī)器。“其中最重要的是大數(shù)據(jù),”他在位于馬薩諸塞州馬爾伯勒的CUBE公司的工作室里說。為什么大數(shù)據(jù)激發(fā)了人們對(duì)人工智能的興趣?因?yàn)檫@對(duì)于訓(xùn)練深度學(xué)習(xí)模型來說是一個(gè)巨大的幫助,使其能夠做出更像人類的推斷。Kobielus和Dave Vellante一起在人工智能和機(jī)器智能領(lǐng)域有了技術(shù)突破。Dave Vellante是Wikibon的首席分析師,他還是SiliconANGLE的直播工作室的聯(lián)合主持人。
人工智能革命將會(huì)被算法化
人工智能在智能對(duì)話方面的長(zhǎng)足進(jìn)步,也反映了其飛速的營(yíng)收增長(zhǎng)。研究機(jī)構(gòu)Tractica LLC的調(diào)查顯示,2016年,人工智能軟件市場(chǎng)規(guī)模為14億美元,到2025年將增至598億美元。“人工智能在幾乎所有行業(yè)的垂直領(lǐng)域都有應(yīng)用和用例,被認(rèn)為是下一個(gè)重大的技術(shù)轉(zhuǎn)變,類似于工業(yè)革命、計(jì)算機(jī)時(shí)代和智能手機(jī)革命等過去曾經(jīng)發(fā)生的轉(zhuǎn)變,”Tractica LCC的研究主管Aditya Kaul說。其中一些垂直領(lǐng)域包括金融、廣告、醫(yī)療、航天和消費(fèi)領(lǐng)域。
下一場(chǎng)工業(yè)革命將圍繞人工智能軟件展開,這聽起來可能像一個(gè)想象力豐富的書呆子的幻想。但即使在硅谷之外,這種情緒也在蔓延?!稌r(shí)代》周刊最近專門刊登了一篇題為《人工智能:人類未來》的特稿。但是,這種人工智能的設(shè)想在科幻小說和科技圈的狂熱沼澤中已經(jīng)存在了幾十年。在過去的幾年里,這項(xiàng)技術(shù)發(fā)展得如此之快嗎?從今天的人工智能和可預(yù)見的未來,我們能從現(xiàn)實(shí)中得到什么?
首先,人工智能是一個(gè)寬泛的標(biāo)簽——實(shí)際上更多的是一個(gè)熱門短語,而不是一個(gè)精確的技術(shù)術(shù)語。Kobielus說,人工智能指的是“任何幫助機(jī)器像人類一樣思考的方法”。但是,從最嚴(yán)格的意義上來說,機(jī)器“思考”難道不是與人類大腦截然不同的思維嗎?機(jī)器不會(huì)真的思考,不是嗎?這要看情況。如果說“思考”的同義詞是“推斷”的話,那么機(jī)器可能被認(rèn)為與大腦是對(duì)等的。
當(dāng)人們討論人工智能的時(shí)候,他們通常會(huì)談?wù)撊斯ぶ悄茏钍軞g迎的方式——機(jī)器學(xué)習(xí)。這是一種數(shù)學(xué)應(yīng)用,原理是從數(shù)據(jù)集中推斷出某種模式。Kobielus說:“很長(zhǎng)時(shí)間以來,人們利用軟件從數(shù)據(jù)中推斷出模式。”一些已有的推理方法包括支持向量機(jī)、貝葉斯邏輯和決策樹。這些技術(shù)并沒有消失,并在日益增長(zhǎng)的人工智能技術(shù)領(lǐng)域被繼續(xù)使用著。機(jī)器學(xué)習(xí)模型或在數(shù)據(jù)上訓(xùn)練的算法能夠做出自己的推斷,這通常被稱為人工智能的輸出或見解。這種推斷不需要預(yù)先編程到一個(gè)機(jī)器上,需要編程的只有模型本身。
機(jī)器學(xué)習(xí)模型的推斷基于統(tǒng)計(jì)學(xué)的可能性,這在某種程度上類似于人類理解的過程。來自數(shù)據(jù)的推論可以以預(yù)測(cè)、相關(guān)性、分類、分類、識(shí)別異常或趨勢(shì)等形式出現(xiàn)。對(duì)于機(jī)器來說,學(xué)習(xí)模式是分層的。數(shù)據(jù)分類器名為“感知器”,通過對(duì)感知器進(jìn)行分層,便形成了一個(gè)人工神經(jīng)網(wǎng)絡(luò)。感知器之間的這種神經(jīng)網(wǎng)絡(luò)關(guān)系激活了它們的功能,包括非線性的感知器,比如tangents。通過這個(gè)神經(jīng)過程,一個(gè)層的答案或輸出就成為了下一層的輸入。最后一層輸出的便是最終結(jié)果。
神經(jīng)元的深層學(xué)習(xí)層
深度學(xué)習(xí)網(wǎng)絡(luò)是有著大量的感知器層的人工神經(jīng)網(wǎng)絡(luò)。網(wǎng)絡(luò)的層次越多,它的深度就越大。這些額外的層會(huì)提出更多的問題,處理更多的輸入,并產(chǎn)生更多的輸出,從而抽象出更高層次的數(shù)據(jù)。
Facebook的自動(dòng)人臉識(shí)別技術(shù)是由深度學(xué)習(xí)網(wǎng)絡(luò)驅(qū)動(dòng)的。通過將更多圖層組合在一起,可以更豐富地描述圖像。“你可能會(huì)問,這不就是一張臉嗎?但是,如果它是一個(gè)場(chǎng)景識(shí)別深度學(xué)習(xí)網(wǎng)絡(luò),它可能會(huì)識(shí)別出這是一個(gè)與一個(gè)名叫戴夫的人對(duì)應(yīng)的臉,他碰巧也是這個(gè)家庭場(chǎng)景中的父親。”Kobielus說。
現(xiàn)在已經(jīng)有了具備1,000個(gè)感知器層的神經(jīng)網(wǎng)絡(luò),軟件開發(fā)人員仍在探索更深層次的神經(jīng)網(wǎng)絡(luò)可以實(shí)現(xiàn)的功能。最新款蘋果iPhone的人臉檢測(cè)軟件依賴于一個(gè)20層的卷積神經(jīng)網(wǎng)絡(luò)。2015年,微軟公司的研究人員通過一個(gè)152層的深度殘差網(wǎng)絡(luò)贏得了ImageNet計(jì)算機(jī)視覺大賽。微軟研究主管彼得·李表示,得益于一種防止數(shù)據(jù)稀釋的設(shè)計(jì),該網(wǎng)絡(luò)能夠從圖片中收集到的信息,超過了典型的20層或30層的深度殘差網(wǎng)絡(luò)。他說:“我們可以從中學(xué)到很多微妙的東西。”
除了圖像處理之外,新的人工智能和深度學(xué)習(xí)用例也層出不窮,從執(zhí)法部門到基因組學(xué)都能找到相關(guān)應(yīng)用。在去年的一項(xiàng)研究中,研究人員利用人工智能預(yù)測(cè)了歐洲人權(quán)法院數(shù)百起案件的判決結(jié)果。他們預(yù)測(cè)人類法官最終決定的準(zhǔn)確率達(dá)到了79%。
具備了“思考”的能力,并且擁有豐富的資源,甚至還有機(jī)器比人更準(zhǔn)確地得出結(jié)論。最近,斯坦福大學(xué)研究人員的深度學(xué)習(xí)算法比人類放射科醫(yī)生更擅長(zhǎng)診斷肺炎。這種名為“CheXNet”的算法使用了一種121層的卷積神經(jīng)網(wǎng)絡(luò),這些神經(jīng)網(wǎng)絡(luò)被訓(xùn)練在一組超過10萬張胸部X光圖像上。
人工智能模型在學(xué)習(xí)中不斷進(jìn)步
這突顯出深度學(xué)習(xí)的一個(gè)關(guān)鍵問題:算法本身和訓(xùn)練它們的數(shù)據(jù)一樣好。它們作出的預(yù)測(cè)的準(zhǔn)確率基本上與訓(xùn)練它們的數(shù)據(jù)集的大小成正比。并且這個(gè)培訓(xùn)過程需要專家的監(jiān)督。Kobielus說:“你需要一個(gè)由數(shù)據(jù)科學(xué)家和其他擅長(zhǎng)統(tǒng)計(jì)建模的開發(fā)人員組成的團(tuán)隊(duì),他們擅長(zhǎng)獲取培訓(xùn)數(shù)據(jù),并對(duì)其進(jìn)行標(biāo)記(標(biāo)簽在那里起著非常重要的作用),而且他們擅長(zhǎng)于通過開發(fā)者操作以迭代的方式開發(fā)和部署某一種模型。”
機(jī)器學(xué)習(xí)模型的標(biāo)簽數(shù)據(jù)確實(shí)至關(guān)重要,但人類的眼睛仍然是工作的最佳工具。IBM公司去年表示,他們已經(jīng)在招聘很多人,只是為了給人工智能標(biāo)記數(shù)據(jù)。多倫多大學(xué)的研究人員Parham Aarabi和Wenzhi Guo探索出了人類的大腦和神經(jīng)網(wǎng)絡(luò)結(jié)合在一起的方式。他們開發(fā)了一種算法,從明確的人類指令中進(jìn)行學(xué)習(xí),而不是通過一系列的例子。在圖像識(shí)別中,訓(xùn)練師可能會(huì)告訴算法,天空通常是藍(lán)色的,并且位于圖片的頂部。與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練相比,他們的方法效果更好。Kobielus說:“如果不訓(xùn)練算法,你就不知道算法是否有效。”他還總結(jié)道,大量的訓(xùn)練都會(huì)在云或其他集中的環(huán)境中進(jìn)行,而分散的“物聯(lián)網(wǎng)”設(shè)備(比如自動(dòng)駕駛汽車)將會(huì)在現(xiàn)場(chǎng)做出決定。(選自:siliconANGLE 作者:R. DANES 編譯:網(wǎng)易見外智能編譯平臺(tái) 審校:李擎)