什么是人工智能?獲得這個(gè)問題的答案取決于你問誰。
早在上世紀(jì)50年代,人工智能行業(yè)先驅(qū)Minsky和McCarthy將人工智能描述為由機(jī)器執(zhí)行的任何任務(wù),這些任務(wù)在以往需要人類智能才能完成。
這顯然是一個(gè)相當(dāng)寬泛的定義,這就是有時(shí)人們針對某種技術(shù)是否真是人工智能進(jìn)行爭論的原因。
如今對“智能”的定義更為具體。谷歌公司人工智能研究人員、機(jī)器學(xué)習(xí)軟件庫Keras的創(chuàng)建者Francois Chollet曾表示,智能與系統(tǒng)在新環(huán)境中適應(yīng)和即興發(fā)揮的能力有關(guān),能夠概括其知識并將其應(yīng)用于不熟悉的場景。
他說:“智能是指在以前沒有準(zhǔn)備好的任務(wù)方面獲得新技能的效率。智能本身并不是技能,不是能做什么,而是學(xué)習(xí)新事物的能力和效率。”
這是人工智能的一個(gè)定義。在這個(gè)定義中,現(xiàn)代人工智能驅(qū)動(dòng)的系統(tǒng)(例如虛擬助手)將被描述為具有“狹義人工智能”的特征。在執(zhí)行有限的一組任務(wù)(如語音識別或計(jì)算機(jī)視覺)時(shí),概括其訓(xùn)練的能力。
通常情況下,人工智能系統(tǒng)至少會表現(xiàn)出與人類智能相關(guān)的以下某些行為:計(jì)劃、學(xué)習(xí)、推理、問題解決、知識表示、感知、運(yùn)動(dòng)和操縱,在某些程度上還包括社會智能和創(chuàng)造力。
人工智能的用途是什么?
如今,人工智能幾乎無處不在,例如推薦人們應(yīng)該在網(wǎng)上購買的物品,了解對虛擬助手(例如亞馬遜的Alexa和蘋果的Siri)所說的內(nèi)容,識別照片中的人物和內(nèi)容,識別垃圾郵件,或者檢測信用卡欺詐。
人工智能有哪些不同類型?
人工智能可以分為兩大類:狹義人工智能和通用人工智能。
如上所述,狹義的人工智能是人們目前在計(jì)算機(jī)中看到的一切:已經(jīng)被訓(xùn)練或?qū)W會如何執(zhí)行特定任務(wù)的智能系統(tǒng)。
這種機(jī)器智能在蘋果iPhone上的Siri虛擬助手的語音和語言識別、自動(dòng)駕駛汽車的視覺識別系統(tǒng)、或根據(jù)人們過去購買的商品推薦可能喜歡的產(chǎn)品的推薦引擎中都可以明顯地看出。與人類不同的是,這些系統(tǒng)只能學(xué)習(xí)或被教授如何完成定義的任務(wù),這就是它們被稱為狹義人工智能的原因。
狹義人工智能能做什么?
狹義人工智能有大量應(yīng)用程序:無人機(jī)的視頻饋送、對基礎(chǔ)設(shè)施(如輸油管道)進(jìn)行視覺檢查、組織個(gè)人和企業(yè)日歷、響應(yīng)簡單的客戶服務(wù)查詢、與其他智能系統(tǒng)協(xié)調(diào)執(zhí)行這些任務(wù)包括在合適的時(shí)間和地點(diǎn)預(yù)定酒店、幫助放射線醫(yī)師發(fā)現(xiàn)X光片中的潛在腫瘤、在線標(biāo)記不當(dāng)內(nèi)容、從物聯(lián)網(wǎng)設(shè)備收集的數(shù)據(jù)中檢測電梯的磨損,以及通過衛(wèi)星生成世界3D模型圖像等。
這些學(xué)習(xí)系統(tǒng)的新應(yīng)用一直在涌現(xiàn)。顯卡設(shè)計(jì)廠商N(yùn)vidia公司最近推出了一種基于人工智能的Maxine系統(tǒng),它可以讓人們進(jìn)行高質(zhì)量的視頻通話,并且不用考慮其互聯(lián)網(wǎng)連接速度。該系統(tǒng)通過不通過互聯(lián)網(wǎng)傳輸完整的視頻流,而是以實(shí)時(shí)再現(xiàn)通話者的面部表情和動(dòng)作并且與視頻不可區(qū)分的方式,將通話所需的帶寬減少了10倍。
但是,盡管這些系統(tǒng)具有尚未開發(fā)的潛力,但有時(shí)對該技術(shù)的期望卻超過了現(xiàn)實(shí)。自動(dòng)駕駛汽車就是一個(gè)很好的例子,自動(dòng)駕駛汽車本身就得到了人工智能驅(qū)動(dòng)的系統(tǒng)(例如計(jì)算機(jī)視覺)的支持。電動(dòng)汽車生產(chǎn)商特斯拉公司首席執(zhí)行官埃隆·馬斯克(Elon Musk)最初提出的汽車自動(dòng)駕駛系統(tǒng)將從有限的輔助駕駛能力升級為“全自動(dòng)駕駛”的時(shí)間表如今有些落后,作為其測試計(jì)劃的一部分,全自動(dòng)駕駛選項(xiàng)最近才推出專業(yè)駕駛程序。
通用人工智能可以做什么?
通用人工智能截然不同,它是一種在人類身上發(fā)現(xiàn)的適應(yīng)性智能,是一種靈活的智能形式,能夠?qū)W習(xí)如何執(zhí)行完全不同的任務(wù),從理發(fā)到構(gòu)建電子表格,或者基于積累的經(jīng)驗(yàn)對各種各樣的主題進(jìn)行推理。這種人工智能在電影中更為常見,例如電影《終結(jié)者》中的Skynet,但現(xiàn)在已經(jīng)不存在了——人工智能專家們對它在什么時(shí)候能成為現(xiàn)實(shí)存在嚴(yán)重的分歧。
人工智能研究人員Vincent CMüller和哲學(xué)家Nick Bostrom在2012年對四組專家進(jìn)行的一項(xiàng)調(diào)查顯示,到2040年至2050年,通用人工智能(AGI)的開發(fā)機(jī)會將達(dá)到50%,到2075年將上升到90%。該小組甚至進(jìn)一步預(yù)測,所謂的“超級智能”在通用人工智能(AGI)實(shí)現(xiàn)約30年后就可以出現(xiàn)。
然而,人工智能專家最近的評估更為謹(jǐn)慎。現(xiàn)代人工智能研究領(lǐng)域的先驅(qū)者,如Geoffrey Hinton、Demis Hassabis和Yann LeCun表示,鑒于對現(xiàn)代人工智能領(lǐng)域的領(lǐng)導(dǎo)者持懷疑態(tài)度,以及現(xiàn)代狹義人工智能系統(tǒng)與通用人工智能(AGI)的本質(zhì)迥然不同,因此幾乎沒有理由擔(dān)心通用人工智在不久的將來能為社會帶來影響。
也就是說,一些人工智能專家認(rèn)為,鑒于人們對人腦的了解有限,這樣的預(yù)測是非常樂觀的,并且相信通用人工智能(AGI)的出現(xiàn)還需要數(shù)百年的時(shí)間。
人工智能發(fā)展的最新里程碑是什么?
雖然現(xiàn)代狹義人工智能可能僅限于執(zhí)行特定任務(wù),但在它們的專業(yè)領(lǐng)域內(nèi),這些系統(tǒng)有時(shí)能夠表現(xiàn)出超人的表現(xiàn),而這種特質(zhì)通常是人類固有的。
雖然沒有太多的技術(shù)突破,但也有一些亮點(diǎn):谷歌公司在2009年表示,豐田普銳斯汽車采用其開發(fā)的自動(dòng)駕駛技術(shù)有可能完成10次以上每次100公里路程的測試,讓無人駕駛汽車技術(shù)向前邁進(jìn)。
2011年,IBM Watson在美國智力競賽節(jié)目《危險(xiǎn)邊緣》中獲勝,擊敗了該節(jié)目有史以來最好的兩位人類選手,成為全球頭條新聞。為了獲勝,Watson采用自然語言處理和分析技術(shù)對海量數(shù)據(jù)進(jìn)行處理,以回答人類提出的問題,通常其處理的速度不到1秒鐘。
2012年,另一項(xiàng)突破性進(jìn)展預(yù)示著人工智能有能力處理許多以前認(rèn)為對任何機(jī)器來說過于復(fù)雜的新任務(wù)。那一年,AlexNet系統(tǒng)在ImageNet大規(guī)模視覺識別挑戰(zhàn)賽中取得了決定性的勝利。在圖像識別比賽中,與競爭對手相比,AlexNet的錯(cuò)誤率降低了一半。
AlexNet的表現(xiàn)證明了基于神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)系統(tǒng)的力量,這種機(jī)器學(xué)習(xí)模型已經(jīng)存在了幾十年,但由于對體系結(jié)構(gòu)的改進(jìn)和摩爾定律使并行處理能力的飛躍,最終實(shí)現(xiàn)了它的潛力。機(jī)器學(xué)習(xí)系統(tǒng)在執(zhí)行計(jì)算機(jī)視覺方面的能力也成為當(dāng)年的頭條新聞,谷歌訓(xùn)練了一個(gè)可以識別貓的圖片的機(jī)器學(xué)習(xí)系統(tǒng)。
另一個(gè)引起人們關(guān)注的機(jī)器學(xué)習(xí)系統(tǒng)的應(yīng)用案例是2016年Google DeepMind 公司的AlphaGo 戰(zhàn)勝了一位圍棋冠軍。圍棋是一款古老的中國棋類游戲,其復(fù)雜性讓計(jì)算機(jī)系統(tǒng)困擾了幾十年。這是因?yàn)閲迕炕睾洗蠹s有200步,而國際象棋只有20步左右。在圍棋比賽的過程中,其每一步動(dòng)作有太多可能性,因此從計(jì)算的角度來看,預(yù)先搜索每一個(gè)動(dòng)作以確定最佳步驟的成本太高。取而代之的是,AlphaGo通過在3000萬個(gè)圍棋游戲案例中模仿人類專家的動(dòng)作,并將其輸入深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)來訓(xùn)練如何玩這個(gè)游戲。
訓(xùn)練這些深度學(xué)習(xí)網(wǎng)絡(luò)可能會花費(fèi)很長時(shí)間,隨著系統(tǒng)逐漸完善其模型以取得最佳結(jié)果,需要攝取和迭代大量數(shù)據(jù)。
然而,最近谷歌公司使用AlphaGo Zero(一種“完全隨機(jī)”游戲的系統(tǒng))改進(jìn)了訓(xùn)練過程,然后從結(jié)果中學(xué)習(xí)。Google DeepMind公司首席執(zhí)行官Demis Hassabis表示,還將推出新版本的AlphaGo Zero,該版本已經(jīng)掌握如何下國際象棋的游戲。
人工智能技術(shù)不斷實(shí)現(xiàn)新的里程碑:OpenAI訓(xùn)練的人工智能系統(tǒng)在在線多人游戲Dota 2的一對一比賽中擊敗了世界頂級玩家。
2020年,人工智能系統(tǒng)似乎獲得了像人類一樣寫作和交談的能力,其中包括人們可以想到的任何話題。
這個(gè)系統(tǒng)名為Generative Pre-training Transformer 3,簡稱GPT-3,是一個(gè)神經(jīng)網(wǎng)絡(luò),它使用開放式網(wǎng)絡(luò)上數(shù)十億篇英語文章進(jìn)行訓(xùn)練。
在OpenAI對其進(jìn)行測試后不久,人們就開始對GPT-3的能力產(chǎn)生興趣,其能力幾乎可以生成涉及該主題的任何文章,這些文章乍一看往往很難與人類撰寫的文章區(qū)分開來。類似的結(jié)果也出現(xiàn)在其他領(lǐng)域,它能夠令人信服地回答廣泛主題的問題。
但是,盡管許多GPT-3生成的文章具有真實(shí)感,但進(jìn)一步的測試發(fā)現(xiàn),其生成的句子并不符合要求,提供表面上看似合理但混亂的陳述,有時(shí)甚至是胡言亂語。
人們對使用模型的自然語言理解作為未來服務(wù)的基礎(chǔ)仍有相當(dāng)大的興趣,并且可以選擇開發(fā)人員通過OpenAI的beta API來構(gòu)建軟件。它還將被納入未來通過微軟的Azure云平臺提供的服務(wù)中。
人工智能潛力最顯著的例子可能是在2020年末,基于Google關(guān)注的神經(jīng)網(wǎng)絡(luò)AlphaFold 2證明了這一結(jié)果。
該系統(tǒng)可以查看蛋白質(zhì)組成部分(氨基酸)的能力,并得出了蛋白質(zhì)的3D結(jié)構(gòu)可能對疾病的理解和藥物開發(fā)的速度產(chǎn)生深遠(yuǎn)影響的結(jié)論。在蛋白質(zhì)結(jié)構(gòu)預(yù)測的關(guān)鍵評估競賽中,AlphaFold 2能夠以與晶體學(xué)相媲美的準(zhǔn)確性確定蛋白質(zhì)的3D結(jié)構(gòu),而晶體學(xué)是令人信服地對蛋白質(zhì)建模的黃金標(biāo)準(zhǔn)。
與需要數(shù)月才能獲得結(jié)果的晶體學(xué)不同,AlphaFold 2可以在數(shù)小時(shí)內(nèi)對蛋白質(zhì)進(jìn)行建模。蛋白質(zhì)的3D結(jié)構(gòu)在人類生物學(xué)和疾病中起著如此重要的作用,這種加速已被預(yù)示為醫(yī)學(xué)界的里程碑式突破,更不用說在生物技術(shù)中使用酶的其他領(lǐng)域中的潛在應(yīng)用。
什么是機(jī)器學(xué)習(xí)?
事實(shí)上,到目前為止提到的所有成就都來自機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)是人工智能的一個(gè)子集,近年來在該領(lǐng)域取得的成就占了絕大多數(shù)。如今人們談?wù)撊斯ぶ悄軙r(shí),通常都是在談?wù)摍C(jī)器學(xué)習(xí)。
簡而言之,當(dāng)前的機(jī)器學(xué)習(xí)技術(shù)正在實(shí)現(xiàn)某種復(fù)興,簡單來說,機(jī)器學(xué)習(xí)是計(jì)算機(jī)系統(tǒng)學(xué)習(xí)如何執(zhí)行任務(wù)的方法,而不是通過編程來了解如何執(zhí)行任務(wù)的方法。對機(jī)器學(xué)習(xí)的描述可以追溯到1959年,當(dāng)時(shí)它是該領(lǐng)域的先驅(qū)Arthur Samuel發(fā)明的,他開發(fā)了世界上第一個(gè)自學(xué)習(xí)系統(tǒng)之一,即Samuel 跳棋程序。
為了自學(xué)習(xí),這些系統(tǒng)被輸入大量的數(shù)據(jù),然后用這些數(shù)據(jù)來學(xué)習(xí)如何執(zhí)行特定的任務(wù),例如理解語音或?yàn)檎掌砑诱f明。這個(gè)數(shù)據(jù)集的質(zhì)量和大小對于建立一個(gè)能夠準(zhǔn)確執(zhí)行其指定任務(wù)的系統(tǒng)非常重要。例如,如果正在構(gòu)建一個(gè)機(jī)器學(xué)習(xí)系統(tǒng)來預(yù)測房價(jià),那么培訓(xùn)數(shù)據(jù)應(yīng)不僅僅包括房地產(chǎn)面積,還應(yīng)包括其他顯著因素,如臥室數(shù)量或花園面積。
什么是神經(jīng)網(wǎng)絡(luò)?
機(jī)器學(xué)習(xí)成功的關(guān)鍵是神經(jīng)網(wǎng)絡(luò)。這些數(shù)學(xué)模型能夠調(diào)整內(nèi)部參數(shù)以更改其輸出。在訓(xùn)練期間,向神經(jīng)網(wǎng)絡(luò)饋送數(shù)據(jù)集,該數(shù)據(jù)集教給它一些特定數(shù)據(jù)時(shí)應(yīng)該輸出的內(nèi)容。具體來說,可能會向網(wǎng)絡(luò)饋送介于0到9之間的數(shù)字的灰度圖像以及一串二進(jìn)制數(shù)字(0和1),這些二進(jìn)制數(shù)字指示每個(gè)灰度圖像中顯示了哪個(gè)數(shù)字。然后將對網(wǎng)絡(luò)進(jìn)行訓(xùn)練,調(diào)整其內(nèi)部參數(shù),直到以高準(zhǔn)確度對每個(gè)圖像中顯示的數(shù)字進(jìn)行分類。然后,可以使用這個(gè)經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)對0到9之間數(shù)字的其他灰度圖像進(jìn)行分類。1989年,Yann LeCun發(fā)表了一篇論文展示了神經(jīng)網(wǎng)絡(luò)的應(yīng)用,美國郵政局已經(jīng)采用神經(jīng)網(wǎng)絡(luò)技術(shù)識別手寫的郵政編碼。
神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和功能基于大腦中神經(jīng)元之間非常松散的聯(lián)系。神經(jīng)網(wǎng)絡(luò)由互連的算法層組成,這些算法層將數(shù)據(jù)相互饋送,并且可以通過修改數(shù)據(jù)在這些層之間傳遞時(shí)的重要性來進(jìn)行訓(xùn)練,以執(zhí)行特定任務(wù)。在訓(xùn)練這些神經(jīng)網(wǎng)絡(luò)的過程中,當(dāng)數(shù)據(jù)在各層之間傳遞時(shí),附加在數(shù)據(jù)上的權(quán)重將會不斷變化,直到神經(jīng)網(wǎng)絡(luò)的輸出非常接近期望值,此時(shí)神經(jīng)網(wǎng)絡(luò)將“學(xué)習(xí)”如何執(zhí)行特定任務(wù)。期望的輸出可以是從正確地標(biāo)記圖像中的水果到根據(jù)其傳感器數(shù)據(jù)預(yù)測電梯何時(shí)可能發(fā)生故障的任何事情。
機(jī)器學(xué)習(xí)的一個(gè)子集是深度學(xué)習(xí),在深度學(xué)習(xí)中,神經(jīng)網(wǎng)絡(luò)被擴(kuò)展成具有大量多層網(wǎng)絡(luò),這些網(wǎng)絡(luò)使用大量的數(shù)據(jù)進(jìn)行訓(xùn)練。正是這些深度神經(jīng)網(wǎng)絡(luò)推動(dòng)了計(jì)算機(jī)執(zhí)行語音識別和計(jì)算機(jī)視覺等任務(wù)的能力的當(dāng)前飛躍。
神經(jīng)網(wǎng)絡(luò)有多種類型,各有優(yōu)缺點(diǎn)。遞歸神經(jīng)網(wǎng)絡(luò)(RNN)是一種特別適合于自然語言處理(NLP)的神經(jīng)網(wǎng)絡(luò),它可以理解文本和語音識別的含義,而卷積神經(jīng)網(wǎng)絡(luò)則植根于圖像識別,其用途與推薦系統(tǒng)和自然語言處理(NLP)一樣多樣。神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)也在不斷發(fā)展,研究人員改進(jìn)了一種更有效的深度神經(jīng)網(wǎng)絡(luò)形式,稱為長短期記憶(簡稱LSTM),這是一種用于自然語言處理(NLP)等任務(wù)和預(yù)測股市的遞歸神經(jīng)網(wǎng)絡(luò)(RNN)構(gòu),使其運(yùn)行速度足夠快,可以在谷歌翻譯等按需系統(tǒng)中使用。
其他類型的人工智能有哪些?
人工智能研究的另一個(gè)領(lǐng)域是進(jìn)化計(jì)算,它借鑒了達(dá)爾文的自然選擇理論,并發(fā)現(xiàn)遺傳算法經(jīng)歷了幾代人之間的隨機(jī)變異和組合,從而試圖發(fā)展出針對給定問題的最佳解決方案。
這種方法甚至被用來幫助設(shè)計(jì)人工智能模型,有效地利用人工智能來幫助構(gòu)建人工智能。這種使用進(jìn)化算法來優(yōu)化神經(jīng)網(wǎng)絡(luò)的方法被稱為神經(jīng)進(jìn)化,隨著智能系統(tǒng)的使用越來越普遍,特別是對數(shù)據(jù)科學(xué)家的需求往往供不應(yīng)求的情況下,在幫助設(shè)計(jì)高效的人工智能方面可以發(fā)揮重要作用。Uber公司的人工智能實(shí)驗(yàn)室展示了這項(xiàng)技術(shù),該實(shí)驗(yàn)室發(fā)表了關(guān)于使用遺傳算法訓(xùn)練深層神經(jīng)網(wǎng)絡(luò)以解決強(qiáng)化學(xué)習(xí)問題的論文。
此外還有專家系統(tǒng),在這種系統(tǒng)中,計(jì)算機(jī)被編入規(guī)則,允許它們根據(jù)大量輸入做出一系列決定,使計(jì)算機(jī)能夠模仿人類專家在特定領(lǐng)域的行為。駕駛飛機(jī)的自動(dòng)駕駛系統(tǒng)就是這些基于專家系統(tǒng)的一個(gè)例子。
是什么推動(dòng)了人工智能的復(fù)興?
如上所述,近年來,人工智能研究的最大突破是機(jī)器學(xué)習(xí)領(lǐng)域,尤其是在深度學(xué)習(xí)領(lǐng)域。
這在某種程度上是由于數(shù)據(jù)的易用性驅(qū)動(dòng)的,而更重要的是,并行計(jì)算能力的爆炸式增長,在此期間,越來越多的圖形處理單元(GPU)集群用于訓(xùn)練機(jī)器學(xué)習(xí)系統(tǒng)。
這些集群不僅為訓(xùn)練機(jī)器學(xué)習(xí)模型提供了功能強(qiáng)大得多的系統(tǒng),而且它們現(xiàn)在作為云服務(wù)在互聯(lián)網(wǎng)上廣泛使用。隨著時(shí)間的推移,全球主要的科技公司(如谷歌、微軟和特斯拉)已經(jīng)開始使用專門為運(yùn)行和培訓(xùn)的機(jī)器學(xué)習(xí)模式量身定做的芯片。
谷歌公司的Tensor Processing Unit(TPU)就是這些定制芯片的一個(gè)例子,它的最新版本加快了使用谷歌TensorFlow軟件庫構(gòu)建的有用機(jī)器學(xué)習(xí)模型從數(shù)據(jù)中推斷信息的速度,以及它們接受訓(xùn)練的速度。
這些芯片不僅用于訓(xùn)練DeepMind和Google Brain的模型,還用于支持谷歌翻譯和谷歌照片中的圖像識別的模型,以及允許公眾使用谷歌的TensorFlow Research構(gòu)建機(jī)器學(xué)習(xí)模型的服務(wù)。這些芯片的第三代產(chǎn)品于2018年5月在谷歌公司的I/O會議上發(fā)布,此后被封裝到稱為Pod的機(jī)器學(xué)習(xí)引擎中,該引擎可以每秒執(zhí)行超過10萬億次浮點(diǎn)運(yùn)算(100 petaflops)。這些正在進(jìn)行的TPU升級使谷歌公司可以改善基于機(jī)器學(xué)習(xí)模型的服務(wù),例如將訓(xùn)練谷歌翻譯中使用的模型所需的時(shí)間減少一半。
機(jī)器學(xué)習(xí)的要素是什么?
如上所述,機(jī)器學(xué)習(xí)是人工智能的一個(gè)子集,通常分為兩大類:有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。
(1)監(jiān)督學(xué)習(xí)
訓(xùn)練人工智能系統(tǒng)的一種常見技術(shù)是通過使用大量帶標(biāo)簽的例子來訓(xùn)練它們。這些機(jī)器學(xué)習(xí)系統(tǒng)被輸入大量的數(shù)據(jù),這些數(shù)據(jù)經(jīng)過注釋以突出感興趣的特征。這些可能是照片,以表明它們是否包含書面句子或腳注,以表明“低音”一詞是與音樂或魚類有關(guān)。一旦經(jīng)過訓(xùn)練,系統(tǒng)就可以將這些標(biāo)簽應(yīng)用到新數(shù)據(jù)上,例如剛剛上傳的照片中的一只狗。
通過示例進(jìn)行機(jī)器教學(xué)的過程稱為監(jiān)督學(xué)習(xí),標(biāo)記這些示例的角色通常是通過Amazon Mechanical Turk等平臺進(jìn)行雇用在線工作人員執(zhí)行的。
訓(xùn)練這些系統(tǒng)通常需要大量的數(shù)據(jù),有些系統(tǒng)需要搜索數(shù)百萬個(gè)例子來學(xué)習(xí)如何有效地執(zhí)行任務(wù),在大數(shù)據(jù)和廣泛數(shù)據(jù)挖掘的時(shí)代,這一點(diǎn)越來越可能。培訓(xùn)數(shù)據(jù)集龐大且規(guī)模不斷擴(kuò)大——谷歌公司的開放式圖像數(shù)據(jù)集約有900萬張圖片,而其標(biāo)簽視頻存儲庫YouTube-8M鏈接了700萬個(gè)標(biāo)簽視頻。ImageNet是早期的此類數(shù)據(jù)庫之一,擁有超過1400萬張分類圖像。經(jīng)過近5萬人耗費(fèi)兩年時(shí)間的編纂,將其匯集在一起,其中大多數(shù)人是通過亞馬遜Amazon Mechanical Turk招募的,他們檢查、分類并標(biāo)記了近10億張候選圖片。
近年來,生成性對抗網(wǎng)絡(luò)(GAN)已被應(yīng)用于機(jī)器學(xué)習(xí)系統(tǒng)中,這些系統(tǒng)只需要少量的標(biāo)記數(shù)據(jù)和大量未標(biāo)記的數(shù)據(jù)。
這種方法可以增加半監(jiān)督學(xué)習(xí)的使用,在這種情況下,系統(tǒng)可以學(xué)習(xí)如何使用比當(dāng)今使用監(jiān)督學(xué)習(xí)的訓(xùn)練系統(tǒng)所需要的少得多的標(biāo)記數(shù)據(jù)來執(zhí)行任務(wù)。
(2)無監(jiān)督學(xué)習(xí)
相比之下,無監(jiān)督學(xué)習(xí)使用不同的方法,即算法嘗試識別數(shù)據(jù)中的模式,尋找可用于對數(shù)據(jù)進(jìn)行分類的相似性。例如,將重量相似的水果或發(fā)動(dòng)機(jī)尺寸相似的汽車聚集在一起。
該算法并不是預(yù)先設(shè)置好挑選特定類型的數(shù)據(jù),而是簡單地尋找可以根據(jù)相似性進(jìn)行分組的數(shù)據(jù),例如谷歌新聞每天都會將類似主題的報(bào)道分組在一起。
(3)強(qiáng)化學(xué)習(xí)
強(qiáng)化學(xué)習(xí)的一個(gè)粗略的類比是,當(dāng)寵物表演一個(gè)節(jié)目時(shí),會給它一個(gè)獎(jiǎng)勵(lì)。在強(qiáng)化學(xué)習(xí)中,系統(tǒng)試圖根據(jù)輸入數(shù)據(jù)最大化獎(jiǎng)勵(lì),基本上要經(jīng)歷反復(fù)試驗(yàn)的過程,直到達(dá)到可能的最佳結(jié)果。
強(qiáng)化學(xué)習(xí)的一個(gè)例子是Google DeepMind的Deep Q網(wǎng)絡(luò),該網(wǎng)絡(luò)已被用于在各種經(jīng)典視頻游戲中實(shí)現(xiàn)最佳人類表現(xiàn)。系統(tǒng)從每個(gè)游戲中獲取像素,并確定各種信息,例如屏幕上物體之間的距離。
通過查看每個(gè)游戲中獲得的分?jǐn)?shù),系統(tǒng)會建立一個(gè)模型,該模型的動(dòng)作將在不同情況下使分?jǐn)?shù)最大化,例如,在視頻游戲Breakout的情況下,應(yīng)將球拍移至其中以攔截球。
該方法還用于機(jī)器人技術(shù)研究,其中強(qiáng)化學(xué)習(xí)可以幫助教會自主機(jī)器人在現(xiàn)實(shí)環(huán)境中表現(xiàn)的最佳方式。
哪些公司在人工智能領(lǐng)域處于領(lǐng)先地位?
隨著人工智能在現(xiàn)代軟件和服務(wù)中扮演越來越重要的角色,全球主要的科技公司都在努力開發(fā)強(qiáng)大的機(jī)器學(xué)習(xí)技術(shù),以供內(nèi)部使用并通過云服務(wù)向公眾出售。
盡管可能是谷歌及其DeepMind AI AlphaFold和AlphaGo系統(tǒng)對公眾的人工智能意識產(chǎn)生了很大的影響,但每個(gè)開創(chuàng)人工智能研究新局面的公司都有可能成為頭條新聞中的主角。
哪些人工智能服務(wù)可用?
全球主要的云計(jì)算提供商——AWS、微軟Azure和谷歌云平臺都提供了對GPU陣列的訪問,用于培訓(xùn)和運(yùn)行機(jī)器學(xué)習(xí)模型。而谷歌公司還準(zhǔn)備讓用戶使用其Tensor處理單元(其定制設(shè)計(jì)的定制芯片)針對訓(xùn)練和運(yùn)行機(jī)器學(xué)習(xí)模型進(jìn)行優(yōu)化。
這三家云計(jì)算提供商(基于云計(jì)算的數(shù)據(jù)存儲)均提供了所有必需的相關(guān)基礎(chǔ)設(shè)施和服務(wù),能夠存儲訓(xùn)練機(jī)器學(xué)習(xí)模型所需的大量數(shù)據(jù),轉(zhuǎn)換數(shù)據(jù)以準(zhǔn)備進(jìn)行分析的服務(wù),可以清晰顯示結(jié)果的可視化工具,以及簡化模型構(gòu)建的軟件。
這些云平臺甚至還簡化了自定義機(jī)器學(xué)習(xí)模型的創(chuàng)建,谷歌公司提供了一種自動(dòng)創(chuàng)建人工智能模型的服務(wù),其名稱為Cloud AutoML。這項(xiàng)拖放服務(wù)可建立自定義的圖像識別模型,并且用戶不必具備機(jī)器學(xué)習(xí)方面的專業(yè)知識。
基于云計(jì)算的機(jī)器學(xué)習(xí)服務(wù)正在不斷發(fā)展。亞馬遜公司現(xiàn)在提供了許多產(chǎn)品,旨在簡化機(jī)器學(xué)習(xí)模型的培訓(xùn)過程,并且最近推出了Amazon SageMaker Clarify,該工具可幫助組織消除培訓(xùn)數(shù)據(jù)中的偏見和不平衡,這些偏見和不平衡可能導(dǎo)致受過訓(xùn)練的模型進(jìn)行錯(cuò)誤的預(yù)測。
對于那些不想建立自己的機(jī)器學(xué)習(xí)模式,而是想消費(fèi)人工智能驅(qū)動(dòng)的按需服務(wù)(如語音、視覺和語言識別)的公司來說,微軟Azure在提供的服務(wù)范圍方面表現(xiàn)突出,緊隨其后的是谷歌云平臺,然后是AWS。與此同時(shí),除了提供一般的按需服務(wù)外,IBM公司還試圖銷售面向從醫(yī)療保健到零售等各個(gè)領(lǐng)域的特定行業(yè)人工智能服務(wù),將這些服務(wù)組合在IBM Watson旗下,并投資20億美元購買了Weather Channel,以釋放大量數(shù)據(jù),以增強(qiáng)其人工智能服務(wù)。
哪家主要的科技公司在人工智能競賽中獲勝?
每家科技巨頭以及Facebook等其他公司都使用人工智能來幫助推動(dòng)各種公共服務(wù):提供搜索結(jié)果、提供推薦、識別照片中的人物和事物、按需翻譯、發(fā)現(xiàn)垃圾郵件,這些服務(wù)清單非常廣泛。
但這場人工智能戰(zhàn)爭最明顯的表現(xiàn)之一是虛擬助理的興起,比如蘋果的Siri、亞馬遜的Alexa、谷歌的助手和微軟的Cortana。
語音識別和自然語言處理依賴人工智能,并且需要龐大的語料庫來回答查詢,因此開發(fā)這些助手需要大量技術(shù)。
不過,雖然蘋果的Siri可能首先嶄露頭角,但谷歌和亞馬遜的助手們后來在人工智能領(lǐng)域超越了蘋果公司——Google Assistant具有回答各種查詢的能力,而亞馬遜的Alexa具有大量的“技能”由第三方開發(fā)人員創(chuàng)建以增加其功能。
隨著時(shí)間的推移,這些人工智能助理的能力在不斷提高,使它們能夠更迅速地回應(yīng)人們在日常談話中提出的問題。例如,Google Assistant現(xiàn)在提供了一個(gè)名為“繼續(xù)對話”的功能,用戶可以在最初的查詢中提出后續(xù)問題,例如“今天天氣怎么樣?”,然后是“明天的天氣怎么樣?”,并且系統(tǒng)了解到后續(xù)問題也與天氣有關(guān)。
這些虛擬助手和相關(guān)服務(wù)不僅可以處理語音,還可以使用Google Lens的最新版本來翻譯圖像中的文本,并允許用戶使用照片搜索衣服或家具等商品。
盡管Cortana已經(jīng)內(nèi)置在Windows 10中,但最近面臨困境。亞馬遜的Alexa現(xiàn)在可以在Windows 10個(gè)人電腦上免費(fèi)使用,而微軟公司則對Cortana在操作系統(tǒng)中的角色進(jìn)行了改造,將更多精力放在生產(chǎn)任務(wù)上,例如管理用戶的日程安排。而不是在其他助手中找到更多以消費(fèi)者為中心的功能,例如播放音樂。
•實(shí)現(xiàn)目標(biāo):結(jié)構(gòu)化數(shù)據(jù)、語義、機(jī)器人技術(shù)和人工智能的未來。
•Adobe推出人工智能工具來跟蹤全渠道、更快地發(fā)現(xiàn)異常。
•IBM公司增加了用于閱讀理解、FAQ提取的Watson工具。
哪些國家在人工智能領(lǐng)域處于領(lǐng)先地位?
如果有人認(rèn)為美國科技巨頭在人工智能領(lǐng)域占主導(dǎo)地位,那么這種想法是錯(cuò)誤的。中國科技廠商阿里巴巴、百度、聯(lián)想正在電子商務(wù)和自主駕駛等領(lǐng)域大力投資人工智能。中國正在遵循三步走的計(jì)劃,將人工智能變成該國的核心產(chǎn)業(yè)。到2020年底,該產(chǎn)業(yè)的價(jià)值將達(dá)到1500億元人民幣(合220億美元),目標(biāo)是到2030年成為世界領(lǐng)先的人工智能大國。
百度公司已投資開發(fā)無人駕駛汽車,該技術(shù)由其深度學(xué)習(xí)算法百度AutoBrain提供支持,經(jīng)過數(shù)年的測試,其阿波羅自動(dòng)駕駛汽車在測試中行駛了300多萬英里,在全球27個(gè)城市載客超過10萬人。百度公司的創(chuàng)始人預(yù)測自動(dòng)駕駛汽車將在五年內(nèi)在中國城市中普及。
一些分析師認(rèn)為,在未來的人工智能研究方面,中國將比美國更具優(yōu)勢。
如何開始使用人工智能?
雖然人們可以為其電腦購買一個(gè)中等功能的Nvidia GPU(大約在Nvidia GeForce RTX 2060或更快的地方),并開始訓(xùn)練機(jī)器學(xué)習(xí)模型,但嘗試人工智能相關(guān)服務(wù)的最簡單方法可能是采用云服務(wù)。
全球主要的科技公司通常提供各種各樣的人工智能服務(wù),從構(gòu)建和訓(xùn)練自己的機(jī)器學(xué)習(xí)模型的基礎(chǔ)設(shè)施到允許按需訪問的人工智能工具(如語音、語言、視覺和情感識別)的網(wǎng)絡(luò)服務(wù)。
人工智能將如何改變世界?
(1)機(jī)器人和無人駕駛汽車
希望機(jī)器人能夠自主行動(dòng)、理解和導(dǎo)航周圍的世界,這意味著機(jī)器人學(xué)和人工智能之間有著天然的重疊。雖然人工智能只是機(jī)器人技術(shù)之一,但人工智能的使用正在幫助機(jī)器人進(jìn)入新的領(lǐng)域,如自動(dòng)駕駛汽車、送貨機(jī)器人,以及幫助機(jī)器人學(xué)習(xí)新技能。在2020年初,通用汽車和本田推出一款電動(dòng)無人駕駛汽車Cruise Origin,谷歌母公司Alphabet公司的自動(dòng)駕駛業(yè)務(wù)部門Waymo最近在亞利桑那州鳳凰城向普通公眾開放了robotaxi服務(wù),其提供的服務(wù)覆蓋城市50平方英里的區(qū)域。
(2)虛假新聞
人們正處于擁有可以創(chuàng)建逼真的圖像或以完美音調(diào)方式復(fù)制某人聲音的神經(jīng)網(wǎng)絡(luò)的邊緣。隨之而來的是巨大的顛覆性社會變革的潛力,例如不再能夠?qū)⒁曨l或音頻素材視為真正的視頻。人們還開始擔(dān)憂可能會使用這種技術(shù)來盜用人們的圖象。
(3)語音和語言識別
機(jī)器學(xué)習(xí)系統(tǒng)幫助計(jì)算機(jī)以幾乎95%的準(zhǔn)確率識別人們所說的內(nèi)容。根據(jù)微軟公司人工智能和研究小組發(fā)布的報(bào)告,他們已經(jīng)開發(fā)出一種系統(tǒng),能夠像翻譯人員一樣準(zhǔn)確地翻譯口語。
隨著研究人員追求99%準(zhǔn)確性的目標(biāo),人們期望與計(jì)算機(jī)對話以及更傳統(tǒng)的人機(jī)交互形式變得越來越普遍。
與此同時(shí),OpenAI的語言預(yù)測模型GPT-3最近引起了業(yè)界關(guān)注,因?yàn)樗軌騽?chuàng)建可以被認(rèn)為是人類所寫的文章。
(4)面部識別和監(jiān)視
近年來,人臉識別系統(tǒng)的準(zhǔn)確性有了突飛猛進(jìn)的發(fā)展,百度公司表示,只要視頻中的人臉足夠清晰,它就可以以99%的準(zhǔn)確性匹配人臉。
盡管世界各地的隱私法規(guī)各不相同,但這種更具侵入性的人工智能技術(shù)(包括能夠識別情緒的人工智能)很可能會逐漸變得更為廣泛。
(5)醫(yī)療保健
人工智能最終會對醫(yī)療保健產(chǎn)生巨大的影響,幫助放射科醫(yī)生在X光片中發(fā)現(xiàn)腫瘤,幫助研究人員發(fā)現(xiàn)與疾病相關(guān)的基因序列,并識別出可能導(dǎo)致更有效藥物的分子。谷歌公司的AlphaFold 2機(jī)器學(xué)習(xí)系統(tǒng)最近的突破有望將開發(fā)新藥的關(guān)鍵步驟所花費(fèi)的時(shí)間從數(shù)月縮短至數(shù)小時(shí)。
在世界各地的醫(yī)院都有人工智能相關(guān)技術(shù)的試驗(yàn)。其中包括IBM的Watson臨床決策支持工具,該工具由Memorial Sloan Kettering癌癥中心的腫瘤學(xué)家進(jìn)行了培訓(xùn),以及英國國家衛(wèi)生服務(wù)局對Google DeepMind系統(tǒng)的使用,它將幫助發(fā)現(xiàn)眼睛異常并簡化篩查患者頭頸部癌癥的過程。
(6)強(qiáng)化歧視和偏見
機(jī)器學(xué)習(xí)系統(tǒng)如何整理其訓(xùn)練數(shù)據(jù)中反映的人為偏見和社會不平等現(xiàn)象的方式日益引起人們的關(guān)注。這些擔(dān)憂已通過多個(gè)示例證明,即用于訓(xùn)練此類系統(tǒng)的數(shù)據(jù)缺乏多樣性會對現(xiàn)實(shí)世界產(chǎn)生負(fù)面影響。
2018年,麻省理工學(xué)院和微軟公司共同發(fā)布的一項(xiàng)研究論文發(fā)現(xiàn),大型科技公司出售的面部識別系統(tǒng)在識別膚色較深的人時(shí)遭受的錯(cuò)誤率明顯更高,這一問題歸因于訓(xùn)練數(shù)據(jù)集主要由白人組成。
一年后的另一項(xiàng)研究強(qiáng)調(diào),亞馬遜的Rekognition面部識別系統(tǒng)在識別膚色較深的人的性別方面存在問題。
自從這項(xiàng)研究報(bào)告發(fā)布以來,許多大型科技公司暫時(shí)停止了向警察部門提供面部識別系統(tǒng)。
2018年,亞馬遜公司廢棄了一款機(jī)器學(xué)習(xí)招聘工具,該工具將男性求職者視為首選,這是培訓(xùn)數(shù)據(jù)差異化導(dǎo)致結(jié)果扭曲的另一個(gè)例子。如今,正在進(jìn)行研究以抵消自學(xué)系統(tǒng)中的偏見。
(7)人工智能與全球變暖
隨著機(jī)器學(xué)習(xí)模型和用于訓(xùn)練它們的數(shù)據(jù)集的規(guī)模不斷擴(kuò)大,塑造和運(yùn)行這些模型的龐大計(jì)算集群的碳足跡也在增長。世界經(jīng)濟(jì)論壇在2018年發(fā)表了一篇論文,主題是數(shù)據(jù)中心供電和制冷設(shè)備對環(huán)境的影響。2019年的一項(xiàng)估計(jì)是,機(jī)器學(xué)習(xí)系統(tǒng)所需的電力每3.4個(gè)月翻一番。
最近,通過發(fā)布語言預(yù)測模型GPT-3(一個(gè)擁有約1,750億個(gè)參數(shù)的龐大的神經(jīng)網(wǎng)絡(luò)),人們開始關(guān)注訓(xùn)練強(qiáng)大的機(jī)器學(xué)習(xí)模型所需的大量能源問題。
雖然訓(xùn)練這些模型所需的資源可能是大量的,而且基本上只有大公司才能具有,但一旦進(jìn)行良好的訓(xùn)練,運(yùn)行這些模型所需的能量就大大減少了。然而,隨著對基于這些模型的服務(wù)需求的增長,電力消耗和由此產(chǎn)生的環(huán)境影響再次成為一個(gè)問題。
一種觀點(diǎn)認(rèn)為,培訓(xùn)和運(yùn)行更大模型對環(huán)境的影響需要與潛在的機(jī)器學(xué)習(xí)進(jìn)行權(quán)衡,必須具有顯著的積極影響,例如,在谷歌DeepMind的alphafold2取得突破之后,醫(yī)療保健領(lǐng)域可能出現(xiàn)更迅速的進(jìn)步。
人工智能會危害人類嗎?
同樣,獲得這個(gè)問題的答案取決于你問誰。隨著以人工智能為動(dòng)力的系統(tǒng)變得越來越強(qiáng)大,對不利因素的警告也越來越嚴(yán)峻。
特斯拉公司首席執(zhí)行官埃隆·馬斯克宣稱,“人工智能是人類文明生存的根本風(fēng)險(xiǎn)”。為了推動(dòng)更強(qiáng)大的監(jiān)管監(jiān)督和開展更多負(fù)責(zé)任的研究以減輕人工智能的負(fù)面影響,他成立了OpenAI,這是一家非盈利性人工智能研究公司,旨在促進(jìn)和發(fā)展有利于整個(gè)社會的友好人工智能。著名物理學(xué)家斯蒂芬·霍金曾警告說,一旦創(chuàng)建了足夠先進(jìn)的人工智能,它將迅速發(fā)展到遠(yuǎn)遠(yuǎn)超過人類能力的地步,這一現(xiàn)象被稱為奇點(diǎn),并可能對人類構(gòu)成生存威脅。
然而,在一些人工智能研究人員看來,人類正處于人工智能爆炸的邊緣,這一觀點(diǎn)似乎很可笑。
微軟公司位于英國劍橋的研究總監(jiān)Chris Bishop強(qiáng)調(diào)了當(dāng)今狹義人工智能與通用人工智能之間的不同。他說,“人們擔(dān)心終結(jié)者和機(jī)器的崛起?這是胡說八道,這樣的討論應(yīng)該是幾十年后的事了。”
人工智能會替代人類的工作嗎?
在不久的將來,人工智能系統(tǒng)取代大部分體力勞動(dòng)的可能性可能更可信。人工智能系統(tǒng)替代許多體力勞動(dòng)人員的可能性也許是更可靠的說法。
雖然人工智能不會取代所有的工作,但似乎可以肯定的是,人工智能將改變工作的性質(zhì),唯一的問題是自動(dòng)化將如何快速和深刻地改變工作場所。
人工智能在各個(gè)領(lǐng)域都具有影響呼。正如人工智能專家Andrew Ng所說:“很多人都在做常規(guī)的重復(fù)性工作。不幸的是,技術(shù)尤其擅長于自動(dòng)化日常的重復(fù)性工作。因此未來幾十年技術(shù)失業(yè)的風(fēng)險(xiǎn)很大。”
有證據(jù)表明哪些工作崗位將被取代。美國現(xiàn)在有27家Amazon Go無需收銀臺的超市,顧客只需從貨架上取下商品走出店門就可以完成交易。這對美國300多萬收銀員意味著什么還有待觀察。亞馬遜公司在使用機(jī)器人提高倉庫效率方面處于領(lǐng)先地位。這些機(jī)器人將貨架的物品運(yùn)送給揀貨人員,揀貨人員選擇要發(fā)送的物品。亞馬遜公司在其運(yùn)營中心擁有超過20萬個(gè)機(jī)器人,并計(jì)劃增加更多機(jī)器人。但是亞馬遜公司還強(qiáng)調(diào),隨著機(jī)器人數(shù)量的增長,這些倉庫中的工作人員也隨之增加。但是,亞馬遜和小型機(jī)器人公司正在努力使倉庫中剩余的體力勞動(dòng)實(shí)施自動(dòng)化,因此,體力勞動(dòng)和機(jī)器人勞動(dòng)將繼續(xù)齊頭并進(jìn)并不是假設(shè)。
全自動(dòng)無人駕駛汽車現(xiàn)在還沒有成為現(xiàn)實(shí),但根據(jù)一些預(yù)測,即使不考慮對快遞員和出租車司機(jī)的影響,僅自動(dòng)駕駛卡車行業(yè)就可能在未來十年內(nèi)替代170萬個(gè)工作崗位。
然而,一些容易實(shí)現(xiàn)自動(dòng)化的工作甚至不需要機(jī)器人技術(shù)。目前有數(shù)以百萬計(jì)的人從事行政工作,在系統(tǒng)之間輸入和復(fù)制數(shù)據(jù),追蹤和預(yù)訂公司的約會。隨著軟件能夠更好地自動(dòng)更新系統(tǒng)并標(biāo)記重要信息,因此對管理員的需求將下降。
與每項(xiàng)技術(shù)變革一樣,人工智能將創(chuàng)造新的工作崗位來替代失去的工作崗位。但是,不確定的是這些新角色是否會迅速為失業(yè)者提供就業(yè)機(jī)會,以及這些失業(yè)者是否具有必要的技能或能力來填補(bǔ)這些新興角色。
并非每個(gè)人都是悲觀主義者。對于某些人來說,人工智能是一種可以提高工作能力而不是替代工作人員的技術(shù)。不僅如此,而且他們認(rèn)為沒有必要采用人工智能,因?yàn)槿斯ぶ悄茌o助工作人員比人工智能系統(tǒng)工作效率更高或更有效,因?yàn)樗麄兛梢栽谌斯ぶ悄芟到y(tǒng)提出要求之前,準(zhǔn)確地告訴他們客戶想要什么。人工智能專家關(guān)于人工智能系統(tǒng)將以多快的速度超越人類的能力有著廣泛的看法。
牛津大學(xué)人類未來研究所邀請了幾百位機(jī)器學(xué)習(xí)專家來預(yù)測未來幾十年人工智能的能力。
他們總結(jié)出來的未來值得注意的事項(xiàng)包括:到2026年,人工智能撰寫的文章將被認(rèn)為是人類所寫的文章、2027年卡車司機(jī)被大量裁員、2031年人工智能在零售業(yè)超過人類能力、人工智能將在2049年寫出暢銷書,到2053年人工智能將完成外科醫(yī)生的工作。
他們估計(jì)人工智能在45年內(nèi)擊敗人類完成所有任務(wù)的可能性相對較高,在120年內(nèi)實(shí)現(xiàn)所有人類工作的自動(dòng)化。
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。