人工智能和大數(shù)據(jù)是人們耳熟能詳?shù)牧餍行g(shù)語,但也可能會有一些混淆。人工智能和大數(shù)據(jù)有什么相似之處和不同之處?它們有什么共同點嗎?它們是否相似?能進行有效的比較嗎?
這兩種技術(shù)所具有的一個共同點是興趣。NewVantage Partners公司對企業(yè)管理人員進行的大數(shù)據(jù)和人工智能調(diào)查發(fā)現(xiàn),97.2%的企業(yè)高管表示他們的公司正在投資、構(gòu)建或啟動大數(shù)據(jù)和人工智能計劃。
更重要的是,76.5%的企業(yè)高管認(rèn)為人工智能和大數(shù)據(jù)密切相關(guān),數(shù)據(jù)的更大可用性正在增強其組織內(nèi)的人工智能和認(rèn)知。
有人認(rèn)為將人工智能與大數(shù)據(jù)結(jié)合在一起是一個很自然的錯誤,其部分原因是兩者實際上是一致的。但它們是完成相同任務(wù)的不同工具。但首先要做的事是先弄清二者的定義。很多人并不知道這些。
咨詢巨頭PriceWaterhouse Coopers公司的高級研究員Alan Morrison說:“我發(fā)現(xiàn)很多人對真正的大數(shù)據(jù)或大數(shù)據(jù)分析并不太了解,或者只是以幾個突出的例子來了解人工智能。”
人工智能與大數(shù)據(jù)的區(qū)別
他說,人工智能與大數(shù)據(jù)一個主要的區(qū)別是大數(shù)據(jù)是需要在數(shù)據(jù)變得有用之前進行清理、結(jié)構(gòu)化和集成的原始輸入,而人工智能則是輸出,即處理數(shù)據(jù)產(chǎn)生的智能。這使得兩者有著本質(zhì)上的不同。
人工智能是一種計算形式,它允許機器執(zhí)行認(rèn)知功能,例如對輸入起作用或作出反應(yīng),類似于人類的做法。傳統(tǒng)的計算應(yīng)用程序也會對數(shù)據(jù)做出反應(yīng),但反應(yīng)和響應(yīng)都必須采用人工編碼。如果出現(xiàn)任何類型的差錯,就像意外的結(jié)果一樣,應(yīng)用程序無法做出反應(yīng)。而人工智能系統(tǒng)不斷改變它們的行為,以適應(yīng)調(diào)查結(jié)果的變化并修改它們的反應(yīng)。
支持人工智能的機器旨在分析和解釋數(shù)據(jù),然后根據(jù)這些解釋解決問題。通過機器學(xué)習(xí),計算機會學(xué)習(xí)一次如何對某個結(jié)果采取行動或做出反應(yīng),并在未來知道采取相同的行動。
大數(shù)據(jù)是一種傳統(tǒng)計算。它不會根據(jù)結(jié)果采取行動,而只是尋找結(jié)果。它定義了非常大的數(shù)據(jù)集,但也可以是極其多樣的數(shù)據(jù)。在大數(shù)據(jù)集中,可以存在結(jié)構(gòu)化數(shù)據(jù),如關(guān)系數(shù)據(jù)庫中的事務(wù)數(shù)據(jù),以及結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù),例如圖像、電子郵件數(shù)據(jù)、傳感器數(shù)據(jù)等。
它們在使用上也有差異。大數(shù)據(jù)主要是為了獲得洞察力,例如Netflix網(wǎng)站可以根據(jù)人們觀看的內(nèi)容了解電影或電視節(jié)目,并向觀眾推薦哪些內(nèi)容。因為它考慮了客戶的習(xí)慣以及他們喜歡的內(nèi)容,推斷出客戶可能會有同樣的感覺。
人工智能是關(guān)于決策和學(xué)習(xí)做出更好的決定。無論是自我調(diào)整軟件、自動駕駛汽車還是檢查醫(yī)學(xué)樣本,人工智能都會在人類之前完成相同的任務(wù),但速度更快,錯誤更少。
人工智能和大數(shù)據(jù)協(xié)同工作
雖然它們有很大的區(qū)別,但人工智能和大數(shù)據(jù)仍然能夠很好地協(xié)同工作。這是因為人工智能需要數(shù)據(jù)來建立其智能,特別是機器學(xué)習(xí)。例如,機器學(xué)習(xí)圖像識別應(yīng)用程序可以查看數(shù)以萬計的飛機圖像,以了解飛機的構(gòu)成,以便將來能夠識別出它們。
當(dāng)然,這是數(shù)據(jù)準(zhǔn)備的重要步驟,Morrison指出,“人們開始使用的數(shù)據(jù)是大數(shù)據(jù),但是為了訓(xùn)練模型,數(shù)據(jù)需要結(jié)構(gòu)化和集成到足夠好的程度,以便機器能夠可靠地識別數(shù)據(jù)中的有用模式。”
大數(shù)據(jù)提供了大量的數(shù)據(jù),而有用的數(shù)據(jù)必須首先從大量繁雜的數(shù)據(jù)中心分離出來,然后再做任何事情。人工智能和機器學(xué)習(xí)中使用的數(shù)據(jù)已經(jīng)被“清理”了,無關(guān)的、重復(fù)的和不必要的數(shù)據(jù)已經(jīng)被清除。所以這是第一步。
在此之后,人工智能可以蓬勃發(fā)展。大數(shù)據(jù)可以提供訓(xùn)練學(xué)習(xí)算法所需的數(shù)據(jù)。有兩種類型的數(shù)據(jù)學(xué)習(xí):初始培訓(xùn)可以定期收集數(shù)據(jù)。人工智能應(yīng)用程序一旦完成最初的培訓(xùn),并不會停止學(xué)習(xí)。隨著數(shù)據(jù)的變化,它們將繼續(xù)接收新數(shù)據(jù),并調(diào)整它們的行動。因此,數(shù)據(jù)是最初的和持續(xù)的。
這兩種計算方式都使用模式識別,但方式有所不同。大數(shù)據(jù)分析通過順序分析來找到模式,有時候是冷數(shù)據(jù),或者是沒有收集到的數(shù)據(jù)。Hadoop是大數(shù)據(jù)分析的基本框架,它是最初設(shè)計用于在低服務(wù)器利用率的夜間運行的批處理過程。
機器學(xué)習(xí)從收集的數(shù)據(jù)中學(xué)習(xí)并不斷收集。例如,自動駕駛汽車從未停止收集數(shù)據(jù),并且不斷學(xué)習(xí)和磨練其流程。數(shù)據(jù)總是以新鮮的方式出現(xiàn)并始終采取行動進行處理。
大數(shù)據(jù)在人工智能中的作用
人工智能一直在被人們關(guān)注。很多人對1999年推出的一部電影“黑客帝國”的情節(jié)記憶猶新,人類與那些變得聰明的機器殊死搏斗。但在現(xiàn)實的實施過程中,人工智能直到最近一直是邊緣技術(shù)。
人工智能實現(xiàn)最大的飛躍是大規(guī)模并行處理器的出現(xiàn),特別是GPU,它是具有數(shù)千個內(nèi)核的大規(guī)模并行處理單元,而不是CPU中的幾十個并行處理單元。這大大加快了現(xiàn)有的人工智能算法的速度,現(xiàn)在已經(jīng)使它們可行。
大數(shù)據(jù)可以采用這些處理器,機器學(xué)習(xí)算法可以學(xué)習(xí)如何重現(xiàn)某種行為,包括收集數(shù)據(jù)以加速機器。人工智能不會像人類那樣推斷出結(jié)論。它通過試驗和錯誤學(xué)習(xí),這需要大量的數(shù)據(jù)來教授和培訓(xùn)人工智能。
人工智能應(yīng)用的數(shù)據(jù)越多,其獲得的結(jié)果就越準(zhǔn)確。在過去,人工智能由于處理器速度慢、數(shù)據(jù)量小而不能很好地工作。也沒有像當(dāng)今先進的傳感器,并且當(dāng)時互聯(lián)網(wǎng)還沒有廣泛使用,所以很難提供實時數(shù)據(jù)。
如今,人們擁有所需要的一切:快速的處理器、輸入設(shè)備、網(wǎng)絡(luò)和大量的數(shù)據(jù)集。毫無疑問,沒有大數(shù)據(jù)就沒有人工智能。