大數據和人工智能到底是什么關系?這是現在的熱門話題。
大數據和人工智能的關系,首先要說什么是大數據。這些年來,大數據先是被神化,繼而又被妖魔化,到了今天,其實誰也不知道別人所謂的大數據指的是什么。有時候大數據的定義里既有平臺(硬件)又有分析技術。但為了說清楚大數據和人工智能的關系,我們還是回歸大數據的本質:海量的、多維度、多形式的數據。
任何智能的發展,其實都需要一個學習的過程。而近期人工智能之所以能取得突飛猛進的進展,不能不說是因為這些年來大數據長足發展的結果。正是由于各類感應器和數據采集技術的發展,我們開始擁有以往難以想象的海量數據,同時,也開始在某一領域擁有深度的、細致的數據。而這些,都是訓練某一領域“智能”的前提。
如果我們把人工智能看成一個嗷嗷待哺擁有無限潛力的嬰兒,某一領域專業的海量的深度的數據就是喂養這個天才的奶粉。奶粉的數量決定了嬰兒是否能長大,而奶粉的質量則決定了嬰兒后續的智力發育水平。
與以前的眾多數據分析技術相比,人工智能技術立足于神經網絡,同時發展出多層神經網絡,從而可以進行深度機器學習。與以往傳統的算法相比,這一算法并無多余的假設前提(比如線性建模需要假設數據之間的線性關系),而是完全利用輸入的數據自行模擬和構建相應的模型結構。這一算法特點決定了它是更為靈活的、且可以根據不同的訓練數據而擁有自優化的能力。
但這一顯著的優點帶來的便是顯著增加的運算量。在計算機運算能力取得突破以前,這樣的算法幾乎沒有實際應用的價值。大概十幾年前,我們嘗試用神經網絡運算一組并不海量的數據,整整等待三天都不一定會有結果。但今天的情況卻大大不同了。高速并行運算、海量數據、更優化的算法共同促成了人工智能發展的突破。
這一突破,如果我們在三十年以后回頭來看,將會是不弱于互聯網對人類產生深遠影響的另一項技術,它所釋放的力量將再次徹底改變我們的生活。