人工智能這幾年有了這么大的突破,其中一個重要的推動力就是大數(shù)據(jù)。在大數(shù)據(jù)這個概念出現(xiàn)之前計算機并不能很好的解決需要人去做判別的一些問題。所以說如今的人工智能不如說是數(shù)據(jù)智能,人工智能其實就是用大量的數(shù)據(jù)作導(dǎo)向,讓需要機器來做判別的問題最終轉(zhuǎn)化為數(shù)據(jù)問題。
技術(shù)型的高科技創(chuàng)業(yè)公司都喜歡特別的新東西,大數(shù)據(jù)與幾年前的火熱相比,近幾年關(guān)注程度略有下降。大數(shù)據(jù)這個概念興起是在2011年至2014年期間,早年的大數(shù)據(jù)是在大型互聯(lián)網(wǎng)公司中重度使用和推動的技術(shù),這些大公司面對著前所未有的數(shù)據(jù)量,需要采集數(shù)據(jù),存儲數(shù)據(jù),清理數(shù)據(jù),查詢數(shù)據(jù),分析數(shù)據(jù),可視化數(shù)據(jù)。而這部分有些由產(chǎn)品來完成,有些由人力來完成,歸根結(jié)底,對于這一切工作,都需要建立一個數(shù)據(jù)驅(qū)動的文化。
大數(shù)據(jù)的價值
沒有數(shù)據(jù)支撐的個例沒有任何參考意義
在穩(wěn)定收入的人群里,大約三到五成的人在炒股,據(jù)統(tǒng)計,95%的個人投資最終跑不贏大盤,50-70%的頻繁短線交易中甚至在虧錢。那么他們?yōu)槭裁催€要炒股,一方面是對自己的炒股能力的自信,另一方面看到周邊賺錢的個例,讓他們覺得炒股賺錢很容易,但是只要看看統(tǒng)計數(shù)據(jù),就會得到相反的結(jié)論。
大量數(shù)據(jù)的意義
2005年,第一次做機器翻譯的Google請來了機器翻譯專家弗朗茲.奧科,一年之后做出了當(dāng)時世界上最好的機器翻譯系統(tǒng),在NIST的年度評審結(jié)果中,Google的BLEU得分51%,領(lǐng)先第二名5%,而基于語法規(guī)則翻譯的SYSTRAN僅為10.79%。奧科的秘訣卻還是兩年前的方法,利用了比其他研究機構(gòu)多幾千甚至上萬倍的數(shù)據(jù),訓(xùn)練出一個六元模型。一般來說,要估計N元模型的各個條件概率,要有足夠多的數(shù)據(jù),N越大,數(shù)據(jù)要越多。如果多使用兩三倍的數(shù)據(jù),機器翻譯效果會好一點,但是幾萬倍的數(shù)據(jù)增加,量變的積累導(dǎo)致質(zhì)變,就能達到更好的效果。
大數(shù)據(jù)的重要性
在醫(yī)療保健里面,基因的缺陷和很多疾病都有關(guān)系,要想搞清楚其中的關(guān)系: 傳統(tǒng)的方法是通過實驗才能清楚某一段基因的機理,但這可能是個漫長的過程。還需要考慮到它的缺陷帶來的身體的變化,再研究這種變化可能導(dǎo)致的疾病,或者什么情況下會導(dǎo)致疾病。但科學(xué)家研究幾十年,都很難找到很多疾病的關(guān)系。 而數(shù)據(jù)統(tǒng)計方法與這些正好相反,可以從數(shù)據(jù)出發(fā),找到基因缺陷與疾病在統(tǒng)計上的相關(guān)性,然后再反過來分析這種相關(guān)性的內(nèi)在原因。
人工智能賦能各個行業(yè)
隨著數(shù)據(jù)的積累、計算機算力的躍升和算法的優(yōu)化,人工智能正在讓生活變得更高效。人工智能的持續(xù)進步和廣泛應(yīng)用帶來的好處是巨大的,為了讓它真正有益于社會,同樣不能忽視的還有對人工智能的價值引導(dǎo)以及倫理調(diào)節(jié)。
2020年作為一個重要的時間節(jié)點,相關(guān)機構(gòu)預(yù)測將會有500億只能設(shè)備接入互聯(lián)網(wǎng),這500億設(shè)備都具備感知通訊和一部分處理的能力,他們會時時不斷的往服務(wù)端傳數(shù)據(jù),那時人類所采集和傳輸?shù)臄?shù)據(jù)都只是其中的一小部分,而到了5G時代,數(shù)據(jù)就不光是為人服務(wù)了,也是在為物服務(wù)。人工智能也將隨著大數(shù)據(jù)的發(fā)展,將智能應(yīng)用發(fā)展得淋漓盡致,在各行各業(yè)都得到廣泛的應(yīng)用。包括智能家居,智慧金融,智能客服,智能醫(yī)療等各大領(lǐng)域。