《企業(yè)網(wǎng)D1Net》5月28日訊
大數(shù)據(jù)時代下,大數(shù)據(jù)的影響無處不在,商業(yè)營銷、政府管理、公共交通、社交網(wǎng)絡(luò)、醫(yī)療健康……都打上了“大數(shù)據(jù)”的深深烙印。大數(shù)據(jù)正以迅雷不及掩耳之勢顛覆著我們的傳統(tǒng)思維。什么是大數(shù)據(jù)?大數(shù)據(jù)能為我們帶來什么?下面為您科普一下“大數(shù)據(jù)”那些事兒。
什么是大數(shù)據(jù)?
最早提出“大數(shù)據(jù)”的是全球知名咨詢公司麥肯錫。麥肯錫在其研究報告中指出,“數(shù)據(jù)已經(jīng)滲透到每一個行業(yè)和業(yè)務(wù)職能領(lǐng)域,逐漸成為重要的生產(chǎn)因素;而人們對于海量數(shù)據(jù)的運用將預(yù)示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來。”
大數(shù)據(jù)(Big data),又稱巨量資料,是指數(shù)據(jù)規(guī)模極其巨大,以致很難通過一般軟件工具加以擷取、管理、處理并整理成為有用資訊的海量數(shù)據(jù)。目前業(yè)界公認(rèn)大數(shù)據(jù)的特點有以下4個V:即Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。
第一,數(shù)據(jù)體量巨大。大數(shù)據(jù)的起始計量單位至少是P(1000個T,1T=1000G)、E(100萬個T)或Z(10億個T);第二,數(shù)據(jù)類型繁多。網(wǎng)絡(luò)日志、視頻、圖片、地理位置信息等等。第三,價值密度低,商業(yè)價值高。在數(shù)以萬計的信息中,能用的可能僅僅有幾個。第四,處理速度快,要在秒級時間范圍內(nèi)出分析結(jié)果,時間太長就失去價值了。速度要求是大數(shù)據(jù)處理技術(shù)和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)最大的區(qū)別。
大數(shù)據(jù)從何而來?
僅以互聯(lián)網(wǎng)為例,一天之中,互聯(lián)網(wǎng)產(chǎn)生的全部內(nèi)容可以刻滿1.68億張DVD;發(fā)出的郵件有2940億封之多;發(fā)出的社區(qū)帖子達(dá)200萬個,相當(dāng)于《時代》雜志770年的文字量……
根據(jù)相關(guān)統(tǒng)計,互聯(lián)網(wǎng)上的數(shù)據(jù)每年將增長50%,每兩年便將翻一番,目前世界上90%以上的數(shù)據(jù)是最近幾年才產(chǎn)生的。全世界的工業(yè)設(shè)備、汽車、電表上有著無數(shù)的數(shù)碼傳感器,隨時測量和傳遞著有關(guān)位置、運動、震動、溫度、濕度乃至空氣中化學(xué)物質(zhì)的變化,也產(chǎn)生了海量的數(shù)據(jù)信息。
物聯(lián)網(wǎng)、云計算、移動互聯(lián)網(wǎng)、車聯(lián)網(wǎng)、手機(jī)、平板電腦、PC以及各種各樣的傳感器,無一不是大數(shù)據(jù)來源或者承載的方式。
大數(shù)據(jù)如何使用?
但是,巨量資料本身其實并無多大用處。我們一般講“大數(shù)據(jù)”的時候,指的是大數(shù)據(jù)的處理和分析,大數(shù)據(jù)經(jīng)過的處理分析過濾提取以及可視化后才變得“有用”。
大數(shù)據(jù)如何使用并沒有“模式”可言。現(xiàn)在大數(shù)據(jù)的影響并不僅僅限于技術(shù)層面,它顛覆了傳統(tǒng)上我們看待世界的思維方法。海量的數(shù)據(jù)資源讓各領(lǐng)域開始了量化,決策行為由過去更多憑借經(jīng)驗和直覺做出,變成了基于數(shù)據(jù)分析做出。這就是“大數(shù)據(jù)思維”,一方面樣本來源從抽樣變成了“全部數(shù)據(jù)”樣本,另一方面是關(guān)注效率和趨勢而不是精確度,關(guān)注相關(guān)性而不是因果關(guān)系。
D1Net評論:
很多人都在談?wù)摯髷?shù)據(jù),試問,有幾人是真正了解大數(shù)據(jù)的價值所在,對于擁有大數(shù)據(jù)思維的人來說,可以將大數(shù)據(jù)的潛在價值轉(zhuǎn)化為實際利,由此可以看出,大數(shù)據(jù)的真正價值在于創(chuàng)造,在于填補無數(shù)個還未實現(xiàn)過的空白,這才是大數(shù)據(jù)的真諦所在。