隨著巨量數據時代來臨,大數據一詞已經十分普及,甚至有些被濫用的趨勢。在這個時代,切身體會到「大數據」貨真價實的存在、以及解讀大數據的潛力成為我們的重要課題。
在此整理了 25 個所謂的「大數據現象」及「大數據事實」(Big Data fun facts)并附上數據來源供大家參考,看完你將會對大數據有多「大」有更清楚的認知,而且也對大數據的潛力及它帶來的改變有更深一層的解讀。
我們現在每兩天產生的數據量是相當于過去到 2003 年為止累積的數據量。
根據 IDC,現今世界上 90% 的數據量是在過去兩年多里所產生的。
根據 UCSD 的研究調查,2008 年光美國居民就生產了 3.6 ZB 的數據量。
2016 年的網絡流量將會到達 1.3 ZB(Zettabyte = 10^21 bytes)。
根據 IDC 跟 EMC 的研究分析,估計了 2020 年時,數碼數據量將會從 3.2 ZB 成長到 40 ZB。
企業所獲取且儲存的數據量每 1.2 年就雙倍成長。
每分鐘世界上有近 2 億封 E-mail 被寄出,也就是每天 2470 億封 E-mail,不過其中 80% 是垃圾信件。
每分鐘 Youtube 影片被上傳超過 100 個小時,而且每天上傳的影片量要花你 15 年的時間來看完。
如果我們將一天內產生的數據全部燒錄進 DVD 光碟內,那這些光碟疊起來可以搭成地表到月球的 DVD 高塔,而且還是「雙塔」。
每天每分鐘有約 570 個新網站出現。
大數據飛快成長,到 2015 年,為了處理大數據,全球多出了 4.4 百萬個 IT 職位,也因此這方面的專業人士缺口,各行各業都在搶奪大數據專家 >> 還沒決定未來方向的學子們不妨考慮這個領域。
根據 McKinsey Global Institute 的數據,到 2018 年時,美國地區將面臨 14 萬到 19 萬的大數據專業人才短缺,以及 1 百 50 萬個擁有洞察大數據的能力、因而做出好的企業決策管理階層人才。
目前世界各地的數據中心(超過 50 萬個)加起來相當于 6000 個足球場的大小。
從 2012 年到 2014 年,行動裝置上傳輸的數據量成長了 81%,達到 1.5 Exabytes (Exabytes = 10^18 bytes),其中 53% 來自影音數據。
NSA 每天得分析 1.6 % 的全球網絡數據量 —— 約 30 PB (Petabytes = 10^15 bytes)。
Hadoop 被公認為大數據主流技術(請參考文章:認識大數據的黃色小象幫手 –– Hadoop),根據市場研究機構 Allied Market Research,Hadoop 市場價值從 2013 年 20 億,估計到了 2020 年時會飆漲到 500 億。
根據 IDC 的分析,2008 年時數碼數據量就超過了目前已知的宇宙內星星數量,而且以數據成長的速度,2023 年時全球數據量將會超過亞佛加厥常數(Avogadro's number)—— 也就是 6.022 × 10^23。
由于物聯網的蓬勃發展,智慧型裝置的數量將會從現在到 2020 年將從 130 億成長到 500 億。
在加州及一些其他地區,大數據已經被用來建立模式、預測犯罪,而且比現今的其他預測技術來得準確。(有興趣請參考相關文章:英美城市用大數據,揪出未知的細菌、罪犯與惡棍交易員)
根據 Tata Consultancy Services Limited(TCS)在 2013 年發表的研究,各企業的數據里 51% 是結構化數據、27% 是非結構化數據、21% 是半結構化數據。
有將近 75% 的企業表示將逐漸增加對大數據的投資。
根據 CIO 的報告,38% 的機構根本不知道大數據是什么,27% 的機構對大數據則是一知半解。
根據 EMC2 的報告,25% 的企業已經有聘請數據科學家,24% 的企業正在使用大數據分析工具,57% 的企業則在慎重考慮采用大數據分析工具。
如果大數據能善加利用在醫療領域,以美國地區為例,將會減少 8% 的醫療開銷并省下 3000 億美元。
最近幾年來,已經有 5 億美元的風險投資基金注入大數據科技公司里。
原文鏈接:http://www.thebigdata.cn/YingYongAnLi/14199.html