云計算和遠程技術通常是大多數企業進行數據備份的解決方案。企業可以將數據推送到遠程、非現場服務器或數據中心,在那里它可以安全地受到保護,并在相當長的時間內保存,從而使本地存儲空間可以容納更多數據。
這正是亞馬遜Snowball數據傳輸設備所需要做的工作。企業可以將敏感數據復制到Snowball便攜式存儲硬件上,然后將其傳輸到亞馬遜的數據存儲中心。
很明顯,對于像Snowball這樣的設備必須處理不斷變化的大量數據。特別是考慮到攜帶Snowball設備的載貨卡車可以容納亞歷山大圖書館數據資料的五百萬倍。
亞歷山大圖書館是現存最著名的圖書館之一,其中包括古典文物的許多文本和閱讀材料。幸存的古典書籍總數超過20萬冊。更進一步說,全球互聯網每天生成超過2.5艾字節的數據。而迅速發展的物聯網和智能家居技術等現代技術讓這一數字令人印象深刻。
讓人驚奇的是,企業或服務提供商產生了多少數據?這些數據看起來是什么樣的,有什么可比性?以下是全球最大的四家科技公司的統計數據。
谷歌:每秒40,000次谷歌網頁搜索
目前全球37億人經常訪問和使用互聯網,而谷歌公司將處理每秒大約40,000次的網絡搜索,而這僅僅在谷歌公司的網頁上。
此外,超過一半的網絡搜索都是在移動設備上進行的。隨著越來越多的人在全球范圍內使用移動設備,網絡搜索總量將會繼續增長。
Facebook:每天500TB字節
2012年,Facebook公司系統每天產生25億條內容和超過500TB的數據。還有無數的照片和數據。其數據相當巨大,而且隨著時間的推移而增長。
如今,Facebook平臺上有20億個活躍用戶,并且數量巨大,使其成為現存最大的社交媒體平臺。每天大約有15億人在網絡上活動,所有人都在生成數據和內容。每秒有五個新用戶加入Facebook,并且每秒超過3億張照片上傳。
Twitter:每天12TB字節
很多人認為140個字符的消息不會包含大量數據,但事實證明Twitter社區每天將會產生超過12TB的數據。這相當于每周84TB字節或者每年4.3PB字節的數據,對于像網絡上共享的那些具有字符限制的短消息,比如那些在網絡上共享的消息。
亞馬遜:每分鐘銷售額258,751.90美元
亞馬遜公司生成的數據是雙重的。主要零售商正在收集和處理有關其常規零售業務的數據,其中包括客戶偏好和購物習慣。但同樣重要的是要記住亞馬遜為企業界提供了云存儲機會。亞馬遜S3在公司處理的所有其他方面,提供全面的云存儲解決方案,也促進了海量數據庫的傳輸和存儲。因此,很難真正確定亞馬遜公司總共生成多少數據。
相反,最好了解一下亞馬遜公司與數據處理和存儲直接相關的企業收入。該公司每分鐘的銷售和服務費用超過258,751.90美元。
一般統計:每分鐘評級
以下是各種社交網絡的每分鐘評級:
•Snapchat:用戶共享了527,760張照片
•LinkedIn:超過120名專業人士加入該網絡
•YouTube:觀看了4,146,600個視頻
•Twitter:發送或創建了456,000條推文
•Instagram:上傳了46,740張照片
•Netflix:觀看了69,444小時的視頻
•Giphy:提供694,444個GIF圖片
•Tumblr:發布了74,220篇帖子
•Skype:用戶撥打了154,200個電話
看看這些數字,很明顯這些平臺的數據量到底是多少。同樣重要的是要記住,這些廠商成為了少數利用當前市場中客戶和使用數據的公司。
甚至還有一些影響因素,比如微軟、Pinterest,甚至谷歌公司的其他平臺,如Gmail,Hangouts或Google Docs。
數據生成每天都在加速
與這些統計數據和數字相比,可能會帶來更大的沖擊是,即人們擁有的所有數據中的90%是在過去兩年內產生的。這相當于過去兩年每天創建的2.5艾字節的數據。
在過去幾年里,人們創造了天文數字般的數據量。那么這到底有多瘋狂?隨著人們要用更多技術并調整現有技術(如物聯網、人工智能和機器學習),數據生成將繼續增長。當然,加速增長也意味著帶來了更多的創新用途、平臺和渠道。
諸如無人駕駛車輛、自動化制造硬件、智能家居設備甚至辦公硬件等技術都將有助于數據的加速生成。人們需要一個地方來存儲、處理和分析它的方法以及大量的平臺來利用它。例如,無人駕駛車輛將需要利用進來的數據為車主提供安全可靠的駕駛。