隨著物聯(lián)網(wǎng)的發(fā)展,攝像頭、感應器等產(chǎn)品的使用,數(shù)據(jù)中心正面臨巨大挑戰(zhàn)。這些設備加起來所創(chuàng)建的數(shù)據(jù)將是前所未有的。物聯(lián)網(wǎng)和大數(shù)據(jù)將會繼續(xù)推動新的存儲技術的研發(fā)。這是正在舉行的2014年中國互聯(lián)網(wǎng)大會相關論壇提出的產(chǎn)業(yè)走勢判斷。
物聯(lián)網(wǎng)快速發(fā)展推動數(shù)據(jù)增長
“全球聯(lián)網(wǎng)設備正在迅速增長:2003年,是5億臺;2015年,將達到250億臺;到2020年,將增至500億臺;未來,人類所需的設備數(shù)將遠遠大于人口數(shù)。MB、GB、TB已經(jīng)無法滿足我們的存儲需求,社會將進入zettabyte時代,存儲空間將以PB、EB計量。”在2014年中國互聯(lián)網(wǎng)大會上HGST亞太區(qū)產(chǎn)品營銷總監(jiān)黃慶民如此表示。幾年前,一個人平均用的設備是兩臺,幾年之后預估是每一個人平均所用的設備會超過7臺,而這些設備所創(chuàng)建的數(shù)據(jù)將是前所未見的巨大。從對個人生活的改變來說,當我們在外出行辦公時,不需要拷貝一大堆文件,只需要攜帶一個移動終端即可。
七牛云存儲總裁呂桂華也表示,數(shù)據(jù)的增長、網(wǎng)絡的普及使得云服務如同空氣和水一樣成為人們生存不可或缺的部分,云服務也將成為和水力和電網(wǎng)一樣的社會基礎設施。
為什么說物聯(lián)網(wǎng)會推動數(shù)據(jù)爆炸?有兩個理由:一是移動網(wǎng)絡和智能終端的迅速普及;二是物聯(lián)網(wǎng)的快速發(fā)展對于數(shù)據(jù)處理有更高要求。
黃慶民介紹,地球上每分鐘發(fā)送電子郵件15TB;每天上傳到頂尖的社交網(wǎng)站照片1.8PB;地鐵攝像頭每分鐘可以收集1.5TB的數(shù)據(jù)。
物聯(lián)網(wǎng)已經(jīng)成為我們生活的一部分。物聯(lián)網(wǎng)的使用會持續(xù)產(chǎn)生數(shù)據(jù),例如快遞服務。智能電腦、智能手機、可穿戴設備、甚至家中的無線監(jiān)控、健身器材、智能家居、道路上的數(shù)字標牌、自動販賣機、交通攝像頭、汽車傳感器等都在每分每秒收集數(shù)據(jù)。個人的生活數(shù)據(jù)被實時收集上傳,技術的突破將使傳感器的體積越來越微型,小到可以出現(xiàn)在生活的每一個角落。傳感器像空氣一樣無處不在,個體的健康、飲食、出行、家居、購物等每一個行為將被采集,并會基于歷史數(shù)據(jù)為人們提供個性化的智能決策。
數(shù)據(jù)爆炸時代:數(shù)據(jù)生數(shù)據(jù) 數(shù)據(jù)中心超負荷
數(shù)據(jù)是未來社會的核心,人的任何行為甚至情緒都可以進行數(shù)據(jù)化管理。
呂桂華認為,數(shù)據(jù)可以分為三類:第一類是數(shù)據(jù)庫里放的數(shù)據(jù),即關系型數(shù)據(jù);第二類是日志,即你的行為軌跡,比如你在電商網(wǎng)站的登陸瀏覽以及購買記錄,這個過程被完整地記錄下來,記在日志文件中;第三類是文件型數(shù)據(jù),通俗來說,就是以文件方式存在的音頻、視頻、圖片、文檔以及其它各類二進制的文件。三種類型的數(shù)據(jù)各自所需要的計算是不同的。
呂桂華認為,海量數(shù)據(jù)的持續(xù)收集就會出現(xiàn)大數(shù)據(jù)分析以及存儲的問題,做好原始數(shù)據(jù)的管理非常重要。大數(shù)據(jù)的工作流程主要分成四個。首先是原始數(shù)據(jù)的收集,第二是原始數(shù)據(jù)的創(chuàng)建,第三和第四是做有關連接跟內(nèi)容分析。通過對于原始數(shù)據(jù)的挖掘處理會產(chǎn)生許多有價值的數(shù)據(jù),而互聯(lián)網(wǎng)連接所產(chǎn)生的互動、機器與機器間的通信,也會產(chǎn)生許多數(shù)據(jù)。所以,大數(shù)據(jù)的普遍化會導致數(shù)據(jù)中心的工作超負荷問題出現(xiàn)。
黃慶民認為,因為數(shù)據(jù)中心容量瓶頸,高容量的硬盤未來幾年會非常穩(wěn)健地成長。