“大數據”是近年來IT行業的熱詞,大數據在各個行業的應用逐漸變得廣泛起來。那么,什么是大數據?大數據時代怎么理解呢?
大數據的定義:大數據,又稱巨量資料,指的是所涉及的數據資料量規模巨大到無法通過人腦甚至主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策更積極目的的資訊。
大數據的特點:數據量大、數據種類多、要求實時性強、數據所蘊藏的價值大。在各行各業均存在大數據,但是眾多的信息和咨詢是紛繁復雜的,我們需要搜索、處理、分析、歸納、總結其深層次的規律。
大數據的采集:科學技術及互聯網的發展,推動著大數據時代的來臨,各行各業每天都在產生數量巨大的數據碎片,數據計量單位已從從Byte、KB、MB、 GB、TB發展到PB、EB、ZB、YB甚至BB、NB、DB來衡量。大數據時代數據的采集也不再是技術問題,只是面對如此眾多的數據,我們怎樣才能找到其內在規律。
大數據的挖掘和處理:大數據必然無法用人腦來推算、估測,或者用單臺的計算機進行處理,必須采用分布式計算架構,依托云計算的分布式處理、分布式數據庫、云存儲和虛擬化技術,因此,大數據的挖掘和處理必須用到云技術。