隨著云時代的來臨,大數(shù)據(Big data)也吸引了越來越多的關注。大數(shù)據分析常和云計算聯(lián)系到一起,因為實時的大型數(shù)據集分析需要像MapReduce一樣的框架來向數(shù)十、數(shù)百或甚至數(shù)千的電腦分配工作。下文是中國報告大廳小編整理的大數(shù)據行業(yè)的定義及用途分析。
大數(shù)據的定義
對于“大數(shù)據”(Big data)研究機構Gartner給出了這樣的定義。“大數(shù)據”是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產。
根據維基百科的定義,大數(shù)據是指無法在可承受的時間范圍內用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據集合。
大數(shù)據技術的戰(zhàn)略意義不在于掌握龐大的數(shù)據信息,而在于對這些含有意義的數(shù)據進行專業(yè)化處理。換言之,如果把大數(shù)據比作一種產業(yè),那么這種產業(yè)實現(xiàn)盈利的關鍵,在于提高對數(shù)據的“加工能力”,通過“加工”實現(xiàn)數(shù)據的“增值”。
從技術上看,大數(shù)據與云計算的關系就像一枚硬幣的正反面一樣密不可分。大數(shù)據必然無法用單臺的計算機進行處理,必須采用分布式架構。據宇博智業(yè)市場研究中心撰寫的大數(shù)據行業(yè)市場調查分析報告顯示,大數(shù)據它的特色在于對海量數(shù)據進行分布式數(shù)據挖掘,但它必須依托云計算的分布式處理、分布式數(shù)據庫和云存儲、虛擬化技術。
大數(shù)據需要特殊的技術,以有效地處理大量的容忍經過時間內的數(shù)據。適用于大數(shù)據的技術,包括大規(guī)模并行處理(MPP)數(shù)據庫、數(shù)據挖掘電網、分布式文件系統(tǒng)、分布式數(shù)據庫、云計算平臺、互聯(lián)網和可擴展的存儲系統(tǒng)。
大數(shù)據的用途分析
大數(shù)據可分成大數(shù)據技術、大數(shù)據工程、大數(shù)據科學和大數(shù)據應用等領域。目前人們談論最多的是大數(shù)據技術和大數(shù)據應用。工程和科學問題尚未被重視。大數(shù)據工程指大數(shù)據的規(guī)劃建設運營管理的系統(tǒng)工程;大數(shù)據科學關注大數(shù)據網絡發(fā)展和運營過程中發(fā)現(xiàn)和驗證大數(shù)據的規(guī)律及其與自然和社會活動之間的關系。
物聯(lián)網、云計算、移動互聯(lián)網、車聯(lián)網、手機、平板電腦、PC以及遍布地球各個角落的各種各樣的傳感器,無一不是數(shù)據來源或者承載的方式。
有些例子包括網絡日志,RFID,傳感器網絡,社會網絡,社會數(shù)據(由于數(shù)據革命的社會),互聯(lián)網文本和文件;互聯(lián)網搜索索引;呼叫詳細記錄,天文學,大氣科學,基因組學,生物地球化學,生物,和其他復雜和/或跨學科的科研,軍事偵察,醫(yī)療記錄;攝影檔案館視頻檔案;和大規(guī)模的電子商務。