大數據其實就是一些數據的集合,但這樣的數據卻不是一般的數據,而是指無法在可承受的時空范圍內,使用一些常規計算機軟件工具,對其進行捕捉或是管理以及處理的數據集合。說到底,大數據就是海量數據的大集合。
維克多.邁爾-舍恩伯格和肯尼斯.庫克耶兩人,在他們所編寫的《大數據時代》一書中,對大數據是做這樣闡述的。他們說大數據就是指不用隨機分析法這樣的捷徑,而是要采用對所有數據都需要進行分析和處理。
大數據所隱含的特點
有人將大數據的特點概括為5V,即大量(Volume)或是高速(Velocity)以及多樣(Variety),還有價值(Value)以及真實性(Veracity)。其實,這正是巧合了大數據這些特點的英文書寫方式的第一個英文字母都是V。但這5V也確實是道出了大數據其本身所蘊含的內部特點,也正是大數據有5V這樣的特點,才使得大數據有了難以琢磨的味道。大數據被列為是一種新興的科學,其利用價值很為廣泛。因為人們已經充分意識到大數據并不是簡單的一組組數據了,而是一種數據信息資產。
大數據是一種數據信息資產
大數據的研究機構,它們對大數據的理解是這樣的。它們認為大數據是需要通過新處理模式才可具有更為強大的決策力或是洞察發現力以及流程優化能力的海量或是高增長率以及多樣化的信息資產。但有的科學研究機構,如麥肯錫全球研究所又是對大數據做這樣解釋的,大數據是規模大到在獲取大數據或是存儲大數據以及管理大數據,還有分析大數據方面都遠遠超過了以往計算機中那些傳統數據庫軟件工具能力范圍的數據集合。
大數據就是一種海量數據的集合,它的規模已經大到超乎人們所想象的范圍,是要多大就有多大,甚或是無限大。不過,大數據具有快速流轉的特性,如果不用正確的捕捉方式,在一般情況下,都難以捕捉到那些海量般的大數據。不過,不是所有海量數據都需要進行捕捉,因為大數據的無限海量,總有捕捉不到的數據現象存在。