大數據(big data),人們用它來描述和定義信息爆炸時代產生的海量數據,并命名與之相關的技術發展與創新。這些數據的規模是如此龐大,以至于不能用G或T來衡量,大數據的起始計量單位至少是P(1000個T)、E(100萬個T)或Z(10億個T)。所以,大數據也稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策更積極目的的資訊。大數據具有4V特點:Volume (大量)、Velocity(高速)、Variety (多樣)、Value(價值)。
最早提出大數據時代到來的是全球知名咨詢公司麥肯錫。麥肯錫稱,數據已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。人們對于海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來。大數據在物理學、生物學、環境生態學等領域以及軍事、金融、通訊等行業已經開始廣泛被應用,卻因為近年來互聯網和信息行業的發展而引起廣泛關注。現在,大數據分析常和云計算聯系到一起,實時的大型數據集分析需要向數十、數百甚至數千的電腦分配工作。