聊完大數(shù)據(jù)概念,我們再來談?wù)劥髷?shù)據(jù)應(yīng)用
近些年,大數(shù)據(jù)概念不斷被提起,各種媒體也開始持續(xù)報道,各種消息中透露出一個現(xiàn)象,一個全新的時代已經(jīng)到來——大數(shù)據(jù)時代。對于從事互聯(lián)網(wǎng)或者信息行業(yè)的從業(yè)人員來說,他們對于大數(shù)據(jù)的了解肯定是比較透徹,比較全面,可是對于廣大普通群眾而言,大數(shù)據(jù)在心中還只是一個新的詞匯,它到底代表什么,有什么價值,到底有多大,有可能還都是一頭霧水,那我們就簡單的一起來解讀一下大數(shù)據(jù)。
1.大數(shù)據(jù)產(chǎn)生的背景
進(jìn)入2012年,大數(shù)據(jù)一詞已經(jīng)越來越多地被提及,我們用它來描述和定義信息爆炸時代產(chǎn)生的海量數(shù)據(jù),并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新。作為信息高速發(fā)展下的產(chǎn)物,大數(shù)據(jù)已經(jīng)被《紐約時報》《華爾街日報》這樣權(quán)威的財經(jīng)雜志在封面專欄報道,而且還進(jìn)入美國白宮官網(wǎng)的新聞,現(xiàn)身在國內(nèi)一些互聯(lián)網(wǎng)主題的講座沙龍中,甚至被嗅覺靈敏的證券公司寫進(jìn)了投資推薦報告,可見它的高人氣背后的超強影響力。
最早提出“大數(shù)據(jù)”時代到來的是全球知名咨詢公司麥肯錫,麥肯錫稱:“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對于海量數(shù)據(jù)的挖掘和運用,預(yù)示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來。” “大數(shù)據(jù)”在物理學(xué)、生物學(xué)、環(huán)境生態(tài)學(xué)等領(lǐng)域以及軍事、金融、通訊等行業(yè)存在已有時日,卻因為近年來互聯(lián)網(wǎng)和信息行業(yè)的發(fā)展而引起人們關(guān)注。
2.大數(shù)據(jù)到底是什么
對于“大數(shù)據(jù)”,研究機構(gòu)Gartner給出了這樣的定義。“大數(shù)據(jù)”是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。維基百科的定義,大數(shù)據(jù)是指無法在可承受的時間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合。簡單來說,大數(shù)據(jù)具有4個特點特點:大量、高速、多樣、價值。
從技術(shù)上看,大數(shù)據(jù)與云計算的關(guān)系就像一枚硬幣的正反面一樣密不可分。大數(shù)據(jù)必然無法用單臺的計算機進(jìn)行處理,必須采用分布式架構(gòu)。它的特色在于對海量數(shù)據(jù)進(jìn)行分布式數(shù)據(jù)挖掘,但它必須依托云計算的分布式處理、分布式數(shù)據(jù)庫和云存儲、虛擬化技術(shù)。隨著云時代的來臨,大數(shù)據(jù)也吸引了越來越多的關(guān)注。
3.大數(shù)據(jù)的應(yīng)用價值
大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進(jìn)行專業(yè)化處理。換言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實現(xiàn)盈利的關(guān)鍵,在于提高對數(shù)據(jù)的“加工能力”,通過“加工”實現(xiàn)數(shù)據(jù)的“增值”。
大數(shù)據(jù)的應(yīng)用其實早已滲透到人們生活中的方方面面:淘寶網(wǎng)運用大數(shù)據(jù)為客戶推薦商品信息,阿里巴巴用大數(shù)據(jù)成立了小微金融服務(wù)集團(tuán),而谷歌更是計劃用大數(shù)據(jù)來接管世界。當(dāng)下,很多行業(yè)都開始增加對大數(shù)據(jù)的需求。大數(shù)據(jù)時代不僅處理著海量的數(shù)據(jù),同時也加工、傳播、分享它們。不知不覺中,數(shù)據(jù)可視化已經(jīng)遍布我們生活的每一個角落,畢竟普通用戶往往更關(guān)心結(jié)果的展示。百度地圖采用LBS定位春運的可視化大數(shù)據(jù),就引起了各界對新聞創(chuàng)新和大數(shù)據(jù)可視化的熱議。
數(shù)據(jù)可視化起源于1960年計算機圖形學(xué),那時候人們使用計算機創(chuàng)建圖形圖表,可視化提取出來的數(shù)據(jù),可以將數(shù)據(jù)的各種屬性和變量呈現(xiàn)出來。隨著計算機硬件的發(fā)展,人們創(chuàng)建更復(fù)雜規(guī)模更大的數(shù)字模型,于是乎發(fā)展了數(shù)據(jù)采集設(shè)備和數(shù)據(jù)保存設(shè)備,而此時也需要更高級的計算機圖形學(xué)技術(shù)及方法來創(chuàng)建這些規(guī)模龐大的數(shù)據(jù)集。隨著數(shù)據(jù)可視化平臺的拓展,應(yīng)用領(lǐng)域的增加,表現(xiàn)形式的不斷變化,以及增加了諸如實時動態(tài)效果、用戶交互使用等,數(shù)據(jù)可視化像所有新興概念一樣邊界不斷擴(kuò)大。
大數(shù)據(jù)時代到來,我們每個人,生活的各行各業(yè)都在直接或者間接享受這大數(shù)據(jù)技術(shù)帶來的便捷,隨著大數(shù)據(jù)技術(shù)日益發(fā)展和成熟,未來,必將帶領(lǐng)我們進(jìn)入一個數(shù)字化、智能化的新世界。