當大數據充斥各種場合,從馬云到釋昭慧都侃侃而談,你還能不懂什么是大數據嗎?你也許已經聽過無數的大數據神話,但對于大數據仍停留在一知半解階段,《數位時代》專訪各大大數據專家,整理出你最應該知道的大數據。
Q:大數據是什么?
A:大數據(Big Data)又被稱為巨量數據,其概念其實就是過去10年廣泛用于企業內部的數據分析、商業智慧(Business Intelligence)和統計應用之大成。但大數據現在不只是數據處理工具,更是一種企業思維和商業模式,因為數據量急速成長、儲存設備成本下降、軟體技術進化和云端環境成熟等種種客觀條件就位,方才讓數據分析從過去的洞悉歷史進化到預測未來,甚至是破舊立新,開創從所未見的商業模式。
一般而言,大數據的定義是Volume(容量)、Velocity(速度)和Variety(多樣性),但也有人另外加上Veracity(真實性)和Value(價值)兩個V。但其實不論是幾V,大數據的數據特質和傳統數據最大的不同是,數據來源多元、種類繁多,大多是非結構化數據,而且更新速度非常快,導致數據量大增。而要用大數據創造價值,不得不注意數據的真實性。
Q:為什么需要大數據?
A:因為當從人到機器都已經被數據解構,數據不僅僅是歐巴馬口中的石油或是黃金,它更是血液,貫穿每個人一生中每個生命階段。這并非危言聳聽,更不是科幻電影,而是正在逐步成真的現實。
例如有一款叫做Ovia Fertility的App,藉由分析30萬名會員的數據,開發演算法,精準計算排卵期,提高懷孕的機率,這個App已幫助5萬名會員成功懷孕。又比如Workday推出一套軟體,預測員工的薪水漲幅和可能跳槽時間,幫助企業決定每名員工的加薪幅度、時間點和轉職時機。理財也逃不過大數據的掌控,騰訊就于年初推出第一家用大數據決定借貸與否的銀行,微眾銀行結合辨識人臉和公安部門數據,決定借貸者的信用等級。
從懷孕生子、工作到理財,大數據將全面影響每個人與每家企業。對企業而言,大數據可望提升服務品質、增加管理效率、幫助決策和創造商業模式;對一般民眾而言,大數據是另一個自我,它可能比本人更了解本人,為你預先解決每個未知,當一切都開始數據化,你能夠不需要數據嗎?
Q:大數據一定要很大嗎?
A:雖然大數據的狹義定義是,數據量要在100TB到PB之間,但其實絕大多數的企業,都不符合這個標準,大企業如eBay、亞馬遜或AT&T或許符合大數據的標準。但其實數據量只是大數據的其中一個面向,大數據揭示的是一種「數據經濟」的精神,而非只是「大」。
「大,是大數據中最無趣的部分。」企業真正要尋找的是非傳統的、而且未曾被挖掘過的數據,并且從這些數據中去提煉出價值,這才是對大數據應有的正確認知,而非只是執著于數據大小,只要能從看似毫無意義的數據礦坑中挖掘出金礦,有誰會在意那座礦坑原本是大得像座山還是小得像狗屋呢?和沛科技創辦人翟本喬就指出,大數據這個名字容易讓人誤導,因為真正重要的其實是大智慧。大數據不只是說數據量有多大,速度快和數據量大都可以用技術輕易解決,但種類(Variety)比較需要智慧。
Q:沒有大數據就不能用大數據嗎?
A:非也,建置大數據架構與環境的確所費不貲,一般中小企業通常無法輕易投入鉅額成本,但大數據時代的精神在于如何妥善利用既有或非傳統數據,從中挖掘出新商機,因此即使是中小企業甚或者是新創企業,都能在大數據時代用「大數據」。
就技術面來說,現在有許多業者開始提供建置成本較低的大數據處理工具和云端系統,有些甚至跟App一樣,只要根據自身需求挑選需要購買的功能即可,例如科智提供的工業化數據管理工具即為一例。另一方面,很多時候中小企業其實不需要建設大數據系統。中研院資訊科學研究所研究員陳昇瑋即指出,在絕大多數情況下,大數據專案其實不需要建置Hadoop系統,特別是臺灣的社群媒體沒那么發達,而是直接采用國外的居多,數據都不在自己手上,與其盲目追求技術和工具,不如先用小量數據去驗證一個概念,是否能將數據轉換成商業機會,再來決定要不要建置大數據的作業環境。
大數據領域權威麥爾茍伯格(Viktor Mayer-Sch?nberger)在《大數據》一書中便提及,大公司有巨量數據的規模優勢,但小公司有成本及創新上的優勢,小公司因為速度夠快、靈活度高,就算維持小規模,還是能夠蓬勃發展。
Q:我要怎么開始進行大數據專案?
A:設置專門統籌大數據專案的部門和職銜是第一步,而且層級越高越好,企業領導人必須足夠正視大數據的力量,才能帶動整個組織重視數據的文化。Etu負責人蔣居裕便指出,大數據其實是管理問題,而非技術問題,缺少跨部門協作,大數據專案很難有個美好的開始。
第二步,切勿陷入大數據迷思,與其急著想用數據變現,不如先回頭看看自己企業內部的問題為何,先定義問題,再試圖用數據找解方。阿里巴巴集團副總裁車品覺建議,與其整天想著大數據,不如先整頓自己企業內部的數據,很多時候光是企業內部的數據就問題叢生,不同部門之間的數據無法相容,「整個數據在一個中小企業里面也是四分五裂,在這個地方沒做好的情況下,居然說你想用大數據,其實是有點難以理解。」
原文鏈接:http://www.thebigdata.cn/YeJieDongTai/13877.html