《企業網D1Net》2月24日訊
引言:在大數據時代下,我們會發現這樣的現象:百度能知道我們在關注什么,淘寶能洞察我們喜歡什么,這是喜還是憂?大數據已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。
在大數據時代下,變革也是無處不在,無論是在生活和工作上,還是思維上都給人們帶來了巨大變革。
首先,是數據的形式由原來的關系型數據(如電子表格形式)更多地表現為非關系型數據(如用戶評論、圖片等);數據存儲方式也由原來集中式存儲變為分布式存儲,大型數據不得不存儲在不同地方的存儲服務器中,通過網絡進行互聯訪問,構成所謂的云存儲。
其次,是對數據處理的方式發生了根本變化,人們已無法只用一臺電腦處理數據,必須依賴網絡后面的云平臺,進行云計算,才能有效處理大數據。在對大數據處理上,我們可以看到三個有趣的變化:在小數據時代,人們限于獲取數據的困難,只能采用隨機抽樣的方式獲取數據樣本,然后根據樣本數據進行分析預測。一旦樣本出現偏差,那推導出的結果就會產生很大的誤差。
而在大數據時代,我們能輕易地得到數據全體,而不再需要樣本。譬如,阿里巴巴能得到所有買家的數據,它能輕易地統計“光棍節”那天的交易金額,算出哪個地區交易最活躍,可以通過媒體實時轉播交易盛況。這就是大數據的全數據模式,數據處理的范圍是全體,而不再是樣本。第二個變化,是不再一味地追求數據的精確性。由于大數據的多樣性、豐富性、動態性(在處理的同時,數據還在大量產生),強調數據的精確性是做不到的,也沒有必要。紛繁的數據會混雜在一起,看起來好像全無用處,甚至有些還是錯誤的數據,但沒有關系,這就是大數據的本性,看似無關無用的一堆數據卻蘊含著無限商機。
想一想,當人們在百度上比以往更多地搜索“感冒”、“發熱”等關鍵字時,往往意味著某地將要爆發流感,甚至還能預測是什么流感,這就是大數據的威力。第三個變化,是關注數據之間的相關性,而不是因果關系。比方說,通過挖掘天貓商城的交易數據,發現購買德龍咖啡機的買家,會有很高的比例購買寵物糧食,那商家會不失時機地推薦你購買皇家狗糧。咖啡機與狗糧沒有因果關系,但卻有內在的相關性。數據之間的相關性,就是大數據所蘊含的價值,也是商家追求的商機。大數據的相關性,告訴我們在面對錯綜繁雜的大數據時,我們不需要去研究“為什么”,只要知道“是什么”就足夠了。
最后,大數據時代將催生一個數據挖掘行業,出現一批數字科學家。簡單地說,數據挖掘就是從收集的數據中用一定的算法分析計算,得到我們所需要信息和知識的過程。傳統的統計分析是將數據按已知的類別進行分類統計,然后尋找有價值的數據。如果給定的分類是不合理的或是錯誤的,那統計出來的結果就不會產生最好的效果。而數據挖掘采用的是一種叫作“聚類”的方法,它事先不需要人工分類,而是由算法分析數據的屬性,將數據自動聚集成“類”,使“類”間的相似性盡量小,“類”內的相似性盡量大。比方說,保險業務涵蓋各類人群、各種職業,所以設計某個險種潛在的客戶目標群,需要對大量數據進行挖掘,才能找出不同的客戶群和重要系數,這不是事先人為設定的。要“讓數據自己說話”,這樣才能因地制宜地制定營銷計劃,科學測算盈虧平衡,為保險企業創造更多利潤。
D1Net評論:
有人說大數據節操掉了一地,大數據帶來的變革無處不在,不管愿不愿意,變革都在進行中,然而,事實并非如此,變革,是這個時代前進的動力,大數據帶來的變革,也是將這個時代推向前進的過程,因此,大數據并非沒有節操。