EMC咨詢服務部CTO
“大數據已死。”
大數據過時了。”
“我們不再需要大數據,我們現在需要機器學習。”
… …
這是我在2017年時常聽到的話語,大數據已死?我并不認同,在我看來,大數據是一種思維,是一種利用數據和分析技術,使你的業務模型變得更加有效(見圖一)。
圖1:利用大數據使業務發展變得更加有效
大數據是一種思維方式
大數據是關于組織利用數據和分析來推動業務模型的能力,優化關鍵業務和運營用例,減少安全和合規風險,發現新的收入機會,創造更有吸引力的差異化的方式。大數據的技術組件包括:
數據:能從各種數據源,包括結構化(表格,關系數據庫)、半結構化(日志文件,XML,JSON)和非結構化數據源(文本,視頻,音頻,圖像)收集和匯總詳細數據。
分析:能利用高級分析(數據科學,深度學習,機器學習,人工智能)發現客戶,產品,服務,運營和市場洞察力。
這些是重要的技術構件,但是它們本身并不提供業務或財務價值。這對于推動大數據,數據貨幣化來說是必要的,但還缺一角。
大數據是關于數據貨幣化
大數據就是利用數據和分析的獨特性作為數字資產,為組織創造新的經濟價值來源。大多數資產呈現出一對一的交易關系。例如,一美元作為一項資產,它的價值是有限的,人力資源也一樣,一個人一次只能做一項工作。但是衡量數據作為一種資產的價值并不受這些制約。
事實上,數據是一種不尋常的資產,因為它具有疊乘效應,不會耗盡或磨損,并且可以在接近零邊際成本的情況下同時用于多個用例。這使得數據成為投資的有力資產(見圖二)。
圖2:疊乘效應
大數據是一個商業學科
今天數字化轉型的領先企業,已經將數據和分析視為商業準則,而不僅僅是另一項IT任務。因此,明天的企業領導者必須成為利用數據和分析來推動業務模式的專家。從市值角度來看目前最有價值的公司,是那些掌握使用大數據(通過人工智能,機器學習,深度學習)來驅動新的價值來源的組織。
圖3:世界上最有價值的公司
數據科學是數據貨幣化的引擎
數據科學可以更好地預測商業和運營績效的變量和指標,并量化因果關系以預測可能的行動和結果,提供糾正措施或建議,防止代價高昂的結果,同時隨著環境的變化不斷學習和適應。
為此,數據科學家需要學習各種各樣的統計,數據挖掘,深度學習,機器學習和人工智能技術和工具。
圖4:高級分析示例
數據貨幣化需要與擁有制定業務和分析戰略責任的業務利益相關者進行密切合作。這些利益相關者還明確界定了要測試的假設,并清楚說明如何將分析結果付諸實施和貨幣化。爭取企業領導力的關鍵是把他們變成“數據科學公民”,教他們“像數據科學家一樣思考”。
大數據的狀態
大數據與機器學習之間的關系:
當互聯網創造了網站和搜索數據的寶庫時,大數據就開始了。今天,社交媒體,移動設備,可穿戴設備,物聯網,甚至是不斷收集信息的麥克風和攝像機,已經增加了數據。
有了這么多的數據,機器學習提供了一種將數據組合起來,并使之有意義的方法,機器學習通過這些數據來辨別模式并預測新的模式。
機器學習在人工智能的發展中起著關鍵的作用。人工智能是指機器執行智能任務的能力,而機器學習是指機器清除數據中有意義模式的自動化過程。沒有機器學習,人工智能是不可能的。
大數據是一種轉變業務領導力,并使之變得更有效率的思維模式,通過利用數據和分析來強化企業業務模型。
圖5:利用數據和分析創建智能企業