大數據有兩個發展方向。一個是方向大家比較熟悉的“數據收集、分析”,借此了解客戶需求、明確產品方向等等。我還在人工智能、機器學習等領域做了一些研究,思考怎樣把這些先進的技術和數據技術綜合在一起,讓大數據不僅能幫人做決策,而且能夠真正自己做一些簡單決策,讓人有時間和精力去做更復雜的決定。
另外一個方向是“數據即服務”。亞馬遜的AWS云計算是“基礎設施即服務”,Salesforce是“軟件即服務”。Splunk是做大數據的管理平臺,我想如果能把這個平臺做得更進一步,也是一個很好的方向,把大數據變成“小數據”。
大數據概念有3v,數據量很大(volume)、數據速度很快(velocity)、數據種類多(variety)。小數據就是說,點點滴滴的數據都很重要,比如人的心跳,雖然數據不大,但對健康很重要。
大小數據的概念不重要,重要的是什么樣的數據給我們帶來最大的價值,怎么把這個價值體現出來。比如,本來房子是不會講話的,但屋里的人知道它的溫度是多少、氣流怎么流。在這些東西數字化之前,我們只能走進屋內去親自感覺,但數字化可以幫我們把各項情況呈現出來。從這個角度講,數據的應用讓我們看到了很多原來看不到的東西。
再舉個例子:一個客戶每天乘電梯時,會在哪個樓層停多長時間、進出多少次,這些數據放在我們的平臺分析之后,便可以預測電梯停留次數最多那層的客戶肯定會續約,而電梯停留最少的那一層不會續約。數據讓電梯“開口講話”,這是一種特別好的“新型語言”。
我們要關心小數據,不是說只有建立一個大的數據中心,才能讓數據實現價值。其實,像電梯這樣的數據可能不是很多,但能“講”的故事非常有價值。我們生活的時代是個數據科學和物聯網的時代,數據是一個新的能源,怎么開發好數據是最重要的事情。