筆者每一天都會聽到這樣的問題:「我到底需要大數據嗎?」實際上,站在管理的角度上,數據越小越好。從這個方向出發,你或許并不需要大數據。但不論如何,在特定情況下大數據其實非常有用。
大數據到底有多大?
在 2001 年,道格 · 萊尼(Doug Laney)寫下了一篇具有開創性意義的文章。在這篇文章中,萊尼描繪了一直困擾著他的客戶的一個數據問題。萊尼的客戶受困于體量(Volume)過于龐大的數據,這些數據正在以爆發式的速度(Velocity)增長,同時數據所呈現的形式也非常多樣化(Variety)。萊尼的體量、速度和多樣化理論得到了廣泛認可,并被稱為「大數據的三重奏」。
遺憾的是,許多人并沒有抓住萊尼的重點。他在文章中所描述的是大數據所蘊含的問題,而不是優勢。
想要收集大數據其實并不容易,而且收集和使用的成本往往非常高昂。與此同時,在一般情況下大數據和具體商業問題的關聯度其實并不明顯,遑論大數據往往不能滿足品質標準的要求。況且在面對大數據時,管理數據所投入的資源并不能在分析、二次研究以及執行等環節中使用。由此看來,大數據對于許多人而言其實并不是一個祝福。相反,大數據有可能會嚴重攤薄企業在數據分析環節所需要的資源。
大數據思維
和其他問題相比,某些問題往往會顯得更加重要,而某些問題則往往會顯得更為復雜。但即便是在解決那些非常重要或復雜問題的時候,我們也不一定需要體量龐大的數據。
我最喜歡的例子之一是載人航天計劃,你只需要考慮想要活著將人送到太空所需要的所有信息和計算,就不難理解這是一個多么復雜的問題。載人航天任務所涉及的數據包括:
宇航員的身體狀況和醫學信息
地理測量學(航天器的位置)和重力場
氣象學,云層量和輻射平衡
大氣物理學
磁場強度
宇宙射線和輻射捕獲量
電磁輻射(紫外線、X 射線和伽瑪射線
這份清單只是所需清單中的一小部分,但它所包含的信息量已經非常龐大。甚至連筆者本人也不清楚這些信息到底意味著什么,他只是從一份老舊的 NASA 文件中找到這份清單。(有誰知道行星際介質的測量方法嗎?)
載人航天計劃所需要的數據到底有多少?與之匹配的計算能力又該有多少?這兩個問題的答案你能猜出來嗎?
筆者曾有幸和「水星計劃」(Mercury Project,美國第一個載人航天計劃)的編程人員露西 · 西蒙 · 拉科夫(Lucy Simon Rakov)進行會談,她向我描述了項目所使用的電腦。據拉科夫描述,盡管項目中的電腦性能非常強大,但內存卻只有 300 千字節。你沒有看錯,不是「艾字節」,不是「拍字節」,也不是「兆字節」,而是「千字節」!
換而言之,只要你足夠聰明,你就可以憑借內存極小的設備將航空器送上太空,要知道 300 千字節的內存甚至連存儲一張大一點的圖片也不夠。由此看來,小小的空間其實也大有所為!
盡管如此,大數據有時會變得相當寶貴,與其價值相比,處理中的煩惱和成本甚至也變得不值一提。
大數據有什么好處?
大數據可以針對用戶提供定制化的細節數據,有了這些數據,你可以作出更加明智的決策。實際上,有了大數據的幫助,你在頃刻間即可完成上千項決策。
如果說你可以一個接著一個地觀察用戶,你會更了解他們的習慣、喜好和需求。你會更了解如何和他們相處。只要數據的準確度和質量得當,大數據可以讓你以定制化的方式與用戶保持親近,就像對待朋友一樣。
你可以通過分析數據中的細節為用戶提供個性化服務,客戶可以從你身上獲得類似于亞馬遜(Amazon)或者 Netflix 的針對性服務。更加顯著的例子是在線婚戀網站的配對服務。
我需要大數據嗎?
除非你已經可以在工作中善用日常更小級別的數據,否則大數據對你而言還言之過早。更重要的是,不論面對的是大數據還是小數據,最重要的是你可以善用數據,并將其轉化成自己的強力武器。