無論新創公司或傳統企業,愈來愈多組織將未來押注在巨量資料。根據 IDG Enterprise,過去一年以來,曾執行數據專案的公司數量增加了 125%1,CapGemini 與 EMC 共同執行的調查則顯示2,70% IT 決策者認為,能否充分運用大數據關鍵價值,將左右公司的前景;65% 的受訪者更直言,如果沒能擁抱大數據,公司很可能日落西山,失去競爭力。從林林總總的數字中,可以觀察到企業十分重視巨量資料,但是實際上,巨量資料專案卻很容易失敗,而且往往重蹈覆轍。Gartner 研究總監 Svetlana Sicular 列舉了八個最常出現的錯誤3,小心別掉進陷阱中。
管理層的惰性:根據 Fortune Knowledge Group 的調查,62% 的企業領導人依然仰賴直覺;下決策時,61% 以真實世界的情境為優先考量,而非數據。Svetlana Sicular 敘述,Gartner 曾經服務一家家喻戶曉的旅游公司,他們采取了大數據技術,執行點擊流(clickstream)分析,以了解消費者在網站上瀏覽與購買的流程,結果竟然發現他們的消費模式與公司高層的銷售模式居然完全相反。在結案報告中這家旅行公司寫道:「這個技術有效的解決了我們的疑惑,其結果劇烈了改變原有的業務,為了充分實踐數據呈現的洞見,我們更替了全新的管理團隊。」
他質問,有多少公司的領導層需要砍掉重練呢?
選擇錯誤的使用案例:有些公司的實力跟不上野心,選擇遠超過自身負荷能力的大數據專案,又或者企圖使用舊方法執行新專案,兩者都無可避免將走上失敗之途。
問錯問題:數據科學是由產業知識(比如零售、金融)、數學與統計、程式結合的復雜混合體。很多公司增聘了資料科學家,他們可能是程式高手也懂統計,卻缺乏了最重要的成分:產業知識。Svetlana Sicular 建議,應從產業中找到對的人才,因為「學習 Hadoop 比了解商業內涵簡單」。
缺乏必要的技能:這點與「問錯問題」類似。曾有一家金融機構想要調查人們的生活習慣如何影響他們購買退休方案的偏好,不過「習慣」太多種,執行這個專案的負責人把問題限縮到抽菸/不抽菸,但是失敗了。後來 Svetlana Sicular 與從事醫療產業的人士聊到這個專案時發現,他們并不問這種非黑即白的問題(抽不抽菸),而是「你抽菸幾年了?」、「你戒菸幾次了?」、「你最後一次吸菸是什麼時候?」總之,進行大數據分析時,應該找到熟稔特定專業領域的人士——醫療、語言學、行為心理學家、社會人類學家等等,IT 部門以外的專業人士。
大數據之外,無法預料的問題:資料分析只是巨量資料專案的一部份,訪問與處理數據的能力同樣重要,不過諸如網絡壅塞、人員訓練不足等等都有可能阻礙專案執行。
企業策略不一:如果巨量資料專案被隔絕於公司核心業務之外,那大概注定失敗,如果公司把云端或其他策略置於巨量資料之前,那失敗的機率當然又更高了。
大數據孤島(silos):很多人喜愛談論「數據湖(data lake)」、「數據中心(data hubs)」,但是現實狀況是,很多公司嘗試建立數據水坑(data puddle),行銷數據水坑、制造數據水坑等等等等,但是彼此楚河漢界,不相往來。對組織而言,巨量資料只在水坑之間的高墻倒下、彼此匯流才會更凸顯價值。只是,辦公室政治或政策,往往抹煞了資料集體發揮的可能性。
問題回避:這在藥物產業中最為明顯,藥廠無法進行情緒分析,因為病人服用某種實驗藥物後,只要一出現頭痛等副作用,就得回報 FDA。由於過程太麻煩,甚至可能碰上法律責任,因此藥廠傾向回避此類措施,結果可能錯失珍貴的發現。
美國媒體 InformationWeek 編輯 Matt Asay 認為4,企業組織執行巨量資料專案時,也應注入「迭代」(iterate)的精神,別好高騖遠,從能夠快速發現問題的小規模開始進行實驗,并且邀請內部員工共同參與。利用大數據解決問題的關鍵,在於靈活且開放的數據基礎建設,讓員工不斷調整實際方案,直至他們的努力結出豐盈的果實,唯有如此,公司才能降低失敗的恐懼,真正嚐到巨量資料的甜美滋味。