在一個不斷釋放出新概念的技術世界,大概從2012年到2015年,作為一個術語,“大數據”的炒作周期已實屬漫長,人們迫不及待地將它漸次比喻為新時代的石油,金礦和土壤——盡管不同于石油,金礦和土壤,也不同于可穿戴設備,虛擬現實等同樣擁有旺盛新鮮度技術的目力所及,以數據庫和后臺分析為根基的大數據多數時候化于無形,無法讓人輕易觸碰。所以在不少人看來,對大數據概念的熱炒已經進入尾聲,從現在開始,作為商業基礎設施的數據分析將逐步迎來一個擲地有聲的落地階段。
大體而言,大數據的落地有兩片最肥沃的土壤:第一是可被輕易體察的2C市場,無論電商還是社交,阿里和騰訊以數據為利器對于個體中心化的追求即是最好的例子;第二是航空,能源,制造,電信,快消等垂直行業,而相比于洞察個體的輕巧與迅捷,數據價值在行業中的落地無疑要相對沉穩——畢竟,理解一個擁有無數細碎分工的行業總要比理解一個具體的消費者困難些,也正因如此,沉穩之后的爆發才尤為可期。
而談及大數據與行業的嫁接,全球四大會計師事務所之一的安永與海云數據的聯姻則頗具樣本意義。去年底,兩家體量不同卻因數據結緣的公司簽訂的全球戰略合作協議曾在大數據業界引發熱議,就在不久前,后者研發的航空大數據可視化產品DIVA正式投入商用,它是海云與安永合作后推出的首款行業級應用產品。透過于此,你會看到當一個行業的數據——或者說行業的知識被可視化之后,會化繁為簡,產生邏輯,產生意義,從而產生價值。
在更大的意義上,如果說大數據是以“上帝視角”還原這個世界,那么數據可視化則稱得上是“上帝的指紋”。
行業痛點
任何一款產品都從解決行業痛點開始,通常來說,大數據在落地過程中要遭遇三個問題。
首先是數據體量過大且種類繁雜。目前現存數據中,75%都是所謂非結構化數據,包括各種文本,語音,圖像,視頻,社交關系,空間軌跡等,它們異構且分別獨立,如一座座信息孤島般難以協同工作。而處理和匯總這些多維信息的最好載體無疑是可視化,一個最淺顯不過的道理是——人類是視覺動物。
嗯,人類層累式進化而來的大腦更偏愛擁有畫面感的信息。右腦對于圖像的記憶速度要比左腦記憶抽象文字快100萬倍,可視化本身即是強化記憶的手段——它更直抵人心。舉個例子,在我剛看完的電影《史蒂夫·喬布斯》最后,喬布斯指著女兒笨拙的隨身聽說:“我要把500到1000首歌裝到你的口袋里。”這就是一個典型的視覺沖擊場景,他可沒說“我要做個能裝1000首歌的機器。”再譬如,IDC研究報告顯示2020年預計全球新建和復制的信息量會超40ZB,沒啥感覺對吧,不如換個說法,2020年全球生產的數據將是地球上所有沙粒的4倍,你會本能腦補沙粒的畫面。
大數據也是如此。知道么,百度百科對大數據有個慘絕人寰的定義,復制給你:大數據“指無法在可承受的時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。”所以說,在實際應用中,與大數據進行視覺對話無疑是聰明之舉。
數據體量過大會導致第二個痛點:難以分辨隨數據洪流裹挾而至的福音與噪音,從而在具體應用中發現有效數據比較少。阿里巴巴集團副總裁,數據分析師車品覺就寫過一個事:“巧遇到谷歌的前數據部門leader,他跟我說了一件他覺得很痛苦的事:提出數據需求的人往往70%的情況又不用提供給他的數據。他為此非常生氣,便質問業務方:為什么你們老問我要數據,結果卻不用?業務方回答說:是的,因為我用完之后才知道這些數據沒有用。對于一個每天都要準備數據的人來說,這好比你是一家餐廳的老板,廚師每天讓你準備很多菜卻只用一小部分材料一樣痛苦。”
嗯,與老舊的餅狀和柱狀圖止于數據展示(先用數據再去做圖),形式大于內容不同,從相互關聯的過程數據中尋找問題和需求,從而做出動態決策,才是數據可視分析最為重要的技能。
最后,在現實層面,目前在做數據分析的更多是技術人員,離企業業務還有段距離,而至少在現階段,決策層對數據的態度則多少有些若即若離,忽明忽暗——他們很感興趣,卻遠未到離不開的份上。而數據可視化無疑是串聯決策層和數據層的最佳橋梁。
雙贏樣本
上述三個痛點也是海云數據嘗試去解決的。而作為這家公司核心底層架構產品,已經發布的圖易4.0(一款自助完成數據可視化的在線工具)即擺脫了傳統的數據倉庫模式,可同時處理結構化數據,非結構化數據和異構數據,能自動對各維度數據生成內部關聯,并以友善的視覺特征完成技術數據與業務決策之間的嫁接。圖易4.0可應用于航空,金融,制造,政府,醫療,快消等諸多行業,其中具體應用于航空行業的衍生產品即是DIVA。
事實上,作為信息化程度高,且標準相對統一的領域,長久以來航空行業對數據分析有著巨大需求。據介紹,DIVA能讓決策層實時了解公司多維度的綜合性數據,通過數據間的關聯邏輯發掘數據價值,以助公司高層做出合理決策。它能把所有航班的數據,乘客數據,飛機數據,地勤和服務保障車輛數據,甚至每個攝像頭數據收集而來并得以應用,目前包括東航,國泰,和馬航在內等不少航空企業都與海云有過合作。
如前所述,DIVA是海云數據與安永合作后推出的首款行業級應用產品(眾所周知,在全球航空行業,安永握有龐大的客戶群),毫無疑問,海云最為看重安永的,是其113年歷史積累下來的各個行業的知識,相信DIVA之后,當完成與安永其他領域知識的嫁接,圖易4.0也會延伸出更多產品。誠如海云數據CEO馮一村所言:“我們構建了一套全新的生態模型,這套模型也形成了閉環,從數據資源開始衍生到算法模型,依靠算法模型落地到行業,形成行業知識,行業知識又會形成新的數據資源,新的數據資源又會有新的算法模型,又導致新的行業知識。所以會良性地循環起來,變成一個閉環……我們后面要做的就是復制,比如復制到快消行業,金融行業,把這種模式更多地走下去。”
當然,任何合作都是雙贏,對安永而言,作為一家老牌事務所,它也需要抓住時代的步點在商業模式上發力,用更有說服力的數據信息為客戶作出策略性的管理咨詢和財務交易決策。
是的,回溯過去,那些被互聯網率先影響的行業(比如電商和娛樂)也都被數據化浪潮率先洗禮,那么接下來,在互聯網+的宏大背景下,大數據應用的下一個落腳點無疑是垂直行業的各自突圍,而數據可視化分析也許將成為它們的標配。