可視化,被視為大數據落地的最后一公里。就如同人們去商場購物時,看見一件漂亮的衣服,但2000元略貴的標價或許會讓部分用戶產生猶豫,而可視化充當的作用就相當于給這件衣服貼上了打8折的標簽,為最后的決策提供了助力。
在大數據領域,重要的是數據本身以及從中得到的價值,但同時可視化的推動作用,為不同年紀、不同職責的用戶采用大數據提供了更好的體驗,降低了認知的壁壘。
商業決策離不開互動性的可視化
目前的大數據可視化呈現,大多數以表格、餅圖等方式展示,例如用戶比較熟悉的支付寶用戶的全年消費記錄。雖然類似的可視化提供了直觀的數據感受,但另一方面,不得不說其呈現的數據信息量有限,內容較為死板,特別是在商業上,難以提供更多的價值或知識。在硅谷領先大數據公司Taste Analytics數據可視化副總裁俞立看來,數據可視化不僅需要提供直觀、形象的體驗,同時還應該包含重點信息提取、可追蹤,以及人機互動性增強兩個方面。
“在商業決策上,企業需要的大數據可視化不僅是一張張大致方向上的圖表,同時需要在這些圖表上進行任意維度的選擇,對真正重要、感興趣的信息進行查找、追蹤。”他表示,在最終數據呈現上,現在的可視化大多停留在數據包含哪些場景和要素領域,而對數據中最重要的人事物、數據發送時間地點、用戶討論這些場景與要素的位置等細節卻無從追蹤,所以企業難以得到更多的知識。
此外,目前國內大多數非結構數據分析產品,包括關鍵詞提取、情感分析、輿情模型分析等,常常采用預先定義文檔標簽和關鍵詞,來進行分類, 需要人工大量干預。“業界比較前沿的做法,是機器通過一定的規則進行文檔自動分類。例如Taste Analytics的Signals平臺不用定義標簽,借助系統后臺的焦點提取功能,通過機器學習和統計歸類的方法,自動地提取出數據的分類模型,同時從語義方向分析這些數據。” 俞立,這位在學生時代便一直研究大規模時變數據可視化的博士表示,這類做法的優勢在于,不僅人工干預少,可以更智能、客觀地分析趨勢;并且對于數據科學家等用戶,可以在此基礎上對分析結果進行調整,加入更多的參數或信息,機器便能重新學習并處理數據,呈現出一個更加準確的結果。
結構化與非結構化數據融合分析
最終可視化結果的準確性與數據分析過程緊密相關。時下,越來越多的企業開始通過第三方平臺,或服務外包來實現大數據分析,例如采用Salesforce、Answers Forsee等平臺,或借助國內一些廠商的類似服務。盡管提供大數據分析服務的公司不少,但現有產品仍是以結構化數據分析為主,少量非結構化分析產品也是針對語義分析、情感分析、輿論分析等提供單一功能,很少將結構化數據和非結構化數據結合形成一套整體解決方案。
“現在Taste Analytics已可以同時實現結構化數據分析和非結構化數據分析。” 俞立表示。
例如大眾點評中用戶對萬達影城的評論中,詳細的語言評論是非結構化數據,環境、服務、視覺效果等評分是結構化數據。Taste Analytics平臺將詳細語言評論進行自動歸類及焦點提取,分析出時間、地點、人物,以及語義焦點(最重要的詞語,如負面評價、正面評價);同時在環境、服務、視覺效果評分等結構化數據導入系統后,可以得到具體城市如北京萬達影城的環境、服務、視覺效果態度分布,以及基于這個分布用戶的評論信息的關鍵詞。通過“結構化數據+非結構化數據”下更多維度的分析,可以得出哪些焦點比較突出,用戶為什么給出5分好評或2分差評。
所以這樣結構化數據與非結構化數據分析的結合,可以帶來更多深入的分析,在可視化呈現上,也不僅能表達出其他數據分析產品展示的“是什么”,同時還能表達出“為什么”。
可視化應同時服務兩類用戶
“從用戶角度看,大數據分析應該越傻越好,越簡單越好,人工干預越少越好。”Taste Analytics移動技術總監沈於眾說道,盡管如此,但實際上大數據分析產品應該面向不同類型的用戶,例如對于數據科學家、分析師,其可能需要更多的觀察或與數據間的互動;而對于企業CEO、產品經理等,其需要最終呈現的信息能直擊企業痛點,越重要越好。所以Taste Analytics的可視化便是同時服務這兩類人群,專業的數據分析師、科學家,以及對數據分析“業余”的決策層人士。
另一方面,在可視化技術實現上,采用SVG和HTML 5已經成為業界事實上的規范。
擁有10年框架設計經驗的沈於眾表示,現在Taste Analytics的產品便是基于Facebook提出的最新的React.js,通過自己的內部延展而形成高性能、高互動性的實現,“通過統一的人機互動設計、精簡的圖像可視化陣線,我們Signals平臺把復雜的數據分析過程簡易化。尤其是當我們的用戶可以在平板電腦、手機、PC、筆記本等終端上,以相近的用戶體驗來隨時分析數據時,我們的平臺極大程度地提升了客戶的數據分析能力和理解能力。”
“我們選擇了各種美國先進的網絡設計語言,同時編寫出了一套自己的優化體系。Signals在最終平臺上呈現的效果也算業界領先,所以最終數據可視化的效果、頁面相應速度、內存上的優化,在同行里也優勢突出。” 沈於眾解釋道。
目前,Signals平臺能夠為用戶提供10余種圖像可視化模式,并且支持客戶自定義分析,共包括15種不同的可視化分類。