大數據、云計算等技術在近幾年得到迅猛的發展,但是在實際操作層面,中美之間還存在很大差距。國內的企業級客戶在進行大數據分析時,仍以分析結構化數據為主,而在美國,很多企業已經開始分析非結構化數據,中國市場仍缺少這方面有效的分析工具。
據IDC的調查報告顯示:企業中80%的數據都是非結構化數據,這些數據每年都按指數增長60%。
位于硅谷的Taste Analytics推出綜合智能數據分析平臺—— Signals,其最獨特的地方在于既具備非結構化文本文檔數據的深度分析能力,同時也支撐著各種傳統的結構化數據 (報表、銷售記錄等)。
那么,什么是非結構化數據?
非結構化數據主要是指那些無法用固定結構來邏輯表達實現的數據,簡單來說就是用戶散落在論壇、微博、微信或其他渠道發表的關于產品的各種評價或吐槽。
從形態上,它主要包含這三大塊:
第一是文本文字;
第二是圖像、圖片等;
第三是視頻流、電視流。
對比一下或許更有助于理解,非結構化數據和結構化數據最本質的區別包括三個層面:
首先,非結構化數據的容量對比結構化數據要大,可以達到10幾倍甚至幾十倍的體量;
其次是產生的速度,比如Twitter剛出來的時候,每天產生一億條的信息量,新浪微博的信息量更大,可以達到幾十億條信息;
最后是數據來源的多樣性,這些數據來源有客服、郵件、調查問卷、社交網絡等等。
因此,signals平臺服務的對象不是企業的 IT、數據庫,而是商業人員,例如市場營銷,客服、信息洞察員、產品優化改進設計人員等。
以手機廠商為例,Signals通過對客戶的郵件反饋、在論壇的相關討論、微信、微博等相關評價信息分析,告訴設計師用戶普遍反映電源鍵的位置設計很不人性化,手機開屏經常掉幀等等,從而進行產品優化。
非結構化數據既然這么復雜,那怎么分析?
Taste analytic主要是通過如下幾個步驟進行非結構化數據分析的:
第一,數據采集,幫助企業更快更全的采集到各類數據。
signals集成了上百個數據接口,包括亞馬遜、天貓、Salesforce,ZenDesk, Esty, Yelp、Twitter、Facebook、Apple Store、Google Play Store等,并且這個數字還在飛速擴大,根據taste analytic創始人汪曉宇的介紹,他們正在和國內的第三方數據提供商聚合數據、百分點等進行合作,將為中國客戶提供更多本地化的數據。
非結構化數據接入口
第二,數據分析,也就是對于非結構化和結構化數據進行深度機器分析。
signal通過深度學習非結構化的自然語言,根據用戶的用詞、造句、行文方式來理解文字含義,通過對大范圍的用戶、上千萬個消費點進行聚類分析。目前Signals平臺具備成熟的實時分析包括中文在內的12種文字以及語音等非結構化數據的能力。
此外,Taste Analytics的服務適用于各種非結構化數據分析場景,只要有聊天記錄、對話記錄和郵件記錄,就可以和數據源直接對接分析。
從各種維度進行分析
第三,將數據進行圖像可視化。
Signals平臺會把數據分析結果進行可視化輸出,為客戶提供10余種圖像可視化模式,并且支持客戶自定義分析,共包括15種不同的可視化分類。
將數據分析結果可視化
此外,汪曉宇告訴創業邦,Taste Analytics研發出的最先進的分析技術——預測性分析,也將在中國上線,用戶可以享受到結構化和非結構數據的精準分析結果,系統針對關鍵詞、時間趨勢等因素對市場行為作出及時的預測。
依據上圖的元素進行預測分析
那憑啥別人不能做或做不了?
與國內諸葛IO、GrowingIo不同的是,Taste Analytics主要針對的是文本非結構化的挖掘和處理,而諸葛IO是對于機器產生的數據流,Click數據的分析。對于企業來說,兩者是相對互補的關系。
汪曉宇告訴創業邦,Taste Analytics成立兩年,就已經獲得了百萬美元量級的訂單,擁有像Ally銀行、ForeSee問卷調查等客戶,收入增長了6倍,并且季度營收增長速度保持在300%左右。
之所以取得這樣的成績,主要核心在于技術和人才,其技術壁壘在于文本數據的深度學習。
汪曉宇博士畢業于北京郵電大學的通信工程專業,之后就到美國直博,之后因為突出的學術貢獻,被破格提拔為北卡大學夏洛特分校的助理敎授,并在美國五大視覺中心之一的夏洛特視覺中心任主任。他曾經應邀在美國海事國防安全風險大會演講;還曾在斯坦福給計算機系的學生傳授研發經驗。
Taste Analytics的CTO俞立和Thomas Kraft,也是從美國頂級學府博士畢業,技術團隊成員全都是碩士以上學歷,博士占比達40%。
Taste Analytics在2月完成Pre-A輪340萬美元融資,由真格基金領投,跟投機構包括聚合數據、華創資本等。
汪曉宇認為在實際操作中,圖片、視頻的潛力還大大沒有被挖掘,機器數據和FinTech 瞬時高維度的金融數據也很有潛力。Taste Analytics未來將加大對圖片和視頻領域的非結構化數據分析。