本期企業網D1Net采訪到的嘉賓包括:新毅金融CIO肖鵬、易觀智庫CTO郭煒,中國大數據專家龔才春博士,優客工廠首席數據官、產品開發總監、前百度大數據運營部創建者范宇,現京東技術學院院長呂建偉。他們將從自身經驗出發告知我們,在大數據探索過程中所面臨的困難及部分解決辦法。
優客工廠首席數據官范宇:數據是死的,我之前在某大型互聯網做了很多領域的探索,比如醫療,比如車聯網,比如商業WIFI等等。在醫療行業,當時我們把某醫院所有的檔案數據拿過來,發現根本沒有用,充其量只能做一個BI分析,告訴你犯哮喘病人的性別分布,一點預測能力都沒有,因為它的數據樣本太小了。但是,想要完全獲得這個樣本需要跟所有醫院合作,拿到至少60%以上的數據采集,這顯然不可能實現。
這家大型互聯網公司當時還花過大價錢買了微博的數據,希望通過微博的數據打通與社交化的聯系,結果發現買過來之后,花了這么多錢的微博數據其打通率只在1.4%。還比如商業WIFI,各種咖啡館、餐館,雖然數據量非常大,但其獲得的數據卻非常零碎,而且各地局域網的接入方法不一樣,要打通這樣的數據也非常難,投入也相當之大。因此,互聯網公司的大數據探索其實走了很多彎路,唯一找到的比較好的切入點是智能電視OTT領域,打通非常容易, PC端打通率在50%左右,移動端打通率在75%,這樣才可以產生商業價值。
目前大數據的主要用途在營銷端,通過與移動端打通,就可以知道消費者看電視的行為方式,知道這個消費者平時在搜索什么,從而可以更好地在智能電視上推薦投放更多的廣告。
優客工場是一家提供全要素、社區化的聯合辦公空間的創業公司,樓宇或者辦公室出租與住宅是不一樣的,首先商業寫字樓與住宅不一樣;第二、銷售與租賃也是兩回事,很難做到業務預測。比如消費者可能在夏天買一身羽絨服,因為反季購買比較便宜,但并不會因為冬天要去滑雪,但在夏天就提前租一個雪橇,因為一般都是在滑雪場現場租用,不會提前租。所以,優客工場面臨的很大壓力就是在場地正式裝修好開業前提前出租,因為優客工場做的是T0B市場,因此采取了一些精準手段,利用了百度的一些資源、人脈,花5萬塊錢購買了一個百度大數據營銷平臺的賬號,用關鍵詞看這些創業者、小微企業、企業主都關注些什么,從而精準優客工場的辦公服務。另外,還通過SNS、旅游等線索進行精準線上營銷,以在前期就吸引到大量的客流。再具體就是商業機密了!
京東技術學院院長呂建偉:京東的廣告投放最主要在線下,京東也曾經嘗試過數據互換和數據交易,但是發現這條路根本走不通。京東現在通過業務合作獲得數據流通,也就是純粹購買數據這條路是死的。京東的活躍用戶,也就是一個月在京東上做一次消費購買完成的活躍用戶是1.4億。京東在大數據精準方面還沒有到人工智能、神經網絡、深度學習等程度。但使用了大量的統計方法,以及在搜索方面的精準搜索、精準推薦,通過給數據打標簽來實現。
中國大數據專家龔才春:中國大數據的首要問題是數據孤島問題,新浪微博每天有一億到兩億條博文發出來,即使新浪與淘寶可以實現賬號互通,其數據打通率也不超過10%。新浪曾探索過場景搜索,就是對人打標簽,給五億人打標簽,包括興趣,愛好,誰在發博文,博文的內容,以及在什么地方什么時間發的博文等等。
很多企業都將大數據用于營銷,但我認為在互聯網行業不應該這么理解,互聯網的每一個環節都可以用大數據,而不僅僅是用作營銷。其正的大數據應該做什么?比如福特,它的每臺發動機都可以檢測發動機的數據,通過檢測發動機的數據,就知道這個汽車大概什么時候會壞,能夠賣多少錢,應該上多少錢的保險。所以,它跟金融,跟危機都可以聯系起來,不僅僅是營銷。
在人力資源行業,大數據也可以得到很好的應用,把一個合適的候選人推薦給一個合適的公司的一個合適的崗位,這是人力資源關注的事,但現在很少有招聘網站做得好,就是沒有大數據,沒有畫像。大數據在人力資源領域的應用,通過對所有人,所有公司,所有職位進行畫像,將一億多人的簡歷進行搜集畫像,最后實現大數據挖掘。未來應該是什么公司什么時候招人,需要招什么樣的人,甚至應聘者的簡歷哪部分是虛假的都可以識別出來,形成一個精準匹配。
易觀智庫CTO郭煒:做大數據第一件事不是先搞技術,而是先懂政治。大數據平臺得先把數放進來,而這些數據可能會損害某些利益集團的利益。CIO需要借勢將背后的利益關系分析清楚,通過自己的影響力把大數據建立起來,數的來源需要政治的博弈才能達到。
第二, “數”可比作石油,原因在于大數據中可能有80%到90%的數據是沒用的,數據如何變現?從大數據的角度來講屬于后臺部門,而變現的則是產品部門和前端業務部門。
大數據變現目前來看有三種模式,一個是分析報告,一個是金融類的征信,另外就是營銷。
新毅金融CIO肖鵬:我沒做過大數據技術,但是現在在用大數據的應用,我們用的是反欺詐跟征信的結果,比如我要借款,通過我的平臺發起借款請求以后,就會把個人的一些信息傳遞到后臺的大數據平臺上。它產生了多個緯度的一些數據,比如它有社交屬性的數據,微博和微信、門戶網站等,以及不同場景下的消費記錄,甚至和社保的數據打通。當我們發送一個請求后,應用會生成一個報告,從而提高效率及風險控制能力。現在的互聯網金融應包括三塊技術:一是區塊鏈技術,其次是大數據征信分析,最后是生物識別技術,這三大技術未來將對金融產生革命性的影響。
現在的傳統銀行,為什么不能做小額信貸?因為它做一筆小額信貸的成本和做一筆幾百萬,上千萬的成本是一樣的,都是靠人工的方式來做。但通過區塊鏈技術在金融行業的應用,區塊鏈是去中心化的,只要有消費,便會被記在這個記賬體系里,可實現有效的反欺詐。比如同一個人如果在很短期里面頻繁的借款,基本上這個人欺詐的可能性比較高。還可以根據他每個月的電話記錄,電商的購物頻度以及其它消費行為,根據上述畫像,便能預測其信用額度。