現在大數據這個慨念已經快要“爛大街“了,無論什么企業什么行業都要嚷嚷兩句自己的業務有融入大數據,似乎有點流量就是大數據,有點數據就可以搞云,搞人工智能。對于這件事,你怎么看?
大數據的未來
Bernardo Huberman 是全世界最早利用社會化數據進行大數據預測的科學家之一,他們普遍認為,未來大數據的核心叫“社會化大數據”,人和人的關系、人和數據的關系都要用數據關聯呈現。這就是為什么在美國很多人認為谷歌的價值不如Facebook。
通過對社會化數據的分析,我們能夠對人,社會和商業有更加深入的理解。這也是近期微軟為什么以每股196美元,合計262億美元的全現金收購包括Linkenin公司的全部股權和凈現金的原因。雖然Linkedin用戶活躍度很低,但是從社會化數據的角度衡量,它的數據非常有價值。
大數據的壁壘
社會化數據有強大的壁壘,巧婦難為無米之炊,只要掌握了數據,即使分析能力不那么精致,也能實現一些匪夷所思的事。社會化數據分兩類:一類是開放的,像Facebook。一類是封閉的,像微信。微信互動數據積累的信息和相互關系,除了騰訊,沒有人可以掌握,更別說使用。大數據的門檻非常非常高。
今天,大家都知道數據里金子,因此大多數公司會采取相對封閉的辦法。雖然今天的掘金能力不強,但是守著這座金礦,不許別人來挖。這種心態會阻礙行業發展,最優秀的專家未必有機會獲得數據進行分析處理。數據壟斷的問題在未來更加嚴重。
無奈的現實
美國著名企業家、發明家、《奇點臨近》作者庫茲韋爾,為了利用谷歌公司的數據研究人工智能,不得不加入谷歌公司。許多公司利用手機APP和瀏覽器里的Cookie獲取大量用戶信息,持續跟蹤用戶行為,但這明顯是對用戶數據隱私的侵權。
對過度要求用戶信息獲取權限的行為進行監管是早晚的事,甚至下一代瀏覽器不再支持Cookie,不允許第三方對用戶行為進行沒有底線的跟蹤。無奈的是,如果不采用這種方法獲取數據,數據就會被大公司壟斷,小公司則沒有出路。數據整合也因大公司的市場比過高而困難重重。
比如說市場上的TalkingData,它會去整合和分析各家小公司的數據。你會發現一個規律,小公司的數據更容易拿出來共享,越大的公司越不容易拿出來共享。小網站一定愿意和你共享數據,但百度一定不愿意,小APP愿意和你共享數據,但微信一定不愿意。
實際上大公司的數據占據了市場的60%甚至70%以上的份額,這也就是大頭理論,頭決定了行業的走向,這些大公司的數據更加真實可靠,而長尾數據只能淪為對市場理解的偏差,或者被大公司收購的命運。所以很多中小公司,都是靠從大平臺分配和購買數據流量,來支持自有業務的成長。大平臺可以做到非常大的數據流量倉庫,但是岔路口怎么管理?這是提出的新學問。
可能的路徑
自己生產數據。數據生產方式已經多樣化,通過第三方采集+自己分析,有很強的優勢。比如美國一家公司,通過一個小衛星,專業監測超市門口車的數量,對車的數量漲落,判斷宏觀經濟是不是出現問題。同時在微觀方面,對超市競爭對手做各種分析。
再比如一個精準種植公司,通過對水質和土質的監測,來指導農民非均勻的播種種植。這些都是一些個性化的數據挖掘和服務。把數據采集和分析結合起來,給用戶提供完整解決方案。個性化服務是未來大數據公司真正的競爭優勢。
最后
大數據很精彩,有能力卻沒有數據,未必能創業。挖掘更多創造數據的渠道,利用數據的方法,最關鍵的是找到數據和應用的結合點。