當下中國,大數據是個熱詞。
無人汽車、人工智能、生物醫療,各種新科技中,大數據的身影無處不在,它像一把萬能鑰匙,開啟了很多不為人知的空間。
但在人們熱捧大數據的同時,卻往往就數據論數據,甚至陷入數據膜拜,而忽視了大數據背后的人的因素。大數據是怎樣發揮價值的?那些不會說話的數據又是怎樣講述鮮活的故事的?關注到騰訊近日發布的大數據報告《95后迷之隱私觀大揭秘》,記者走進位于深圳的騰訊總部,走進那些讓數據“活”起來的人。
大數據給不出解釋
搞大數據研發,不就是坐在實驗室、電腦前,整天對著數字噼里啪啦地運算?可騰訊公司用戶與市場研究中心調研員韓娜,更多地是奔波在見調研對象的路上。
韓娜講了一個對于她來說“家常”的故事。
一年冬天,她從南方的深圳趕到北方的沈陽,約了一個孩子做用戶調研。本來知情的父母臨時有事不在,孩子的姑姑不讓韓娜進門。韓娜拿出身份證、工作證、介紹信,反復解釋,但所有證明一概無用,對方就是不肯相信。
最終,韓娜被“砰”的一聲拒之門外。
類似的經歷,韓娜所在的團隊幾乎人人都遇到過。
很多人不理解,一個互聯網公司怎么還用上門調研這種“老土”的方式?
的確,擁有7.62億月活躍微信賬戶、8.77億月活躍qq賬戶的騰訊,并不缺乏用戶社交的大數據,但光有數字就行了嗎?
“大數據給出了結論,但給不了解釋。”用戶與市場研究中心總監譚池舉了一個他自己的親身經歷。
多年前,他曾經參與過早期蘋果手機一代的調研。當時,老外們通過大數據驚訝地發現一個現象:蘋果的幾種輸入法中,中國人特別偏愛某一種。可是老外想不通,這是為什么?
譚池說,“為什么”往往是大數據的盲點,而產品改進的關鍵,有時候恰恰就在于這個“為什么”。想要找到答案,目前,還只能依靠傳統的人對人詢問。
當時,經過傳統調研,譚池找到了原因:中國抽煙人口比西方國家多,許多公共場合更是想抽就能抽,人們一只手拿煙時,只好單手握著手機打字,因此中國的蘋果一代用戶,特別偏愛單手型、單指型的輸入法。知道這個“為什么”以后,相關產品的開發,開始更多考慮單手模式了。
數據會拋出許多令人驚訝的結果。但結果意味著什么,人們仍然一無所知。可以說,人與人交流的傳統模式,不僅沒有被掩埋,反而在大數據時代,被一個個數據又激發出來。
大數據讀不出場景
“滴”“滴”――訪談室里充滿此起彼伏的電子音。研究員們有些震驚。
事情緣起于產品經理想做一個無障礙功能的設計。研究員朱丹招募了6位盲人進行訪談。起初,大家做好充分準備,以為盲人們可能不會使用智能手機,不會用app,需要先教一下。
但沒想到,這群盲人使用互聯網產品相當熟練。他們利用智能手機的讀屏功能,并且每個人都把聲音調到最快檔,只聽見手機發出“滴”“滴”這樣短促的電子音,常人的耳朵根本聽不懂是什么,但6位盲人卻在怪誕的聲音中,熟練地使用互聯網,讓在場的“小伙伴都驚呆了”。
“原來網絡對他們的幫助比我想象中大很多。”朱丹感慨。有位盲人告訴她,比如移動支付,對正常人來說只是多了一種支付手段,但對他們而言是一種顛覆式的設計,大大方便了盲人消費。
大數據往往會這樣,提供了一個結果,但它并不知道用戶在使用產品時,身處什么樣的場景,懷揣怎樣的心情,有著怎樣的需求。這一切,唯有人與人面對面,才能知曉。
還有一次,譚池找到了成都的一名用戶,興高采烈跑到對方家里。目的是為了知道,用戶使用產品時,真實的生活場景什么樣。一番交流和觀察后,他忽然覺得不太對勁:這戶人家冰箱里只有6罐可樂,沒有多余的食物,房間里也找不到水壺或飲水機。譚池發短信給同行的同事:留意一下,這是不是他真的家。
等到雙方聊得很開心以后,對方果然露出了口風,原來他確實不住在這兒,這間屋子的主人是他父母,目前租給別人,這次為了接受調研,臨時借用了一下。
“這樣一來,我觀察他的生活場景,有一半信息就沒用了,比如小區、鄰里關系等。”譚池遺憾地說。
進一步說,比起直接的數據,如何解讀數據背后的意義,才是把大數據用“活”的重頭戲。用戶真正的使用情景,他們的擔憂、開心、困惑與不爽,目前的大數據讀不出來。數據再大也是死的,只有人能激活它。
大數據不知道怎么做
多年前,有一位調研員曾經接過一個項目,對方要求調研某產品在用戶心中是多少分,如果得分在80分以下,整個相關團隊就要被撤銷。“其實,給79分還是80分,有很大區別嗎?”譚池反問,“不談評分機制,就算根據數據得分,判了一個團隊的生死又怎樣?問題還是在那兒,依然沒有得到解決。”
大數據本身,并不能給出一個既定做法。面對數據運算的結果,之后的步驟可能更加重要。
調研員小迪同時負責1-3個調研項目,一般9點半從公司出發,去深圳市里與用戶一對一訪談。中午回公司,下午另外一個項目的招募和策劃會議又開始了,當中偶有空隙,他就回到座位寫一些訪談總結。這就是一名調研員每天的工作日常。
每一年,研究中心負責調研的項目數以百計,這些課題并非調研員自己“拍腦袋”想的,大部分來自產品策劃的需求方,比如產品經理,改進一個產品功能時可能會冒出一個問題,希望通過調研來解答。
韓娜說,剛入這一行,自己與產品經理交流時,經常需要磨合。比如一位產品經理很糾結,關于“簽到”有兩種改進方案,究竟95后用戶更喜歡哪一種呢?他不知道。他可能先去找數據師,去調相關的大數據。大數據顯示,95后更熱衷于每天上網“簽到”。但是他們“簽到”究竟是出于什么心理,獲得了什么滿足,數據并不懂。
于是,產品經理接著找韓娜,請她進行用戶研究。結果顯示,95后樂意“簽到”,更多是為了滿足自己的情感需求,尤其是“刷存在感”。可是知道了這一點后,產品經理依然無法抉擇,究竟哪個方案更好。
時間久了,韓娜漸漸明白,自己做完調研,不能僅僅解答“為什么”,“用戶怎么想”,還要給出“怎么做”的建議。
當然,再細致的調研,最終也不一定能找到產品經理想要的答案。有時候,答案是有了,但考慮到成本營收、缺乏供應商、缺乏可操作性等因素,改進方案依然不了了之。大數據和訪談就都白做了。
另一位調研員馬建說,自己工作最開心的那刻,就是調研的建議被采納,最終體現到產品中。
今天的企業、政府,乃至整個社會,很容易通過大數據對市場一目了然,但一目了然之后怎么做?漠視它、改正它、還是適應它?
大數據未必懂得價值
羅英、何文是“數據挖掘師”。但這份工作想做得好,單純依靠算數據并不夠,其實還要動用“情商”。
比如,qq音樂有一個功能叫“猜你喜歡”。根據用戶的數據,軟件會自動推薦一些陌生歌曲,它們往往符合你的音樂品位。這種推薦,顯然是基于大數據平臺。一般我們以為,只要提供一些算法,大數據平臺照此運算就成,但事實沒那么簡單。
首當其沖的是準確率。“猜你喜歡”究竟能猜對多少首歌?不同的數據師,可能會設計不同的算法,有的人效果明顯比較好,他把“年齡”的數據用起來,而另外一個人沒用,就會導致兩者準確率差很大。
究竟需要考慮哪些數據維度,薦歌才會最符合心意呢?沒有標準答案,不同數據師有自己的判斷。同樣的大數據庫,一個運算下來比較準確,一個不準,其中唯一的變化就是人。
第二個問題是,為什么有人能想到“年齡”,而有人卻想不到?憑借的也是個人經驗。或者說,憑借的是人對事物的理解,考驗的正是數據師的“情商”。
“在我們行內有一個不等式:業務知識>數據>算法。”羅英解釋,“而業務知識就是你的理解能力。”用同行的話來說,就是“你的架構是否合理。”
沒什么課題的時候,數據師的常規工作十分枯燥。
每天上班第一件事,就是低頭看手機。手機上,已經裝有數據展示的平臺,到點就會自動發布一些基本情況,比如當天登錄用戶數多少,這些已經無需太多人工干預。
然而一旦看出今天的數據有異常波動,數據師就要馬上查找原因,比如去各個相關部門詢問,是不是因為今天有大型活動?如果有,那算是幸運的。比較棘手的情況是,今天更新了一個新版本,而用戶在新版本上,上傳照片的完成率很低,那也是一種異常,需要趕緊找原因。
如果產品經理提出一個課題,需要與小伙伴們湊在一起開會討論,那數據師的工作會稍微有趣些。
比如最近,產品經理提出:能不能根據大數據,觀察每座城市的人口遷移,隨后做一份《城市年輕指數》報告?
策劃會上,數據師們給出了這樣一些數據:用戶的登錄地,再比對他們的年齡信息等。最后給出來的數據,大家一看都覺得有價值,《城市年輕指數》報告就這樣出爐了。
當然,更多時候,理想很完美,但運算出來的數據卻沒什么變化,被判定“數據價值不大”,議題便會不了了之。
“大數據就好像是一杯水,我們需要去廚房煮菜,水只是材料之一。我們不能直接把水賣給客戶,我們需要煮好一碗菜,才能端給客戶。”羅英形容。
何文則說,他工作的成就感,不在于運算大數據,而在于最終“能給出有價值的數據”。
大數據還能做什么
第一張與家人的合影、第一張旅行的照片、第一張寶寶的笑容……
已經活躍了11年的社交平臺qq空間有著豐富的用戶數據,最近,騰訊運用這些數據,為個人生成一份“社交回顧互動”h5,比如顯現出你第一次注冊空間的時間,跳出第一張上傳的家人合照。
“其實也捏了一把汗,這對圖片的數據解讀要求非常高。”從事qq空間運營的琪琪說,“試想,第一張與家人的合影,萬一大數據判斷錯誤,跳出來的照片是與男同事的合影,豈不是很尷尬?”怎么抽取數據,讓數據判斷準確很重要。
小迪做調研時遇到一名初中男孩,對方很有傾訴欲。男孩告訴他,自己有5個qq號,4個已經被媽媽“破解”了,可能是因為密碼太簡單,都是生日之類,媽媽太容易猜到。于是他想出了第5個qq密碼,復雜到連自己也記不住。他把密碼放在帶鎖的儲錢罐里,再把儲錢罐藏在床底下,每次用這個賬號登錄qq時,他都要先從床底下把密碼翻出來才行。即便如此,為了屏蔽父母,他還準備再注冊一個賬號。
這個故事,后來被小迪寫進了《95后迷之隱私觀大揭秘》報告中。該報告揭示,95后是一群非常注重隱私的群體,近4成95后認為,自己的隱私遭到過侵犯,他們為了保護隱私采取過各種小手段。
然而隱私報告誕生后,也讓一些媒體和學者產生了危機感。報告既有大數據的樣本分析,這點比高校科研的取樣還大;又有案例故事,這點又與媒體的角度重合。長此以往,是不是一家互聯網公司就能自己完成科研報告了?大數據會不會讓一些科研機構被取代呢?
除了活動、推薦、科研,大數據目前已經用來進行精準的廣告投放。比如一個平臺,經大數據分析,把1000萬流量分成兩半,一半是對汽車感興趣的人,一半是對奶粉感興趣的人。只需要把500萬流量給車商打廣告,它的轉化率就非常高。
而最讓人期待的是,大數據在某個領域正發揮著超乎想象的作用――城市公共空間的實時數據檢測。
類似功能,其實微信上已經有了。打開微信個人錢包,選擇城市服務,右下方有一條“城市熱力圖”。點擊進入,熱力圖能實時顯現你所在的位置附近,有多少人流,它意味著交通是否擁擠。當然,擴大使用的話,它還能實時監測某塊區域,是否短時間內人流密度過高,及時提出預警。
也是基于相同的原理,近幾年騰訊發布了春運遷徙報告,實時監測每年春運的遷徙情況。
以上這些,都是已經使用大數據的方面,而未來,很多人都對大數據賦予了想象空間――
當每個人的身體信息都能被實時收集,形成個人的大數據時,人會怎樣?當整個社會被大數據連接起來,形成一個龐大的系統,不僅交通、運輸,整座城市管理,都可以用大數據運算出一個“最佳方案”時,城市又會怎樣?
我們已經邁入一個大數據的時代。有人說,終究有一天,數據的價值將超過土地的價值。但是也有人說,世界就是一個“黑盒子”,永遠無法窺探內部的秘密。
遠古時代,宇宙對于人類就是一個巨大的黑盒子。如今,科學技術正在解開一個又一個黑盒子,可是大數據的終解會通往哪里?目前依然沒人說得清楚。
“技術是有局限性的。”當我們一直在展望科技的無限可能時,反倒是這些一直與大數據打交道的人,不斷強調著這一點。
(文中的人名均為化名)
對話
人始終無法被替代
解放周一:企業對大數據的估值一直都很高,不會輕易公開。你們怎么會想到免費對公眾發布一些大數據的社會報告?這本身就是一種試驗嗎?
李航(騰訊集團市場與公關部總經理):這幾年,社會上的大數據報告很多,每家互聯網公司各有偏重。
社交平臺本身就是一個濃縮的小社會,社會的新變化、新趨勢,都會在這個平臺有所反應。比如,大家越來越覺得,當代年輕人變得無法定義了,他們似乎喜歡追星、喜歡消費,他們究竟是怎樣一群人呢?能否做出一些描述?那么,在我們的社交數據平臺上,是否可以觀察到年輕人的一些變化?意識到這是一個社會共同關注的話題,我們就基于大數據發布了相關的報告。
另一方面,大數據是個很大的盤。但是這個大盤上也可以有許多小的切面和故事。大數據未必一定要生成一個宏觀的大報告,從特別的角度切入,以小見大,也是一種嘗試。這次我們推出95后的隱私觀,那么下次可以繼續推出當代年輕人的審美觀、擇業觀等,持續聚焦一些可長期跟蹤的社會話題。
解放周一:這份報告既有宏觀數據,又有微觀故事,看起來似乎“搶”了高校和媒體的活,您覺得,你們做的調研,與高校和媒體的調研本質區別在哪里?
李航:我們是一個平臺,也許從能力上,我們可以做到像高校那樣,或者像媒體那樣,但從自身的定位來說,我們盡量只做平臺該做的,那就是客觀陳述。有些洞見,不輕易進行價值判斷。社會現象一擊即中講清楚即可。這些大數據發布出去以后,如果高校、媒體引用,進一步就這個社會現象深入分析下去,我們也很高興。
大家知道,騰訊一直在做平臺服務,提倡“開放”,這個思路也適用于傳播。我們現在的社會類報告,大數據依然是開放狀態,未來外部機構可以一起策劃做下去,共同搭建一個挖掘數據價值的生態圈。
解放周一:是不是因為互聯網行業變化太快,所以你們對社會的細微變化很敏感,也因此對調研投入了很大精力?
李航:pony(指馬化騰)曾經說:巨人倒下的時候,身體還是溫的。互聯網這個行業,分分秒秒都在變化,特別讓人敬畏,所以我們始終有一種危機意識。基于此,我們專門有課題研究社交如何改變人。今天,我們愿意開放一部分資源和數據,也是希望能與全社會一起去解讀互聯網的動向,可以說是為了社會,同時也是為了我們自己的生存前景。
解放周一:那么您對大數據的未來怎么看?有了人工智能、深度學習,未來人還有用武之地嗎?
李航:目前看待和處理大數據有幾種方式。一類是對年齡、性別、星座等基礎結構型數據進行呈現和總結。第二類是視頻數據、語音數據、圖像數據。我們有像優圖這樣世界領先的技術團隊,他們在音頻、人臉、圖片識別等領域都有深入研究。現在我們正在研究,如何讓語音數據與圖像數據結合進行分析。第三類就是人工智能,它的想象空間非常大,或許通過深度學習,未來人工智能自己會對數據產生洞察力,理解數據背后的意義、原因、提供建議,一切皆有可能。
未來也許人機之間有新的協作模式,但我相信人無法被替代。人性很復雜,即使人與人的當面交流,所知也是有限的。人的情感、動機、心理,這些都是目前機器解讀不了的。
越是與大數據打交道,我越是對人性保有敬畏之心。