互聯網時代,數據無處不在。當我們使用搜索引擎,在微信與人互動,或享受打車軟件的便利時,都在產生和分享社交數據。數據總量的指數增長讓人們覺察:數據為我們造福的時代已經到來。
近日,《大數據和我們》由中信出版集團出版,作者安德雷斯·韋思岸(Andreas Weigend)是美國大數據和消費行為專家。近一段時間,他正攜自己的新書在北京、上海等城市作巡回演講,傳播他的數據心得。近日,長江日報記者在上海專訪韋思岸,他結合研究和觀察告訴我們,數據將讓我們的生活變得更有質量。
寫書勸大家分享隱私
韋思岸曾任美國亞馬遜首席科學家,在斯坦福大學、加州大學伯克利分校及復旦大學任教。過去10年來,他保持著一個習慣,將自己的每一場講座和演講,以及乘坐的航班信息都發布在個人網頁上,甚至包括航班座位號。“我相信,分享數據可獲得實際價值”。
身處大數據前沿,韋思岸發現一個現象:人們非常害怕失去隱私,不停抱怨隱私被人窺探,卻又想得到更多、更精細的服務。“必須寫本書告訴人們,這種思維要改變。”2012年韋思岸就萌生了寫《大數據和我們》的想法。
韋思岸提出,在社交數據泛濫的世界里,舊的規則已不適用。收發電子郵件、上社交網站、打開導航系統、使用計步器等感應裝備、用手機查天氣預報等普通行為都會產生數據,并被數據公司記錄。通過提煉這些數據,可以發現人們的偏好或傾向,還能做出預測,比如人們可能會購買何種商品等,基于分析結果,能為用戶提供貼心、實用的服務;相應的,普通人也能因利用數據受益,“我們可以基于這些數據做出決策,讓數據為生活服務”。
“100年來,我們一直珍視隱私權,但現在,我們必須認識到,隱私權其實只是一個幻象。”韋思岸通過自己的書告訴大家,數據公司對我們個人數據記錄得越多,我們的存在感越強,更利于作出準確的決策。“如果你希望從數據中獲利,就必須分享自己的數據”。
“猜你可能還想買”的創意來自他
如今,我們在網上購物常常可以看到“猜你想買”“你可能還想買”之類的提示,最先想到提供這種服務的人正是韋思岸。
2002年的一天,韋思岸接到亞馬遜首席執行官貝佐斯的一個電話,對方表示想雇傭他。“人們會好奇,為什么會有人雇傭一個物理學博士來做電商呢?因為物理學家知道怎樣做實驗,怎樣收集數據又怎樣解讀數據”。
擔任亞馬遜首席科學家期間,韋思岸與貝佐斯共同制定了該公司數據戰略——以客戶為中心。韋思岸主導開展了一系列實驗,比如比較哪些商品評論更能讓客戶開心,用哪種方式為客戶推薦商品成功率更高等。他還分析顧客與網站達成的每一樁交易,分析他們的購買地點、商品品種、消費金額等數據,進行分析得出結果,可用于為顧客推薦合適的商品。于是,亞馬遜在此基礎上開發了自己的商品推薦系統。
“猜你想買”,亞馬遜的數據挖掘改變了10億人的購物習慣。
在過去10年中,韋思岸還為漢莎航空、百思買、騰訊、阿里工作。“經驗告訴我,在這個時代,人們正在將數據轉化為服務”。
想辦法讓數據分享變得平等
“當我們認識到數據的價值后,重點不僅是獲得數據,而是要主動行動。”韋思岸發現,因為技術差異、信息不對等,現實生活中,普通人想與企業實現數據平等分享很難。如何避免社交數據被濫用?韋思岸認為,透明性與主動性原則最能保護我們免受傷害,提高我們從中得到的價值。
“你需要了解你提供的數據與你得到的數據是否對等。”在《大數據和我們》中,韋思岸教讀者如何與企業客服打交道:當我們打通客服電話時會聽到“為保證服務質量,本次通話可能會被錄音。”我們應該對他們說,我也會為此次通話錄音,以保證我所獲得的服務質量。
前不久,在“2016陸家嘴金融全球峰會”上,韋思岸在演講中分享了個人網絡用戶的6項權利,為普通人合理利用數據支招。
首先是查看數據、獲取數據的權利。比如在淘寶網上查看所有的交易記錄、購物趨勢以便你做出更好的選擇;第二是看到數據加工的過程,我們可以分析百度是如何進行數據匯總、提煉的,也可以觀察螞蟻金服是怎樣計算你的積分,以便幫你做出更好的決策。
再就是修改數據的權利,也就是你有權對自己的數據增添刪改。你還可以將數據模糊處理,根據用途決定所提供數據的精度,比如分享自己的位置是精確到方圓1米還是1公里,求職時個人信息提供是否需要面面俱到。
“事在人為,只要你愿意。”他說。
︻訪談︼
“每個人都可以成為數據高手”
記者宋磊 翻譯趙媛
安德雷斯·韋思岸
“數據用不好不是技術差,是因為惰性”
讀+:你經常為企業出謀劃策,但在書中你更多站在普通用戶一邊,這是為什么?
韋思岸:確實,我有很多在企業工作的經驗,越是這樣,我越覺得,如果沒有普通人利用它們產生的數據,這些企業將失去存在的意義。比如,人們如果不是體驗到在亞馬遜購物的便利,在這個平臺購物,亞馬遜不會存在。
以前,我花了很多時間在如何幫助企業善用數據上,讓客戶能得到更多快樂的體驗。大數據會引起巨大的革命。以前,我曾看過一本叫《身體和我們》的書,我認為,數據和我們的關系在今天如此重要,不亞于身體對我們的重要性。
讀+:你提出人們要努力培養“數據素養”,那是個什么素養?
韋思岸:不能充分、有效利用數據,是不是因為人們不夠勤奮、不夠聰明呢?不是,其實是因為惰性。在做一件事時,人們通常會選擇最簡便、快捷的方式,而忽略了很多更重要的事情,比如安全。很多人將銀行卡、電腦密碼設置成123456,這樣做隱患很大。
“數據素養”不是指素質或習慣,而是一種自覺的意識。包括了解數據服務商的工作機制,知道哪些參數可以改變或不可改變,善于改正錯誤,了解不確定因素,以及分享社交數據可能會帶來哪些結果等技能。在當今世界,數據服務商的推薦意見、分析結果對我們大多數決策都有引導作用,因此數據素養必不可少。
數據是新世紀最重要的原材料
讀+:你新書封面有一句宣傳語“數據是未來的新石油”,數據與石油有何聯系?
韋思岸:在今天,讓數據為人類造福的需求具有無以復加的重要性。作為21世紀最重要的原材料,數據就是石油。
一個多世紀以來,石油的發現、開采技術的進步,對社會、經濟產生深遠影響。人們通過提取、儲存和精煉,把石油變成人類需要的各種產品?,F在,由原始數據轉變而成的產品和服務,正在改變我們的生活,其影響力足以與工業革命媲美。
讀+:但數據和石油畢竟有不同之處吧?
韋思岸:石油總量是有限的,剩余的石油資源越少,開采成本越高。與之相反,數據量呈指數增長趨勢,而數據交流與處理所需的成本卻在不斷下降。我們每次使用電話時,就會產生數據,與石油不同,數據永遠不會枯竭。
此外,一份原油只有一個實體擁有使用權,或只能提煉一種產品;而一個數據庫,多個實體可以同時接入,并且創造出多個不同的產品。
讀+:數據必須加工才能為我們所用嗎?
韋思岸:很對,不是所有的數據都有用,有些數據會迷惑、誤導我們。前不久,我知道有“東北大拉皮”這道菜,但我不知道菜名的意思,當我用網絡工具翻譯這個詞時,讓我嚇了一跳——“東北的皮膚”,顯然,我得到的數據不適用。
數據是有時效的,比如我今天在上海,這個數據只是暫時有效,當我過幾天離開后,這個數據就是無效、錯誤的。同樣,大眾點評網、淘寶網也有很多不實的評價。
因此,我們在利用數據時,還要了解更多相關數據,作為輔助,并盡可能精確。你還應該知道哪些數據合情合理,哪些數據是虛假的。人不要被數據主導,而應以需求主導。
因為害怕泄露隱私而封閉自己不可取
讀+:“猜你想買”的確幫助人們開拓了購買想象力,但也讓很多人心理不適。你怎么看?
韋思岸:解決這樣一個問題,可能更多需要心理學家參與,而不是數據科學家。如何在隱私的共享得到好處,而不至于被侵犯?要分清何時需要提供,何時需要說不。在提供隱私數據時,我們要了解,隱私的提供能給自己帶來多大好處,與自己所需要的服務有沒有相關性,你不需要提供不必要的隱私。比如,打車軟件需要了解你的位置、目的地很正常,但如果需要你的婚姻狀況,那便是侵犯隱私,你必須拒絕。
讀+:當用戶在網上提供個人信息,讓自己得到更好的服務的同時,卻也給犯罪分子提供了可乘之機,這矛盾如何解決?
韋思岸:這其實是兩個不同的問題,我們應該區分隱私利用和網絡犯罪的含義。
當用戶向企業提供自己的隱私,以獲得更好的服務,那么,這些企業必須對你所提供的信息負責,讓它很難泄露,包括防范黑客攻擊。
但是不是因為隱私有可能泄露、共享,我們就拒絕提供呢?不能一概而論。在很多情況下,你向企業提供了個人數據,雖然有些數據被用來企業間共享,但大都會給你帶來回報——更高效的服務、更少的花銷,這便是隱私利用;但企業不注意網絡安全保護,黑客可能盜用賬戶密碼,或冒用用戶身份證貸款,造成嚴重經濟損失,這又是另一個層面的事了。
有人會說,我們提供隱私數據需要索要報酬,其實他們已經得到了報酬。比如美國某網站將所有利潤分給用戶,每名用戶當年可分得3.5美元,那么,一個好用的社交平臺在你心中的價值是不是高于3.5美元呢?
如果你回答是,那么,已經有人為你的數據付費了。
讀+:如今,很多企業在搜集、整合、分析人們的數據,需要擔心嗎?
韋思岸:與其擔心不如從容,因為你的擔心是沒有用的,你永遠無法知道那些數據服務商有多強大。我們可以把社交數據的挖掘程序視為神秘的“黑匣子”。我們不應花費精力去擔心數據可能被企業利用,而應該全神貫注,充分利用數據服務商的產品,使數據分享盡可能在積極與消極間取得平衡。
普通人也可讓數據發揮神奇作用
讀+:普通人利用數據的能力小得多,渠道也很單一,難道我們只能甘于處于下風、被動狀態嗎?
韋思岸:事實并非這樣,普通人也有能力去發掘一些看起來不可思議的數據。
美國舊金山有家數據公司,它掌握了大量職場人士信息,包括他們的工作經歷、業績、財務狀況等,以此為其他公司提供有償服務。但是,這個關系是可以反轉的。如果你的信息被他們掌握并利用,你就可以通過信息的輸出渠道、經過找到有用數據,再將這些數據整合、分析,你能知道這家公司的工作方式、數據的用途和輸出方向,并有可能窺探到更多企業的信息,為自己所用。
世界很奇妙,數據在產生、使用上總是雙向的,我們要學會在數據背后挖掘更多更有用的信息。
讀+:未來,當我們充分利用數據時,還會有哪些驚喜?
韋思岸:這需要問我們自己了,除得到買東西更物美價廉,求職交友更靠譜等等之外,我們還需要什么?還期待數據給你帶來怎樣的驚喜?
對于個人來說,數據最大的價值是幫助你作出更正確的決策,這適用于任何時間、任何狀況下。所以,數據幾乎能及你之所及的,只要想得到的,數據都能辦到。但前提是你必須學會整合數據——利用一切可用的信息。通過整合,能找出更多隱藏的信息,為我們服務。
︻手記︼
數據偵探
記者宋磊
圣誕節前一天,記者走進韋思岸上海的家。他將一個小盒狀儀器接通電腦,并告訴記者,“我樂意將自己的生活公之于眾”。
2012年,韋思岸買下上海某居民小區一套約80平方米的房子,每年都會在此住一個月。除了到大學講課、到企業分享數據經驗外,他會用滴滴打車、大眾點評和微信。在他看來,在不同國家體驗不同的社交網絡平臺、不同的數據共享感受非常必要,也很有趣。
韋思岸的工作臺相當擁擠,并排擺了三個液晶顯示器,一臺平板電腦,平時,他會在這里上傳數據、搜索數據。“相比數據科學家,我更愿意把自己稱作數據偵探”。
韋思岸具有一種能力,能在浩如煙海的數據中甄別優劣,找到真正有用的數據。他知道數據來源,也知道數據間的關系,在他看來,數據科學包羅萬象,涵蓋生物學、商業、心理學等方方面面,“要厘清各方面的關系,必須充滿好奇心”。
采訪結束后,韋思岸把記者帶到他的電腦前,打開某搜索引擎,展示他近10年任意一天的行蹤,如數家珍。他還打開某知名網站,展示他的朋友、朋友的朋友,并翻出多年前的聊天記錄,開懷大笑。
“太不可思議了,那些并不相干的人們,通過數據產生聯系,并共享數據帶來的好處和驚喜,我有幸參與其中,妙不可言。”他說。