[摘要] 9月25日,時代周報品牌活動2015“影響力·中國”秋季峰會暨“大數據之父”舍恩伯格訪華活動將在上海舉行。
牛津大學網絡研究院網絡監督及管理學教授,研究領域為網絡經濟。曾任哈佛大學肯尼迪學院信息監管科研項目負責人,哈佛國家電子商務研究中心網絡監管項目負責人;曾任新加坡國立大學李光耀學院信息與創新策略研究中心主任。并擔任耶魯大學、芝加哥大學、弗吉尼亞大學、圣地亞哥大學、維也納大學的客座教授。
有100多篇論文公開發表在《科學》、《自然》等著名學術期刊上,同時也是哈佛大學出版社、麻省理工出版社、通信政策期刊、美國社會學期刊等多家出版機構的特約評論員。
信息權威與顧問,咨詢客戶包括微軟、惠普和IBM等全球頂級企業。早在1986年與1995年就擔任兩家軟件公司的總裁兼CEO,1991年躋身奧地利軟件企業家前5名之列,2000年被評為奧地利薩爾斯堡州的年度人物。
機構和國家政府高層的信息政策智囊,專注于信息安全與信息政策與戰略的研究,是歐盟專家之一,也是世界經濟論壇、馬歇爾計劃基金會等機構的咨詢顧問,先后擔任新加坡商務部高層、文萊國防部高層、科威特商務部高層、迪拜及中東政府高層的咨詢顧問。
舍恩伯格又要戴著他標志性的約翰·列儂式的圓眼鏡來中國了。
9月25日,時代周報舉辦2015“影響力·中國”秋季峰會,舍恩伯格將受邀出席,講他最擅長的大數據。
最近兩年,這位數據科學領域的權威學者每隔幾個月就會出現在中國,而他所到之處,無不受到媒體、讀者的簇擁。
舍恩伯格之所以在國內名聲大噪,主要是因為他的兩本暢銷書、關于大數據的先河之作—《大數據:一場將改變我們生活、工作和思考方式的革命》(Big Data :A Revolution That Will Transform How We Live, Work, and Think,中文版又名《大數據時代》)以及《刪除:大數據取舍之道》(Delete: The Virtue of Forgetting in the Digital Age)。前者揭示了大數據給人類帶來的巨大改變,后者則嘗試探索大數據時代人類應該如何構建積極而安全的未來。
作為最早洞悉大數據發展趨勢的數據科學家,舍恩伯格在國內受追捧并不奇怪。畢竟,此刻的中國—國務院剛剛印發《促進大數據發展行動綱要》,提出推動大數據發展和應用在未來5-10年逐步實現的目標及主要任務。國內的大數據產業正迎來大發展時期。
而由于大數據太火,在這個新淘金時代,人們對舍恩伯格的興趣不再停留于他的研究,還延伸至他本人以及他獲得一系列學術成就的過程。
恰好,舍恩伯格是個性格有趣而經歷豐富的人。比如,他曾因不想繼承家業而與父親爭執數十年,最終走上學術之路。
代碼少年
“我母親以前經營一家電影院,我每年都會問她,過去一年最好的電影是什么?她總是說,我知道,是×××。但她總是錯的。”
舍恩伯格常常在演講中提起這個例子,盡管只是為了佐證大多數人都需要數據分析工具這個觀點,但無意間卻把很多人的興趣引向了他的過去。
這位如今在全球數據科學領域極具名望的科學家其實算得上是“富二代”。他出生在距離莫扎特故鄉奧地利薩爾茨堡兩小時車程的一個小鎮上,父親是當地的稅務律師,有自己的事務所;母親則打理著小型電影院、花店等生意。
1966年,舍恩伯格出生那年,他的父親買來了小鎮上的第一臺電腦,價格不菲。當時,鎮上所有人都覺得他瘋了,肯定會破產。而這臺巨大的個人電腦運轉時發出的嗡嗡聲陪伴了舍恩伯格的整個童年。
小時候,舍恩伯格喜歡看阿斯特麗德·林德格倫的童話書。這位已故瑞典作家最著名的作品是那本充滿想象力的《長襪子皮皮》。而那時的舍恩伯格夢想成為發明家,因為,讓想法變成現實是一件特別誘人的事。
“如果還可以和林德格倫共進午餐,我想問她,她如何激發自身的想象力?愛因斯坦說過,想象力比知識更重要。”舍恩伯格說。
讀書時,舍恩伯格最喜歡的科目是物理和數學,進而又對計算機著迷。十一二歲時,他就想用那臺嗡嗡作響的電腦編程。
“當時,只有大學才有計算機,我就去當地大學報了一門編程課。但老師覺得我不可能學會,就讓我自己玩。于是,我便在角落里自學。”到了高中時期,這位天賦異稟的少年先后在國際物理奧林匹克競賽和奧地利青年程序員競賽中獲了獎。
17歲時,舍恩伯格第一次觸網。當時,他無意間得到一個聲音耦合器,其實不過是簡陋的調制解調器—使用者得把電話聽筒與之連接,從而激活以聲音傳送方式進行的數據傳輸。
在此之前,舍恩伯格聽說過互聯網,但從沒體驗過。于是,他搗鼓了好幾個月,試掉了一大筆電話費,最終連上了一個提供初級的郵件、論壇等商業在線服務的無線電通訊網站“The Source”。此后,舍恩伯格便一發不可收拾,對網絡著了迷。
1986年,年僅20歲、沒讀完大學的舍恩伯格“創業”了—成立殺毒軟件公司Ikarus,并開發了一款當時奧地利最暢銷的軟件Virus Utilities。至今,百度百科對Virus Utilities的介紹上寫著,這是一款剽悍的殺毒軟件。1991年,年輕的舍恩伯格還被評選為奧地利最頂尖的5位軟件企業家之一。
這段程序員的經歷為舍恩伯格的未來打下了基礎。許多年后,在《大數據時代》這本書中,舍恩伯格寫道,真正的數據科學家是統計學家、軟件程序員、圖形設計師與作家的結合體。
父與子
在舍恩伯格的學術之路上,很難繞開的一個人物,就是買來了小鎮上第一臺電腦的父親。
舍恩伯格與父親的關系并不差。至今,他記憶最深的關于父母的細節是,每天晚餐后,父親都會耐心聽他講述那天發生的事以及他的一些想法。舍恩伯格覺得,這是父親的“超能力”。
不過,父親始終不希望舍恩伯格滿腦子想著如何成為計算機學家,盡管他遷就兒子喜歡計算機。這位在小鎮上有頭有臉的稅務律師總在勸說自己的孩子盡早學完法律,繼承家業。在子承父業和投身計算科學之間,舍恩伯格與父親爭執了數十年,直到后者去世。
而在20歲左右的年齡,舍恩伯格還是順從父親,先在奧地利薩爾茨堡大學讀了法學本科。據說,因為法律太無趣,這位學霸硬是在3年半里讀完了7年的書。
接著,父親要求舍恩伯格繼續在法律上深造,但這個年輕人心不甘情不愿,于是便賭氣地只申請了一所學校—哈佛。他覺得,自己肯定不會被錄取。
收到錄取通知書那天,舍恩伯格以為是朋友開玩笑,于是按照上面的電話號碼打過去斥責,“這是愚蠢的玩笑!”而電話另一頭卻有聲音說,“不,這里是哈佛。有什么能幫你嗎?”
這不是舍恩伯格唯一一次“厚積薄發”。其實,在學生時代的大部分時期,舍恩伯格雖然出色,但不是最出色的那個。但到了最后一個學年,他就像突然間開了竅,過去學過的東西頓時“融會貫通”了。于是,出乎所有人包括他自己的意料,他在畢業前的最后一次考試中獲得了學生生涯唯一一次的全A。
而在美國最古老的法學院哈佛法學院,舍恩伯格開始覺得自己學的法律不再像本科時那么了無生趣。盡管如此,他依然不想學成后接手父親的公司。
有記者采訪舍恩伯格時曾問,“你后來為什么當上了大學教授?”他說,“我一直想成為發明家,直到我那個一直‘逼’我接手家業的父親有天問我,如果不想做稅務律師,你想做什么時,我才下定決心當大學教授。至少,對于我父母來說,這會是一個比發明家更容易接受、更受人尊敬的工作。”
從哈佛畢業后,舍恩伯格又拿到了薩爾茨堡大學的法學博士以及倫敦政經學院的理學碩士學位,并依照對父親的承諾,在倫敦一所大學謀得了教職。
當時,舍恩伯格的父親面對這樣的局面依然感到有些失落,最后竟然猝然辭世。父親去世的第二天,舍恩伯格選擇離開倫敦,放棄自己的事業和學術,回到自家的鎮子上,做起了以前無數次拒絕的稅務律師。
“我的人生,和大多數人一樣,既是連貫的,同時又屢受波折。我最初喜歡物理、數學,轉而對計算機產生興趣,進而關注數據安全和數據編碼,并喜歡上了研究隱私法、知識產權法以及網絡法。依照這個路徑,數據逐漸成為我關注的重點。但我的生活又被一次次打亂。比如,父親的離世讓我放棄了原來的事業規劃,回到了老家;但一年后,我又賣掉父親的公司,艱難地重回學術圈;后來,偶然的機會讓我得以到哈佛大學肯尼迪學院任教。某種意義上說,這些波折給我制造了意想不到的困難,但也帶來了意想不到的機會。”舍恩伯格告訴時代周報記者。
大數據之父
自1998年始,舍恩伯格的學術研究步入正軌。他進入哈佛大學肯尼迪學院任教,并在那里度過了10年。此后,他曾在新加坡國立大學李光耀公共政策學院做過3年副教授,借機觀察亞洲的信息政策,而今則在牛津大學互聯網研究院擔任治理與監管專業的教授。
這10余年間,互聯網飛速發展,人們開始使用手機上網、聊天、購物,完成很多過去必須線下操作的事。而這些變化都被舍恩伯格陸續記錄在論著里。
2010年,在舍恩伯格組織的一次研討會上,幾乎所有參會者發言時都開始提及社會運轉模式正在發生某種改變,但誰也說不出這種變化的實質是什么。當時,《經濟學人》的數據編輯肯尼思·庫克耶(Kenn Cukier)也在會場,他不久前剛做過一期《大數據的沖擊》的特刊報道。
那場研討會后,舍恩伯格與庫克耶進行了很多次深入交談,“然后,我們決定合寫一本書,探討大數據對于當下的意義以及大數據時代的本質”。
2012年12月,舍恩伯格與庫克耶合寫的《大數據時代》出版。這本大數據研究的先河之作不僅廣受媒體好評,還讓舍恩伯格知名度大漲。
在書里,舍恩伯格通過各種例子展現大數據帶來的改變。比如,一家叫Farecast的公司通過近十萬億條價格記錄來預測美國國內航班的票價。到2012年為止,票價預測的準確率達到75%,使用Farecast票價預測工具購買機票的旅客,平均每張機票可節省50美元。
“大數據的核心是預測。它通常被視為人工智能的一部分,或者說是一種機器學習。但其實,這種定義具有誤導性。大數據不是要教機器像人一樣思考,相反,它是把數學算法運用到海量數據上來預測事情發生的可能性。”舍恩伯格寫道。
在這本書里,舍恩伯格還提出了一個廣為引用的觀點—大數據關注的不是隨機樣本,而是全體數據;不是精確性,而是混雜性;不是因果關系,而是相關關系。
“具體來說,大數據的目的是全面的數據收集和分析;同時,我們要明白,在數據質量和數據數量之間要有一個平衡,所以,‘不是精確性,而是混雜性’,而‘不是因果關系,而是相關關系’,這是讓我們意識到,因果關系不再是解釋這個世界的唯一邏輯。”舍恩伯格告訴時代周報記者。
此外,舍恩伯格還是倡導大數據商業應用的第一人。在《大數據時代》中,他指出,如今的數據已經成為一種商業資本、一項重要的經濟投入,可以創造新的經濟利益。而這也是他屢屢被正在大力推動大數據產業發展的中國人當作座上賓的原因之一。
在關注數據的價值之余,舍恩伯格感興趣的另一重要領域是如何避免數據被濫用。在早于《大數據時代》出版的《刪除:大數據取舍之道》一書中,舍恩伯格提出了數字時代最大的問題:互聯網記住了人們希望自己忘記的東西。當遺忘成為例外,記住變成常態,人類理性決策的能力就會受到威脅。所以,在大數據時代,所有人都應該享受“被遺忘的權利”。
事實上,舍恩伯格本人早早地為自己確立了一套關于刪除的生活準則。比如,那些超過兩年沒穿的衣服會被他送人或處理;那些拍得不好看的照片,他會當即刪除。因為,“如果不刪除,在數字時代,互聯網可能會比你自己更加了解你”。
舍恩伯格這些新穎的想法曾一度讓讀者直呼開了眼界。而目前,他告訴時代周報記者,自己的興趣點轉到了小型無人機上。其實,一直以來,舍恩伯格對飛機駕駛以及基于大數據分析的無人駕駛都頗感興趣。只是不知道,這位數據科學家未來又會在這個問題上帶來怎樣“讓人感覺腦洞大開”的思考。
9月13日,在接受時代周報記者獨家專訪時,舍恩伯格講述了自己對大數據的一些理解,以及收獲這些理解的過程。
影響最深的人是高中物理老師
時代周報:今年暑假,以艾倫·圖靈為原型的傳記電影《模仿游戲》在中國上映,感動了很多人。你看過這部影片嗎?艾倫·圖靈是計算機科學之父,他對你從事數據科學研究是否有影響?
舍恩伯格:我看過這部電影。事實上,很多年前,我就讀過一些圖靈的論著。你可能記得,我以前做軟件公司時就需要編碼,所以,圖靈的書肯定要看。
不過,影響我最深的人不是圖靈,而是我的高中物理老師。他讓我開始接觸到熵的概念、相對論、量子理論等。對于我來說,他就像是為我打開了通往新世界的大門。
時代周報:大家都認為你是當今最重要的數據科學家之一。我特別好奇,大數據給你本人的日常生活帶來改變了嗎?
舍恩伯格:我是大數據服務的“大用戶”。平常,我會戴蘋果手表,一直以來,它為我的身體健康提供了很多幫助;我也喜歡諸如亞馬遜一類的電子商務公司,同時,還經常使用谷歌地圖。此外,維基百科對我來說是個難得的好幫手,它讓我比過去更加容易獲得有用的信息,對我的幫助很大。
時代周報:我今年曾采訪過暢銷書《大停滯》(The Great Stagnation)的作者、美國經濟學家泰勒·考恩。在談到對大數據的看法時,他告訴我,“大數據被高估了,因為,大多數人都不知道他們手握的這些數據要用來干什么,企業也一樣。大數據能幫助我們在某些邊緣地帶提高效率,比如針對性的廣告,但它無法改變全局。這其中,最困難的是問對問題,并且找到問題背后特定的模式,再用數據去加以匹配。這非常難以實現。”你認同他的觀點嗎?
舍恩伯格:我非常欣賞泰勒·考恩,《大停滯》是一本很棒的著作。我還曾引用過這本書里的一些觀點。但在大數據的問題上,我覺得他的觀點是錯誤的,或許,這是因為這方面不是他所研究的核心專業領域。
大數據可減少資源不公平的危害
時代周報:現在,大多數行業提起大數據就言必稱“這是一場行業革命,要顛覆過去”。你認為,大數據真的會顛覆那些傳統行業嗎?
舍恩伯格:會的,這種顛覆已經發生,并在快速進行。施樂帕羅奧爾托研究中心前主管約翰·西里·布朗(John Seely Brown)就發現,過去幾十年,超大型企業的壽命正在縮短。與此同時,我們看到,就在最近幾年,大數據驅動、估值達到數百億美元以上的互聯網企業不斷涌現。在人類歷史上,沒有哪個時期在比今天更多的領域,發生比今天更快的變化。
時代周報:目前,中國存在百度、阿里巴巴、騰訊三大互聯網巨頭,分別統治著搜索、電商、社交三個領域,他們不斷吸納著用戶的網上行為數據,幾乎肯定會成為中國的數據寡頭。你認為,在數據層面是否需要反壟斷?
舍恩伯格:我認為必要的一點是,互聯網要對新的創新主體保持開放的狀態。只要大企業不濫用自己的權力,將那些更小但更好的初創企業趕出市場,那么,他們就不會制造太多的威脅。所以,我更關注的是這些企業的實際行為,而非他們的規模。
時代周報:除了數據,我知道,你還對教育問題有著深入研究。今年1月,你出版了一本名為《與大數據同行:學習和教育的未來》的新書,專門探討大數據研究在教育領域的應用,以求真正實現因材施教。而中國教育的主要問題是教育資源分配不公平,大數據能解決這個問題嗎?
舍恩伯格:大數據不能從根本上消除這種不公平,但是,通過大數據的手段,我們能以相對較低的成本提供高度個性化的教育,從而減少這種不公平帶來的危害。換言之,大數據能讓學生以很低的成本,獲得至少像“私人家教”那樣的訂制教育。所以,大數據可以成為改變整個游戲的因子。