關(guān)健
[“IDST要做阿里其他部門不愿做也做不了的事情。”這是王堅對IDST的角色定位。]
這兩天,阿里巴巴投入1500萬元新啟動了一個代號為“天池”的數(shù)據(jù)競賽,選手們比拼如何利用現(xiàn)有大數(shù)據(jù)進(jìn)行淘寶女裝搭配的算法推薦、余額寶資金的流入流出預(yù)測等。其背后的推動者是被外界稱為阿里巴巴最神秘部門IDST的負(fù)責(zé)人涂子沛,著有《大數(shù)據(jù)》和《數(shù)據(jù)之巔》。
3月25日,《第一財經(jīng)日報》記者在阿里巴巴西溪園區(qū)的會議室里對涂子沛進(jìn)行了獨家專訪。軍人出身的他,身上帶有一股特殊的英氣,這在IT圈里并不多見。
涂子沛去年年底從美國硅谷空降阿里巴巴出任副總裁,負(fù)責(zé)大數(shù)據(jù)的商業(yè)化創(chuàng)新研究。該消息引得業(yè)界廣泛關(guān)注,但這個主要由科學(xué)家組成的新部門一直未向外界揭開神秘面紗。
在阿里內(nèi)部,做數(shù)據(jù)研究工作的IDST幾乎和集團(tuán)的每一個BU(事業(yè)部)都有交集,這個扮演中轉(zhuǎn)站角色的部門,要如何肩負(fù)起馬云“讓數(shù)據(jù)驅(qū)動未來”的商業(yè)夢想?
做其他部門不愿做、做不了的事
IDST(InstituteofDataScience&Technologies),數(shù)據(jù)科學(xué)與技術(shù)研究院,單從名稱上看,就明顯區(qū)別于互聯(lián)網(wǎng)公司內(nèi)部的事業(yè)部運營風(fēng)格,如果把各事業(yè)部比喻成拼殺于戰(zhàn)場上的江湖派,那么IDST則充滿了學(xué)院風(fēng)格,其員工也大多具有科學(xué)家背景。
作為負(fù)責(zé)人,涂子沛的名片上印的英文名字是Jack,和人們熟悉的JackMa(馬云)同名,其職位只寫了阿里巴巴集團(tuán)副總裁,此外再沒有任何如IDST等相關(guān)名頭。
目前,這個部門大約有150名員工,分布在杭州、北京、硅谷和西雅圖兩岸四地,其中杭州有50人左右。在組織架構(gòu)上,IDST分屬于阿里云;層級關(guān)系上,涂子沛向阿里巴巴集團(tuán)首席技術(shù)官王堅博士匯報,王堅就是IDST這個想法的最初設(shè)計師。
事實上,IDST的三名負(fù)責(zé)人都有來頭。除了涂子沛,漆遠(yuǎn)是普渡大學(xué)計算機(jī)系和統(tǒng)計系兩個系的終身教授,擅長機(jī)器學(xué)習(xí)和人工智能;金榕為美國密歇根州立大學(xué)終身教授,獲得過美國國家科學(xué)基金會獎(NSFCareerAward)。涂子沛對記者說,在分工上,漆遠(yuǎn)帶中國團(tuán)隊,金榕帶美國團(tuán)隊,他負(fù)責(zé)商業(yè)和數(shù)據(jù)經(jīng)濟(jì)方面的研究。
涂子沛出國前在廣州武警邊防總隊待了8年,后又在廣東省經(jīng)貿(mào)部門工作兩年,其在政府方面的人脈也是馬云看中的資源。要知道去年以來,阿里云披荊斬棘般地與全國十幾個省份達(dá)成合作協(xié)議,與政府機(jī)構(gòu)數(shù)據(jù)的對接對任何一個民間數(shù)據(jù)公司來說都如獲至寶。
“IDST要做阿里其他部門不愿做也做不了的事情。”這是王堅對IDST的角色定位。何為不愿做?與那些營收增長立竿見影的業(yè)務(wù)部門相比,數(shù)據(jù)研究、機(jī)器學(xué)習(xí)、自然語言處理這些領(lǐng)域很難快速出成績。涂子沛也說,既然是創(chuàng)新部門,就沒有背負(fù)傳統(tǒng)的績效考核目標(biāo)。何為做不了?單聽這些前沿性的研究領(lǐng)域就知道門檻有多高。
類似的研究室在全球有實力的科技企業(yè)中生根發(fā)芽,像谷歌大腦,即googleX實驗室,做的是人工智能、機(jī)器學(xué)習(xí)的研究,可應(yīng)用到語音識別、無人汽車等領(lǐng)域;微軟類似的深度學(xué)習(xí)系統(tǒng)名叫Adam(亞當(dāng));去年5月,前“谷歌大腦”、第一個讓機(jī)器識別出“貓”的科學(xué)家吳恩達(dá)從硅谷回國,加盟百度深度學(xué)習(xí)研究院,推進(jìn)人工智能研究。
從硅谷到中國,不只是科學(xué)家,大量云計算方面的高層人才正演繹著這個流動趨勢,比如從甲骨文到阿里云。涂子沛認(rèn)為,這股趨勢背后說明,在大數(shù)據(jù)、云計算等前沿領(lǐng)域,中國與美國的差距微乎其微,越來越多的人看到了回國建功立業(yè)的機(jī)會。
每年投入1500萬元辦數(shù)據(jù)大賽
對大數(shù)據(jù)的分析和使用將對互聯(lián)網(wǎng)公司和用戶生活層面產(chǎn)生多大的改變?
去年,阿里巴巴舉辦了一次天貓算法推薦大賽,其中6名大學(xué)生組成的團(tuán)隊拿走了100萬元的頭獎,他們設(shè)計的算法效率超過了阿里巴巴工程師16.9%,這套算法隨即被應(yīng)用到“雙11”中,通俗地講就是讓商品推薦變得更精準(zhǔn),內(nèi)部預(yù)計這套算法給平臺帶來了上千萬元的經(jīng)濟(jì)價值,這也讓阿里見識到了外部新生力量的強(qiáng)大。
該項目的負(fù)責(zé)人、來自IDST部門的高級經(jīng)理王一婷對《第一財經(jīng)日報》記者說,6個人中有一人即將入職阿里巴巴,一人靠這次的一炮而紅開始創(chuàng)業(yè),其他人還未畢業(yè)。26日剛啟動的天池大賽與此類似,將持續(xù)一年時間,有“聯(lián)賽”的意味,去年比賽有國內(nèi)外共7276支隊伍參加。
招攬人才、創(chuàng)新產(chǎn)品的商業(yè)化應(yīng)用、推動大數(shù)據(jù)生態(tài)建設(shè),這是IDST舉辦這類大賽的目的。這也得到了涂子沛的證實,他向本報記者透露,阿里每年在這個比賽上投入的資金在1500萬元左右,其中最大的花費是計算成本,阿里拿出了1000臺服務(wù)器專門提供給參賽者,項目還會對接風(fēng)投,孵化選手們的創(chuàng)業(yè)夢想,“如果非要說這里邊有什么商業(yè)利益的話,只有參賽者的算法被應(yīng)用到阿里業(yè)務(wù)中這一點。”
這次天池大賽,選手們會圍繞3個課題施展拳腳,其中之一是淘寶女裝搭配,阿里將淘寶上的大數(shù)據(jù)脫敏后給到參賽者,后者需要設(shè)計一套算法,利用圖像識別等技術(shù)讓機(jī)器來搭配服飾,代替以往的人工挑選和搭配。當(dāng)然,機(jī)器的“眼光”如何,最后還要經(jīng)過消費者的評估。
還有針對資金規(guī)模高達(dá)5789億元的余額寶,選手們要做的是精準(zhǔn)預(yù)測其未來每天的資金流入流出情況,既保證用戶的高收益,又避免大量贖回導(dǎo)致擠兌;此外,就是預(yù)測手機(jī)淘寶用戶的購物喜好。
而像在蝦米音樂上根據(jù)用戶的喜歡推薦音樂等課題將放到下一次大賽中去落實。
一切業(yè)務(wù)數(shù)據(jù)化,一切數(shù)據(jù)業(yè)務(wù)化,馬云最近一年在全球眾多高端場合“布道”其數(shù)據(jù)觀點。涂子沛稱,中國目前擁有的數(shù)據(jù)量占全世界的14%,預(yù)計到2020年這一比例將為21%,但數(shù)據(jù)利用率不到0.4%,數(shù)據(jù)商業(yè)化的空間以及數(shù)據(jù)經(jīng)濟(jì)的未來價值已經(jīng)顯現(xiàn)。
數(shù)據(jù)開放和數(shù)據(jù)商業(yè)化,將是未來幾年內(nèi)不斷延伸的兩條交叉線。涂子沛說,以前寫書、演講,是知識傳播,這次從美國舉家搬到杭州,角色要求轉(zhuǎn)變成了知識創(chuàng)新,將會更有挑戰(zhàn)。