先后通過投資GrabTaxi、Lyft將業務伸向海外市場之前,滴滴的技術團隊已經跑了好些遍美國。目的很簡單,就是尋覓海外優質的技術人才。
事實上,相比在業務和資本領域的高調,滴滴的技術更多習慣性地隱藏在幕后。
但作為一個互聯網公司,技術的重要性卻不容小覷。
按照滴滴出行CTO張博的理解,大數據才是滴滴的心臟。“不只是滴滴產品的心臟,還是滴滴商業的心臟。”
“挖角”硅谷人才
《第一財經日報》記者見到滴滴出行大數據架構部總監張浩的時候,他剛入職滴滴半個月。
盡管滴滴大部隊已經搬去了位于北京西二旗軟件園二期的全新辦公樓,但由于裝修進度,張浩和他的團隊暫時還得留守在得實大廈辦公。
僅有1部客梯和2部貨梯的寫字樓,擁擠的工位,這是一個與遠在大洋彼岸的硅谷截然不同的工作環境。
但張浩還是決定舉家從美國搬回來。
在此之前的2015年7月,剛過完美國獨立日不久的張浩在推特樓下見到了張博和滴滴大數據領域負責人。
加盟滴滴之前,張浩有過微軟多年的工作經歷,當時關注最多的就是大數據和人工智能。
“但我始終覺得這個東西屬于技術,屬于極客們特喜歡玩的,其實沒有真正觸及到人的生活。但出行領域加上大數據真的可以改變這個行業。”按照張浩透露的信息,和他一起從硅谷回來的大數據領域高端人才還有好幾個。
這些人加盟滴滴更多緣于一個今年上半年開始正式啟動的人才招募計劃。
5月22日,滴滴對外宣布將正式成立“機器學習研究院”,同期公布的是上述研究院的科學家招募計劃,計劃將在全球范圍招募相關領域的世界級科學家。
而張博也因此多了一個任務,就是經常性地帶著團隊飛美國張羅招聘。
張浩入職滴滴第一天最為直接的感受就是這個團隊太年輕了。“公司里所有的領導都比我年輕,我們這幾個國外待了十幾年回來的,一下把平均年齡拉大了不少。”
大數據的想象力
滴滴出行戰略負責人朱景士日前對外公布了這樣一組數據。
滴滴目前每分鐘要匹配200萬次需求,超過所有地圖軟件,每天數據分析量級是50TB,大約是5萬部高清電影。每天連續上傳的定位數據是50億次。
“中國市場的規模、人口密度、收入、車輛保有率、交通環境的各種差異,決定了中國市場需要一個超越單一專車App的全平臺服務。”而且中國的交通問題和美國根本不是一個量級的,面對中國如此復雜的交通體系和所需路線的精密計算,按照朱景士的觀點,“我們等于每天都在做微積分,而其他的公司只不過是在做一些算術,加減乘除。”
也正是這樣一個復雜的業務需求和龐大的數據量帶來的想象空間使得滴滴成為不少大數據業務專家加盟的重要原因。
但隨之而來的問題是,這些從海外費盡心思尋覓而來的技術人才能給滴滴帶來什么。
張浩的回答是兩點,海外經驗對大家視野的擴展和硅谷的工程師文化、工匠精神。
“滴滴一個很大的強項是擁抱變化,這點我是在美國別的公司沒有見到的,每個員工都非常有激情,對我們的目標非常看好,這些都是好的。”而張浩在入職之后更關注的是如何讓堅持以業務為驅動的滴滴在高速發展的同時保持工程師團隊的技術沉淀。
在大談特談大數據的當下,移動互聯網的普及已經讓獲取數據變得相對比較容易。但是如何有效地分析和理解海量數據仍是一個很大的問題。
按照張博此前的介紹,滴滴研發的基本原則是想辦法撮合乘客和司機,滿足他們的需求,保證他們的體驗。簡單點說,就是將訂單發送給合適的司機。
以滴滴專車業務為例,目前還要用到人為制定的規則,例如如何將信息推送給最適合區域內的司機、誰優先獲得訂單等等。在數據量較小的情況下,可以基于規則、人的經驗來設定算法,但是在數據量更大更豐富的情況下,這樣的做法可能和現實存在一定程度的脫節。
這是一個頗為繁雜的過程。“除了推薦算法要準確、匹配效率要高、計算要快、推送要及時,還要在推送訂單到這位司機之前,通過對小費、長短途、時間、方向敏感等靜態特征和司機與訂單之間的位置關系、時間關系等動態特征進行綜合分析來預測他對訂單感興趣的程度。”張博解釋道。
此外,給乘客什么樣的補貼、給司機什么樣的補貼、誰更敏感、多少金額影響更積極,這些策略的背后都是大數據在起作用。
一鍵式一步出行平臺
作為大數據方面的專家,張浩向《第一財經日報》記者描繪了一個移動出行相當誘人的未來場景——真真正正實現一鍵式一步出行平臺。現在還需要自己篩選出行方式,是坐公交車還是選擇順風車、坐快車、專車。未來通過更多的數據與更精確的算法和匹配,用戶只要輸入目的地就能獲得更多更精準的出行方式推薦。“到那個時候,即使是沒有地圖產品,即便是不太熟悉智能手機的老人、小孩都能夠真正享受這個大數據提供的優越性。”
在過去的幾年間,滴滴每張訂單的乘客信息、司機信息、出行軌跡都被悉心記錄下來。但出行領域的大數據與電商和搜索引擎方面的有著不同的標準。
在張浩看來,電商和搜索引擎這塊的大數據分析已經做得比較成熟,但從效果來說,電商和搜索引擎的大數據分析如果不夠準確損害程度并不大。“大不了給我推薦的東西我不喜歡就沒買;給我推薦的工作大不了完全不搭界我不理睬就行了。但真正涉及到每個人每天的出行,如果有一步做得不對,沒趕上開會或者誤了航班都會帶來很大的麻煩。”
從2014年底便開始醞釀的滴滴“機器學習研究院”要解決的就是更好更精準的數據匹配。
按理說,在使用機器學習的方法后,可以自動設定合理的規則,提高數據處理效率。而且,對機器學習來說,數據量越大,分析結果就越精確。
但實際上越是智能、越是自動化的東西,就越會出問題。“這意味著對我們的科學家和工程師團隊要求會越來越高。”張浩補充道。
入職滴滴之后,張浩遇到最多的問題是如何在保持系統的通用性的技術上,滿足不同業務線獨特的需要。
將業務從單一的出租車迅速擴張到包括專車、快車、順風車、代駕等多個領域之后,來自技術部門的煩惱是滴滴的各個業務線產品大多每個星期都需要有一個迭代,而此前滴滴快的合并之后還給工程師們留下了不同系統整合優化的任務。
“我現在一半的時間花在系統整合和優化,另一半的時間花在勾畫出未來6個月到一年需要做的新的事情,這兩個事情都得同時做。”這樣的工作狀態和滴滴快速的業務拓展有點類似,“就好像一邊造自行車,一邊在往前騎。”