日前,交通運(yùn)輸部科技大講堂邀請(qǐng)微軟研究院主任研究員鄭宇博士,帶來(lái)了題為“大數(shù)據(jù)和AI驅(qū)動(dòng)城市智能——交通篇”的講座。大數(shù)據(jù)的核心是什么、能解決城市交通哪些問(wèn)題,目前難點(diǎn)在哪?針對(duì)這些問(wèn)題,鄭宇帶來(lái)的城市交通大數(shù)據(jù)解題思路。
多元數(shù)據(jù)融合是大數(shù)據(jù)核心
鄭宇認(rèn)為,大數(shù)據(jù)的核心并不是要處理很大量的數(shù)據(jù),而是要應(yīng)用多種數(shù)據(jù)解決實(shí)際問(wèn)題。比如計(jì)算一個(gè)城市汽車的總排放量,首先面臨的難題是算出這個(gè)城市中的車流量。因?yàn)槌鞘械缆分杏须娮痈袘?yīng)線圈的通常不到1%。用路口攝像頭計(jì)算車流量也比較困難,因?yàn)橹灰獢z像頭的高度、角度不同,就得重新建立計(jì)算模型,工作量非常巨大。所以要計(jì)算一個(gè)城市的車流量,需要用到出租車GPS數(shù)據(jù)、路網(wǎng)結(jié)構(gòu)數(shù)據(jù)、天氣數(shù)據(jù)和周邊基礎(chǔ)設(shè)施數(shù)據(jù)等,用多元數(shù)據(jù)建立一個(gè)比較復(fù)雜的計(jì)算模型。
鄭宇又舉了用大數(shù)據(jù)監(jiān)測(cè)城市道路異常情況的例子:“車流量增加了10%并不會(huì)讓我們感覺(jué)有什么異常,可當(dāng)這條路上和周邊區(qū)域刷微博的人多了10%,共享單車的使用量也增加了10%的時(shí)候,大數(shù)據(jù)就能預(yù)測(cè)到這條路可能面臨擁堵,需要采取措施進(jìn)行疏導(dǎo)。疏導(dǎo)交通需要找到源頭,可能這條路堵,源頭是在另一條路或者更遠(yuǎn)的地方,這時(shí)候就需要更多的數(shù)據(jù),如軌道交通數(shù)據(jù)、天氣數(shù)據(jù)、突發(fā)事件數(shù)據(jù)、市內(nèi)大型活動(dòng)等數(shù)據(jù)。”
鄭宇表示,用大數(shù)據(jù)解決問(wèn)題,經(jīng)常有人會(huì)說(shuō)數(shù)據(jù)不夠,其實(shí)是個(gè)思路問(wèn)題,要放開(kāi)思路和思維維度,讓更多的數(shù)據(jù)為我所用。大數(shù)據(jù)是多元數(shù)據(jù)融合,有時(shí)更考驗(yàn)人的視野和想象力,要“既見(jiàn)樹(shù)木,又見(jiàn)森林”。
既能算道路規(guī)劃還能算客貨運(yùn)營(yíng)
從城市道路規(guī)劃到出租車運(yùn)營(yíng),甚至到城市急救站的設(shè)置,大數(shù)據(jù)都有用武之地。
鄭宇舉例說(shuō):“有些城市擁堵是因?yàn)榈缆芬?guī)劃不科學(xué)造成的,大數(shù)據(jù)計(jì)算可以解決這個(gè)問(wèn)題。首先要把城市網(wǎng)格化,形成一個(gè)個(gè)區(qū)域,然后把各區(qū)域之間連接線每天的路況特征提取出來(lái),這些特征主要有速度、流量和繞路比等。例如從A到B,如果速度慢,還經(jīng)常被繞路,說(shuō)明這兩個(gè)區(qū)域間的交通出了問(wèn)題,需要重新規(guī)劃。”
在天津,以前急救中心的設(shè)置主要靠人的經(jīng)驗(yàn),通過(guò)大數(shù)據(jù)計(jì)算后,在不增加任何人和車輛資源的情況下,還是原來(lái)的道路,通過(guò)改變急救中心的位置,急救車接送病人的時(shí)間降低了30%,這也意味著醫(yī)生有更充裕的時(shí)間來(lái)救治這些危重病人,挽救更多的生命。拼車最優(yōu)一直是交通大數(shù)據(jù)領(lǐng)域的難題之一,前不久高考期間還有考生因?yàn)槠窜囧e(cuò)過(guò)了考試時(shí)間。目前鄭宇博士帶領(lǐng)團(tuán)隊(duì)建立了拼車最優(yōu)的大數(shù)據(jù)模型,運(yùn)力可以提高10%到15%。如果把人變成貨物,該模型還可復(fù)制到物流中。
鄭宇表示,在城市交通領(lǐng)域,送餐問(wèn)題是大數(shù)據(jù)面臨的最難的挑戰(zhàn)之一,因?yàn)樗筒蜕婕暗剿筒蛦T、餐廳、買家三點(diǎn)聯(lián)動(dòng)的問(wèn)題,三點(diǎn)聯(lián)動(dòng)會(huì)產(chǎn)生多種選擇,這種選擇隨著業(yè)務(wù)量的增加呈幾何級(jí)增加,而且送餐對(duì)時(shí)間要求更加苛刻。一個(gè)成熟的送餐員面對(duì)2到3單時(shí)還可以用經(jīng)驗(yàn)算出最優(yōu)路徑,但面對(duì)4到5單以上時(shí),人腦就不夠用了,必須靠大數(shù)據(jù)系統(tǒng)來(lái)計(jì)算。這個(gè)問(wèn)題的解決對(duì)于互聯(lián)網(wǎng)餐飲配送公司尤為重要,甚至可以成為公司的核心競(jìng)爭(zhēng)力。
人的功能不能被忽視
“在人工智能和大數(shù)據(jù)領(lǐng)域,計(jì)算機(jī)深度學(xué)習(xí)的概念非常熱,但在大數(shù)據(jù)應(yīng)用領(lǐng)域,人的功能不能被忽視。”鄭宇舉例說(shuō),要在一個(gè)區(qū)域設(shè)置5個(gè)充電樁,如何設(shè)置才能讓充電樁覆蓋的范圍最大?這是一個(gè)復(fù)雜的問(wèn)題,其計(jì)算模型是在人機(jī)交互中不斷調(diào)整完善的。首先通過(guò)一些簡(jiǎn)單條件建立模型,計(jì)算機(jī)會(huì)得出一個(gè)結(jié)果,然后行業(yè)專家根據(jù)經(jīng)驗(yàn)對(duì)結(jié)果進(jìn)行調(diào)整并增加條件,機(jī)器根據(jù)調(diào)整結(jié)果和條件進(jìn)行再計(jì)算,行業(yè)專家再調(diào)整,這樣經(jīng)過(guò)幾輪的反復(fù),計(jì)算模型才會(huì)趨于完善和科學(xué)。從上面例子可以看出,大數(shù)據(jù)不僅是計(jì)算機(jī)深度學(xué)習(xí),還有人機(jī)交互,互相學(xué)習(xí)。
“根據(jù)銀行以往的交易數(shù)據(jù),來(lái)確定信用卡發(fā)卡客戶,做的是數(shù)據(jù)分析員的工作。但如果要弄清設(shè)立城市副中心帶來(lái)交通影響,需要一名數(shù)據(jù)科學(xué)家。一名數(shù)據(jù)科學(xué)家需要7到10年的培養(yǎng),屬于稀缺人才。”鄭宇表示,成為一名數(shù)據(jù)科學(xué)家要有深厚的行業(yè)知識(shí),知道產(chǎn)生問(wèn)題的深層次原因;還要了解數(shù)據(jù)的涵義,視野寬闊,知道社交媒體的數(shù)據(jù)可以用來(lái)解決交通問(wèn)題;此外還要懂算法和云平臺(tái)。數(shù)據(jù)科學(xué)家不僅要解決問(wèn)題,還要想問(wèn)題,甚至要比政府提前看出問(wèn)題。
另外,鄭宇認(rèn)為,要解決城市問(wèn)題包括交通問(wèn)題,建立城市大數(shù)據(jù)平臺(tái)是必須的。在這個(gè)平臺(tái)上,集多元、異構(gòu)、多模和大規(guī)模數(shù)據(jù)于一體,遇到問(wèn)題時(shí)可以迅速調(diào)取數(shù)據(jù),建立模型進(jìn)行計(jì)算。