你認(rèn)為只有企業(yè)才會面臨大數(shù)據(jù)問題嗎?想一下紐約市:這個美國最大的城市擁有820萬人口,每天產(chǎn)生大量的數(shù)據(jù),其中大部分?jǐn)?shù)據(jù)位于很多市政機構(gòu)和部門的高度分散的孤島中。
這些數(shù)據(jù)涉及商業(yè)識別碼(BIN)、BBL稅號、營業(yè)執(zhí)照、違規(guī)停車罰單、交通違法行為、健康檢查、犯罪行為、救護服務(wù)召喚、火災(zāi)等。
紐約市市長辦公室政策和戰(zhàn)略規(guī)劃分析主管兼紐約金融犯罪特遣部隊主管Michael Flowers表示:“我們每天需要處理各種數(shù)據(jù):郵寄地址、稅號、建筑標(biāo)識號等等,但當(dāng)我們試圖利用所有這些數(shù)據(jù)時,從本體論和分類學(xué)的角度來看,這變得非常困難。此外,所有這些數(shù)據(jù)都被存儲在城市的不同位置,可以說是支離破碎。存儲系統(tǒng)本身也存在巨大差異,有些系統(tǒng)很先進且易于使用,而有些系統(tǒng)則早已過時。”
紐約市的311熱線每天接收超過65000次呼叫
讓事情更具挑戰(zhàn)性的是,紐約市的311非緊急熱線每天接收超過65000次呼叫,其中涉及對噪音的投訴以及對破爛和坑坑洼洼的人行道的報告,還有詢問如何獲取契據(jù)或者養(yǎng)食人魚是否合法。
“我們只是基于簡單的先后順序來分配我們的資源,”Flowers表示,“有電話打進來,我們就會對這個電話做出響應(yīng)。”
唯一的問題是:但是311的呼叫情況并不能說明這些資源的真正去向,它們是數(shù)據(jù),但是不完整的數(shù)據(jù)。
于是,F(xiàn)lowers對紐約市進行了臭鼬項目(用來形容高度靈活、高度自治、不受約束的項目),他和他的團隊需要向紐約市政府社區(qū)展示紐約的大量數(shù)據(jù)如何可以用來更有效地分配資源。
“我們正在努力使你們的生活更加輕松,同時盡可能地有效地分配這些資源,這樣你們就不需要想過去一樣付太高的稅額,”Flowers表示,“我們需要做的是想辦法展示一個共用平臺的效用。我需要向紐約政府社區(qū)證明我們能夠整合和利用這些信息,這是我們的工作。”
大數(shù)據(jù)和非法改建
這個項目“雄心勃勃”,F(xiàn)lowers想要利用這些數(shù)據(jù)來幫助識別可能存在非法改建的建筑物,例如,原本只能容納六個人的建筑物居住了60個人。
根據(jù)對311熱線的投訴,你會認(rèn)為大部分非法改建發(fā)生在曼哈頓下城。但實際上,我們發(fā)現(xiàn)非法改建出現(xiàn)在布魯克林、皇后區(qū)和布朗克斯各區(qū)的外圍。
Flowers表示:“在2011年春天和夏天,我們有兩棟非法改建的建筑物發(fā)生火災(zāi),一些消防員受重傷,還有一些人死亡。”
Flowers稱,非法改建的建筑物更容易發(fā)生火災(zāi),更重要的是,在這些建筑物中,消防員更容易受傷或者死亡,因為這些建筑物的逃生出口往往被阻塞。“我們的任務(wù)就是想辦法解決這個問題。”
成功的數(shù)據(jù)項目從與人們溝通開始
對于Flowers的團隊來說,這似乎是不可能完成的目標(biāo)。他的團隊都沒有很高的學(xué)歷,并且都在25歲或者以下。此外,因為這是一個臭鼬項目,很少人明白他們在做什么。但他們下決心改變局面。Flowers做的第一件事情就是與第一線的人們交談。
他表示:“我跟消防員談,跟警察談,跟屋宇署的督察談,我問他們:‘當(dāng)你們看到一個不安全的建筑,你們看到了什么?’然后我將這些用數(shù)據(jù)來體現(xiàn)。”
Flowers讓其團隊研究實際“騰出”情況,即當(dāng)檢察院發(fā)現(xiàn)建筑物不安全時,他們會要求騰空整個或者部分建筑物。
“我不需要解構(gòu)人們的投訴,”Flowers表示,“而是解構(gòu)問題,我使用城市數(shù)據(jù)來解構(gòu)問題。”
Flowers的團隊找出了幾個可行的指標(biāo),包括以下:
-- 這個建筑物是否位于“高風(fēng)險地區(qū)”,即較貧窮的市民更可能居住的危險的地區(qū)?
-- 這是1938年以前的建筑物嗎?1938年建筑規(guī)范有所改變,在規(guī)范改變后的建筑往往更加安全。
-- 建筑物是否已經(jīng)喪失抵押品贖回權(quán)或者稅收留置權(quán)?“這兩個問題的答案很重要,這表明業(yè)主的財務(wù)狀況,”Flowers表示,“我并不是說當(dāng)業(yè)主破產(chǎn)后,他們會向?qū)Υ粯訉Υ麄兊姆课荨?rdquo;
--是否有過投訴?Flowers表示:“如果此前有過投訴,六個月后又有投訴,那么這個建筑物很有可能會發(fā)生火災(zāi)。”
通過這些正確的數(shù)據(jù),F(xiàn)lowers的團隊創(chuàng)建了一個工具,可供檢察員直接使用。在檢察員使用該工具前,當(dāng)他們發(fā)現(xiàn)建筑物不安全時,他們不得不騰空13%的建筑,而在Flowers項目的18個月后,檢察員現(xiàn)在可以騰出70%的建筑物。
“我們?nèi)〉贸晒Φ脑蛟谟谖覀兪褂昧苏_的數(shù)據(jù),”Flowers表示,“這個城市的數(shù)據(jù)是好的,我們采用了正確的方式來使用這些數(shù)據(jù)。”
“我們所做的就是分清輕重緩急,”他補充說,“這是需要立即采取行動的情報信息。”
隨著受數(shù)據(jù)驅(qū)動的決策的價值得到證明,F(xiàn)lowers表示在現(xiàn)任市長2014年1月離任之前,他還有三個目標(biāo):
-- 建立全市范圍內(nèi)的分析,主要集中在更有效地利用機構(gòu)資源
-- 發(fā)展和啟動基于數(shù)據(jù)的資源分配文化
-- 將動態(tài)紐約市數(shù)據(jù)推向公眾、技術(shù)/創(chuàng)業(yè)界和學(xué)術(shù)界