“截至2017年年底,深圳市公安局要求全市范圍內(nèi)在視頻監(jiān)控領(lǐng)域?qū)崿F(xiàn)兩萬路的人像識別的建設(shè)。”在某次會議上,深圳大學(xué)安鶴男教授介紹道。
他表示,如今AI已與很多行業(yè)融合、落地,就拿安防行業(yè)來說,深圳公安部門已經(jīng)越來越多地使用相關(guān)系統(tǒng)協(xié)助自身辦案。在系統(tǒng)建設(shè)過程中,深圳平安城市建設(shè)與公安部要求不謀而合,總結(jié)起來有四點:全面高清、全域覆蓋、全網(wǎng)共享、全時可用。
安教授透露說,龍崗分局是深圳市公安系統(tǒng)人臉識別建設(shè)規(guī)模最大的一個分局。截止到目前已經(jīng)建設(shè)了智慧警務(wù)二期,人臉一期建設(shè)了108路,二期就已經(jīng)上升到了603路,相關(guān)關(guān)聯(lián)項目建設(shè)了1761路。現(xiàn)如今,接入到龍崗分局業(yè)務(wù)系統(tǒng)中的人臉識別是2910路,其中還包括了250路從其他分局匯聚到龍崗分局的人像識別的業(yè)務(wù)系統(tǒng),比如說聯(lián)合判案等等。
他在會上強調(diào),人臉識別等系統(tǒng)的應(yīng)用有效解決了公安以往遇到的棘手難題。在去年的深圳十大杰出優(yōu)秀警務(wù)案例評比中,有六個案例是完全依賴于人像的智能識別,有四個案例是借用了這些系統(tǒng)。
隨后,安鶴男教授還例舉了一個詳細(xì)案例加以敘述。“在中國(深圳)國際文化產(chǎn)業(yè)博覽交易會(文博會)上,深圳市公安局福田分局通過動態(tài)人臉布控系統(tǒng)實現(xiàn)了近20萬人次的人像識別,并比中20多名前科人員,保障了文博會零案件的發(fā)生。”
對于未來,安鶴男教授認(rèn)為AI等技術(shù)將會在安防行業(yè)落地生根,語音識別及人臉識別將成兩個大方向,包括安防機器人等產(chǎn)品將大受市場歡迎。
以下是安鶴男教授的演講全文,雷鋒網(wǎng)作了不改變原意的編輯:
深圳是智慧安防應(yīng)用比較早的一個城市。尤其是在平安城市的建設(shè)當(dāng)中,它既圍繞著公安部對平安城市的具體建設(shè)要求,同時又有深圳本地公安在平安城市建設(shè)當(dāng)中的一些創(chuàng)新和心得。
智慧安防從提出到發(fā)展大概走過幾個“節(jié)點”。從看得見到看得清、從看得清到看得懂。AI的出現(xiàn)很好地解決了機器“如何看懂”難題。
如今,深圳平安城市的建設(shè)過程主要圍繞四點展開:
一、全面高清。未來的建設(shè)目標(biāo)是全高清。
二、全域覆蓋。不留死角,尤其是在死角當(dāng)中,必須有高清記錄。
三、全網(wǎng)共享。全網(wǎng)聯(lián)通,更寬、更快的信息基礎(chǔ)建設(shè)。
四、全時可用。全城隨時隨地可以有效利用相關(guān)設(shè)備。
其實按照上面的四個目標(biāo),也就知道高清前端越多,效果會越好,但由此帶來的視頻數(shù)據(jù)也會越大。隨著這些數(shù)據(jù)的指數(shù)增長,為這些數(shù)據(jù)服務(wù)的人力、物力的增長成本也是不計其數(shù)的。這也就顯示出AI在視頻監(jiān)控當(dāng)中的重要地位及使用環(huán)境。
我們常說的這類技術(shù),其實無外乎從三個維度來詮釋這些問題:大數(shù)據(jù)、超算集群、算法。
在世界范圍內(nèi),包括Google、微軟提出來的其實就是卷積神經(jīng)網(wǎng)絡(luò)的一些算法,但從用戶角度來講,我們更關(guān)注的是在云架構(gòu)下大數(shù)據(jù)的計算,包括GPU的集群、給我們帶來的API的出口,未來安防行業(yè)無論是企業(yè)、還是集成單位,更多關(guān)心的是使用成本。
這個特點也決定了相關(guān)產(chǎn)品在市場上的智能應(yīng)用。
接下來我會分享一些數(shù)據(jù),這些數(shù)據(jù)是深圳公安局對深圳智慧城市建設(shè)當(dāng)中關(guān)乎到AI方面做的一些重點規(guī)劃。
2017年年底,深圳市公安局要求全市范圍內(nèi)在視頻監(jiān)控領(lǐng)域?qū)崿F(xiàn)兩萬路的人像識別的建設(shè)。
截止目前建設(shè)情況是怎樣的呢?首先說一下龍崗分局,龍崗分局是深圳市公安系統(tǒng)人臉識別建設(shè)規(guī)模最大的一個分局,截止到今天已經(jīng)建設(shè)了智慧警務(wù)二期,人臉一期建設(shè)了108路,二期就已經(jīng)上升到了603路,相關(guān)關(guān)聯(lián)項目建設(shè)了1761路。
現(xiàn)如今,接入到龍崗分局業(yè)務(wù)系統(tǒng)中的人臉識別是2910路。這個2910路里面還包括了250路從其他分局匯聚到龍崗分局的人像識別之后的業(yè)務(wù)系統(tǒng),比如說聯(lián)合判案等等。
那么這么多的人臉識別建設(shè)在龍崗的公安業(yè)務(wù)系統(tǒng)當(dāng)中有何成效?深圳在去年年底做了一個十大杰出優(yōu)秀警務(wù)案例評比,其中有6個案例是完全依賴于人像的智能識別,有4個案例是借用了這個系統(tǒng),從這些數(shù)據(jù)可以看出,建設(shè)相關(guān)設(shè)備及系統(tǒng)非常有利于公安部門展開工作。
其次是福田分局。福田分局建設(shè)相對較晚,之前只建設(shè)了65路。但由于該區(qū)域由深圳市政府所管轄,包括會展中心每年有很多大型活動,對相關(guān)方案需求比較大。比如文博會,今年的文博會總共裝了40路相關(guān)產(chǎn)品,在此次工作中,系統(tǒng)共識別了180883人,預(yù)警了2871人,抓了20人,實現(xiàn)了零案的發(fā)生。
說了這么多,其實我們一直都是給AI唱贊歌。“聞其身,觀其形”,未來人工智能在安防領(lǐng)域的應(yīng)用主要會體現(xiàn)在兩個方面:
一、語音識別;
二、人臉識別。
而這些技術(shù)的應(yīng)用背后都涉及到深度學(xué)習(xí)算法,主要關(guān)聯(lián)的就四大塊:
第一、計算資源。
我覺得它比算法更為重要,計算資源其實指引的就是超算,基于GPU的超算其實是基于一種浮點、寬浮點的運算,以往,它可能是一千個CPU做的集群,然后存20萬張圖片,做一次卷積的迭代大概需要一個月。像這樣的設(shè)備,做12次的迭代,需要一年。
那么今天,如果只有200個GPU,集成一千萬張圖片做一次迭代只需要兩個小時,使得識別率出現(xiàn)革命性變化,機器的識別首次超過了人類。
在這個背景下,無論是科學(xué)家也好、企業(yè)家也好,就盯上了這個變化,并將這些成果帶入安防行業(yè)。
第二、規(guī)模效應(yīng)。
規(guī)模效應(yīng)其實是問題的關(guān)鍵。個別案例的破獲可能不足以說明問題,但大規(guī)模的建設(shè)可能會變成相關(guān)產(chǎn)品在安防行業(yè)落地的導(dǎo)向。
第三、加工。
系統(tǒng)識別過后的數(shù)據(jù)挖掘及分析。
第四、作業(yè)。
其指的是安防領(lǐng)域中相關(guān)聯(lián)的一些業(yè)務(wù)系統(tǒng)。在以前,很多數(shù)據(jù)處理在后臺完成,未來可以將應(yīng)用前移,經(jīng)過芯片算法集成,放在攝像機的前端去做。那么這種作業(yè)量和集成量到底是什么關(guān)系?目前很多公司可以通過很多的途徑來獲取大量的數(shù)據(jù),目前中國人多,數(shù)據(jù)也非常多,但是數(shù)據(jù)采集、抓取之后,數(shù)據(jù)的整理工作進(jìn)行的如何呢?
在這里,我想插敘一個故事,AlphaGo可能是對普羅大眾最深的一次傷害,這個機器居然能夠贏人。
其實,在1996年的時候,也有一個非常轟動的實踐——深藍(lán),IBM推出了一款專門下國際象棋的超級計算機,重1270公斤,只有32顆CPU,線程是并行的,4核,大概是120多個計算單元。
在當(dāng)年迎戰(zhàn)俄羅斯象棋高手,結(jié)果是:機器輸了,人贏了。那個時候所謂的計算機與如今所談的AI完全不是一個概念,結(jié)構(gòu)也完全不同;但1997年再戰(zhàn)的時候,深藍(lán)就贏了象棋大師,當(dāng)時就有人非常恐慌,未來該怎么辦?
今天,我們看到的這種基于深度學(xué)習(xí)的AI架構(gòu),是建立了一個深度的卷積標(biāo)做迭代,其實就是耗費背后龐大的計算資源,也就是剛才提到的作業(yè)。
后面的這幾個指標(biāo),就跟我們的業(yè)務(wù)系統(tǒng)有關(guān)系,一個是公安的業(yè)務(wù),不僅看臉,還看物、聽聲、判別類別。未來應(yīng)用場景有很多:
類別一、視頻監(jiān)控。
這個應(yīng)用很龐大,包括視頻門禁等。
類別二、機器人。
自2015年之后,安防機器人雨后春筍般冒出,包括如今非常火的物流分揀機器人,機器人在安防領(lǐng)域的應(yīng)用不可低估。
未來,AI在安防領(lǐng)域的‘機會’將非常巨大,可能會體現(xiàn)在兩個方面:
方面一、視頻監(jiān)控。
視頻監(jiān)控看得清已經(jīng)不重要了,未來一定要看得懂。
方面二、大數(shù)據(jù)和視頻結(jié)構(gòu)化技術(shù)。
視頻記錄下來的是非結(jié)構(gòu)化數(shù)據(jù),結(jié)構(gòu)化數(shù)據(jù)的轉(zhuǎn)化是一個非常重要的過程,也是一個非常難的技術(shù)。當(dāng)然,今天已經(jīng)有了很大進(jìn)步,但也能從原來手動的變成了半自動的;另外,我們今天的標(biāo)注其實還有人為的因素。
隨著數(shù)據(jù)量增大,AI將進(jìn)入一個快速發(fā)展期;同時,由于AI的發(fā)展,各個行業(yè)對AI的依賴性也會越來越大。
在AI的路上,不僅有風(fēng)花雪月,可能還有詩和遠(yuǎn)方!