在當前以高端裝備制造為核心的智造工業(yè)4.0時代背景下,隨著“中國制造2025”戰(zhàn)略的深入,工業(yè)智能機器人產(chǎn)業(yè)市場呈現(xiàn)不斷增長的勢頭,其中充當工業(yè)機器人“火眼金睛”角色的機器視覺功不可沒。
安防的技術(shù)一直在演進中,當行業(yè)完成了網(wǎng)絡化和高清化之后,智能化應用就成了各個安防門類廠家的技術(shù)熱門。應該說,從2012年開始,安防行業(yè)都在圍繞如何使產(chǎn)品和系統(tǒng)智能化應用展開深入研發(fā)和探討,從而引發(fā)了一波技術(shù)潮流。如果說智能視頻分析是智慧安防應用的2.0版本,那么,機器視覺,將開啟智慧安防應用2.0時代,這是一個智能安防新的應用天地。
精準把握機器視覺的研究內(nèi)容
要探討機器視覺的應用,首先還是需要精準把握什么是機器視覺,并把其與當下熱門又有重疊部分的人工智能和深度學習區(qū)分開來。
人工智能的外延范圍最大,包括了機器視覺、深度學習、機器人技術(shù)、生物識別技術(shù)和自然語言處理。可以看出,人工智能包括了深度學習和機器視覺,研究的是人類智能活動規(guī)律,構(gòu)造具有一定智能的人工系統(tǒng),研究如何讓計算機去完成以往需要人的智力才能勝任的工作,也就是研究如何應用計算機的軟硬件來模擬人類某些智能行為的基本理論、方法和技術(shù)。
深度學習,是人工智能研究中的一個新的領域,其動機在于建立、模擬人腦進行分析學習的神經(jīng)網(wǎng)絡,它模仿人腦的機制來解釋數(shù)據(jù),例如視頻、聲音和文本。深度學習在安防行業(yè)的應用極為熱門,在評測產(chǎn)品時關(guān)于人臉和車輛的識別技術(shù)都基于深度學習。究其原因,深度學習的關(guān)鍵要素是數(shù)據(jù),而占大數(shù)據(jù)總量60%以上的為視頻監(jiān)控數(shù)據(jù),所以,深度學習的在安防行業(yè)的方方面面得到了應用:人臉檢測、車輛檢測、非機動車檢測、人臉識別、車輛品牌識別、行人檢索、車輛檢測、人體屬性、異常人臉檢測、人群行為分析、各種感興趣目標的跟蹤等。
機器視覺是人工智能正在快速發(fā)展的一個分支。簡單說來,機器視覺就是用機器代替人眼來做測量和判斷。通過分CMOS或CCD傳感器將被攝取目標轉(zhuǎn)換成圖像信號,傳送給專用的圖像處理系統(tǒng),得到被攝目標的形態(tài)信息,根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號;圖像系統(tǒng)對這些信號進行各種運算來抽取目標的特征,進而根據(jù)判別的結(jié)果來控制現(xiàn)場的設備動作。
機器視覺主要是對圖像進行識別,因此機器視覺在人臉識別、車牌識別等方面得到大量運用。以智能交通行業(yè)為例,機器視覺具有成本低、穩(wěn)定性強、準確性高、應用范圍廣等優(yōu)點,目前已經(jīng)在國內(nèi)外高速公路和公路的交通監(jiān)控系統(tǒng)中得到了廣泛的應用,具體體現(xiàn)在車牌識別、車身顏色識別、車型識別、違章識別、車流量統(tǒng)計、流量控制等。
這時有人會產(chǎn)生疑惑,機器視覺和深度學習有太多重疊之處,是否兩者在安防行業(yè)是同一概念的不同表達。其實不然,如果僅從視頻監(jiān)控行業(yè)來看,學習算法是機器視覺更高層面的應用,因為基于巨大樣本采集把握了大量數(shù)據(jù)特征,而機器視覺主要在特征感知、圖像預處理、特征提取、特征篩選面擅長,也就是說,機器視覺主要是在特征識別提煉部分,而深度學習是把特征和學習結(jié)合起來,比如用特征的感知和提取來預判數(shù)據(jù)。
機器視覺安防應用的核心技術(shù)
在今年6月份有美國商業(yè)資訊的權(quán)威機構(gòu)作出了預測,全球機器視覺市場正處于迅速發(fā)展之中,預計到2025年年底,市值將超過192億美元。時至今日,機器視覺技術(shù)不僅成功應用于多個領域,并且應用范圍還在逐步擴大。已由起初的電子制造業(yè)和半導體生產(chǎn)企業(yè),發(fā)展到了安防、包裝、汽車、交通和印刷等多個行業(yè)。
安防,是機器視覺應用的主戰(zhàn)場之一,有幾大心技術(shù)應用為安防行業(yè)帶來改變:
目標識別
目標識別技術(shù)和穩(wěn)定的追蹤方法是機器視覺在安防發(fā)展的關(guān)鍵技術(shù)。它在很多領域都得到大量的應用,例如身份確認的指紋識別、人臉識別、虹膜識以及在智能交通管理、機動車檢測、停車場管理等場合的車牌識別等。一個目標識別系統(tǒng)應該具有在復雜背景以及各種天氣情況下檢測、分類、識別標的能力,這樣才能有針對性地對目標進行持續(xù)的跟蹤。
近些年來,目標識別技術(shù)已由理論探索、實驗室仿真逐漸走向?qū)嶋H應用,其技術(shù)方法也從經(jīng)典的統(tǒng)計模式識別,向著基于知識、模型、多傳感器信息融合以及向深度學習神經(jīng)網(wǎng)絡的識別方法演進。
目標追蹤
運動目標跟蹤是確定同一物體在圖像序列不同幀中位置的過程。其主要工作方式就是選擇好的目標特征和采用適當?shù)乃阉鞣椒ǎ鶕?jù)匹配原理,把現(xiàn)有的跟蹤方法分為基于模型、區(qū)域、特征以及活動輪廓的跟蹤,這是機器視覺力所能及之處。
雙目技術(shù)
雙目立體技術(shù)核心目的是提高識別的準確率。由于立體視覺技術(shù)形成的視場中帶有物體的三維幾何信息,因此能夠有效的設定檢測規(guī)則,排除光線、影子等干擾因素,大幅提高智能分析的準確度。在評測杭州巨頭企業(yè)的高空了望云臺攝像機時,發(fā)現(xiàn)都基于機器視覺的雙目技術(shù),其對于人、物的識別率有極大提高,并且采用雙相機或多相機,對視場內(nèi)空間的自由運動體的三維位置坐標及姿態(tài)進行高精度的測量,確定運動目標的質(zhì)心位置,并根據(jù)標定結(jié)果對運動目標進行高精度跟蹤。
多球機聯(lián)動跟蹤技術(shù)
多球機聯(lián)動跟蹤技術(shù)是以單球機智能跟蹤技術(shù)作為基礎的。從應用的層面上看,能夠?qū)⑵胀ǖ母櫱驒C的單點式監(jiān)控,提升為系統(tǒng)內(nèi)對單個目標的無縫式接力跟蹤,配合電子地圖的使用,能夠容易的實現(xiàn)對高安全等級區(qū)域的無縫式跟蹤,并實現(xiàn)目標軌跡描繪、犯罪行為預警等高等級的安保需求。多球機聯(lián)動跟蹤技術(shù)的實現(xiàn),需要具備多目標識別與跟蹤技術(shù)。在應用中,通常設定一臺球機作為發(fā)起點,對廣域范圍內(nèi)目標進行的智能行為分析,并將同時監(jiān)控的多個目標按照既定的策略進行排序,并按照先后順序,指揮智能跟蹤球機逐個跟蹤監(jiān)控目標。與單目標跟蹤相比,多目標跟蹤技術(shù)的關(guān)鍵點是數(shù)據(jù)關(guān)聯(lián)問題,即建立一個統(tǒng)一的坐標系,使得發(fā)起球機可以將目標的坐標信息傳遞給跟蹤球機,實現(xiàn)聯(lián)動跟蹤。該技術(shù)其實是安防行業(yè)機器視覺的最早應用,在蘇州某安防企業(yè)的接觸中就窺見了一斑。
面向事后應用的視頻摘要、視頻檢索
隨著監(jiān)控探頭的普及,監(jiān)控系統(tǒng)中存有海量的錄像數(shù)據(jù),在目前人工查看的模式下,傳統(tǒng)的方法需要從頭到尾順序播放,往往需要數(shù)倍于原始視頻的時間才能審看完成,因此需要大量人員連續(xù)加班數(shù)周進行視頻的審看。為了規(guī)避遺漏和誤差,就要加大人力投入的方法。如何有效、高效的應用,減輕人工查看回放帶來的時效性差、成本高、疲勞問題,并在不同分辨率、不同清晰度的錄像中準確的辨別出需要獲取的信息,基于以上需求,安防廠家研發(fā)了視頻摘要、視頻檢索等技術(shù)手段,這也是機器視覺的研究內(nèi)容之一。
機器視覺開啟智慧安防應用
從以上的介紹和分析中,我們大概能了解機器視覺有所認知,但其在安防行業(yè)能做什么,為行業(yè)帶來哪些改變,值得關(guān)注。先舉例子來看機器視覺應用價值:
2017年7月16日,深圳市寶安區(qū)西鄉(xiāng)金港華庭沃爾瑪超市內(nèi),驚現(xiàn)一名男子持菜刀傷人,并導致2人死亡,9人受傷。如今,監(jiān)控在大小商場店鋪中隨處可見,幾乎成為了每個商場店鋪的必備。顯然,使用監(jiān)控對于店鋪日常管理與安防工作都十分有用。但事實上,目前以人力為主的監(jiān)控設備存在極大的安全漏洞,使安防工作在一定程度上形同虛設。基于機器視覺技術(shù)的智能安防系統(tǒng),能夠從眾多視頻材料中進行圖像識別,搜尋可疑人物等信息,實現(xiàn)對高危人員的識別和篩查;同時還能夠從多個監(jiān)控設備自動識別可疑物體,比如菜刀等,自動發(fā)出警報提醒安保人員。
除了事前的預防和制止功能,機器視覺的視頻摘要和檢索是面向事后應用的智能技術(shù)。其中,視頻摘要技術(shù)使24小時的視頻被制作成一個簡短到幾分鐘摘要視頻成為現(xiàn)實,這將大大提高海量視頻監(jiān)控錄像分析的效率。視頻檢索技術(shù)則主要是依賴于視頻算法對視頻進行預處理,通過對視頻內(nèi)容進行結(jié)構(gòu)化處理,提取出視頻內(nèi)容中的有效信息,進行標記或者相關(guān)處理后,人后可以通過各種屬性描述進行快速檢索。
可以說,如果上述案例中具有機器視覺的智能安防產(chǎn)品,必然不會發(fā)生如此慘劇。以點帶面,看機器視覺如何弄潮安防新時代。
與公安機關(guān)建立人臉捕捉數(shù)據(jù)庫
在公共場合人員密集區(qū)域,比如:天安門廣場、火車站等敏感的公共場合監(jiān)控,相關(guān)機器視覺產(chǎn)品也隨著技術(shù)的發(fā)展不斷地細化。產(chǎn)品能與公安機關(guān)搭建人臉識別比對系統(tǒng),建立人臉捕捉數(shù)據(jù)庫,將人臉信息歸檔,并與個人身份建立關(guān)系,在實際運用過程中采用人臉搜索、黑名單布防、陌生人識別等多項智能分析功能,大大提高視頻監(jiān)控的防范功效,可以讓犯罪分子無可遁形。
智能交通中對車的識別和管控
在交通行業(yè),與其他識別技術(shù)相比,機器視覺具有成本低、穩(wěn)定性強、準確性高、應用范圍廣等優(yōu)點,目前已經(jīng)在國內(nèi)外高速公路和公路的交通監(jiān)控系統(tǒng)中得到了廣泛的應用,比如車牌識別、車身顏色識別、車型識別、違章識別、車流量統(tǒng)計、流量控制等。
人臉布控
人臉識別基于人的臉部特征信息進行身份識別,主要指通過攝像機采集含有人臉的圖片或視頻流,然后在圖片或視頻流中進行人臉檢測并抓拍,進行面部特征提取,以實現(xiàn)抓拍的人臉與數(shù)據(jù)庫中的人臉進行比對的技術(shù)。目前已有不少企業(yè)推出了機器視覺的人臉布控系統(tǒng),能夠適應于各種交通要道、住宿場所、智能樓宇、大型連鎖商場,平安城市等場合,具有人臉布控、以圖搜圖、用戶管理等核心業(yè)務功能。
一些企業(yè)在努力的用機器視覺改變安防。比如:2017上海國際機器視覺展VisionChina在上海舉行,海康機器人的技術(shù)與設計都是源于機器視覺;大華股份浙江華睿科技與英特爾聯(lián)合共推機器視覺業(yè)務。今年6月29日,華睿科技與英特爾重磅發(fā)布了9MP/12MP高性能小面陣相機、50MPCoaXPress大面陣相機等機器視覺系列新品。此外,北京清影機器視覺技術(shù)有限公司研發(fā)的通用式三維即時成像技術(shù)具有通用式和即”兩大特點,填補了國內(nèi)機器視覺領域的空白;騰龍推出的4款機器視覺專用定焦鏡頭,進一步充實產(chǎn)品陣容,提供更多高像素鏡頭方案,滿足用戶需求;今年5月,美國亞馬遜公司收購了一支歐洲頂級機器視覺團隊用于無人機和視頻監(jiān)控領域研究。
結(jié)束語
業(yè)界有這樣的觀點,機器視覺形成了智能視頻分析的閉環(huán),從特征提取到應用都極大提升了智能安防行業(yè)應用,是智慧安防2.0。為此,一場由機器視覺引發(fā)的智慧安防風暴已經(jīng)吹響全球,并在迅速蔓延中,將改變智慧安防格局。