說起人工智能,更多人腦海中第一時間浮現(xiàn)的是那部讓人記憶猶新的美國電影,在安防行業(yè),目前為止,視頻前端采集圖像,后端存儲,通過存儲錄像觀看視頻是目前大部分人員接觸接觸視頻圖像的方式。但這樣的方式,在2014年中出現(xiàn)了新的變革,感知攝像機概念的提出,機器視覺的理念便在業(yè)內(nèi)開始生根。
百度讀圖人工智能成亮點
也許,單純從安防的角度出發(fā),比較難以理解人工智能的真正意義,據(jù)了解更多的從業(yè)人員對于感知的理解,更愿意將它視為智能分析發(fā)展的新的臺階。但如果將這樣的理念放在行業(yè)外,也許我們能了解得更多。
早在今年五月份,百度創(chuàng)始人李彥宏受邀參加聯(lián)想techworld大會,展示百度在大數(shù)據(jù)、人工智能領(lǐng)域的最新技術(shù)成果。大會現(xiàn)場李彥宏演示了百度機器讀圖技術(shù)的最新成果:ImageQA圖文問答技術(shù),讓眾人眼前一亮。演示前,手機屏幕上出現(xiàn)了一張男子在打網(wǎng)球的照片,李彥宏先對著話筒提問:他在做什么?機器用清亮的女聲準(zhǔn)確的回答:打網(wǎng)球。隨后李彥宏繼續(xù)提問:他的衣服是什么顏色?他手里拿著什么?機器也都準(zhǔn)確的做出了回答。
這項技術(shù)無疑證實著機器能聽懂人的提問之外,更能準(zhǔn)確的識別出圖片的信息,并且能夠用與人交流的自然語言表達,人工智能的發(fā)展得到了實質(zhì)性的突破。
在回到一開始的話題中,回頭看感知攝像機,雖然無法像百度這樣能“回答”用戶的提問,但經(jīng)最近測試之后發(fā)現(xiàn),目前這方面的攝像機在對畫面目標(biāo)進行數(shù)據(jù)結(jié)構(gòu)化分析之后,為后臺的語義分析提供數(shù)據(jù)。后臺可以接收所有數(shù)據(jù)進行深度分析,如錄像摘要、人臉比對等,生成語義描述。
無疑這才是智能安防的起步,數(shù)字化時代已經(jīng)成熟,數(shù)字化的時代正要到來,人必須躲在視頻數(shù)據(jù)之后,傳統(tǒng)的人工讀圖并不能稱為嚴格意義上的智能,機器讀圖時代需要更多多彩多樣的運用。也許就如微軟的研發(fā)人員所說,目前無論是芯片還是平臺都屬于半成品,真正的運用階段必須與實際的產(chǎn)品配合起來。在這個階段,我們也發(fā)現(xiàn)了行業(yè)內(nèi)不乏已經(jīng)著手準(zhǔn)備的企業(yè)。
三維建模3D攝像機嶄露頭角
在本次安博會上,無論是海康威視、藍色星際、格靈深瞳等都推出了3D攝像機。與一般的攝像機相比,3D攝像機除了除了能夠提供圖像數(shù)據(jù)之外,還能夠提供深度信息數(shù)據(jù),利用深度數(shù)據(jù)可以對物體進行三維建模,實現(xiàn)物體的三維感知。
三維感知與二維感知最大的優(yōu)勢在于三點:解決二維圖像中的遮擋、影隨人動、比例混淆問題。與平面的二維相比,三維的立體感能使監(jiān)控攝像機更精準(zhǔn)判斷監(jiān)控范圍內(nèi)的異動。從某種意義上講,從平面進入了三維,已經(jīng)完全超越了人眼,解決機器看的問題,可極大應(yīng)用于人工智能領(lǐng)域。在人工智能的時代背景中,安防監(jiān)控廠商似乎已經(jīng)占據(jù)著感知的入口的領(lǐng)先地位。
人工智能的意義
有經(jīng)濟分析師指出,按照目前的互聯(lián)網(wǎng)時代發(fā)展,信息瞬時傳輸,技術(shù)更新周期更短,市場變化更快,很容易造成一步領(lǐng)先步步領(lǐng)先,最終形成強者恒強,老大通吃、龍頭一枝獨秀的行業(yè)格局,假如按照這個邏輯,那么人工智能的各個領(lǐng)域龍頭基本可以從現(xiàn)階段集中度高的龍頭里面挑選。
一個很簡單的例子,未來必然將是機器不斷取代人工發(fā)展的社會,例如智慧工廠、在線醫(yī)療、在線教育等,機器作業(yè)必然少不了智能視覺,無論是機器視覺還是機器識圖,機器的感知——眼睛(視頻),都是未來的核心。