近日,市場研究&咨詢公司GrandViewResearch發布了一份深度學習市場分析報告。報告表明,2016年全球深度學習市場估值為2.72億美元,其在自動駕駛和醫療行業的應用越來越多,有望為行業增長做出突出貢獻。這項技術的崛起得益于數據驅動的復雜應用,包括語音和圖像識別,它可以和其他技術一起克服大數據量和高計算能力的挑戰以及改進數據存儲。同時在剛舉行的“2017 CCF青年精英大會”上,香港中文大學教授湯曉鷗作了《人工智能的明天,中國去哪?》的主題演講。其中,針對人工智能和深度學習的應用、發展,湯教授發表了自己的看法。
到底什么是深度學習技術?落地到安防領域,深度學習如何應用呢?首先來聽聽湯教授如何理解深度學習。
什么是深度學習?
首先,人工智能和深度學習是什么關系?湯教授認為,人工智能真正落地的部分就是深度學習。因為以前的人工智能確實是在很多情況下用不起來,人手設計的智能來做某一件事情還是比較難超越人。而有了深度學習之后,可以把這個過程變成一個數據驅動的過程:當做某一件特定事情時,數據量及參數量大到一定程度之后,機器就可能在做這件事情上超過人類。很多現實中落地的產品化的東西,都是深度學習做出來的。深度學習做的東西,成功的案例比較多,一方面是在語音識別領域,另外可能更多的是視覺這方面,所以大家可以看到很多計算機視覺方面新的成果。
深度學習到底在做什么事情?實際上它所做的事情抽象出來是比較簡單的,就是在做一個從X到Y的回歸、或者說從A到B的Mapping(對應)--你給它一個輸入,它怎么樣給出一個對應的輸出?特殊的地方就是深度學習把這件事情做得非常非常好。以前也有其他算法可以做,只不過一直做不過人,現在深度學習做到了極致。
比如說給了一張人臉照片,它就可以給你對應出這個人的名字;給一個物體的形狀,它就可以告訴你是什么物體;給一個車的行駛場景,它就可以給你輸出這個車應該往哪兒拐;給一個棋局,它能算出下一步怎么走;給一個醫療的圖像,它就能幫你判斷這是什么病……實際上就是這樣的一個過程。不要把人工智能想象成可以超越人類,可以控制人類,這些都是所謂的“好萊塢的人工智能”或者想象中的人工智能,真正人工智能在現在這個階段其實就是做這么簡單的事,當然,做成這個簡單的事情其實已經很不簡單了。
深度學習的突破?
最近這幾年深度學習確實在學術界、工業界取得了重大的突破。第一個突破是在語音識別上,語音識別取得了巨大成功以后,深度學習緊接著在視覺方面又取得了重大突破。接著人工智能在自動駕駛領域也取得了一些重大的突破,現在比較熱門的是醫療影像方面,借助人工智能進行診斷。
深度學習有三個核心的要素:學習算法的設計,你設計的大腦到底夠不夠聰明;要有高性能的計算能力,訓練一個大的網絡;必須要有大數據。
“深度學習+安防”的應用
目前深度學習主要的研究領域在語音識別和視覺方面,而且將深度學習應用到各個方向,可以不同的領域做出不同的技術創新。對于掌握了許多視頻圖像資源的安防行業來說,深度學習和安防的結合擁有比較高的契合度,即對圖像和視頻的分析,包括:
——在圖像分析方面,比如人們熟悉的人臉識別、文字識別和大規模圖像分類等,深度學習大幅提升了復雜任務分類的準確率,使得圖像識別、語音識別,以及語義理解準確率大幅提升。
——在人臉方面,可以實現人臉檢測、人臉關鍵點定位、身份證對比、聚類以及人臉屬性、活體檢測等等。在智能監控方面,可以做人、機動車、非機動車視頻結構化研究。
——在文字方面,小票的識別、信用卡的識別、車牌的識別,這些都是由深度學習的算法來做的。同時在圖像的處理方面,在去霧、超分辨率、去抖動、去模糊,HDR、各種智能濾鏡的設計都是用深度學習的算法。
有人說,深度學習技術可謂安防行業的“顛覆性力量”,極大地推動了智能安防的發展。較之以往的傳統智能算法,深度學習在解決視頻結構化和人臉識別等方面更“智能”。比如視頻結構化,把視頻里面的人、機動車、非機動車及其特性都檢測出來了,并且自動標注出來了,這樣整個視頻就變成了文檔,可以進行文檔性的搜索;人臉的布控系統,目前已在很多城市實時布控了,還有百米之外抓人,百米之外看到一個目標拉近然后進行人臉識別。
隨著深度學習算法的突破,目標識別、物體檢測、場景分割、人物和車輛屬性分析等智能分析技術,都取得了突破性進展。
現階段,不僅安防行業,越來越多的產業和企業在深度學習領域進行探索。當然我們也期待在深度學習甚至是人工智能的影響和各個安防生廠商的創新下,更多的智能安防產品能迅速落地應用,提高城市安防系統的工作效率!