人臉識(shí)別只是視覺AI 落地的開始
作為一個(gè)天然入口,人臉識(shí)別已普遍應(yīng)用在手機(jī)刷臉、刷臉考勤、人臉門禁、刷臉過關(guān)、人證比對(duì)等實(shí)際場(chǎng)景中。但成熟也意味著眾多的入局者,以人臉識(shí)別落地規(guī)模最大的行業(yè)“安防”為例,新興算法見長(zhǎng)的視覺AI公司要切入仍然舉步維艱,行業(yè)內(nèi)的傳統(tǒng)設(shè)備供應(yīng)商海康、大華、宇視等,仍處于強(qiáng)勢(shì)地位。其中海康威視公司資料顯示,目前該公司已經(jīng)有2000多萬臺(tái)攝像應(yīng)用裝置在世界上應(yīng)用,銷售額位居攝像頭領(lǐng)域第一。
從實(shí)質(zhì)上來說,人臉識(shí)別是視覺AI領(lǐng)域中一項(xiàng)視覺認(rèn)知技術(shù)。視覺認(rèn)知是指通過深度學(xué)習(xí)讓機(jī)器可以用鏡頭感知世界,它可以用于識(shí)別場(chǎng)景,如分析到畫面是在海邊、草原、會(huì)議室、學(xué)校。也可以是物體識(shí)別,識(shí)別出畫面中有什么東西,AI物體識(shí)別已廣泛應(yīng)用在智能零售的商品識(shí)別,智能冰箱的食材識(shí)別與智能汽車的道路標(biāo)識(shí)、行人、車輛等識(shí)別。此外還可以識(shí)別個(gè)體,它可以從全家福中分辨出哪個(gè)是你,也可以從停車場(chǎng)中分辨出哪輛是你的車。在視覺認(rèn)知技術(shù)中,目前實(shí)際應(yīng)用最廣的就是生物識(shí)別技術(shù),人臉識(shí)別正是其中一種。
值得一提的是,近期還發(fā)布的一項(xiàng)非常有趣的生物識(shí)別技術(shù)。視覺AI技術(shù)提供商ArcSoft虹軟發(fā)布了全新的“豬臉識(shí)別”技術(shù)。由于生物體征不同,豬臉識(shí)別要比人臉識(shí)別的難度更高。首先,豬類差異很小,同品類的豬就像多胞胎一樣難以分辨。其次,由于豬自身及生活環(huán)境問題,在識(shí)別時(shí)需要攻克諸多遮擋干擾的難題,而且不似人臉的光滑,豬的臉上都是硬硬的毛。“豬臉識(shí)別”不僅能夠幫助養(yǎng)殖場(chǎng)對(duì)每一頭豬進(jìn)行跟蹤,通過對(duì)動(dòng)物面部特征、體態(tài)的識(shí)別來判斷豬的品種,通過對(duì)豬體態(tài)和動(dòng)作的識(shí)別來判斷豬的健康情況,實(shí)現(xiàn)日常個(gè)體信息管理與全流程追溯,而且還能實(shí)現(xiàn)農(nóng)村金融養(yǎng)殖保險(xiǎn)的革新、數(shù)據(jù)農(nóng)貸的開展,讓農(nóng)民能用上金融工具來更好的開展養(yǎng)殖生產(chǎn)。
無獨(dú)有偶,2018年6月,阿里云也宣布開始將視覺AI引入到豬養(yǎng)殖領(lǐng)域,開設(shè)智能化養(yǎng)殖場(chǎng)。從人臉到豬臉,從這條全新的產(chǎn)業(yè)鏈可以意識(shí)到,人臉識(shí)別只是視覺AI進(jìn)入生產(chǎn)生活的開始。
技術(shù)融合或成視覺AI落地未來趨勢(shì)
事實(shí)上,視覺AI應(yīng)用范圍很廣。從技術(shù)層面上來說,視覺AI將從三個(gè)方面提升機(jī)器能力。除了提升視覺認(rèn)知能力外,還有成像技術(shù)的提升,讓設(shè)備可以看得更清、更廣、更遠(yuǎn)。以及交互與多維度的提升,實(shí)現(xiàn)交互與虛實(shí)結(jié)合的效果,讓人享受視覺。這些功能在目前使用人數(shù)最多的AI落地應(yīng)用——AI拍照中得到了淋漓盡致的體現(xiàn)。
在各大手機(jī)品牌發(fā)布會(huì)上,如全球領(lǐng)先的智能視覺技術(shù)提供商虹軟等部分AI企業(yè)已成為占據(jù)重要位置的常客。正是在他們提供的AI雙攝、AI美顏、HDR、智能場(chǎng)景拍攝等視覺AI技術(shù)的加持下,AI拍照成為了智能手機(jī)的最大賣點(diǎn)之一。全球智能手機(jī)每年十億量級(jí)的出貨量,也為這些企業(yè)帶來了無限商機(jī)。
通過AI雙攝技術(shù)可以實(shí)現(xiàn)光學(xué)變焦和背景虛化功能,讓設(shè)備看的更清。在智能場(chǎng)景拍攝上,通過場(chǎng)景識(shí)別技術(shù),可以自動(dòng)識(shí)別白天、晚上、沙漠、森林等拍攝場(chǎng)景,并智能化的調(diào)節(jié)照片參數(shù)以達(dá)到最佳拍攝效果。而AI美顏技術(shù)中,也運(yùn)用了多層次的視覺AI技術(shù),首先在美顏拍照時(shí)就運(yùn)用到了人臉檢測(cè)、人臉識(shí)別等技術(shù),通過AI算法檢測(cè)和識(shí)別拍攝對(duì)象的人臉關(guān)鍵點(diǎn),再進(jìn)行運(yùn)用個(gè)性化磨皮、修飾、五官調(diào)整來達(dá)到美顏的目的。
通過AI拍照這一成熟的落地場(chǎng)景可以大膽的猜測(cè),在視覺AI正確的落地姿勢(shì),往往不是出現(xiàn)單一技術(shù),而需要多種視覺AI技術(shù)的緊密融合。
而聯(lián)想到眾多廠商看好的下一代平臺(tái)級(jí)應(yīng)用智能汽車上,更是將融合運(yùn)用到視覺、語音等多種人工智能技術(shù)。如其車載雷達(dá)、車載攝像頭等感知部分硬件大量搭載視覺AI技術(shù),對(duì)汽車內(nèi)部環(huán)境、路況信息、行駛狀況進(jìn)行收集和初步整理,再通過大數(shù)據(jù)及機(jī)器學(xué)習(xí)技術(shù),為智能駕駛行為做出決策。在控制方面,語音AI將配合視覺AI形成整體的智能化交互形式,通過語音、手勢(shì)的控制實(shí)現(xiàn)對(duì)駕駛的控制。
結(jié)語:
不難發(fā)現(xiàn),多層次的人工智能技術(shù)融合,也是未來包括智能駕駛在內(nèi)的各種實(shí)際落地應(yīng)用場(chǎng)景的需求趨勢(shì)。由此可見,視覺AI的成熟落地,將考驗(yàn)的是企業(yè)豐富的技術(shù)儲(chǔ)備及多種技術(shù)之間的整合能力。