機(jī)器視覺最早被提出來是在20世紀(jì)60年代,直到20世紀(jì)80到90年代,機(jī)器視覺才迎來了蓬勃發(fā)展,而在21世紀(jì)之后,機(jī)器視覺技術(shù)才步入成熟期。
有公開數(shù)據(jù)顯示,在2018年,全球用于工業(yè)自動(dòng)化領(lǐng)域的機(jī)器視覺技術(shù)市場規(guī)模達(dá)44.4億美元,預(yù)計(jì)2023年將達(dá)122.9億美元,其年復(fù)合增長率高達(dá)21%。
相較于全球機(jī)器視覺行業(yè)而言,中國的機(jī)器視覺相關(guān)產(chǎn)業(yè)起步較晚,但發(fā)展速度很快。自2011年到2019年,我國機(jī)器視覺市場從10億元躍升到百億級(jí),每年都維持著兩位數(shù)的增速。目前,中國已成為僅次于美國和日本的世界第三大機(jī)器視覺市場。
而2020年新冠疫情的爆發(fā),雖然對(duì)整個(gè)行業(yè)有一定的沖擊影響,但卻成為了機(jī)器視覺最大的“練兵場””——無人機(jī)噴灑消毒、機(jī)器人無接觸式配送等,加速了大眾對(duì)機(jī)器人的認(rèn)知,長期來看,這無疑會(huì)加速機(jī)器視覺行業(yè)的發(fā)展進(jìn)程,各行各業(yè)將會(huì)對(duì)機(jī)器視覺的功能特性運(yùn)用更加多元化,助推行業(yè)的全面升級(jí)。
從目前的行業(yè)發(fā)展來看,機(jī)器視覺在功能上的應(yīng)用主要表現(xiàn)在四個(gè)方面:
一、導(dǎo)航和定位
對(duì)于人眼而言,導(dǎo)航和定位,實(shí)則就是通過雙眼來目標(biāo)物體的判定相對(duì)位置和絕對(duì)位置。于機(jī)器而言,則需為其造一雙“眼睛”——3D視覺來實(shí)現(xiàn)的。
談到3D視覺,首先說說3D視覺的測量原理。目前市場上主流的有四種3D視覺測量技術(shù):雙目視覺、TOF、結(jié)構(gòu)光和激光三角測量。
1、雙目技術(shù),是目前較為廣泛的3D視覺系統(tǒng),它的原理就像我們?nèi)说膬芍谎劬Γ脙蓚€(gè)視點(diǎn)觀察同一景物,以獲取在不同視角下的感知圖像,然后通過三角測量原理計(jì)算圖像的視差,來獲取景物的三維信息 。
雙目視覺對(duì)于硬件要求低,因而能一定程度上控制成本。但它對(duì)于環(huán)境光照非常敏感,光照角度變化、光照強(qiáng)度變化等環(huán)境因素的影響,拍攝的圖片亮度差別會(huì)比較大,這無疑加大了對(duì)算法的要求。另外相機(jī)基線(兩個(gè)攝像頭間距)限制了測量范圍,測量范圍和基線關(guān)系很大:基線越大,測量范圍越遠(yuǎn);基線越小,測量范圍越近。
雙目視覺優(yōu)劣勢(shì)決定了它更適合于制造現(xiàn)場的在線、產(chǎn)品檢測和質(zhì)量控制。當(dāng)然也有一些產(chǎn)品也會(huì)用此技術(shù)原理,如基于slam算法導(dǎo)航定位的終端產(chǎn)品、體感攝像頭等。
2、TOF(全稱:Time Of Flight)飛行時(shí)間法成像技術(shù),它的原理是通過給目標(biāo)物連續(xù)發(fā)送光脈沖,然后用傳感器接收從物體返回的光,通過探測光脈沖的飛行時(shí)間來得到目標(biāo)物距離。
TOF的核心部件是光源和感光接收模塊,它不需要類似雙目視覺算法來計(jì)算,通過特定的公式即可直接輸出物體的深度信息,因而具有響應(yīng)快、軟件簡單、識(shí)別距離遠(yuǎn)的特點(diǎn),而且由于不需要進(jìn)行灰度圖像的獲取與分析,因此不受外界光源物體表面性質(zhì)影響,不過TOF技術(shù)的缺點(diǎn)是,分辨率低、不能精密成像。
這就決定了TOF技術(shù)更適合遠(yuǎn)距離的3D信息采集,我們最常見的就是自動(dòng)駕駛領(lǐng)域的激光雷達(dá),但由于自動(dòng)駕駛行業(yè)的發(fā)展特點(diǎn),從而導(dǎo)致在該領(lǐng)域的激光雷達(dá)公司并不多,市場份額都已被頭部企業(yè)占領(lǐng),后入者的市場門檻就因此變得很高。近幾年來,隨著To C市場掃地機(jī)器人市場份額的不斷壯大,很多企業(yè)都在考慮運(yùn)用TOF技術(shù)進(jìn)入該領(lǐng)域,在這里分得一杯羹。但擺在以TOF技術(shù)企業(yè)眼前最主要的問題是如何降低成本,我們拭目以待。
3、由于雙目和TOF都有各自的缺點(diǎn),所以就有了第三種方式——結(jié)構(gòu)光技術(shù),它通過一個(gè)光源投射出一束結(jié)構(gòu)光,打到想要測量的物體上,因?yàn)椴煌奈矬w有不同的形狀,這就會(huì)因一些條紋或斑點(diǎn)發(fā)生不同的變形,有這樣的變形之后,就需要通過算法可以計(jì)算出距離、形狀、尺寸等信息,從而獲得物體的三維圖像。
結(jié)構(gòu)光技術(shù),既不需要用很精準(zhǔn)的時(shí)間延時(shí)來測量,又解決了雙目中匹配算法的復(fù)雜度和魯棒性問題,所以具有計(jì)算簡單、測量精度較高的優(yōu)勢(shì),而且對(duì)于弱光環(huán)境、無明顯紋理和形狀變化的表面,同樣都可進(jìn)行精密測量,所以越來越多的行業(yè)應(yīng)用采用結(jié)構(gòu)光技術(shù)。最為常見的就是手機(jī)的面部識(shí)別。
4、激光三角測距技術(shù),也是一種幾何測量方法,本質(zhì)上講,是在利用物體之間的三角幾何關(guān)系進(jìn)行測距。一個(gè)典型應(yīng)用就是利用激光作為光源的測量方案,它也是基于光學(xué)幾何原理,根據(jù)光源、物體和檢測器三者之間的幾何成像關(guān)系,來確定空間物體各點(diǎn)的三維坐標(biāo)。
這種方法通常用激光作為光源,用CCD/CMOS相機(jī)作為檢測器,具有結(jié)構(gòu)光3D視覺的優(yōu)點(diǎn)精準(zhǔn)、快速、成本低的優(yōu)點(diǎn)。根據(jù)幾何原理計(jì)算,被測物體越近,在CCD /CMOS上的位置差別就越大,分辨率和精度就越高,所以這種測量法在中近距離下的精度很高,特別適合中近距離測距,所以成為了室內(nèi)機(jī)器人測距定位的首選方案。
二、外觀檢查
外觀檢查是通過圖像處理技術(shù)來完成的,圖像處理其實(shí)是計(jì)算機(jī)對(duì)圖像信息進(jìn)行處理。
對(duì)圖像進(jìn)行處理的主要目的有三個(gè)方面:提高圖像的視感質(zhì)量、提取圖像中所包含的某些特征或特殊信息、圖像數(shù)據(jù)的變換、編碼和壓縮,以便于圖像的存儲(chǔ)和傳輸。而這些正是生產(chǎn)線上檢查產(chǎn)品是否存在質(zhì)量問題最好的應(yīng)用,這個(gè)環(huán)節(jié)也是取代勞動(dòng)力最重要的部分。
除此,它還在其它的一些領(lǐng)域有應(yīng)用,如生成原圖的預(yù)覽圖、在小車或無人飛行器上裝載攝像頭,利用圖像處理技術(shù)處理攝像頭拍攝的畫面。
三、識(shí)別
識(shí)別,從字面上就可以看出,這是一個(gè)認(rèn)識(shí)加辨別的過程,需要機(jī)器有類人的判斷。因此識(shí)別主要是通過圖像處理和深度學(xué)習(xí)的融合來實(shí)現(xiàn)這個(gè)功能。
圖像處理把外部物體信息轉(zhuǎn)換成機(jī)器語言,然后過視覺感知來完成信息的輸入,這一過程實(shí)質(zhì)就是機(jī)器學(xué)習(xí)的過程,兩者疊加融合,從而使得識(shí)別功能變得智能。最為常見的應(yīng)用就是人臉識(shí)別和無人駕駛。
四、高精度檢測
高精度檢測其實(shí)和第一個(gè)導(dǎo)航定位功能原理相同,不同的是,它可能會(huì)把多個(gè)測量技術(shù)融合在一起,形成高精度的檢測系統(tǒng)。
因?yàn)檫\(yùn)用到高精度檢測的行業(yè)一般都是在精密加工型產(chǎn)業(yè)與高端工業(yè)制造領(lǐng)域等高要求的行業(yè),檢測精度要求達(dá)到um級(jí),這些都是人眼無法檢測到,必須用機(jī)器完成的。而這也成為了工業(yè)4.0時(shí)代,工業(yè)自動(dòng)化的關(guān)鍵應(yīng)用。
人工智能和中國制造2025戰(zhàn)略的深入下行,勢(shì)必帶來機(jī)器視覺需求的不斷提升。
機(jī)器視覺屬于技術(shù)密集型行業(yè),核心技術(shù)的積累和持續(xù)的技術(shù)創(chuàng)新是企業(yè)取得競爭優(yōu)勢(shì)的關(guān)鍵因素之一,我們期待行業(yè)有更多的優(yōu)秀者出現(xiàn),一起為整個(gè)行業(yè)的發(fā)展添磚加瓦。