前言
圖形識別(Pattern recognition,或稱模式識別),為透過計算機運算技術方法達到圖形的自動判讀之技術。影像在計算機中以數組的形式儲存與運算,如三原色光模式(RGB),先將影像以不同色彩分層,以上述方法代表不同顏色后,再以相對位置分配顏色的強度數值。此外尚有印刷四分色模式(CMYK)、CIE 1931等色彩空間結構。模型識別將代表影像的數組進行數學算,利用機率、向量等特征模型,進行特征選取或萃取、分類器設計以及系統辨識率測試,使得信息系統得以自動化辨識輸入影像中的信息,將目標信息主體與背景分離并轉換成所需之內容,以利后續運算。
《圖一》國際照明協會(CIE;INTERNATIONAL COMMISSION ON ILLUMINATION)所訂定之色彩空間 來源:http://www.cie.co.at/
來源:Guangyi Chen, Wenfang Xie. (2011) Wavelet-based moment invariants for pattern recognition. Optical Engineering 50, 077205. . Online publication date: 1-Jan-2011. [ CrossRef ]
《圖二》 識別辨識戰斗機機型樣本來源:Guangyi Chen, Wenfang Xie. (2011) Wavelet-based moment invariants for pattern recognition. Optical Engineering 50, 077205. . Online publication date: 1-Jan-2011. [ CrossRef ]
隨著信息科技的進步,信息處理過程日趨復雜,應用范疇也與日俱增,物聯網(IOT;Internet of Things)時代的來臨使得圖像處理需求增加,含有影像攝取鏡頭的硬設備越來越多,并融入各種生產制造、商業行為甚至日常生活,不同應用的信息系統漸漸倚靠自動化影像辨識技術,完成各種新的應用。
當今常見的代表性技術如字符識別(OCR;Optical Character Recognition),將文字影像進行處理,抽取主要表達特征并將特征模型紀錄,比對實際輸入影像后,依邏輯與機率轉換成字符串形式,供系統進行后續處理,如車牌辨識系統,將各種車輛的影像做為系統輸入,以特征匹配辨識車牌字符后,即可進行如計費、安全控管、疑車追蹤等應用。某些系統結合甚至機器學習等算法,透過訓練,能自動修正模型提升準確率。拜計算機運算之速度快、準確性高、效率高特性之賜,此技術能逐步取代人工操作行為,目前常用于醫療判讀、聲紋辨識、車輛監控計費、個人安全等信息系統,應用范疇仍隨著時間快速擴展中。
《圖三》文字識別辨識標的不同角度的樣本范例來源:Guangyi Chen, Wenfang Xie. (2011) Wavelet-based moment invariants for pattern recognition. Optical Engineering 50, 077205. . Online publication date: 1-Jan-2011. [ CrossRef ]
圖形辨識的流程
圖形辨識流程可以分為特征表現、特征萃取、分類器設計以及系統辨識率測試幾個步驟。在特征表現步驟將數據之特征量化取出,再借助特征萃取找出較具分類效果的特征,限縮數據維度。再根據數據是否包含先前取得并選取之類別信息以與應用面考慮采用分群法或分類法來進行分類器設計,產生分類函數,最后依測試數據來驗證該系統準確率,了解分類函數是否完善等個步驟之準確性,逐一優化。
圖形辨識的相關技術
圖形偵測(detection)技術,如線條偵測、臉部偵測等,偵測一個物體在一個圖像中的表現,線條偵測即偵測影像中是否含有符合條件的直線;臉部偵測則欲在影像中偵測人臉。Hough Transform(霍式轉換)為此技術之經典算法,將圖形轉換成特征空間,再由投票選取圖形。圖形辨識(recognition)則是要判斷影像中物體所屬條件,相對于偵測,以人臉為例,偵測的目的為標記出人臉位置,辨識則是能進一步的認出這是屬于哪個人物的人臉。圖形偵測主要鉆研偵測速度以及對于噪聲的敏感度,而辨識則討論復雜環境中對應不同結果的方法。相較于圖形偵測除定位與判斷欲偵測的對象是否存在外,圖形辨識因能判斷出圖形中存在對象的其他特性,應用更為多廣。
至于辨識時的分類方法,多源自于機率上的理論,如貝氏定理(Bayes' theorem)、主成分分析(PCA;Principal component analysis)、線性識別分析(LDA;Latent Dirichlet allocation)、支持向量機(SVM;Support Vector Machine)、類神經網絡Neural Network等,研究將辨識對象進行分類并優化。
結論
智能家居、數字安全監控、個人裝置安全控管等議題一直是物聯網的熱門討論內容,車牌辨識、街道影像系統、移動裝置應用等熱門技術亦需要成熟的影像辨識技術,任何需要針對圖形中的對象(如用戶、車輛、文件等)進行萃取的系統均能看到圖形辨識的技術實作。因圖形辨識可應用之領域相當廣泛,在物聯網發展的同時,圖形辨識的技術仍同樣在進步中,各種圖形辨識算法均有擅長的辨識對象目標,優良的圖形辨識算法須結合不同領域之知識,開發者熟悉辨識對象的各種外顯特性,以及動態行為,并且不斷設計修改算法內容,方能設計出最適宜的辨識與分類算法,提升準確率。對于跨領域之技術人才如醫療與信息;工業設計與信息;機械與信息等,同時具有辨識對象與辨識算法知識的人才,將能在這一波躍進中提供更多見解、嶄露頭角。