還記得上月,??低曆芯吭侯A研團隊基于深度學習技術研發(fā)的OCR(Optical Character Recognition,圖像中文字識別)技術,在ICDARRobust Reading競賽數(shù)據(jù)集競賽中刷新全球最好成績,并在“互聯(lián)網(wǎng)圖像文字”、“對焦自然場景文字”和“隨拍自然場景文字”三項挑戰(zhàn)的文字識別(Word Recognition)任務中獲得第一嗎?《??低暽疃葘W習“文字識別技術”國際競賽中獲第一》
安防OCR技術實力彰顯 市場應用其實很廣
借助先進的OCR技術,??低暤奈淖肿R別系統(tǒng)能夠應對更為復雜文字識別場景,如污損及模糊、背景干擾及形變、惡劣天氣等。目前,基于全新OCR技術的??低曑嚺谱R別系統(tǒng)已經(jīng)覆蓋全球六十余個國家和地區(qū)?;谲嚺谱R別技術的卡口、電子警察、出入口控制、停車系統(tǒng)等應用也已經(jīng)全面鋪開。
這里是不是有人要問OCR技術是個什么?小編這就先科普下:OCR 技術是通過識別軟件將圖像中的文字轉換成文本格式,供文字處理軟件進一步編輯加工的技術。具體的說,OCR意為光學字符識別,即自動識別通過掃描儀、數(shù)碼相機、攝像機等得到的圖像中的文字(含字符)或書寫在紙面上的文字,便于存儲、編輯和檢索。
事實上,OCR智能識別技術還可以進行細分,下面介紹下幾種OCR智能識別技術。
1.證件OC識別
此類最開始是基于PC的,近幾年開始向移動端發(fā)展,主要有android,ios平臺的SDK,目前成熟的有身份證識別,行駛證識別,駕駛證識別,護照識別等。
2.銀行卡OCR識別
此類技術是2014年以后開始興起的技術,主要用于移動支付綁卡,是一項非常有技術含量的細分OCR技術,目前有一些APP已經(jīng)在用,如拉卡拉,宜人貸,支付寶,微信等。
3.名片OCR識別
這一類技術也非常成熟了,目前市場上名片管理的APP也非常多,多半已經(jīng)使用這類技術。
4.文檔OCR識別
其實OCR最早的時候就是主要識別文檔,主要針對圖書,報刊等,把這些紙質文檔進行電子化。但這類技術主要是借助在掃描儀的基礎上得到快速發(fā)展,目前識別率也非常高。移動端的文檔OCR識別,近幾年也有不少成功的應用。
5.票據(jù)類OCR識別
這類技術主要是針對各種不同格式的票據(jù),主要基于模板機制,需要針對不同的票據(jù),定制不同的識別要素,這項技術也稱要素識別OCR,最早的其實運用的是銀行行業(yè),主要在銀行的后督中,有非常成功的應用。
6.手寫OCR識別
其實手寫OCR可以分為兩類,一類是書面手寫的識別,這類技術沒有得到很好的應用,只有是因為每個人的手寫習慣不太一樣。目前能識別好是手寫的數(shù)字和字母,因為這些差異不會太大,手寫的漢子,難度還是非常大的。第二類是聯(lián)機手寫技術:聯(lián)機手寫技術得到了非常好的應用,各種手寫輸入法,都是基于這個技術??赡苡行┤藭?,同時手寫OCR智能識別技術,為了聯(lián)機手寫識別的非常好,其實有兩點,一是聯(lián)機手寫是單字識別,不用做切分,OCR里最難的不是比對識別,而是字符切分。二是因為聯(lián)機手寫技術是單字選擇,有人進行判斷。所以應用的非常廣。
7.車牌OCR識別
車牌識別技術相信大家都不會覺得陌生,智能交通,小區(qū)停車場等,都有很好的應用,車牌識別的原理其實技術對車牌進行OCR識別,再進行比對的過程。也是相當成熟的技術。
目前,人工智能蓬勃發(fā)展,OCR作為AI黑技術的重要組成部分已經(jīng)深深融入人們的日常生活工作當中。以當下最流行的身份證識別為例,最簡單的描述它的工作流程包括,圖像的采集輸入、圖像預處理、圖像文字的分割與識別、信息關鍵詞歸屬的判斷和處理,以及OCR識別信息的輸出。在這五大模塊中,圖像的文字分割與識別作為核心技術在開源的OCR中,作為一個技術開發(fā)新人,無法從開源的OCR內(nèi)獲取到有用的算法或代碼。例如谷歌的OCR開源項目,Tesseract-OCR需要通過復雜的配置和訓練方式才有可能接近自己想要的結果。冗余的代碼讓工程師在代碼熟悉階段就對OCR技術望而怯步。
其實仔細觀察,我們會發(fā)現(xiàn)OCR識別技術在身邊生活中隨處可見,比如網(wǎng)上購物手機充值要用移動支付、理財貸款要找互聯(lián)網(wǎng)金融、轉賬要用手機銀行、股票開戶要用證券移動、公司票據(jù)信息錄入存檔等,在這些業(yè)務里你會發(fā)現(xiàn)很多環(huán)節(jié)都已經(jīng)用到了OCR技術,在錄入身份證和銀行卡證件或發(fā)票等票據(jù)信息時現(xiàn)在不需要再手動輸入,通過OCR識別,信息就會自動識別并錄入存檔,速度快而且準確度提升很多。
隨著未來業(yè)務流程的自動化、智能化和多樣化趨勢,OCR識別將會被更廣泛應用,很多場景會實現(xiàn)操作的實時識別錄入存檔,屆時人們將真正感受到智能化生活所帶來的便利,看到人工智能時代發(fā)展將收獲跨越式的發(fā)展。