相信這幾天大家和筆者一樣,正在為搶票殫精竭慮。無論是登錄自己的賬號,還是最終確定自己的火車票訂單,都要過8張一厘米見方的小圖這一關。
這一款“賣萌任性”的驗證碼的出現為了攔阻形形色色的搶票軟件。然而,“道高一尺魔高一丈”,圖片驗證碼剛一推出,就被部分搶票軟件破解了。
據說,融合了360人工智能研究院視覺識別技術的360瀏覽器,就已經可以快速準確識別圖片驗證碼。而今年這項技術將更加成熟強大,不僅可以自動識別驗證碼,用戶還可以自動登錄、自動提交訂單。筆者在搶票中也嘗試過,確實可以自動識別驗證碼。
所有這些步驟的完成,得益于一項技術:圖像識別技術。
其實,圖像識別技術是人工智能的一個重要領域。圖像識別在學術界已經被研究了幾十年,從大約50年前就有人提出讓計算機外接相機來識別相機看到的東西(圖靈獎得主Marvin Minsky)。這個見地在今天似乎沒有什么,但是在50年前提出則相當不易。
圖像識別方法可以分為兩大類,模型的方法和搜索的方法。模型就是通過機器學習的方式學習一些已知的圖像,構建符合這些特征的“新的未知圖像”,經過這個模型判斷出其應該具有的標簽。
(基于模型的圖像識別示意圖,圖片來自于網絡)
搜索的方法是將已知標簽的圖像數據建成一個可以進行高效率檢索的數據庫,稱為圖像索引。與模型的方法比較起來,就是直接省去建立模型的環節,直接用這些數據來進行匹配。
所以,只要擁有圖像數據,那些搶票軟件的驗證碼便成為小菜一碟了。
那么,問題來了:自動圖像識別有多牛?那么筆者有必要用數字說話了。在深度學習方式使用之前,最好的識別“前5準確率”(也就是給待測圖像預測出的前5個標簽中有一個是對的)只有74%左右,而深度學習第一次就將這個結果提升了將近10個百分點,到達83.6%。而最新的2015年的最好結果達到了96.3%。
想象一下:
淘寶上有超過10000種實物商品,在全國不同的城市,標注著不同的標簽,如何快速找到?一個圖像識別系統必不可少。
有個技術大牛曾這樣舉例:去參加朋友家里的一個聚會,主人家里有一株很漂亮的花,參與聚會的朋友們這都想知道花的名字,可惜主人也忘了。于是,我啟動我研發的花卉識別器,成功地識別出了這株花。
成功識別出這是“Amaryllis(孤挺花)”,厲害了我的哥
圖像識別與安防淵源頗深
識別的最基礎是海量數據,而安防無疑是個巨大的數據入口,而且伴隨著強烈的數據分析、圖像分析需求。
視頻監控在過去的應用中最大的問題是人工查看的問題,視頻智能分析技術應運而生。目前安防行業采用的一般是前端智能+后端智能的方式,前端的攝像機進行基礎的結構化數據提取,后端再進行深度二次分析。
要知道,視頻監控領域是圖像識別技術一直在尋求突破的主要領域之一。
在公安領域,城市道路、廣場及各類重點場所的人、車、物等目標的識別,提取包括人的性別、人臉、全身等信息,車的車標、車牌、車身顏色等信息,都涉及到視頻圖像分析技術。偵破與搜尋的效率得到前所未有的提高。
在智能交通領域,具有分析、感知能力的智能攝像機通過視頻識別分析技術,可對每輛車進行完整的違法行為分析、識別、抓拍和錄像,記錄車輛違法的整個過程,再將每條記錄生成文本數據提交給后端智能管理與分析系統,是不是神奇到沒朋友呢?
監獄、看守所等司法系統以及校園等教育地域的安防都與監控、視頻圖像識別密不可分……圖像識別與安防關系密切。
筆者語
作為安防行業的一個小小的細胞,深知這個行業的廣袤,其實我們很多安防技術并不是古板的、官方的。隨著安防的民用化不斷深入,很多安防人正在將安防嵌入我們日常生活的每個細節。
比如,搶票這個事兒。