如今隨著人工智能深度學(xué)習(xí)的持續(xù)火熱,計算機視覺領(lǐng)域也發(fā)生了翻天覆地的變化,而場景文字檢測與識別作為其重要的研究課題之一,自然也不可避免被這股新科技浪潮所席卷。
其實場景文字這問題早在15-20年前就已經(jīng)被關(guān)注并研究,與傳統(tǒng)的文本文字檢測相比,其重要區(qū)別在于需要將照片或者視頻中的文字準(zhǔn)確識別出來。
通常這個過程可以大致被理解為兩個步驟,首先需要對照片中存在文字的區(qū)域進行定位,也就是找到單詞或者文本的邊界框;第二步才是對定位到的文字進行精準(zhǔn)識別。
總體來看,場景文字檢測的發(fā)展歷程與很多計算機視覺方面的探究任務(wù)相類似,起初都是基于傳統(tǒng)的手工設(shè)計特征,但這一點在2014年左右發(fā)生了本質(zhì)變化,主要是人工智能深度學(xué)習(xí)方法的出現(xiàn)打破了之前的藩籬。
但不容忽視的一點是,盡管強大的深度學(xué)習(xí)為該領(lǐng)域帶來了十足的推動力,但目前的場景文字識別與檢測還面臨數(shù)不清的挑戰(zhàn)。
例如,以文字顏色、大小、方向、字體等多變維度主導(dǎo)的場景文字多樣性為自然條件下的文字識別與檢測帶來了不小困難。日常生活中隨處可見的信號燈、指示標(biāo)、柵欄、花草等局部與文字有一定相似性,這也為文字檢測與識別過程帶來很大干擾,等等。
發(fā)展至今,深度學(xué)習(xí)在不規(guī)則排列的文字檢測與識別方面仍然表現(xiàn)非常棘手,模型的泛化能力有限……以上統(tǒng)統(tǒng)都會成為深度學(xué)習(xí)亟需突破的障礙!
沒想到發(fā)展正旺的深度學(xué)習(xí)竟然有這么多坑坑洼洼,但開發(fā)者小伙伴們又對其如此“執(zhí)念”,腫么辦呢?別急,福利說到就到!
1月17日,由華為開發(fā)者聯(lián)盟(華為終端開放平臺https://developer.huawei.com/consumer/cn/)舉辦的HUAWEI Developer Day系列沙龍活動19年第一站武漢站,有確切消息稱華中科技大學(xué)教授白翔將應(yīng)邀亮相沙龍現(xiàn)場。
與會的開發(fā)者們不單能親眼看到久負(fù)盛名的技術(shù)大牛,還將全面了解最先進的深度學(xué)習(xí)方法,用于自然場景圖像中的文本識別與檢測,并評估其準(zhǔn)確性與穩(wěn)定性等系列干貨。
另外,白翔教授還會就如何將深度學(xué)習(xí)方法有效地應(yīng)用于從二維視角中檢索和識別具有任意形狀的拉丁文和非拉丁文,并結(jié)合成功的場景文本閱讀應(yīng)用分析以及潛在研究方向做出預(yù)測等方面進行深入探討,如此有料的學(xué)習(xí)內(nèi)容,還等什么?
當(dāng)然,除了涉及深度學(xué)習(xí)技術(shù)的透徹交流之外,本次武漢站沙龍活動,華為開發(fā)者聯(lián)盟還攜以下干貨亮點來襲,都有哪些閃亮之處需要畫圈圈呢?
深挖“時髦”的AI、AR/VR能力,打造酷炫應(yīng)用不再難!關(guān)于諸多前沿技術(shù),華為的多位高級架構(gòu)師將在本次活動中,通過成功并詳盡的應(yīng)用案例,為到場的開發(fā)者深入講述AI、AR/VR、快應(yīng)用等最新技術(shù),幫助開發(fā)者們理解與應(yīng)用,完成打造酷炫應(yīng)用的終極目標(biāo)。
全面解讀創(chuàng)新生態(tài),智慧分發(fā)、直達所需不是夢!
關(guān)于如何通過華為快服務(wù)平臺的智慧分發(fā)技術(shù)手段獲取更多流量,并同時在競爭激烈的市場中成功探索流量新風(fēng)口?對于這個開發(fā)者們普遍get的問題,現(xiàn)場華為高級產(chǎn)品經(jīng)理將從全方位、多角度解讀終端新生態(tài)服務(wù)體系,幫助開發(fā)者提高推廣效率,提供更便捷、更優(yōu)化的體驗,惠及開發(fā)者,一個都不能少!
P20+榮耀手環(huán),豪華大禮驚喜怎能間斷?每位報名成功并且是前300位到現(xiàn)場開發(fā)者都會獲得一份精美的伴手禮,同時還可現(xiàn)場體驗AI、AR、快應(yīng)用等創(chuàng)新業(yè)務(wù)。令人欣喜的是,議題間隙還會抽取華為P20、榮耀手環(huán)等豪華大禮!
HUAWEI Developer Day系列沙龍活動作為一個與廣大開發(fā)者深度交流的平臺,自上線以來,主要通過主題討論、熱門技術(shù)解讀、行業(yè)大咖案例分享等多重形式,圍繞最新技術(shù)和產(chǎn)品形態(tài),將華為的最新開放能力及服務(wù)賦能給互聯(lián)網(wǎng)開發(fā)者,同時還將最新行業(yè)動向及趨勢傳傳遞給最需要的人。
不論是資深開發(fā)者,抑或是開發(fā)新手,哪怕是對終端推廣新形態(tài)感興趣的運營經(jīng)理……統(tǒng)統(tǒng)都可以參與其中,提升能力、受益頗多。
武漢站近在眼前!
這里有深度學(xué)習(xí)大牛的前沿技術(shù)分享;
這里有航班管家設(shè)計總監(jiān)帶來的精彩應(yīng)用;
這里有華為最新的創(chuàng)新生態(tài)解讀;
這里有炫酷時髦而又可行的技術(shù)……
面對如此一場充滿楚風(fēng)情結(jié)的AI技術(shù)的饕餮盛宴,你怎能不心動?
所以心動總不如行動!
從即日起到1月16日15:00,本場HUAWEI Developer Day武漢站沙龍的報名通道將持續(xù)暢通,并于1月17日正式在武漢上線啟動。
想?yún)⒓樱亢芎唵危苯拥顷懭A為開發(fā)者聯(lián)盟官網(wǎng),或者及時戳一戳下方鏈接就能妥妥進入報名通道啦!
報名鏈接:https://huiyi.csdn.net/activity/product/goods_list?project_id=4084