人工智能火了之后,要找一個“懂”人工智能的人才卻依舊很難。當“深度學習”成為新一代科技革命與產業變革的核心驅動力量時,去點燃這“驅動力”的核心人才又將從何而來呢?
縱觀人工智能產業落地現況,據中國社會科學院科學技術和社會研究中心研究員段偉文指出,“我國到2020年人工智能核心產業規模要超過1500億元,帶動相關產業規模超過1萬億元,相關人才需求的缺口無疑是巨大的。”其中深度學習作為推動人工智能大規模產業化落地的核心技術,人才供求比例問題更是嚴峻。
2019年初,百度聯合“深度學習技術及應用國家工程實驗室”成立黃埔學院,旨在為各行各業培養第一批“首席AI架構師”。所謂AI架構師,不僅需要對軟件技術架構、大數據等有深入理解,而且需要能夠利用相關知識指導人工智能平臺的設計和開發。
“AI架構師是這個時代新衍生出來的一種新的角色,能力要求更加全面,除了與傳統架構師類似的一些基本架構設計能力之外,需要對整個AI相關的算法、框架、平臺相關的能力有一個綜合的素質要求,所以,AI架構師對AI時代真正的AI算法落地產生社會價值是非常重要的。”百度黃埔學院技術導師如是說。
百度黃埔學院在人工智能領域成立的意義,可能不僅是在人才培養方面,鍛煉出更多“首席AI架構師”,對企業乃至產業,都能帶來屬于他們自己的價值,這才是技術帶來的最大社會責任。
人工智能帶來的“更多機會”
“計算機視覺的技術,一樣能夠放在醫學上面。”
上一次創業將人工智能順利應用到金融行業之后,朱森華發現人工智能在醫療領域同樣潛力巨大。碩博投身腦科學的他對醫學并不陌生,于是來到連心醫療擔任人工智能技術總監,驗證自己的想法落地。
朱森華的認知是正確的。連心醫療主要將人工智能算法用在改進腫瘤放射治療的過程。而沒有AI介入之前,治療過程效率低到令人無法想象。
在具體的腫瘤治療場景中,確定病灶(機體上發生病變的部分)后,醫生才能規劃被射線殺死癌細胞的區域,同時不可以讓射線接觸到周邊的正常身體組織,用內部話講,這個步驟叫“畫靶區”。
每照出一張CT影像,需要制定“靶區”時,醫生都要親自手繪病灶區域和周邊正常器官的區域。放在科技發達的現在,我們也許根本沒法相信,畫出一張CT影像的時間是3-5小時,一個工作日二分之一的時間,就消耗在這里。
連心醫療要做的事,就是提升效率,而且不是緩慢提升。人工智能介入以后,利用計算機視覺當中的圖像分割技術,AI可以將影像里的病灶與正常器官自動勾畫出來,甚至還能幫助醫生自動規劃射線的具體劑量。從3-5小時直接縮短至幾分鐘內可以完成,對于醫生來說,僅需要最后對結果進行審核確認即可,生產力得到了莫大的解放,從而能夠將更多精力放在治療計劃里其他重要的地方。
新一輪技術帶來的產業變化巨大,各行各業都有著巨大需求,怎樣滿足如此大的需求,是所有技術型企業需要有的責任感,也是潛在的最佳機會。
深度學習與商業化
經過了技術的發展演進,人工智能與深度學習已成為我們避不開的詞匯。
但是提到人工智能,仍有人覺得離我們非常遙遠,似乎每一項技術進入生活前都需要沖破一層隔膜。
其實不然。在日常生活、工作生產當中,人工智能已經滲透到方方面面,70年代就已成型的人工智能技術,面臨的是技術升級帶來的變革。
已經被廣泛使用著的“人臉識別”似乎成為大眾最容易體驗到的AI應用之一。但是會人臉識別就會其他物體的識別嗎?其實沒那么簡單。行業與行業之間有著巨大的隔閡,而不投入人力物力去鉆研,根本無法達到使用的階段,更不用說“進入產業”。在這方面,掌握著足夠資金,以及最重要的數據的大公司才有機會把這件事做成通用的框架,進而深入到產業當中去。
一般來講,自研算法是眾多AI公司解決AI落地場景、真實應用于實踐的一個難題。資源、精力、人才等等問題,讓很多企業,特別是AI創業公司常常難以兼顧。而百度飛槳(PaddlePaddle)開源框架則可以填補算法的底層應用,幫助其他公司在AI領域快速使用深度學習的成型算法,解放出更多精力放在重要業務上。
上面提到的“人臉識別”,就是CV(Computer Vision)——計算機視覺領域的技術能力之一。據了解,百度大腦AI開放平臺九月份集中分享了基于飛槳的CV領域資料,面向眾多開發者推出“百度大腦金秋九月CV盛典”。此次CV主題“盛典”分享了百度大腦自身扎根多年,在人臉識別、文字識別OCR、圖像識別、AR/VR、視頻理解、智能視頻監控開發平臺等,多個技術方向、解決方案案例以及公開課的參考資料,方便更多開發者了解應用,最終將技術帶入產業中去。
“AI芯片+算法,讓人工智能在各個場景下落地。”北京嘉楠捷思信息技術有限公司CTO翟新剛告訴筆者。嘉楠捷思以邊緣計算AI芯片起家,走向商業化道路的過程中,必須找到各種合適的場景,比如 “農林監測”應用場景。
中國的植被森林區長期以來被一種名叫“紅脂大小蠹”的害蟲侵犯,每年危害的森林面積不斷擴大,影響到自然生態。如果按照傳統的解決方法,林業專家們必須翻山越嶺巡查在林區布置好的昆蟲誘捕器,費時費力,需要專業人才不說,發現不及時的話,還容易引起蟲災。
為了解決這個需求,嘉楠捷思、百度飛槳和北京林業大學共同合作研發出了智能害蟲檢測系統,利用搭載AI芯片的攝像頭模組進行蟲子的檢測與識別,分析病蟲害當中蟲子的種類,以及害蟲集中在哪個層面,以進行針對性的防治。
對于這樣一套系統來說,三方的努力缺一不可。檢測模組輕巧方便,可進行輕量化的計算,芯片模組對能耗的要求不能太大,掛在樹上就能輕易開啟觀察;后臺分析需要用到的深度學習算法,是嘉楠捷思通過百度飛槳開源的深度學習框架拿到模型,快速開發落地,時間上得到保證;林業大學最懂行業需求,合力促成了對產業的認知和訴求的解決。目前,智能害蟲檢測項目得到初步驗證,逐漸接觸商業化方向。
“AI芯片在各個場景都會嘗試落地,我們手頭上就有很多項目可以結合飛槳深度學習平臺進行落地,來到百度黃埔學院就是想驗證項目與百度飛槳深度合作,會產生什么樣的火花。”翟新剛在溝通中提到的百度黃埔學院,就是百度聯合國家深度學習技術及應用國家工程實驗室,專為AI核心人才提供深度學習技術培訓的機構。說到百度黃埔學院,又不得不提到一個略顯神秘、科技企業卻幾乎必備的職位——AI架構師。
當傳統行業遇到人工智能
人工智能火了之后,要找一個懂人工智能的人才是很難的。
這里的“懂”,不只是懂技術。技術與算法固然是非常重要的組成部分,但如何理解人工智能的底層邏輯、根據具體場景具體分析,并最終將其落地,這是AI架構師最主要的任務。
一位關注技術的投資人曾表示,要成為AI架構師人才,必須是“跨界”的。既懂技術,又懂場景,復合型人才永遠是企業當中稀缺的存在,這也是百度黃埔學院成立的意義。
在百度黃埔學院第二期開學典禮現場,百度AI 技術平臺體系執行總監、深度學習技術及應用國家工程實驗室副主任、黃埔學院院長吳甜表示,百度黃埔學院希望能夠把技術和應用結合起來,核心關注三個方面:一是重視實際場景中問題的沉淀與總結,而不是做想象中的需求。深度學習技術是一個好用的工具,但是這不代表我們“拿著榔頭找釘子”;二是重視技術和場景的結合,而不是僅僅依賴數據集上的測試結果;三是重視集成到系統當中的工程實現,而不僅僅是關注到算法的單點上。
對于傳統行業中正在轉型的公司,或許對人工智能的浪潮感觸更深刻。
成立于1991年的大恒圖像,一直致力于機器視覺在工業質檢方面的應用,大恒圖像研發中心AI組負責人陳亮向筆者表示,在接觸到深度學習之前,公司在工業檢測方面一直用的是“傳統算法”。所謂傳統,其實是先人工手動設計產品可能會出現的缺陷情況,如果在流水線上發現有這樣缺陷特征的產品,機器能夠識別出并歸類。
但是手動設計缺陷特征本身就是一件需要大量人力的工作,做完標注之后放到流水線上,機器也只能比照識別人工設定的、有缺陷的產品,對于新的缺陷特征出現,或者有其他的意外情況發生時,卻不能得到很好的解決。
大恒圖像其中一條流水線用于檢測新能源汽車電池的重要組成部分——隔膜。隔膜主要用途是把電池的正負極給隔離開,保證鋰離子通過的同時,阻礙電子傳輸,從而不讓電池正負極接觸,導致電池短路,汽車自燃。隔膜需要做的非常薄,在生產時就不可避免地會有一些缺陷。因此隔膜檢測十分有必要。
深度學習實際上就是取代了“手動設計”這一過程,讓機器可以不斷地“自我學習”去發現新的缺陷,并自動標注。在這方面,大恒圖像與百度飛槳合作,在深度學習的框架下生成一個模型,將產品缺陷分類,之后進行流水線上的檢測。其檢出率可達99.8%,節省不少人力。
節省人力,可以看作是技術升級帶來的一項顛覆。直到現在,為了控制成本,工業流水線依然很愿意嘗試新技術帶來效率的提升。在這其中,百度飛槳的開源框架和各個深度學習模型都能幫助企業實現技術在場景當中的應用。
人才培養的魅力
開源平臺那么多,為什么是飛槳?
經了解,來參加黃埔學院的相當一部分學員們都對百度飛槳表現出強烈的興趣,因為“飛槳火了”。
“市場上的幾大開源框架,像TensorFlow、Caffe、飛槳(PaddlePaddle)這些,每個框架都有自己的優勢,之所以選擇飛槳,是因為他們這一年發展非常地快,而且對最前沿模型的開發,響應也非常快速。”連心醫療朱森華告訴筆者,公司正在考慮將算法開發框架從TensorFlow遷移到百度飛槳平臺。
持有相同想法的企業,在黃埔學院不在少數。比起其他開源框架,百度飛槳更能顧及到中國開發者的感受,在中文自然語言處理、中國人臉、中文語音處理方面更具有優勢。加上百度內部對于飛槳的支持,企業更愿意接受這個來自本土的技術平臺。
如今的百度飛槳在框架穩定性、兼容性和成熟度上,都上升了一個臺階。在工業領域,從事3C電子產品缺陷檢測的精測電子,在對比幾大開源框架后,這家公司發現,在實際業務中,百度飛槳的易用性與穩定性很好,并且在相同效果的情況下,百度飛槳的運算速度更快一些。“在使用的時候,百度飛槳也更加友好”,精測電子高級算法工程師張勝森表示。
在深度學習領域當中,人才培養和解決問題依然是產業化的重心。據悉,在本期黃埔學院課程當中,每位學員都帶著一份“作業”,即實際的應用場景。在學習的過程里,把深度學習帶入每份作業當中,最終成型技術應用解決方案。面對各場景不同的應用,十余位百度重量級科學家和百度AI架構師將作為導師,圍繞著問題定位、問題拆解、解決方案探討、實際解決設計作業和實驗體系,基于百度飛槳有針對性的講授深度學習技術和應用知識。
正如百度AI技術平臺體系執行總監、深度學習技術及應用國家工程實驗室副主任、黃埔學院院長吳甜所言:“國內現在有大量的需求在驅動著我們,我們能夠預見,人工智能和產業的深度結合勢必發展迅速。黃埔學院希望能切實幫助企業儲備既能分析業務問題,又掌握模型算法,還能操刀落地應用,深諳算法與工程的緊密結合的企業創新型人才。”
文中所有企業受訪人皆為百度黃埔學院二期學員。了解百度黃埔學院——首席AI架構師培養計劃,請訪問“百度AI開放平臺”官網。https://ai.baidu.com