2017年碩士畢業(yè)后,張凱通過校招進(jìn)入深圳狗尾草智能科技有限公司人工智能研究院,成為狗尾草知識(shí)圖譜團(tuán)隊(duì)中的一員。“2017年以前,公司的人工智能研發(fā)崗位統(tǒng)稱為語義工程師,在我入職的那一年,隨著團(tuán)隊(duì)規(guī)模的擴(kuò)大,以及戰(zhàn)略研發(fā)投入的加大,公司對人工智能崗位開始細(xì)分,設(shè)立了知識(shí)圖譜工程師、自然語言處理工程師、深度學(xué)習(xí)工程師等崗位。”
近幾年,人工智能研究形成了一個(gè)場,匯集了屬于人工智能工程師們的信仰、夢想與狂熱。2017年,人工智能一詞首次被寫入政府工作報(bào)告。作為人工智能的一個(gè)分支,知識(shí)圖譜也成為近兩年火熱起來的新賽道。
“深度學(xué)習(xí)在處理感知、識(shí)別和判斷等方面表現(xiàn)突出,能幫助構(gòu)建聰明的AI,但在模擬人的思考過程、處理常識(shí)知識(shí)和推理,以及理解人的語言方面仍然舉步維艱。這是催生知識(shí)圖譜技術(shù)及與其相對應(yīng)的工程師的重要原因之一。”張凱在接受經(jīng)濟(jì)觀察報(bào)記者采訪時(shí)說。
“人工智能技術(shù)在行業(yè)應(yīng)用里落地時(shí),往往需要結(jié)合每個(gè)行業(yè)已有的領(lǐng)域知識(shí)。負(fù)責(zé)開發(fā)知識(shí)圖譜技術(shù)系統(tǒng)的工程師便隨著人工智能行業(yè)應(yīng)用增多應(yīng)運(yùn)而生。“達(dá)觀數(shù)據(jù)創(chuàng)始人陳運(yùn)文告訴經(jīng)濟(jì)觀察報(bào)記者。
技術(shù)迭代中的新工程師們
“我剛讀研的時(shí)候是在海量數(shù)據(jù)研究所,快畢業(yè)的時(shí)候才成立了數(shù)據(jù)科學(xué)與工程學(xué)院。”張凱介紹說,他的母校華東師范屬于最早開設(shè)人工智能相關(guān)專業(yè)的高校之一。
從事人工智能相關(guān)職業(yè)的人或許都注意到,2017年前后,全國各大高校開始設(shè)立與人工智能相關(guān)的大類專業(yè),培養(yǎng)專業(yè)人才。2017年7月,中國政府網(wǎng)發(fā)布國務(wù)院通知公布了《新一代人工智能發(fā)展規(guī)劃》,規(guī)劃文件指出,我國經(jīng)濟(jì)發(fā)展進(jìn)入新常態(tài),深化供給側(cè)結(jié)構(gòu)性改革任務(wù)非常艱巨,必須加快人工智能深度應(yīng)用,培育壯大人工智能產(chǎn)業(yè),為我國經(jīng)濟(jì)發(fā)展注入新動(dòng)能。
2018年6月,在杭州舉行的新聞發(fā)布會(huì)上,教育部公布了各大高校開設(shè)人工智能專業(yè)的階段性成果:截至2017年12月,全國共有71所高校圍繞人工智能領(lǐng)域設(shè)置86個(gè)二級(jí)學(xué)科或交叉學(xué)科。
同年,教育部發(fā)布了《高等學(xué)校人工智能創(chuàng)新行動(dòng)計(jì)劃》,意在彌補(bǔ)人工智能技術(shù)發(fā)展和應(yīng)用落地過程中的人才短缺問題,加強(qiáng)人才培養(yǎng)。《計(jì)劃》強(qiáng)調(diào),要加強(qiáng)人工智能領(lǐng)域?qū)I(yè)建設(shè),形成“人工智能+X”復(fù)合專業(yè)培養(yǎng)新模式。計(jì)劃的重點(diǎn)任務(wù)之一是要完善人工智能領(lǐng)域人才培養(yǎng)體系,并且推動(dòng)高校人工智能領(lǐng)域科技成果轉(zhuǎn)化與示范應(yīng)用。
在人工智能行業(yè)中,知識(shí)圖譜工程師屬于新興職業(yè),這一點(diǎn)從陳運(yùn)文的描述中便可得知:“早先出去談客戶,客戶都問有哪些AI技術(shù)可以用,而現(xiàn)在客戶會(huì)直接說:需要一套管理XX的知識(shí)圖譜系統(tǒng)。”
2015年,達(dá)觀數(shù)據(jù)設(shè)立知識(shí)圖譜工程師崗位,負(fù)責(zé)開發(fā)面向垂直行業(yè)應(yīng)用的知識(shí)圖譜,并結(jié)合達(dá)觀的文本智能處理系統(tǒng),將AI技術(shù)應(yīng)用于金融、制造、電信、政府等行業(yè)。
在狗尾草智能科技的張凱工程師看來,知識(shí)圖譜工程師們擁有與軟件開發(fā)工程師們相同的標(biāo)簽:高學(xué)歷、高薪、男性、加班、壓力。
差別在于對知識(shí)面、專業(yè)知識(shí)的要求不同。“知識(shí)圖譜不是單一技術(shù),而是一個(gè)龐大的技術(shù)棧,涉及包括數(shù)據(jù)庫、自然語言處理(NLP)、機(jī)器學(xué)習(xí)(ML)、前端應(yīng)用等多個(gè)領(lǐng)域知識(shí),因而知識(shí)圖譜工程師不僅要對知識(shí)圖譜技術(shù)中的某一項(xiàng)專精,還要有整體的架構(gòu)能力。許多知識(shí)圖譜工程師是從傳統(tǒng)領(lǐng)域轉(zhuǎn)型而來,并與多個(gè)其他領(lǐng)域交叉協(xié)同。”張凱說。
雖說從事的是自己感興趣的職業(yè),但OKR指標(biāo)與技術(shù)迭代周期快速的特點(diǎn)仍讓張凱感覺到壓力。為緩解壓力,每天固定兩小時(shí)的充電是必備的,從讀研期間,他養(yǎng)成的每天讀文獻(xiàn)與了解行業(yè)新動(dòng)態(tài)的習(xí)慣一直保留。“我們這個(gè)職業(yè),自我學(xué)習(xí)非常重要,要及時(shí)更新知識(shí)庫。”
“整個(gè)IT行業(yè)的變化非常快,技術(shù)迭代之快讓人有時(shí)反應(yīng)不過來。”張凱對經(jīng)濟(jì)觀察報(bào)記者說,要適應(yīng)快速的技術(shù)迭代,就要不斷的深度學(xué)習(xí),不斷提升自己,適應(yīng)轉(zhuǎn)型。
讓機(jī)器具備認(rèn)知能力
知識(shí)圖譜是什么?可能你說不出知識(shí)圖譜的具體定義,但其實(shí)你每天都在使用它,當(dāng)你在使用百度搜索時(shí),搜索結(jié)果右側(cè)的聯(lián)想,就來自知識(shí)圖譜技術(shù)的應(yīng)用。知識(shí)圖譜是將互聯(lián)網(wǎng)所有的知識(shí)積累起來,將“信息”搜集上升成為了“知識(shí)”積累,歸根結(jié)底,知識(shí)圖譜的意義在于在盤根錯(cuò)節(jié)的數(shù)據(jù)海洋中進(jìn)行梳理和串聯(lián),讓以前模糊的世界變得更加清晰。
知識(shí)圖譜的概念最先由谷歌于2012年正式提出,主要用來支撐下一代搜索和在線廣告業(yè)務(wù)。2013年以后,知識(shí)圖譜開始在學(xué)術(shù)界和業(yè)界普及,并在搜索、智能問答、情報(bào)分析、金融等領(lǐng)域應(yīng)用中發(fā)揮重要作用。
多位致力于人工智能行業(yè)研究的領(lǐng)軍人物曾一直認(rèn)為:知識(shí)圖譜對于人工智能的價(jià)值,就在于讓機(jī)器具備了認(rèn)知能力。
“知識(shí)圖譜工程師們的工作可以比喻成為人工智能‘塑造大腦’。”張凱說,由于缺乏諸如知識(shí)圖譜此類常識(shí)知識(shí)庫,各類工具理解大數(shù)據(jù)的手段有限,限制了基于大數(shù)據(jù)的精準(zhǔn)分析,大大降低了大數(shù)據(jù)的潛在價(jià)值。盡管越來越多的行業(yè)或者企業(yè)積累了規(guī)模可觀的數(shù)據(jù),但這些數(shù)據(jù)并未能創(chuàng)造價(jià)值。知識(shí)圖譜工程師們則通過數(shù)據(jù)操作,塑造了一個(gè)人工智能的大腦,為機(jī)器處理各種通用型任務(wù)提供了可能。
狗尾草旗下有一款A(yù)I虛擬生命產(chǎn)品“琥珀·虛顏”,與傳統(tǒng)聊天機(jī)器人不同的是,她能夠與人類進(jìn)行語音和視覺的交流,擁有自己的生活狀態(tài)和小情緒,具備情感交互能力。而這款虛擬生命產(chǎn)品的大腦就是由張凱和他所在的知識(shí)圖譜團(tuán)隊(duì)塑造的。
根據(jù)中國電子學(xué)會(huì)統(tǒng)計(jì),2018年全年,全球人工智能核心產(chǎn)業(yè)市場規(guī)模超過555.7億美元,相較于2017年同比增長50.2%。目前中國人工智能行業(yè)的企業(yè)總數(shù)達(dá)到670家,占全球的11.2%。
“知識(shí)圖譜是未來人工智能實(shí)現(xiàn)從感知到認(rèn)知跨越的重要基石之一。隨著數(shù)據(jù)紅利的消失,以大數(shù)據(jù)和深度學(xué)習(xí)為基礎(chǔ)的感知智能會(huì)遭遇天花板。而認(rèn)知智能很有可能借助大規(guī)模知識(shí)圖譜技術(shù)取得進(jìn)一步突破。”深圳狗尾草智能科技有限公司技術(shù)總監(jiān)、人工智能研究院院長邵浩說。