高斌博士畢業(yè)于北京大學(xué)數(shù)學(xué)科學(xué)學(xué)院,現(xiàn)任微軟總部必應(yīng)搜索廣告部門(mén)首席機(jī)器學(xué)習(xí)科學(xué)家,此前曾擔(dān)任微軟亞洲研究院機(jī)器學(xué)習(xí)研究組主任研究員,主要從事機(jī)器學(xué)習(xí)、信息檢索、數(shù)據(jù)挖掘和計(jì)算廣告等領(lǐng)域的研究,在國(guó)際頂級(jí)期刊和會(huì)議上發(fā)表相關(guān)論文 40 余篇,持有 30 余項(xiàng)美國(guó)專(zhuān)利,其指導(dǎo)的論文曾獲得國(guó)際信息檢索大會(huì) (SIGIR) 最佳學(xué)生論文獎(jiǎng)。幾年前,他的研究團(tuán)隊(duì)用基于知識(shí)圖譜的詞向量技術(shù)來(lái)做詞匯類(lèi)的智商測(cè)試題(IQ Test),測(cè)試結(jié)果超出人類(lèi)平均水平,該成果受到了麻省理工學(xué)院技術(shù)評(píng)論(MIT Technology Review)的關(guān)注。
在做研究的同時(shí),高斌博士十分重視和產(chǎn)品部門(mén)的合作,將十多項(xiàng)技術(shù)轉(zhuǎn)化到了必應(yīng)搜索、必應(yīng)搜索廣告、微軟小冰等產(chǎn)品中。也是在這個(gè)過(guò)程中,高斌博士對(duì)應(yīng)用型研究產(chǎn)生濃厚興趣,因此申請(qǐng)轉(zhuǎn)到產(chǎn)品部門(mén),成為了微軟總部必應(yīng)搜索廣告部門(mén)的首席機(jī)器學(xué)習(xí)科學(xué)家,將前沿的機(jī)器學(xué)習(xí)技術(shù)應(yīng)用到產(chǎn)品中,同時(shí)針對(duì)具體應(yīng)用研發(fā)新的算法模型,改進(jìn)產(chǎn)品性能。
日前,TGO 鯤鵬會(huì)采訪了高斌博士,為我們分享了其對(duì)人工智能現(xiàn)狀及未來(lái)發(fā)展的一些看法:
您認(rèn)為目前影響人工智能落地的因素有哪些?
我認(rèn)為目前影響人工智能落地的因素主要有以下三個(gè)方面:
第一,明確技術(shù)應(yīng)用的邊界和程度。雖然人工智能技術(shù)發(fā)展日新月異,但是目前能夠解決的問(wèn)題還是有限的。我們要弄清楚在一個(gè)應(yīng)用場(chǎng)景中哪些部分是人工智能技術(shù)可以解決的,可以解決到什么程度,哪些部分不能解決。然后針對(duì)應(yīng)用場(chǎng)景的需求期望來(lái)決定哪些部分使用人工智能技術(shù)以及使用何種人工智能技術(shù)。這樣才能最大的發(fā)揮技術(shù)功效,并且避免因?yàn)橐恍┎磺袑?shí)際的幻想破滅而造成的負(fù)面影響。
第二,提升數(shù)據(jù)的質(zhì)量。人工智能技術(shù)尤其是深度學(xué)習(xí)技術(shù)需要依托海量數(shù)據(jù)來(lái)進(jìn)行模型訓(xùn)練。我們需要針對(duì)具體的應(yīng)用問(wèn)題來(lái)對(duì)數(shù)據(jù)進(jìn)行選擇和處理,包括對(duì)數(shù)據(jù)量的積累、對(duì)多種類(lèi)型的數(shù)據(jù)進(jìn)行取舍、對(duì)數(shù)據(jù)進(jìn)行降噪、對(duì)數(shù)據(jù)內(nèi)在關(guān)聯(lián)進(jìn)行分析和利用等。在這個(gè)基礎(chǔ)上,才能更好的建立模型并提升模型學(xué)習(xí)質(zhì)量。
第三,提高工程實(shí)現(xiàn)能力。雖然近年來(lái)高性能計(jì)算硬件的發(fā)展和普及非常迅猛,高水平的工程實(shí)現(xiàn)能力依然是影響人工智能落地的重要因素。一般來(lái)說(shuō),數(shù)據(jù)量、模型尺度的增長(zhǎng)速度還是大于硬件發(fā)展的速度的,高水平的工程實(shí)現(xiàn)能力可以最高效地在硬件計(jì)算資源、數(shù)據(jù)量和算法模型之間找到平衡點(diǎn),實(shí)現(xiàn)人工智能技術(shù)的落地。
人工智能幫助必應(yīng)搜索廣告部在業(yè)務(wù)上實(shí)現(xiàn)了哪些實(shí)實(shí)在在的突破?又能給用戶(hù)帶來(lái)哪些便利?
近年來(lái),人工智能尤其是深度學(xué)習(xí)技術(shù)在必應(yīng)搜索廣告的廣告選取、廣告相關(guān)性計(jì)算、廣告排序等方面都取得了很大的改進(jìn),大部分模塊的核心算法都升級(jí)成了深度學(xué)習(xí)模型,在有限度提高計(jì)算資源的前提下實(shí)現(xiàn)了 RPM(每千次搜索的廣告收益)等指標(biāo)的連續(xù)大幅增長(zhǎng)。對(duì)用戶(hù)來(lái)講,高質(zhì)量廣告可以提升搜索頁(yè)面的整體相關(guān)性(whole page relevance)。
您覺(jué)得大眾對(duì)人工智能的認(rèn)知偏差大嗎?這種偏差會(huì)對(duì)行業(yè)造成哪些影響?
我覺(jué)得大眾對(duì)人工智能的認(rèn)知偏差普遍比較大,出現(xiàn)這種偏差有多方面的原因:藝術(shù)作品的先入為主、對(duì)大眾的人工智能知識(shí)科普的不足、媒體的過(guò)度渲染、部分從業(yè)人員的炒作等等。這種偏差的影響也是多方面的,第一個(gè)影響是大眾的恐慌。比如人工智能取代人類(lèi),人工智能導(dǎo)致失業(yè)率升高等等,這有可能會(huì)導(dǎo)致社會(huì)上對(duì)人工智能的一些恐慌,一些人可能并不太了解人工智能在做什么,而是盲目的反對(duì)和否定,這當(dāng)然會(huì)影響行業(yè)的發(fā)展。其實(shí),雖然人工智能技術(shù)確實(shí)會(huì)導(dǎo)致某些職業(yè)崗位的需求量大幅下降,但是同時(shí)也會(huì)創(chuàng)造一些新的職業(yè)類(lèi)型,人力資源會(huì)向新興的崗位流動(dòng)。第二個(gè)影響是大眾的失望。過(guò)分的渲染和炒作會(huì)過(guò)度拉高大眾對(duì)人工智能的期望值,當(dāng)項(xiàng)目或者產(chǎn)品投放市場(chǎng)以后,如果產(chǎn)品的實(shí)際表現(xiàn)和宣傳相差過(guò)大,大眾就會(huì)大失所望而可能拋棄產(chǎn)品并且對(duì)人工智能產(chǎn)生質(zhì)疑,這對(duì)人工智能技術(shù)和產(chǎn)品的改進(jìn)和推廣都會(huì)帶來(lái)一定的負(fù)面影響。
您覺(jué)得未來(lái)人工智能會(huì)成為一種什么樣的存在?
我覺(jué)得人工智能在未來(lái)會(huì)回歸它原本的位置,成為人們比較關(guān)注的幾個(gè)前沿技術(shù)領(lǐng)域,并會(huì)不斷地帶來(lái)改變?nèi)藗兩畹男录夹g(shù)。
在您看來(lái),什么樣的企業(yè)應(yīng)該發(fā)展人工智能技術(shù)?
我覺(jué)得與數(shù)據(jù)相關(guān)的企業(yè)都可以發(fā)展人工智能技術(shù),只是不同企業(yè)的發(fā)力點(diǎn)可能不一樣。有的企業(yè)可能注重人工智能技術(shù)與傳統(tǒng)行業(yè)的結(jié)合來(lái)進(jìn)行技術(shù)升級(jí)和創(chuàng)新,有的企業(yè)可能注重對(duì)人工智能關(guān)鍵技術(shù)的本質(zhì)突破,有的企業(yè)可能注重人工智能在某個(gè)非常具體的應(yīng)用場(chǎng)景的創(chuàng)新。
您在人工智能領(lǐng)域深耕多年,對(duì)于剛開(kāi)始學(xué)習(xí)人工智能的技術(shù)人有什么建議?
首先是要打好基礎(chǔ),數(shù)學(xué)基礎(chǔ)、計(jì)算機(jī)基礎(chǔ)、編程基礎(chǔ)都要扎實(shí);然后就是選擇一個(gè)方向,人工智能領(lǐng)域里面課題眾多,要結(jié)合自身?xiàng)l件、個(gè)人興趣和行業(yè)發(fā)展選擇適合自己的方向;再就是要緊跟技術(shù)的發(fā)展,人工智能領(lǐng)域技術(shù)更新迭代速度很快,稍不留神就會(huì)被落在后面。
未來(lái)人工智能在金融領(lǐng)域的應(yīng)用場(chǎng)景有哪些?您最期待的是哪個(gè)場(chǎng)景?
在金融領(lǐng)域,人工智能可以應(yīng)用于收益預(yù)測(cè)、投資組合構(gòu)建、風(fēng)險(xiǎn)管理、金融產(chǎn)品推薦等方面。我本人最期待的應(yīng)用場(chǎng)景是投資組合構(gòu)建。
在很多年里,普通人對(duì)人工智能的印象主要來(lái)自一些機(jī)器人電影,過(guò)去您看那些機(jī)器人電影的時(shí)候是什么感覺(jué)?
我聽(tīng)說(shuō)過(guò),有些人看了某部科幻電影之后便立志投身人工智能領(lǐng)域改變?nèi)祟?lèi),一部電影成了他們?nèi)松霓D(zhuǎn)折點(diǎn),從此開(kāi)啟了開(kāi)掛的人生,我很敬佩他們。我很喜歡電影,不過(guò)對(duì)于機(jī)器人題材的電影倒是沒(méi)有什么特別的偏好,我更加關(guān)注的是電影故事所引發(fā)的思考。對(duì)于機(jī)器人題材的電影里面展現(xiàn)的一些有關(guān)人工智能的情節(jié),我有時(shí)會(huì)想哪些是有希望實(shí)現(xiàn)的,是否還可以聯(lián)想到一些類(lèi)似的有意思的應(yīng)用,哪些不過(guò)是人們美好的想象,僅此而已。而對(duì)于整個(gè)故事所引發(fā)的思考我倒可能會(huì)時(shí)不時(shí)反復(fù)回顧。
發(fā)展人工智能技術(shù)一定需要人才支持,您通過(guò)什么樣的方式吸引人才的?
對(duì)于人才的吸引,我們主要通過(guò)以下三個(gè)方面。一是對(duì)外進(jìn)行宣傳,比如我們會(huì)在一些學(xué)術(shù)會(huì)議、產(chǎn)業(yè)會(huì)議等技術(shù)交流活動(dòng)中展現(xiàn)我們的技術(shù)實(shí)力、宣傳我們的產(chǎn)品性能,從而吸引人才的加盟;二是通過(guò)實(shí)習(xí)生項(xiàng)目從在讀的碩士研究生和博士研究生中篩選高水平技術(shù)人才;三是通過(guò)一些前沿的有挑戰(zhàn)性的項(xiàng)目,來(lái)吸引內(nèi)部人才的流動(dòng)。
可以介紹一下微軟必應(yīng)搜索廣告部門(mén)現(xiàn)在的技術(shù)人才團(tuán)隊(duì)嗎?
微軟必應(yīng)搜索廣告部門(mén)的技術(shù)團(tuán)隊(duì)主要分為三種角色。一是軟件開(kāi)發(fā)工程師(software development engineer),主要負(fù)責(zé)產(chǎn)品系統(tǒng)構(gòu)建、模塊開(kāi)發(fā)、技術(shù)維護(hù)等;二是數(shù)據(jù)科學(xué)家(data scientist),主要負(fù)責(zé)各種數(shù)據(jù)的處理、分析、挖掘、預(yù)測(cè)、決策等;三是應(yīng)用科學(xué)家(applied scientist),主要負(fù)責(zé)針對(duì)具體問(wèn)題進(jìn)行分析,運(yùn)用、改進(jìn)或者發(fā)明機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、信息檢索等領(lǐng)域里的技術(shù)來(lái)對(duì)問(wèn)題進(jìn)行建模、實(shí)現(xiàn)相應(yīng)的算法并嵌入到產(chǎn)品系統(tǒng)中。
您和其他部門(mén)的負(fù)責(zé)人在工作中會(huì)發(fā)生觀點(diǎn)不一致的情況嗎?一般會(huì)怎么處理?
工作上發(fā)生觀點(diǎn)不一致的情況是比較常見(jiàn)的,一般來(lái)說(shuō)我們會(huì)通過(guò)協(xié)商解決。這里可能有多種不同情況,如果項(xiàng)目目標(biāo)不一致,那就要看多個(gè)目標(biāo)是否可以分階段完成,是否可以雙方都做一些妥協(xié)做一些取舍;如果是在目標(biāo)一致的情況下項(xiàng)目執(zhí)行方案不一樣,那就要論證每個(gè)方案的可行性并根據(jù)一些衡量標(biāo)準(zhǔn)來(lái)做出大家都認(rèn)可的選擇。總之,需要具體問(wèn)題具體分析,在大家本著解決問(wèn)題的態(tài)度下,進(jìn)行協(xié)商和互相之間的妥協(xié)。