6月17日,上海,由CSDN主辦,IBM和興業(yè)數(shù)金協(xié)辦的PowerAI人工智能線下馬拉松編程大賽Q2場(chǎng)將拉開序幕。本賽季賽題將聚焦金融行業(yè)的語(yǔ)料大數(shù)據(jù)識(shí)別,基于人工智能相關(guān)技術(shù),計(jì)算有關(guān)金融場(chǎng)景的信息聚類,將電話銀行海量通話內(nèi)容結(jié)構(gòu)化,并打上各類標(biāo)簽。通過(guò)挖掘分析有價(jià)值信息,為服務(wù)與營(yíng)銷提供數(shù)據(jù)與決策支持,發(fā)現(xiàn)最新的市場(chǎng)機(jī)遇和客戶關(guān)注熱點(diǎn)。活動(dòng)旨在進(jìn)一步推動(dòng)人工智能技術(shù)在行業(yè)領(lǐng)域的落地,貼近生活并與真實(shí)案例場(chǎng)景,也是系列賽題內(nèi)容的一大特色。
截止目前,本輪活動(dòng)已收到了大量參賽者報(bào)名,絕大部分參賽團(tuán)隊(duì)成員來(lái)自金融機(jī)構(gòu)和相關(guān)的技術(shù)服務(wù)公司,例如招商銀行上海分行、民生銀行、包商銀行、華通銀行、陸金所、太平洋保險(xiǎn)、華為、東方證券研究所、上海金融期貨信息技術(shù)有限公司、中國(guó)大地保險(xiǎn)、國(guó)泰基金、西藏東方財(cái)富證券、東軟集團(tuán)、實(shí)達(dá)電腦等,也有一些一線互聯(lián)網(wǎng)公司和頂尖的科研院所報(bào)名,例如今日頭條、京東、中科院上海所、上海交大、中國(guó)科學(xué)技術(shù)大學(xué)等。
從本季題目?jī)?nèi)容來(lái)看,主辦方會(huì)提供訓(xùn)練樣本數(shù)據(jù),分為訓(xùn)練和測(cè)試部分。訓(xùn)練部分包括:
- 對(duì)話內(nèi)容文件(文件格式可能存在轉(zhuǎn)碼需求),對(duì)話內(nèi)容分為11類
- 對(duì)話內(nèi)容標(biāo)簽文件,包括理財(cái)產(chǎn)品分類和意愿分類(肯定、否定、疑問)
- 語(yǔ)料文件-文件格式為txt格式。內(nèi)容包括中文和標(biāo)點(diǎn)符號(hào)。文章內(nèi)容是金融相關(guān)的文章。文件總量在50M左右。參賽團(tuán)隊(duì)可以利用這些文件來(lái)建立自己的語(yǔ)言模型、分詞模型
- 訓(xùn)練數(shù)據(jù):每個(gè)分類的樣本個(gè)數(shù)不少于150條。數(shù)據(jù)樣本間有一定區(qū)分度。
參賽者需要根據(jù)訓(xùn)練文件進(jìn)行購(gòu)買產(chǎn)品分類和意愿分類;大賽鼓勵(lì)參賽選手自己構(gòu)建分詞和語(yǔ)言模型,如果選手選擇使用第三方分詞或者語(yǔ)言模型需要自己解決平臺(tái)依賴。
在參賽要求方面,主辦方也給出了一些建議:
1.參賽者可以通過(guò)Caffe、Tensorflow、Torch 、Theano 進(jìn)行模型訓(xùn)練, 鼓勵(lì)發(fā)揮GPU on Power硬件特性;
2.要求參賽者編寫神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)考題需求。參賽者可以修改Caffe、Torch、Theano或者Tensorflow源代碼,但是必須在修改后,提供代碼修改說(shuō)明以確定沒有違規(guī)部分。參賽者也可以使用Github上開源的不同發(fā)行版的Caffe、Torch、Theano或者Tensorflow,但是必須自己解決在Power上的依賴和編譯問題;
3.本次比賽涉及金融領(lǐng)域?qū)υ捨谋痉诸悊栴}。希望選手通過(guò)深度神經(jīng)網(wǎng)絡(luò)能夠?qū)蛻舾信d趣購(gòu)買的保險(xiǎn)或者理財(cái)產(chǎn)品的類型和意愿進(jìn)行分類。語(yǔ)料中會(huì)有“肯定”,“疑問”,“否定或者雙重否定”語(yǔ)句。傳統(tǒng)的詞頻或者簡(jiǎn)單的SVD方式很難在測(cè)試數(shù)據(jù)集中有良好的表現(xiàn);
大賽開戰(zhàn)在即,CSDN也對(duì)某位報(bào)名參賽的開發(fā)者進(jìn)行了簡(jiǎn)短采訪,他就目前人工智能技術(shù)在金融行業(yè)的應(yīng)用現(xiàn)狀和挑戰(zhàn)等話題分享了自己的看法。以下為采訪內(nèi)容(受訪者不便透露真實(shí)姓名,以李成代替):
1.CSDN:請(qǐng)先介紹下自己所從事的工作和參賽原因。
李成:目前本人在金融行業(yè)軟件公司工作,主要負(fù)責(zé)銀行、證券行業(yè)的信息開發(fā)服務(wù)。這次主要是想檢驗(yàn)自己在項(xiàng)目中用到的技術(shù),也想結(jié)識(shí)更多在金融行業(yè)從事人工智能技術(shù)研究的開發(fā)者,互相切磋。
2.CSDN:請(qǐng)談?wù)勀鷮?duì)人工智能技術(shù)在金融行業(yè)應(yīng)用現(xiàn)狀的看法。
李成:隨著金融信息化的不斷深入,銀行正在從過(guò)去的手工銀行轉(zhuǎn)變成數(shù)字化銀行,極大的推動(dòng)了全球金融的發(fā)展。由于云計(jì)算、大數(shù)據(jù)、人工智能等技術(shù)在金融行業(yè)的不斷普及,更多的銀行都在思考如何通過(guò)這些新技術(shù)提供客戶粘合度,為客戶提供全生命周期的服務(wù),提高服務(wù)質(zhì)量,以及從所積累的海量用戶數(shù)據(jù)中挖掘新的商機(jī)。目前,我們看到人工智能技術(shù)已經(jīng)在金融領(lǐng)域的授信、反欺詐、風(fēng)控、審批、差異化服務(wù)等多方面落地。
3.CSDN:從您的介紹看有從事人工智能應(yīng)用項(xiàng)目的經(jīng)歷,請(qǐng)談?wù)劗?dāng)時(shí)所希望解決的問題。
李成:主要有幾個(gè)方面:1.通過(guò)人像識(shí)別技術(shù)在銀行監(jiān)控范圍內(nèi)識(shí)別客戶的各種行為特征,例如身份認(rèn)證、人臉?biāo)⒖ǎ蛘咂渌踩R(shí)別等;2.通過(guò)語(yǔ)音識(shí)別判斷客戶目前的狀態(tài)和特征;3.可以通過(guò)人像、語(yǔ)音識(shí)別縮短業(yè)務(wù)流程;4.通過(guò)呼叫中心平臺(tái)識(shí)別客戶具體語(yǔ)音,如客戶說(shuō)出某關(guān)鍵詞以后自動(dòng)處理下一步業(yè)務(wù)等。
結(jié)合我現(xiàn)在正在做的項(xiàng)目,具體來(lái)說(shuō),目前銀行信用卡中心的業(yè)務(wù)都是通過(guò)電話進(jìn)行,我們希望利用語(yǔ)音識(shí)別技術(shù),對(duì)通話進(jìn)行實(shí)時(shí)分析,幫助銀行提升服務(wù)的質(zhì)量。還有就是利用機(jī)器學(xué)習(xí),可以讓機(jī)器人回答客戶的提問和交互。
4.CSDN:您認(rèn)為現(xiàn)階段,在金融行業(yè)什么樣的應(yīng)用場(chǎng)景是比較適合用機(jī)器學(xué)習(xí)或人工智能技術(shù)來(lái)解決的?
李成:不管是在提升客戶體驗(yàn)還是內(nèi)部管理效率,商機(jī)挖掘以及風(fēng)險(xiǎn)防范方面,人工智能在金融行業(yè)的應(yīng)用前景都非常廣泛。結(jié)合我的經(jīng)歷,我認(rèn)為銀行行用卡中心應(yīng)該是一個(gè)很好的驗(yàn)證場(chǎng)景。人工智能,目前語(yǔ)音方面技術(shù)是最成熟的,而銀行信用卡中心,基本全部的業(yè)務(wù)都是通過(guò)電話進(jìn)行,技術(shù)應(yīng)用潛力非常大。
5.CSDN:您之前是否了解過(guò)IBM的產(chǎn)品或解決方案?從您的角度看,IBM在人工智能領(lǐng)域的機(jī)會(huì)主要在哪些方面?
李成:了解過(guò)。IBM的機(jī)會(huì)在于不僅在技術(shù)上持續(xù)投入很大,而且對(duì)于金融行業(yè)的業(yè)務(wù)、流程都很熟悉。在這個(gè)金融行業(yè)向數(shù)字化轉(zhuǎn)型的風(fēng)口,只要切準(zhǔn)用戶痛點(diǎn),技術(shù)精深+業(yè)務(wù)流程熟悉,就能找到很多機(jī)會(huì)。
6.CSDN:對(duì)本次大賽有什么期望,對(duì)參賽伙伴有什么寄語(yǔ)?
李成:我相信這次的選手中大拿很多,我自己在金融行業(yè)和人工智能也有一些實(shí)踐經(jīng)歷和積累,希望大家能獲得優(yōu)異的成績(jī)。另外,希望通過(guò)AI技術(shù)能夠真正幫助金融機(jī)構(gòu)提升他們的業(yè)務(wù)。
據(jù)悉,本次所有的參賽團(tuán)隊(duì),都將現(xiàn)場(chǎng)免費(fèi)體驗(yàn)所有參賽團(tuán)隊(duì),將現(xiàn)場(chǎng)免費(fèi)體驗(yàn)IBM專門為人工智能所建的高性能計(jì)算服務(wù)器PowerAI。PowerAI人工智能平臺(tái)基于Power8體系結(jié)構(gòu),支持開源機(jī)器學(xué)習(xí)和深度學(xué)習(xí)架構(gòu),包括Caffe, Chainer、TensorFlow、Theano、Torch、cuDNN、NVIDIA DIGITS以及其它若干個(gè)機(jī)器學(xué)習(xí)與深度學(xué)習(xí)架構(gòu)和庫(kù)。參賽者將輕松便捷地使用這些人工智能方法,創(chuàng)建新的計(jì)算機(jī)模式以高效的對(duì)數(shù)據(jù)進(jìn)行分析。
最后,一如既往,主辦方為獲勝團(tuán)隊(duì)和參賽者準(zhǔn)備了豐厚的現(xiàn)金和獎(jiǎng)品獎(jiǎng)勵(lì),歡迎大家6月17日來(lái)玩!
報(bào)名官網(wǎng):PowerAI 人工智能線下馬拉松編程大賽Q2賽季——探秘金融語(yǔ)料大數(shù)據(jù)的商業(yè)價(jià)值