10月15日消息,互聯(lián)網(wǎng)金融發(fā)展的關(guān)鍵是風(fēng)險控制,“風(fēng)險控制”已然成為諸多互聯(lián)網(wǎng)金融企業(yè)能否長大的魔咒,這個不爭的事實像一座大山擺在眾多互聯(lián)網(wǎng)金融大佬與創(chuàng)業(yè)者的面前。為什么阿里金融能夠?qū)⑺木W(wǎng)絡(luò)小貸不良率控制在不到1%,有膽量再貸多點嗎?大數(shù)據(jù)挖掘技術(shù)和互聯(lián)網(wǎng)金融的風(fēng)險控制到底是什么關(guān)系?互聯(lián)網(wǎng)金融將怎樣建立有效的風(fēng)險控制生態(tài)體系?本文將帶你揭開大數(shù)據(jù)挖掘與互聯(lián)網(wǎng)金融風(fēng)險控制的神秘面紗。
最近互聯(lián)網(wǎng)金融圈不僅自己玩的很開心,而且還拉上了金融界甚至央行的大佬們一起玩的很開心。盡管讓互聯(lián)網(wǎng)金融企業(yè)頭痛的問題——央行征信系統(tǒng)不對市場開放,仍然沒有解決,但至少央行的態(tài)度明朗,支持互聯(lián)網(wǎng)金融的發(fā)展,并認為互聯(lián)網(wǎng)金融是傳統(tǒng)金融的有益補充。
生命的神奇之處在于它總能找到一個出口。作為新生事物的互聯(lián)網(wǎng)金融也不例外,在那扇門朝他們關(guān)閉的同時,他們卻找到了另外一扇窗。在亦步亦趨的探索中,他們中的大企業(yè)通過自身力量,小企業(yè)通過聯(lián)合的力量找到了適合自身發(fā)展的風(fēng)險控制生態(tài)系統(tǒng),正朝著良性和有序的方向發(fā)展,正如凱文凱利在他的《失控》中描述的群氓智慧那只無形的手。
互聯(lián)網(wǎng)金融掌握了可以顛覆傳統(tǒng)金融的風(fēng)控技術(shù)
在不依賴央行征信系統(tǒng)的情況下,市場自發(fā)形成了各具特色的風(fēng)險控制生態(tài)系統(tǒng)。大公司通過大數(shù)據(jù)挖掘,自建信用評級系統(tǒng);小公司通過信息分享,借助第三方獲得信用評級咨詢服務(wù)。
互聯(lián)網(wǎng)金融企業(yè)的風(fēng)控大致分為兩種模式,一種是類似于阿里的風(fēng)控模式,他們通過自身系統(tǒng)大量的電商交易以及支付信息數(shù)據(jù)建立了封閉系統(tǒng)的信用評級和風(fēng)控模型。另外一種則是眾多中小互聯(lián)網(wǎng)金融公司通過貢獻數(shù)據(jù)給一個中間征信機構(gòu),再分享征信信息。
央行的征信系統(tǒng)是通過商業(yè)銀行、其它社會機構(gòu)上報的數(shù)據(jù),結(jié)合身份認證中心的身份審核,提供給銀行系統(tǒng)信用查詢和提供給個人信用報告。但對于其它征信機構(gòu)和互聯(lián)金融公司目前不提供直接查詢服務(wù)。2006年1月開通運行的央行征信系統(tǒng),至2013年初,有大概8億人在其中有檔案。在這個8億人當(dāng)中,只有不到3億人有過銀行或其他金融機構(gòu)發(fā)生過借貸的記錄,其中存在大量沒有信貸記錄的個人。
而這些人卻有可能在央行征信系統(tǒng)外的其它機構(gòu)、互聯(lián)網(wǎng)金融公司自己的數(shù)據(jù)系統(tǒng)中,存有相應(yīng)的信貸記錄。市場上一些線下小貸公司、網(wǎng)絡(luò)信貸公司對于借貸人的信用評級信息需求非常旺盛,也因此催生了若干市場化征信公司,目前國內(nèi)較大的具有代表性的市場化征信公司有幾家:如北京安融惠眾、上海資信、深圳鵬元等等。
從P2P網(wǎng)貸公司和一些線下小貸公司采集動態(tài)大數(shù)據(jù),為互聯(lián)網(wǎng)金融企業(yè)提供重復(fù)借貸查詢、不良用戶信息查詢、信用等級查詢等多樣化服務(wù)是目前這些市場化的征信公司正在推進的工作。而隨著加入這個游戲規(guī)則的企業(yè)越來越多,這個由大量動態(tài)數(shù)據(jù)勾勒的信用圖譜也將越來越清晰。
互聯(lián)網(wǎng)海量大數(shù)據(jù)中與風(fēng)控相關(guān)的數(shù)據(jù)
互聯(lián)網(wǎng)大數(shù)據(jù)海量且龐雜,充滿噪音,哪些大數(shù)據(jù)是互聯(lián)網(wǎng)金融企業(yè)風(fēng)險控制官鐘愛的有價值的數(shù)據(jù)類型?下圖為大家揭示了互聯(lián)網(wǎng)海量大數(shù)據(jù)中與風(fēng)控相關(guān)的數(shù)據(jù),以及哪些企業(yè)或產(chǎn)品擁有這些數(shù)據(jù)。
(圖)風(fēng)控相關(guān)大數(shù)據(jù)及代表企業(yè)或產(chǎn)品
利用電商大數(shù)據(jù)進行風(fēng)控,阿里金融對于大數(shù)據(jù)的謀劃可謂非一日之功。在很多行業(yè)人士還在云里霧里的時候,阿里已經(jīng)建立了相對完善的大數(shù)據(jù)挖掘系統(tǒng)。通過電商平臺阿里巴巴、淘寶、天貓、支付寶等積累的大量交易支付數(shù)據(jù)作為最基本的數(shù)據(jù)原料,再加上賣家自己提供的銷售數(shù)據(jù)、銀行流水、水電繳納甚至結(jié)婚證等情況作為輔助數(shù)據(jù)原料。所有信息匯總后,將數(shù)值輸入網(wǎng)絡(luò)行為評分模型,進行信用評級。
信用卡類網(wǎng)站的大數(shù)據(jù)同樣對互聯(lián)網(wǎng)金融的風(fēng)險控制非常有價值。申請信用卡的年份、是否通過、授信額度、卡片種類;信用卡還款數(shù)額、對優(yōu)惠信息的關(guān)注等都可以作為信用評級的參考數(shù)據(jù)。國內(nèi)最具代表性的企業(yè)是成立于2005年,最早開展網(wǎng)上代理申請信用卡業(yè)務(wù)的“我愛卡”。其創(chuàng)始人涂志云和他的團隊又在2013年推出了信用風(fēng)險管理平臺“信用寶”,利用“我愛卡”積累的數(shù)據(jù)和流量優(yōu)勢,結(jié)合其早年的從事的FICO(費埃哲)風(fēng)控模型,做互聯(lián)網(wǎng)金融小微貸款。
利用社交網(wǎng)站的大數(shù)據(jù)進行網(wǎng)絡(luò)借貸的典型是美國的Lending Club。Lending club于2007年5月24日在facebook上開張,通過在上面鑲嵌的一款應(yīng)用搭建借貸雙方平臺。利用社交網(wǎng)絡(luò)關(guān)系數(shù)據(jù)和朋友之間的相互信任聚合人氣。借款人被分為若干信用等級,但是卻不必公布自己的信用歷史。
在國內(nèi),2013年阿里巴巴以5.86億美元購入新浪微博18%的股份,其用意給人很多遐想空間,獲得社交大數(shù)據(jù),阿里完善了大數(shù)據(jù)類型。加上淘寶的水電煤繳費信息、信用卡還款信息、支付和交易信息,已然成為了數(shù)據(jù)全能選手。
小貸類網(wǎng)站積累的信貸大數(shù)據(jù)包括信貸額度、違約記錄等等。但單一企業(yè)缺陷在于數(shù)據(jù)的數(shù)量級別低和地域性太強。還有部分小貸網(wǎng)站平臺通過線下采集數(shù)據(jù)轉(zhuǎn)移到線上的方式來完善信用數(shù)據(jù)。這些特點決定了如果單兵作戰(zhàn)他們必定付出巨大成本。因此,貢獻數(shù)據(jù),共享數(shù)據(jù)的模式正逐步被認可,抱團取暖勝過單打獨斗。其中有數(shù)據(jù)統(tǒng)計的全國小貸平臺有幾百家,全國性比較知名的有人人貸、拍拍貸、紅嶺和信用寶等。
第三方支付類平臺未來的機遇在于,未來有可能基于用戶的消費數(shù)據(jù)做信用分析。支付的方向、每月支付的額度、購買產(chǎn)品品牌都可以作為信用評級的重要參考數(shù)據(jù)。代表產(chǎn)品為易寶、財付通等。
生活服務(wù)類網(wǎng)站的大數(shù)據(jù)如水、電、煤氣、有線電視、電話、網(wǎng)絡(luò)費、物業(yè)費交納平臺則客觀真實地反映了個人的基本信息,是信用評級中一類重要的數(shù)據(jù)類型。代表產(chǎn)品為平安的“一賬通”。
互聯(lián)網(wǎng)金融風(fēng)控大數(shù)據(jù)加工過程
(圖)大數(shù)據(jù)加工過程圖解析
如上圖所示,在進行數(shù)據(jù)處理之前,對業(yè)務(wù)的理解、對數(shù)據(jù)的理解非常重要,這決定了要選取哪些數(shù)據(jù)原料進行數(shù)據(jù)挖掘,在進入“數(shù)據(jù)工廠”之前的工作量通常要占到整個過程的60%以上。
在數(shù)據(jù)原料方面,越來越多的互聯(lián)網(wǎng)在線動態(tài)大數(shù)據(jù)被添加進來。例如一個虛假的借款申請人信息就可以通過分析網(wǎng)絡(luò)行為痕跡被識別出來,一個真實的互聯(lián)網(wǎng)用戶總會在網(wǎng)絡(luò)上留下蛛絲馬跡。對征信有用的數(shù)據(jù)的時效性也非常關(guān)鍵,通常被征信行業(yè)公認的有效的動態(tài)數(shù)據(jù)通常是從現(xiàn)在開始倒推24個月的數(shù)據(jù)。
通過獲得多渠道的大數(shù)據(jù)原料,利用數(shù)學(xué)運算和統(tǒng)計學(xué)的模型進行分析,從而評估出借款者的信用風(fēng)險,典型的企業(yè)是美國的ZestFinance。這家企業(yè)的大部分員工是數(shù)據(jù)科學(xué)家,他們并不特別地依賴于信用擔(dān)保行業(yè),用大數(shù)據(jù)分析進行風(fēng)險控制是ZestFinance的核心技術(shù)。他們的原始數(shù)據(jù)來源非常廣泛。
他們的數(shù)據(jù)工廠的核心技術(shù)和機密是他們開發(fā)的10個基于學(xué)習(xí)機器的分析模型,對每位信貸申請人的超過1萬條原始信息數(shù)據(jù)進行分析,并得出超過7萬個可對其行為做出測量的指標(biāo),而這一過程在5秒鐘內(nèi)就能全部完成。
事實上,在美國,征信公司或者大數(shù)據(jù)挖掘公司的產(chǎn)品不僅用于提供給相關(guān)企業(yè)用于降低金融信貸行業(yè)的風(fēng)險,同時也用于幫助做決策判斷和市場營銷,后兩者不在本文的探討范圍內(nèi),但是可以從另一個方面給我們很多啟發(fā)。