大數據風控同傳統風控在本質上沒有區別,主要區別在于風控模型數據輸入的緯度和數據關聯性分析。據統計,目前銀行傳統的風控模型對市場上70%的客戶是有效的,但是對另外30%的用戶,其風控模型有效性將大打折扣。
大數據風控作為傳統風控方式補充,主要利用行為數據來實施風險控制,用戶行為數據可以作為另外的30%客戶風控的有效補充。大數據風險控制的作用就是從原來被拒絕的貸款用戶中找到合格用戶,識別出已經通過審核的高風險客戶和欺詐客戶。
一、銀行信用風險控制的原理
金融行業中,銀行是對信用風險依賴最強的一個主體,銀行本質就是經營風險,不同的風險偏好決定了銀行的經營水平。在經濟結構調整周期過程中,信用風險管理也是各個銀行面臨的巨大挑戰。
1.兩種常見的信用風險管理方式
銀行信用風險管理有兩種方式,第一種方式是從大量申請人中找到合格的貸款客戶,將貸款放給這些人。第二種方式是從申請人中識別出有潛在風險的貸款客戶,不將貸款發給這些人。可以簡單地認為是找到好種子和識別出壞種子
2.如何找到合格的貸款人?
銀行在找好種子時,一般會對好種子進行一些基本限定,從貸款人的學歷、年齡、收入、職業、資產、負債、消費等幾個方面進行打分,最后綜合評級,依據評估分數進行貸款審批,可以簡單地認為是風險定價(RBP)。
貸款銷售人員主要的任務是找到好種子的用戶,通過KYC和風險評估等方式的找到潛在合格客戶。這個階段的風險控制可以認為是一個基線控制,經過風險評估之后,會得到客戶的評估分數或風險評級。在控制基線之上的客戶會被放進來,認為是潛在合格客戶;風險管理部門進一步驗證,如果審核通過之后,就會依據分數和級別發放貸款。
3.識別出潛在風險的人
利用數學模型來識別風險客戶,目的是找到欺詐客戶和未來不會還款的用戶。在識別壞種子時,數學模型和壞種子是關鍵,數學模型決定風控方式是否科學,數據緯度是否全面,結論是否科學。壞種子是用來修正風控模型參數,提升模型的魯邦性,同時讓模型可以不斷完善自己。在預防欺詐用戶時,行業共享的黑名單也起到了很大的作用。
壞種子對識別出欺詐用戶和潛在違約用戶十分關鍵,風控模型是否有效的一個前提就是是否有足夠多的壞種子。
4.個人消費金融授信的5P原則
信用貸款分為抵押貸款和無抵押貸款,其中抵押貸款的風險相對較低,風險評估過程中主要關注抵押品的自身價值和貸款覆蓋率,貸款用途和還款能力占信用審批權重比例較低。銀行過去大量的個人貸款,都是抵押貸款,其中按揭房貸占了很大的比重。
無抵押貸款稱為信用貸款,時髦的稱呼為消費金融。貸款人無需進行財產抵押,僅僅依靠自身信用分數或還款能力申請貸款。相對于抵押貸款,其風險較高,也是銀行信用風險管理的重點領域。這幾年消費貸款增加較快,預計2017年同個人消費相關的消費貸款,可以達到27萬億左右。很多銀行、信用卡中心、互聯網金融公司都在爭奪這個市場。
個人金融消費貸款除了遵循CCCP消費金融授信審核標準之外,授信5P原則也經常用于評估客戶信用風險。“5P”原則主要是指貸款人情況(people),資金用途(purpose),還款來源(payment),債權確保(protection),借款人展望(perspective)。
貸款人情況
是指貸款人信用情況、個人財力、銀行往來記錄,其中其個人信用評分比重最高,個人財力次之,貸款人的還款記錄和還款意愿也很重要。
資金用途
是指貸款人的借款用途是否合理、合法。是否用于投機領域或高風險領域,例如高利貸或賭博等。資金用途是否合法,同貸款被按時歸還相關度較高。
還款來源
是授信審批中最重要的,用來了解貸款客戶是否具備還款來源,其償債能力如何。其中客人的月度薪資收入、資產收入、支出費用、財產價值都高度相關。其中常用衡量標準是無擔保貸款不得超過月收入的22倍(DBR小于等于22),月還款金額不得超過客人扣掉所有支出費用后,所剩費用的一半。另外信用卡的授信額度也會被考慮在內。
債權確保
主要是指對申貸客戶所提供的各項擔保品進行評估,當貸款違約時,銀行可以處理擔保品,減少帶貸款損失。消費金融一般無擔保品,因此債權擔保不太適用,但是某些消費金融公司會讓貸款人購買一個擔保產品,一般為貸款總額的2%,可以作為債權確保。
借款人展望
就是貸款人未來違約的可能性,依據貸款人的行業、薪資、職業、職務、學歷等因素進行預測,評估未來發生風險的概率。一般入門門檻低、專業程度低,可替代性高度高的工作或行業風險較高。
5.貸前風險控制的重要性。
信用貸款的風險控制分為貸前,貸中,貸后三個階段。貸前控制主要是找到合格貸款人;貸中控制主要預防抵押品資產減值,無法覆蓋貸款標的,或者預防借款人還款能力下降,無法按時歸還貸款;貸后控制,主要當貸款發生逾期時,通過催收降低銀行損失。其中,貸前風險控制是最為重要的。
摩根大通銀行有一個統計,75%的信用風險可以在貸款前進行風險控制,貸后風險控制的有效性大概只用25%。因此對于金融企業,貸款前的風險控制更為重要。在信用卡領域,貸款前的惡意欺詐占整體信用貸款損失的60%,真正貸款到期,不進行還款的的客戶只占信用貸款損失的40%。互聯網金融企業也是如此。信用貸款風險控制過程中,貸前風險控制是最為重要的。
二、金融行業信用風險控制的挑戰
金融行業在過去主要依靠經驗和宏觀經濟形式來實施風險控制,以定性為主,更多依賴風險管理精英的個人能力,特別在經濟發展很好的時期,風險管理偏好不太科學,不能夠反應出真正的風險水平。定性的風險管理占主體,定量的風險管理起到很小的作用。
現在,越來越多的銀行正在重視定量風險管理,積極利用風控模型來實施風險評估。巴塞爾III協議的推行,推動了定量風險評估。大多數中國銀行的風控模型大多從國外引入,經過自己定制和改良之后用于信用風險評估。但是信用風險和操作風險比較復雜,由于信息不全以及其他問題,很多國外的信用風險模型效果不太明顯。于是大多數中國銀行參考國外信用風險評估模型,做了一個中國版本。包括著名的FICO風控模型,現在銀行很少直接采用。
在這個中國版本的風控模型中,企業信用貸款過于依賴政府授信和國有企業,這種粗放型信用風險管理在經濟結構調整過程中,引發了很高的不良貸款率。對私業務中,過高的信用審核標準,無法為更多的貸款申請人提供貸款,造成了無法為更多人提供服務,特別是在信用消費領域,無法實現普惠金融服務。
銀行在個人信用風險管理過程中遇到的主要挑戰。
1.缺少壞種子
銀行建立風控模型的基本原理是,利用大量壞種子,尋找到共性信息,建立風控模型。在利用另外一批壞種子來優化風控模型,找到合適算法,預測參數,加快收斂等。
壞種子對于建立風控模型至關重要,如果壞種子數量不夠,風控模型無法設定參數和修正模型。過去銀行嚴格的信貸審批機制,造成了小額貸款(信用消費信貸)規模很小,產生的壞種子也不多,規模較小的壞種子對于建立信用評估模型不利,無法優化已有的模型和提高風控模型的適用性。
信用風險常見的算法有參數統計法例如邏輯回歸、Bayes風險判別分析法,以及非參數統計方法例如聚類和K-means法,神經網絡法。現在應用較多的是SVM支持向量級機方法,其在小樣本、非線性及高緯模式識別中有特有的優勢。同時SVM也是努力最小化結構風險的算法。
2.數據緯度不全
量化風險評估需要將涉及到此風險的所有相關數據都包含進來,通過模型進行信用風險評估,計算出還款意愿和還款能力。評估采用的基本數據因素有年齡、收入、學歷、客戶資歷、行業、區域等,其占主要部分。信用因素包含如負債狀況、繳款記錄、理財方式;以及行為因素例如交易時間和頻率等。
除了這些變量和因素,其實還有一些因素并沒有被考慮到現有的風險評估模型中。例如貸款者的身體健康情況、生活規律、是否參與賭博、是否參與民間借貸等,同信貸違約高度相關的信息沒有被考慮到信用風險評估當中。
特別是用戶行為特征,幾乎很少的信貸評估模型會考慮用戶的行為。如果客戶在借款前,頻繁去澳門賭博、或參與民間高利貸、或有吸毒歷史、或者飆車、或者經常半夜出入夜店等危險區域、或經常半夜使用App等。這些危險行為因素都會對其信用風險產生影響,但這些因素原來并沒有被考慮到信用風險評估之中。
風險評估過程中,如果數據緯度不全,高相關數據沒有被考慮進來,對風控模型是一個大的風險。信用風險評估模型缺少了重要風險因素的輸入,其評估結果的偏離度就會較大,評估結果失效的可能性就很大。
3.風險定價不夠精細
量化風險管理的一個核心是風險定價,根據銀行自身的風險偏好來對資產進行定價,高風險資產定價較高,低風險產品定價較低,根據風險高低來制定資產收益,RBP(基于風險定價)已經成為主流。
大多數銀行過于保守,不愿意容忍較高的逾期率和不良率,對于所有信貸產品都一視同仁,嚴格控制逾期率和不良率水,一旦過高,立即縮緊信貸政策,嚴格控制貸款規模。復雜的經濟環境和風險場景,以及缺少全面數據,讓風險管理專家更加謹慎對待風險管理,誤殺率遠遠大于漏放率。
實際上,不同風險的產品應該有不同的信貸風險控制指標,高收益的產品,其不良率應該比低風險的產品要高。例如利率為12%的小額信貸就可以容忍3%左右的不良貸款率,其利差收益完全可以覆蓋不良貸款。對于風險較低的消費信貸,其不良貸款率也可以適當放開。在逾期和不良貸款管理中,應該按照風險覆蓋程度細化資產定價,不能采用統一的風險偏好,這樣才能支持消費貸款,依據風險水平,提供精細化信貸產品。
4.風險模型的自我學習能力和數據的實時性
量化風險成為主流風險管理方式之后,銀行也在思考風險評估模型的科學性。影響信用風險管理的因素很多,除了客戶自身的還款能力和還款意愿,還有惡意欺詐、外界經濟環境、黑天鵝事件等不可預見的因素。信用風險的評估完全依賴風控模型將會產生另外一個風險,就是模型自身學習能力和數據實效性。
好的風控模型需要具有自我學習能力,可以依據輸入數據來修正模型,另外模型的抗干擾能力也需要較強,避免大量噪聲數據干擾計算結果。具有自我學習能力的模型可以適應外部多種因素的變化,同時也可以自身迭代提高,抵抗外界噪音干擾。
實時有效的數據對于風險評估結果影響也很大,數據是有時間價值的,滯后的數據會影響評估結果,不能反映實時風險變化情況。實時的數據錄入和動態信用風險評估現在對銀行是一個巨大的挑戰,一個月進行一次的風險評估并不能實時反映信用風險變化情況,銀行需要找到一個好的方法來建立動態風險視圖,不僅僅是信用風險管理,其他的風險管理方法也要向實時數據錄入和風險實時評價方向轉變。
5.外部風險來源的多樣化
現在的信貸市場,不再是銀行一家的市場。互聯網金融企業的崛起,讓客戶更加容易獲得貸款,同時也加大了銀行管理信貸風險的難度。
例如一個客戶在銀行環境內部授信額度是10萬,但是其在外面的互聯網金融公司、典當行、民間借貸機構,都有借貸行為,可能總計借貸規模遠遠超過10萬元。客戶的高額借貸增加了違約風險,這些不在金融企業內部的借貸行為,銀行無法了解,也無法實施有效的信貸風險管理。
信貸環境的復雜給銀行信貸風險管理帶來的較大挑戰,客戶信貸信息分散和孤立,造成了外部風險來源的多樣化,銀行需要尋找一種方式來打破這種信息不對稱,購買外部信貸數據可以解決這個問題,但信貸數據的覆蓋率也是一個較大的挑戰。
2015年互聯金融出現了井噴式的發展,行業貸款規模已經突破1萬億元,同時幾個大的案件也將互聯網金融推到了風口。相對于傳統金融來講,互聯金融面對的客戶風險較高,其風控面臨的挑戰更大,對數據風控對要求就會更高。
三、互聯網金融行業的風控挑戰
中國的互聯網金融企業愿意從美國挖一些風控人才來提高自身風控水平。但是美國的征信環境比中國簡單,很多信息可以拿得到,美國已經是一個成熟的信用社會,復雜的欺詐場景和復雜的信用風險場景不多。很多風控模型到了中國之后并不適合,因此很多中國領先的互聯網金融公司并沒有采用美國的風控模型,大多是自己開發風控模型。中國目前互聯網金融的風控環境和東歐的信用環境相似,東歐的一些征信公司在中國很有市場就是這個原因。中國互聯網金融公司在信貸風險管理方面面臨的挑戰如下。
1.客戶風險較高
傳統金融主要服務70%左右的客戶,他們共同的特征就是還款能力強或者背景好。其他的客戶包括中小企業和收入較低的白領、藍領客戶,銀行不愿為他們提供服務。互聯網金融公司主要為這些客戶提供短期貸款、過橋貸款、消費貸款、發薪日貸款等。
大多數互聯網金融客戶收入較低,在銀行那里拿不到較好的貸款額度,不是銀行的目標客戶,其信用評分較低。傳統金融認為這批客戶還款能力較差,不愿意降低信貸審批要求,為他們提供融資。
特別在目前中國經濟調整的階段,這些小企業經營者或者中低收入人群缺少原始積累,受宏觀經濟影響較大,企業經營和收入波動較大,他們的還款能力不穩定。互聯網金融客戶中,還款能力不穩定的客戶占很大比例,他們的信用風險較高,對互聯網金融企業的信用風險控制提出了很大的挑戰。
2.客戶信用信息不全
傳統金融行業可以借助于人民銀行的企業征信和個人征信數據實施信用風險評估,各個銀行和信用卡中心也可以及時更新客戶金融信貸信息,共享黑名單。在傳統金融領域,個人和企業的信用信息集中在一起,容易進行風險評估。
在互聯網金融領域,大多數互聯網金融公司沒有接入人行征信系統,無法拿到客戶全維度信用信息,例如客戶財產、學歷、收入、貸款、金融機構交易信息等信息。互聯網金融企業在實施信用風險評估時,僅能夠依靠客戶提供信息進行驗證,但是客戶在傳統金融領域的借款信息,互聯網金融客戶的信用信息是不全的。
互聯網金融企業無法拿到客戶所有的信用信息,包含傳統金融環境和民間借貸領域,缺少這信息對其實施信用風險評估影響很大。這也是互聯網金融反欺詐公司或征信公司興起的原因,他們主要的作用就是解決了客戶信用信息不對稱的問題。
3.惡意欺詐和薅羊毛比例較高
信用風險體現在兩個方面,一個是客戶惡意欺詐,另外一是客戶信貸違約。依據互聯網金融企業的經驗,惡意欺詐占了其60%左右的信用損失。
互聯網金融企業還面對了另外一有趣的問題,專門有一批薅羊毛的人,利用互聯網金融企業的營銷漏洞,通過新用戶注冊,用戶推薦,積分兌換,短期投資來攥取超額收入。經過精心設計,薅羊毛的收入可以達到20%/月。很多互聯網金融企業風險控制部門主要任務就是找出羊毛黨,拒絕他們的貸款請求。
互聯網金融的不良貸款率沒有對外公布,但是依據行業經驗,5%的不良貸款率是一個較好的水平,主要損失來源于過高的互聯網惡意欺詐、過高的信貸審批成本、以及過高的獲客成本。
惡意欺詐基本上以團伙作案為主,并且這些人越來越聰明,技術手段越來越先進,越來越進化,很難找到公共特征,也很難歸納,不容易及時發現。惡意欺詐的共性信息較少,即使有大量的壞種子,也不好建立風控模型來實施控制,
互聯網金融公司只能依靠風控經驗、客戶信息驗證、部分行為數據來實施反欺詐。
4.客戶違約成本低,債務收回成本較高
互聯網金融公司的客戶違約比例較高,并且建立了自己的貸款催收團隊。互聯網金融公司遇到貸款違約時,一般采用三種方式進行解決。
第一種是將資產打包,以3-4折的方式賣給資產管理公司,由他們去催收,效果不是太好,損失較大,還有法律分線風險,因此不是主流。
第二種方式是由擔保公司承擔,客戶承擔2%左右的擔保費用,這個較為普遍,但是一旦借款規模較大,也不太適合。另外加大了客戶貸款成本,產品競爭力下降。
第三種是自己催收,大部分逾期的貸款可以催收回來,惡意不還款的客戶較少。逾期之后又還款的客戶反倒是互聯網金融的優質客戶,其給公司帶來的收益最高。但是缺點就是催收成本太高,客戶違約成本很低。
中國缺少個人征信評分,造成客戶信貸違約成本較低,個人貸款的違約,不會影響客戶的正常社會生活和商業行為。
5.風控模型冷啟動問題
每年都有大量互聯網金融公司出現,風控成了所有互聯網金融公司的核心競爭力。每一家互聯網金融公司都會建立風控模型,實施信用風險管理。
壞種子和數據是風控模型重要輸入,決定了風控模型的有效性。新興的互聯網金融公司,面對新的客戶,缺少足夠的種子用戶來優化模型,同時也缺少用戶的行為數據來完善用戶風險評估卡。
互聯網金融公司做風控時,缺少壞種子用戶和數據的冷啟動對其風控是一個較大的挑戰。這種信貸違約和惡意欺詐的壞種子,不能夠通過其他方式來解決,例如線下和向第三方購買。互聯網金融公司只能依靠自己的業務不斷積累,利用自己平臺積累的數據和種子來解決這個問題,一旦管理不好,會對新興的互聯網金融公司造成較大影響。
四、大數據風控的優勢和劣勢
大數據風控是一個廣義詞和一個時代的熱詞,量化風險控制就是利用數據分析和模型進行風險評估,依據評估分數,預測還款人的還款能力、還款意愿、以及欺詐風險。
大數據主要是指全量數據和用戶行為數據,目前領先的數據風控或者大數據風控使用的還是小數據,使用的是圍繞客戶周圍的信用數據,這些數據的特點是和用戶的信用情況高度相關。之所以叫做大數據風控,完全是一個是時代用語,確切地說就是利用數據實施科學風控。就像互聯網思維一樣,就是以客戶為中心的商業思維,被稱為互聯網思維,只不過是利用了這個時代的特征而已。
大數據風控的優勢:
1、用戶行為數據成為風控數據
風控最好的數據還是金融數據,例如年齡、收入、職業、學歷、資產、負債等信用數據,這些數據同信用相關度高,可以反映用戶的還款能力和還款意愿,這些數據因子在風控模型中必不可少,權重也很高,是信用風險評估最好的數據。
但是除了這些強相關的數據,一些用戶行為數據對信用風險評估也具有較大的影響,例如用戶是否經常去澳門賭博,用戶是否經常刻意隱藏自己,用戶是否參與高利貸,用戶是否具有吸毒傾向,是否患有重大心理疾病等等,這些信息在一定概率下決定了用戶風險水平。
在某些條件下這些因素會成為決定信用風險事件的強相關數據。過去這些用戶行為數據,并沒有放到信用風險評估模型中,沒有參與客戶的信用風險評估。金融企業和互聯網金融企業在分析已經發生的信用風險事件之后,發現的這些用戶行為信息在很多風險事件中起到了很關鍵的作用。小概率風險事件會導致很嚴重的后果,同信用風險事件的發生具有較強的關聯性。
現實世界的用戶行為可以揭示信用風險,互聯網上的用戶行為也同信用風險高度相關。例如全部用大寫字母填寫資料的人,信用貸款逾期率較高;凌晨1點登陸網絡申請貸款的人,惡意欺詐的比較多;手機上只有貸款App,沒有其他App的人,其惡意欺詐比率高;缺少社交活動的人,其貸款逾期可能性較高。這些用戶行為信息都同信用風險高度相關,可以作為一個重要因子進行錄入,影響客戶的信用評分。
大數據風控的一個最大的優勢就是豐富了信用風險評估的數據緯度,這些用戶行為信息,很大程度是大數據采集和分析的結果,用戶一般是不會提供給金融行業的。很多信息是規律性信息,需要大數據分析才有可能得到,其在信用評估中的權重,也需要不斷的優化模型去完善。
2、實時輸入和實時計算,解決風險視圖實效性問題
傳統風控的另外一個缺點是數據錄入和評估結果的滯后性,缺乏實效性數據的輸入,風控模型反映的往往是滯后數據的結果。利用滯后數據的評估結果來管理信用風險,本身產生的結構性風險就較大。
銀行現有的風險控制機制是參考歷史數據+模型+專家經驗。但是風險事件的聯動效應已經變大,一個小的風險事件可能在很短的時間內產生巨大的影響后果,風險事件撬動的杠桿變大了。歷史數據反應未來趨勢的相關程度正在變弱,因此信用風險管理需要大量實時的數據,已有的模型對風險事件(尤其是內部欺詐,外部欺詐)的識別能力在下降,需要新的風險控制模型和實時數據。
大數據的數據采集和計算能力,可以幫助企業建立實時的風險管理視圖。借助于全面多緯度的數據、自我學習能力的風控模型、實時計算結果、壞種子數據,企業可以提升量化風險評估能力。
數據、技術、模型、分析將成為信用風險評估的四個關鍵元素,其背后的力量就是大數據的技術和分析能力。企業利用大數據的風控能力,實時輸出風險因子信息,為金融企業提供實時風險管理視圖,提高風險管理的及時性。
3、豐富數據輸入緯度以及較細的顆粒度,對傳統風控的補充
傳統風控模型已經不能適應復雜的現代風險管理環境,特別在數據信息錄入緯度上,影響客戶信用評分的信息較多,很多都沒有引入到風險評估流程。例如企業所處行業的競爭環境以及同業產品的競爭、企業產品的生命周期、企業的關聯交易信息和司法信息、貸款個人的心理和性格、上下游產業經營情況、市場需求變化、客戶對企業產品的評價等。
大數據風控可以提供全面的數據(數據的廣度),強相關數據(數據的深度),實效性數據(數據的鮮活度)。這些數據顆粒度可以很小,同內部數據以及原有數據打通和整合之后,會影響風險評估結果,提升信用風險管理水平,客觀地反映用戶風險水平。
信用風險管理中還款意愿也較為重要,多維度、全量的用戶行為數據可以客觀揭示用戶的還款意愿,另外細小的顆粒度信息在打通之后,可以更加客觀了解客戶的還款能力。全量數據加用戶行為分析,可以充分了解客戶行為,幫助企業識別出惡意欺詐客戶。這些多緯度,細顆粒度,全面的信息正是大數分風控的優勢所在,同時也是傳統風控的一個很好的補充。
大數據風控的劣勢:
還是要強調一下,信用風險評估最好的數據還是金融數據,就是人行征信系統里的數據,大數據風控只是一個補充,不能夠完全替代傳統的信貸風險管理。大數據風控可以從數據緯度和分析角度提升傳統風控水平,是一個必要的補充,可以讓傳統風控更加科學嚴謹,但是不是取代傳統風控的模型和數據。
大數據風控也有缺點,例如數據的覆蓋率,匹配率,飽和度,鮮活度,查得率,以及相關度,甚至數據采集和使用涉及得隱私問題都是大數據風控的缺點。就像大數據應用本質一樣,其只是提供輔助決策,數據可以說明一個問題,但是不能都代替人腦去做決定,當利用數據分析出結果后,風險管理決策還是需要風險管理專家依靠其他的信息來決定。市場上大多數的征信公司和風控公司都面臨這些問題,數據的匹配率很多都低于20%,有的做風控的公司,其數據匹配率低于8%,無法進行商用,吹牛的成分很大。
五、反欺詐成為信用風險防范的主戰場
依據幾家互聯網金融公司的數據,在統計的信用風險損失事件中,惡意欺詐占了60%的比例。惡意欺詐防控成了所有互聯網金融公司的主要風險管理任務。市場上常用的防范惡意欺詐的方式有三種。
第一種是利用黑名單機制,來拒絕一些惡意欺詐人獲得貸款。但是道高一尺,魔高一丈,黑名單共享機制時效性越來越差,并且惡意欺詐的人頻繁使用其他人信息進行欺詐,黑名單機制在一定程度上很難幫到金融企業預防欺詐。并且很多平臺不太愿意共享自己的黑名單,因為黑名單在一定程度反映貸款平臺風控管理水平,過多的黑名單會影響平臺的聲譽,甚至影響平臺融資。另外黑名單覆蓋率較低也是一個挑戰,目前領先的反欺詐企業,其黑名單覆蓋率也不超過30%。
第二種是利用共享貸款數據機制,第三方企業或者大的P2P,防欺詐聯盟共享貸款平臺的貸款記錄。其他貸款平臺可以依據申請人在其他平臺的貸款記錄來決定是否提供貸款,降低欺詐風險。這種方式效果比較好,但是對于最先受理惡意欺詐的貸款平臺是無效的,原因是沒有其他平臺的貸款記錄,無法識別出貸款者是否屬于惡意欺詐。
第三種是借助于平臺自己的風控模型,依據壞種子歸納出來的規律,識別出惡意欺詐申請者。這種方式正在成為主流,其中基本采用信息驗證,特征匹配,行為分析等方式來識別出貸款用戶是否屬于惡意欺詐用戶。常見的方式有驗證用戶的工作地點,生活區域,查看手機應用安裝,社交活動軌跡,設備聚集點,是否經常換手機卡,是否刻意隱藏個人信息,是否短期內故意暴露個人信息等方式。企業利用風險評分卡來對用戶進行評估,依據評分結果來決定是否貸款給客戶。
移動大數據可以幫助金融企業防范惡意欺詐,例如可以通過手機的位置信息來驗證申請人的居住地和工作地;依據App安裝列表來驗證用戶是否在活躍在多家借款平臺;依據數據識別用戶是否在幾天內不停更換手機卡;依據手機App裝載和使用情況來辨識用戶是否安裝了很多惡意軟件例如密碼破解器,偽裝號碼軟件;客戶是否僅僅使用貸款軟件,沒有安裝常用軟件。借助于移動大數據和用戶行為信息,金融企業可以識別惡意欺詐用戶。國內領先的移動大數據服務商TalkingData,正在為互聯網金融公司提供移動大數據來防范用戶的惡意欺詐,數據的查得率超過了50%左右,具有成熟的數據商業應用場景。
六、Zest Finance如何利用大數據實施風險控制
市場上最熱的大數據風控公司就是美國的Zest Finance。其技術來源于Google,正在為15%左右的美國客戶提供信用評估服務,并且也服務很多傳統金融企業,共有400萬美國人直接通過Zest Finance申請信用評分,另外在銀行等金融機構通過Zest Finance模型獲得信用背書的人數則遠遠大于該數。
Zest Finance公司的CEO介紹了他們公司在大數據風控領域的經驗,很值得傳統企業借鑒。歐美傳統銀行通常采用對所有人都適用的線性回歸模型,其中包含性別、出生地等20個左右變量,對每個人都簡單化處理,以打分卡的形式評分Zest Finance采用的變量則多達70000個,采用的算法也不是線性回歸模型,而是來自Google的大數據模型。
FICO信用評分參考的數據變量只有不到50個,很多人摸清了FICO關注的變量后,就可以“模型套利”增加自己的信用評分,例如一個人可以每天反復在圖書館借書還書“刷信用”。
銀行往往采用200個一下變量和幾個模型,從模型數量而言,傳統征信評分通常采用一個模型,Zest Finance采用十個模型,從不同角度進行計算。十個模型從不同角度衡量申請人的分數,其中兩個是進行身份驗證防欺詐的,一個是預測提前還款概率的,其余都是評判還款意愿和能力的。最后會用一個決策模型將十個模型的結果整合在一起,得到最終的結果。
Zest Finance發現模型越多,準確率越高。有兩個模型,對利潤的提升分別是16.9%和9.4%,可能第二個模型往往會被棄用。但如果把這兩個模型放在一起使用,利潤會提升了38.3%。每個模型平均半年就會誕生一個新版本,替代舊的版本。新版本通常會加入更多的變量和數據源。每個新版本模型都以開發者的名字命名,從而紀念付出勞動與智慧的工程師。
Zest Finance模型中大部分信號都是通過機器學習找到的。例如,一個人在網上填表喜歡用大寫還是小寫就是一個信號。Zest Finance模型發現,填表喜歡全部用大寫字母的人違約率更高。在月收入經過驗證的情況下(Zest Finance有一些渠道可以大概獲知一個人的收入狀況),收入越高,違約率越低。然而,在月收入沒有經過驗證的情況下,自己填寫月收入7500美元的人違約率是最低的,填寫7500美元以上則數字越大違約率就更高。
很多人將社交數據視為神器,但是ZestFinance不這么認為,主要還是采用結構化和類結構化的數據,例如交易信息、法律記錄、租賃信息等,來源主要是從數據代理商處購買。
Zest Finance的先進之處并非數據來源,“我們有的數據銀行都有”,區別在于,銀行的人有數據卻不會用,就好比坐擁大量礦藏卻不會冶煉。相反,Zest Finance最大的優勢就是“數據冶煉”,同樣的數據到了Zest Fiance手中,就可以碰撞產生無數有價值的信號。