近年來,互聯網金融的迅猛發展,對線上線下金融機構的風險控制都帶來了較大的挑戰。一方面,以商業銀行為代表的傳統金融機構,其主流風控策略主要以央行征信報告為主要數據源,以專家經驗或專家規則為評判策略。過于定性的風控方法,雖然降低了壞賬率,但是不利于業務發展,容易錯失很多有效客戶;另一方面,許多新興的互聯網金融機構,由于所掌握的客戶信息有限,風控經驗的薄弱和風控執行手段不夠專業,其逾期率和壞賬率遠超于銀行。
好在隨著移動互聯網時代的來臨,從電子商務到互聯網金融,人們在網絡上產生的數據“足跡”越來越多,大數據已經成為當前金融機構加強風險控制的重要補充手段。
大數據征信開啟風控新格局
大數據征信是利用數據分析和模型進行風險評估,依據評估分數,預測還款人的還款能力、還款意愿、以及欺詐風險。在金融風控領域,大數據指的是全量數據和用戶行為數據。目前使用的是圍繞客戶周圍的與客戶信用情況高度相關的數據,利用數據實施科學風控。
與傳統征信相比,大數據的助力將帶來以下三大益處。
首先,大數據征信模型可以使信用評價更精準。
大數據征信模型將海量數據納入征信體系,并以多個信用模型進行多角度分析,以美國互聯網金融公司ZestFinance為例,它的模型基本會處理3500個數據項,提取近70000個變量,利用身份驗證模型、欺詐模型、還款能力模型等十余個模型進行分析,使評價結果更加全面準確,是模型評估性能大大提高。
其次,大數據征信能納入更為多樣性的行為數據。
大數據時代,每個相關機構都在最大程度上設法獲取行為主體的數據信息,使數據在最大程度上覆蓋廣泛、實時鮮活。
過去,征信機構對于企業和個人信息的搜集相對比較困難,數據搜集數量也比較有限。隨著互聯網和大數據的普及,依托于大數據和云計算技術優勢,可挖掘大量數據碎片中的關聯性,推動數據統計模型不斷完善,更加科學的反映用戶的信用狀況。
大數據風控的一個最大的優勢就是豐富了信用風險評估的數據維度,征信數據規模越來越大,數據維度越來越廣,模型不斷迭代優化,大數據等新興技術正在成為征信行業突破傳統瓶頸的重要手段。
最后,大數據征信帶來了更為時效性的評判標準。
傳統風控的另外一個缺點是缺乏實效性數據的輸入,其風控模型反映的往往是滯后數據的結果。利用滯后數據的評估結果來管理信用風險,本身產生的結構性風險就較大。
大數據的數據采集和計算能力,可以幫助企業建立實時的風險管理視圖。借助于全面多緯度的數據、自我學習能力的風控模型、實時計算結果,企業可以提升量化風險評估能力。
不過,雖然大數據征信能夠降低信息不對稱,更全面地了解授信對象,并增加反欺詐能力,同時更精準的進行風險定價,但目前還不能完全取代傳統征信。大數據風控可以從數據維度和分析角度提升傳統風控水平,是一個必要的補充,可以讓傳統風控更加科學嚴謹,但目前由于覆蓋率、匹配率等問題,不能完全取代傳統風控。
大數據征信如何提升金融機構風控能力
下面我們以一份人數約5萬的小額貸款客戶數據樣本,將通過分析得出哪些變量對于不良率有顯著影響;另外,對這個數據樣本使用前海征信的大數據征信產品進行評估,通過比較實際不良客戶和大數據評估結果,來看看使用大數據征信產品是否能有效起到風控能力的提升作用。
1F 客戶基本系信息和不良率的關聯分析
在這份小額貸款客戶的整體數據中,大約有27%的不良客戶。我們來看看學歷、婚姻狀況及地域等基本信息中與不良客戶的關聯度。
見圖2-1,我們發現高中及以下學歷是不良客戶主要構成;但經過分析,樣本數據中學歷信息完善度較低。因此,要想降低不良率,可以關注客戶的學歷信息是否完善,并進行嚴格審核。
見圖2-2,在考慮婚姻情況與不良客戶之間的關聯時,發現不良客戶中未婚者占比明顯高于已婚者;說明如果能提高樣本的婚姻信息完善度,并嚴格審核這個指標,亦可以對降低不良率起到一定作用。
通過對客戶信息進行地域分析發現,不良用戶的出現與地域分布有極大的相關性,如圖2-3,不良用戶會呈現集中式分布,說明客戶的地域信息也可作為有效的審核參考指標。
從上述分析中可以看出,客戶基本信息如學歷、婚姻、年齡、收入、地區等,均與風險有一定關聯度,所以應該盡可能完善客戶信息,并可部署在授信前段進行身份驗證,提高審核效率。
2F 大數據評估和不良率的匹配情況
接下來,我們看看前海征信大數據產品對不良客戶的評估情況。
首先看看好信度好信分。
前海征信推出的好信度好信分,是基于大量金融數據、互聯網行為等信息來刻畫客戶身份、履約能力等七個不同維度,從而獲得的綜合信用得分,可用于分析好信度分和客戶最終出現不良是否有相關關系。
我們再來看看常貸客評估的情況。
前海征信的常貸客數據,來源于好信平臺系列產品的數據共享,包含千萬級別客戶信貸行為信息,可查出客戶短期內是否向其他機構申請過貸款。此前數據證明,常貸客信貸逾期風險是普通客戶的3到4倍,可供用戶信用審核參考。讓我們來看看這一數據對于樣本的表現情況。
見圖2-8,對比數據表明,隨著命中機構數目的增加,不良客戶比例有著顯著提高。因此,常貸客對于客戶不良情況有顯著的識別及區分能力。
最后,我們來看看風險度評估的表現。風險度基于千萬量級的風險數據庫,并結合多維的外部數據,利用大數據建模從多方面對客戶出現信用風險的可能性。
目前,風險度整體命中率約為8.5%。被風險度命中的客戶,其不良比例顯著高于未命中的客戶。見圖2-9和圖2-10.
綜上所述,大數據征信評估有望對金融機構降低信用風險和欺詐風險帶來顯著效果。因此金融機構在設計授信政策時,不妨多維度使用征信產品數據,實現全流程大數據風控,從不同角度篩選不良客戶。