大數據在互聯網金融領域已經成為熱詞。在信而富看來,“Test And Learn”是大數據應用于P2P風險管理的核心方法。
“Test And Learn”,意思為“測試與獲知”,意味著在放款實踐中收集數據,通過建立風險模型和目標變量,研究客戶數據與信用行為之間的關系,從而調整授信策略。
信而富對借款人采集的數據多達1500個,并須在“細枝末節”中尋找線索。比如,關注申請人的郵政編碼最近12個月是否變更,關聯的信用卡張數是否變化,最近3個月、6個月的信用卡消費總額、交易類別與交易次數是否出現異常等。這些變量構成了信而富自動化授信決策的重要依據。
但是數據的紛繁復雜會讓開采者遭遇困境。在信而富設置的上千個數據緯度中,實際有用的數據可能只有100個。不同數據緯度間的邏輯關系,也很有可能產生沖突。不斷地測試并且獲取正確的數據維度和信息,構成了信而富的大數據應用的核心機密。比如,信而富針對使用一年、兩年、三年、五年號碼乃至更多的手機用戶分別作一些測試,通過這些用戶的借款行為不斷進行總結。假設公司發現使用手機號少于三年零兩個月的用戶借款風險較高,過了這個點后風險率顯著下降,那么“三年零兩個月”這個數字就是信而富的授信標準,也是公司的核心機密。