大數據無疑是近些年的流行詞。購物,繳費,貸款等等,生活中無數場景,我們都在形成和使用數據。這些數據以不同維度勾畫出一個較為立體的信用形象,進而方便評估、辨識金融活動中的借貸風險。
它比央行征信,內容更豐富,角度更多維,適用更廣泛。正是基于這種優勢,大數據近年頗受政府重視。融都網貸系統了解到,先是,放開民間征信,批準8家民間機構的準備工作,后報告、考察、擬發放個人征信牌照。9月5日,國務院更是下發《國務院關于印發促進大數據發展行動綱要的通知》,鼓勵推動公共信息資源共享和大數據產業的健康發展。
互聯網金融中,以P2P網貸為例,大數據的優勢體現在:第一,優化資產獲得能力;第二,提升平臺風險識別和定價能力;第三,實現資金端的精準營銷,降低獲客成本;第四,有助于平臺構造多元化的場景,增加P2P平臺與理財客戶的粘稠度。
但另一方面,大數據的應用僅是近幾年的事,體系的不成熟無法不正視。正如著名商業思想家納西姆塔勒布曾指出的,“數據會制造出更大的噪音,這就如同在干草垛中尋找一根針,當我們撥開干草垛時,要找的那根針被越埋越深。”
如何降低龐大數據帶來的“噪音”,是大數據真正發揮作用的重點,也是難點。融都網貸系統認為,具體到大數據在P2P領域應用,還需突破以下三方面限制:
第一,作為大數據核心的“大”,不僅僅是數據來源和量級,更重要的是通過怎樣的方式,用多長的時間積累出來。當P2P平臺試圖利用海量數據預測人群社會行為,進而借以區別出資產優劣時,單一時間點或短暫時間跨度內的數據很容易進行仿造,導致反欺詐模型的甄別精度降低。而即便這些數據均真實有效,對于正確預測人群行為模式、提升平臺的資產識別能力也是收效甚微。因此,大數據風控的剛性成本不在于錢,而在于如何獲得蘊含時間價值的有效數據。
第二,應用場景。從聯結有效性的角度來看,數據具有邊際效應,也就是說任何數據都無法做到在每種特定應用場景之下都發揮同等的效果。例如,阿里巴巴15年積累的網絡交易數據用于對自己商戶的放貸可以實現良好的批核率和精確性,但又有誰能保證這些數據遷移到汽車代銷網站或旅游網站上也同樣有效呢?所以我們才看到阿里巴巴戰略投資蘇寧云商,其目的之一便是阿里借蘇寧消費者樣本,彌補自身數據多元性短板。
第三,數據處理能力。P2P平臺如何針對自身每條業務線的場景特點,總結出所需數據的類型,并在浩如煙海的數據源中有針對性地加以篩選,決定了整個風控體系根基的穩固與否。這也引發了幾乎所有P2P平臺在大數據應用中的第三個短板——數據處理能力。