隨著互聯網的發展,大數據征信已被越來越多地運用到金融領域,互聯網金融平臺利用大數據判斷用戶的信用記錄是否良好,從而授予用戶相應的信貸額度。傳統銀行也在加緊布局大數據網絡,試圖與互聯網平臺接軌。與傳統信用評估模型不同的是,傳統的信用評估是根據一個人的借貸歷史和還款表現,通過邏輯回歸的方式來判斷這個人的信用情況,而大數據征信的數據源則十分廣泛,電子商務、社交網絡和搜索行為等都產生了大量的數據,在如此海量的數據面前,如何把控數據源的“量”與“度”是互聯網平臺和傳統金融機構需要重視并解決的問題。
如今一切信息皆可以成為信用數據,經過分析后用于證明一個人或企業的信用狀況。大數據的“量”是指有多少個體在被分析,每一個網上注冊賬號的個體都可以成為被分析的對象。數據源的“度”是指被分析的個體都有哪些方面能夠成為可以參考的數據。有很多人認為數據能夠被稱為“大數據”需具備兩個因素:第一要覆蓋面廣,用戶足夠多;第二維度廣,要從一個人行為的方方面面反映個體的行為與信用的關系。但是,筆者認為事實并非如此,數據的“量”與“度”也應嚴格加以控制。
把控大數據的“量”關鍵在于從大量的數據之中篩選出“有效用戶”。無論是在傳統金融領域,還是互聯網金融領域,給客戶做信用評估的前提是必須知道這個人就是他自己。所以,如何證明“你是你”是大數據征信首先要解決的問題。然而現實的情況是:一個人可以同時申請多個賬號,多個人在知道賬戶信息的條件下也可以同時使用一個賬號。在這樣的情況下數據信息往往有所重疊。因此,數據的體量大并不代表數據更加可靠。
隨著越來越多的金融業務互聯網化,“反欺詐”面臨的挑戰也日益增大。“身份認證”的重要性在各項監管文件中反復被強調,而各家機構也在不斷探索如何利用新的技術在網上實現身份的核實。金融機構在重視數據量的同時還可運用先進的科學技術手段,如指紋、虹膜、人臉識別等一系列生物識別技術,將大量的無效信息排除在外,同時也能夠抵御數據造假所帶來的信用風險。
對數據源“度”的有效性進行控制也是金融平臺和金融機構需要考慮的問題。社交軟件在數據量上有著非常明顯的優勢,許多社交軟件常常從用戶行為上分析判斷一個人的信用是否良好,這就有可能出現“分析過度”的情況。
在一些大數據征信的文章中,一些案例是這樣分析個人行為和信用評分的關系的:經常半夜上網的用戶可能被認為沒有穩定的工作而降低信用評分,購買大件家具的用戶可能提示有固定房屋資產而使其信用評分較高,微博更新頻繁的用戶可能因為社交活躍而信用評分較高等等。但這些因素并不十分穩定且準確,有些行為可能只是用戶的個人習慣,如果過度依賴這些因素將對用戶信用的判斷產生誤差。因此,哪些行為可以成為判斷個人信用的標準需要考量。
因此,大數據能夠成為金融機構的征信參考標準并不一定要求數據量大、數據的維度多,數據的有效性高、數據更能反映問題才能讓征信更加全面、可靠。