精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當前位置:大數據業界動態 → 正文

大數據征信的應用和啟示:ZestFinance的基于大數據的信用評估技術

責任編輯:editor006 |來源:企業網D1Net  2014-12-28 20:48:37 本文摘自:清華金融

2014年11月,本文作者有機會和ZestFinance的創始人和首席執行官梅里爾(Douglas C.Merill)先生進行了面對面的交流。這位普林斯頓的認知學博士闡述了ZestFinance利用大數據進行信用風險管理的基本框架。基于和梅里爾梅里爾先生的交流,本文對ZestFinance的商業模式和大數據挖掘技術進行進一步的解讀,希望能夠對中國未來的大數據征信有一些啟示。

信息技術的進步驅動了消費者信用信息的可得性

征信(Credit reporting或者是Credit reference)是指依法收集、整理、保存、加工自然人、法人及其他組織的信用信息,并對外提供信用報告、信用評估、信用信息咨詢等服務,幫助客戶判斷、控制信用風險,進行信用管理的活動。征信的主要目的是解決交易雙方信息不對稱的問題,進行信用風險管理。征信業與信息技術聯系密切,在歐美甚至被歸類為信息產業。信息技術的進步驅動了信用風險管理水平的提高,促進了信用的可獲得性。

歐美發達國家的個人征信(或者是個人消費者的信用風險管理)的發展可以分為三個階段:

第一個階段(1950年以前):定性信用風險決策。1950年之前,審貸過程是根據放貸人的經驗和對借貸人的了解,靠人工來完成的。這是一種定性的決策,效率比較低,沒有一個客觀統一的標準,放不放貸款完全依賴于信貸員個人的經驗。審貸的標準因人而異,不具備客觀性和科學性。從圖一(以消費信貸為例)可以看出在這一階段信貸市場的發展緩慢,總的信貸金額規模較小。

第二個階段(20世紀50年代—70年代):局部風險量化分析。1956年信用評估數據挖掘公司費埃哲(FICO)成立,來自斯坦福的工程師費爾(William Fair)和數學家埃薩克(Earl Isaac)進行了數學分析模型和工程實現的整合,兩年之后FICO公司賣出了它的第一個評分系統。利用FICO評分模型,銀行等信貸機構可以進行自動化的批量審貸,增加了信貸的可獲得性,減少了違約率,促成了消費信貸的第一次革命。如圖一所示,在該階段,消費信貸市場得到了快速的發展。但由于銀行只是利用內部的數據進行FICO個人評分建模,因此FICO模型在解決信貸交易雙方信息不對稱問題上的作用仍有局限。

第三個階段(1980年以后):全局量化風險分析。1980年之后,征信機構Experian收集了不同信貸機構個人消費者的信貸信息,形成了消費者的全局信息。不同的信貸結構之間共享全局信息,可以全面地了解個人消費者的信用狀況,更好地解決了信息不對稱問題,促成了信用風險管理的又一次革命。從圖一可以看出,自1980年之后,消費信貸市場得到飛速地擴張。但在該階段,由于征信機構不能為缺少信貸信息的少量個人消費者提供全局信用記錄,因此這類消費者無法享受信貸機構的正常服務。

圖一美國消費信貸市場的發展過程

目前,信息技術(IT)的突飛猛進使人類社會進入了大數據時代,更多維度的數據和不同層次的數據都可以用來挖掘和分析。挖掘數據中大的價值,使其為我們的工作和生活服務,需要有更好的挖掘和分析能力。機器學習的算法和模型可以實現對大數據的深入挖掘和分析。機器學習是近20多年興起的一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法復雜度理論等多門學科。機器學習理論主要是設計和分析一些讓計算機可以自動“學習”的算法。梅里爾先生認為大數據技術加上機器學習算法使個人消費信貸的信用風險管理進入了第四個階段。在這個階段,可以從大數據中挖掘出更多的消費者信用信息。即使是傳統征信體系不能覆蓋的一些缺乏信貸記錄人群的信用信息,也能從大數據中挖掘出來。

ZestFinance的基本商業理念

作為一家創新型的科技金融公司,ZestFinance自創立以來,由于其獨特的商業理念而不斷受到投資界和互聯網金融領域的矚目。

為弱勢群體制造信用的普惠金融思想

ZestFinance認為,它的使命是為每一個人創造公平而且透明的信用信息。ZestFinance最初的服務對象是只能使用高利貸的人群(稱為借貸日貸款人群),通過大數據挖掘出他們的信用信息,幫助他們享受正常的金融服務。ZestFinance假定每一個消費者都是“好”人,希望通過搜集證據,證明信貸信息不完整人群的真正的信用狀況,,進而幫助他們實現享受正常金融服務的權利。

非傳統征信視角看信用

個人征信的目的是通過搜集數據來挖掘出消費者已有和潛在的信用信息,數據和具體的技術只是征信的手段和工具。消費者的信用狀況是和其信貸記錄聯系最緊密,是強相關的,所以傳統征信從消費者的信貸記錄挖掘其信用狀況。但是消費者的信用狀況和其信貸記錄并非是一一映射的關系。消費者的信用狀況還會和消費者的其它信息和行為有聯系,盡管這種聯系可能較弱。

圖二大數據征信視角和傳統征信視角的比較

圖二展示了ZestFinance公司的大數據征信的視角。和傳統征信相同,對消費者的信用評估也是基于兩個基本面的信息:消費者的還款能力和消費者的還款意愿。所不同的是,傳統征信中,數據依賴于銀行信貸數據,而大數據征信的數據并不僅僅包括傳統的信貸數據,同時也包括了與消費者還款能力、還款意愿相關的一些描述性風險特征,這些相關性描述風險特征的抽取與篩選是ZestFinance的技術核心。相比于傳統征信數據的強相關性,這些大數據征信的數據和消費者的信用狀況相關性較弱,ZestFinance就利用大數據技術搜集更多的數據維度來加強這些弱相關數據的描述能力。這樣就使大數據征信不依賴于傳統信貸數據,可以對傳統征信無法服務的人群進行征信,實現對整個消費者人群的覆蓋。

優于銀行的大數據挖掘技術

ZestFiance的優勢在于其強大的數據挖掘能力,能開發出新穎的信用評估模型,從大數據中挖掘出更多不易被發現的消費者信用信息。盡管ZestFinance公司自運營以來取得了不錯的業績,但梅里爾先生還是具有專業學術人士特有的謙遜嚴謹的風格,他闡述了一些ZestFinance的發展弱勢,即:公司規模還比較小,目前直接服務的人群只有10萬人左右;不擁有銀行豐富的個人消費者數據,但其本身所擁有的數據卻可以被銀行通過正常手段和渠道獲得。

對于大數據的理解和利用

不同的應用對大數據有著不同的理解,目前也沒有一個統一的概念。梅里爾先生認為“數據多”并不是“大數據”,能夠利用IT先進技術將碎片化的信息整合起來才能形成真正有用的大數據。這種對大數據的理解特別適用于征信業,因為征信的基本過程也是將分散于不同信貸機構看似用處不大的局部信息整合成為可以完整描述消費者信用狀況的全局信息。

值得指出的是,ZestFinance雖然利用大數據技術進行征信,但是主要利用的還是結構化的大數據,對于復雜的大數據類型,例如文本數據和社交網絡數據,利用得比較少,主要原因是由于這些復雜的大數據和ZestFinance所服務的消費者的信用風險相關性太弱了。這種現象其實也被其他互聯網金融的征信實踐所驗證,例如最大的互聯網P2P公司Lending Club最早從臉譜(Facebook)平臺登陸信貸市場,希望通過對社交網絡的數據進行信貸審批,結果效果很差,難以為繼,最后只好回歸傳統的信貸手段發展。

提文:ZestFinance的核心競爭力在于其強大的數據挖掘能力和模型開發能力,將機器學習領域比較成熟的技術創造性地用于傳統的信貸風險管理領域。

ZestFinance的技術分析

ZestFinane的核心業務是消費信貸審批,主要客戶是次級貸消費者,主要的競爭對手是銀行或典當行。ZestFinance的核心競爭力在于其強大的數據挖掘能力和模型開發能力,將機器學習領域比較成熟的技術創造性地用于傳統的信貸風險管理領域。

采用了基于多角度學習的評分預測模型

傳統的信用評分模型一般擁有500個數據項,從中提取50個變量,利用一個預測分析模型做出信用風險量化評估。而在ZestFinance的新模型中,往往要用到3500個數據項,從中提取70,000個變量,利用10個預測分析模型進行集成學習或者多角度學習,進而得到最終的消費者信用評分。如圖三所示,ZestFinance的數據源是大數據,可以生成數以萬計的風險變量,然后分別輸入不同的預測模型中,例如欺詐模型、身份驗證模型、預付能力模型、還款能力模型、還款意愿模型以及穩定性模型等。每一個子模型都從不同的角度預測個人消費者的信用狀況,克服了傳統信用評估中一個模型考慮因素的局限性,使預測更為細致。

機器學習方法在生產、科研和生活中有著廣泛應用,而集成學習則是機器學習最近的熱門研究方向。集成學習是使用一系列算法模型進行分析預測,并使用某種規則把各個模型分析結果進行整合從而獲得比單個算法模型更好的預測效果的一種機器學習方法。如果把單個模型比作一個決策者的話,集成學習的方法就相當于多個決策者共同進行一項決策。由于融合多種信息和綜合多種決策機制,經過集成學習得到的分析預測要明顯優于單一模型。不同角度的信息存在關聯,各自包含互補信息、多角度學習的過程,相當于一個不斷搜集證據的過程,加強互補信息,進行信息融合。例如,兩個獨立的評分模型對利潤提升的能力分別是16.9%和9.4%,傳統信用評估中,第二個模型可能被棄用,但如果發現這兩個模型分別包含互補信息,將這兩個模型的結果進行融合,可以將利潤提高至38%。

這些多角度學習中每一個子模型也沒有采用傳統的邏輯回歸, 而是機器學習中的其它的預測模型(該模型的細節對于ZestFinance是核心機密)。ZestFinance的信用評估中沒有利用邏輯回歸模型的原因是大數據征信的數據比較零碎,而且變量過多;以及所抽取的風險變量分布不能滿足正態分布。

圖三ZestFinance的信用評估模型解讀

評分模型不斷更新

當ZestFinance不斷地進行數據搜集和增加新數據源的同時,評分模型也在不斷更新。如表一所示,從2012年到目前,差不多每一個季度就會新推出一個新的信用評估模型。而且模型是以每一位不同的開發者命名,目前已經有14個模型。ZestFinance評分模型的改進也提高了其信用風險評估水平。雖然這些新的模型仍然會遇到數據充足性和數據可得性的挑戰,但是模型的持續改進還在進行中。

評分模型不斷地細化

ZestFinance最早從事的是信貸審批,僅有信貸審批評分模型,隨后不斷細化其評估模型來支持不斷推出新的信用風險業務。如表三所示,2013年第一季度推出了催收評分,2014年第二季度推出了市場營銷評分;2014年推出了汽車貸款和法律催收,目前已經開發出八類信用評估模型,用于不同信用風險評估服務。

(原始參考資料,以ZestFinance公司的研發工程師命名的算法模型)

表一ZestFinance的信用評估模型基本情況(來源于ZestFinance公司資料[a1] ,表中列出的是ZestFinance公司的算法模型,都是研發出該模型的工程師命名)

挖掘丟失數據,變廢為寶

丟失數據(Missing data)指的是機器學習中某一些數據項因為種種原因造成了缺失,較多的丟失數據會給建模過程帶來挑戰。由于ZestFinance利用多維度的大數據,所以丟失數據的現象更加突出。ZestFinance處理丟失數據也有其獨特之處。首先ZestFinance不斷改進其評分模型,增強其處理丟失數據的能力,最新的評分模型可以處理超過30%的丟失數據。其次,ZestFinance另辟蹊徑,充分利用丟失數據之間的關聯、和正常數據的交叉,探尋數據丟失的原因。通過這樣的深耕細作,獲得了一些有用的消費者信用信息。當然,這種做法要求使用于特定環境,要結合信貸業務,并對消費者的行為模式有深入的理解。

ZestFinance和競爭對手的比較

根據調查,80%左右的信貸風險來自信貸審批環節,一旦消費者獲得信貸,后續的管理只能控制20%的風險,由此可見科學的信貸審批管理十分重要。開發高質量的信貸審批評分模型,進行科學的審批風險管理,可以大幅降低壞賬率,并取得比較好的經濟效益。雖然ZestFinance并未透漏其壞賬率,但在實際應用的過程中,和其競爭對手銀行或典當行的放貸者相比,還是取得了一些不錯的結果。

1.獲得貸款顧客的成本是競爭者的25%。根據JMP2012的行業報告,對于一個在線的借貸者來說,獲取一個顧客的平均花銷應該在250美元和500美元之間。如圖四所示,2014年,通過ZestFinance的服務,獲得顧客的成本穩定在100美元左右。

圖四ZestFinance獲得顧客的成本(圖四至圖七來源于ZestFinance公司資料)

2.首次還貸違約率(First pay default, FPD)低于競爭者。如圖五所示,藍色曲線為ZestFinance的首次還貸違約率,紅色、灰色和黑色的曲線表示其他競爭對手(對于銀行放貸者來說,FPD已經比較穩定)。從圖五可以看出,從2012年初起,ZestFinance的首次還貸違約率還在不斷波動,有時高于第三個競爭對手,隨著模型的不斷改進,到2013年已基本穩定,明顯低于三個競爭對手。

圖五ZestFinance的首次還貸違約率和其競爭對手比較

3.不斷提高客戶的投資回報率。ZestFinance最初的投資回報率在100%左右,隨著模型的不斷改進,目前的客戶投資回報率達到了150%以上,如圖六所示。

圖六ZestFinance不斷提高客戶投資回報率

4.投資回報率高于競爭對手。圖七展示了ZestFinance在不同時間和其競爭對手在投資回報率方面的比較,可以看出ZestFinance的投資回報率明顯高于行業標準和其競爭對手。

圖七ZestFinance的投資回報率高于競爭對手

相比而言,目前國內的信用風險管理,懲罰性太強,一種類似“有罪推理”的思路大行其道,這種方式可能簡單有效,但是并沒有把征信的作用全面發揮出來。征信的真正作用不僅僅是懲戒失信,更重要的是褒揚誠信。

對中國的征信業的啟示

ZestFinance通過技術創新和金融風險管理的創新,帶來新穎的商業理念和技術路線,對于正在起步的中國征信業以及互聯網金融中的風險管理有一定的啟示作用。

一、征信勿以“懲罰性”為目的。ZestFinance以大數據征信技術,假定每一個消費者都是“好”人,不隨便設黑名單進行“有罪推理”。ZestFinance為所有的消費者挖掘信用,用科技的力量推動普惠金融的發展,打破信貸機構為富人服務的怪圈。相比而言,目前國內的信用風險管理,懲罰性太強,一種類似“有罪推理”的思路大行其道,這種方式可能簡單有效,但是并沒有把征信的作用全面發揮出來。征信的真正作用不僅僅是懲戒失信,更重要的是褒揚誠信。

二、定位于特定的服務人群。ZestFinance的主要服務對象是約占人口5%的、信用評分在500分以下的次級貸人群。通過對這部分消費者的深入理解,篩選大數據描述信息,所開發的也是針對這部分人群有效的信貸審批模型。在機器學習領域沒有特別通用的分析模型,但是往往有對特定范圍內有效的模型。所以,合理地定位服務人群和深入理解服務對象是開發征信分析模型乃至開展征信服務業務成敗的關鍵。

三、加強信用分析模型的研發。ZestFinance優于其競爭對手和傳統信貸機構的一個重要的原因是強大的信用評分模型的開發能力:基于多角度學習的預測模型,模型及時更新而且不斷細化。相比而言,中國的信貸審批,或信用風險管理,層次不齊,從定性判斷到簡單的量化決策都有,總的來說量化分析不足,而且征信機構的信用評分還未推出。只有加強對量化的信用風險分析技術研發投入,才能真正實現對消費信貸的專業風險管理。同時,值得強調的是,大數據時代,沒有現成的免費午餐,數據和模型需要提煉,需要數據科學家的人工參與,即使把ZestFinance的模型拿到中國來,也不能直接用。對數據和消費者的理解和數據挖掘技術的掌握都是建模過程中不能省掉的功課。

同時我們也要對大數據征信以及ZestFinance有一個全面的認識:

一、征信數據是天然的大數據,無論是從Gartner提出4V理論還是本文中梅里爾先生對于大數據的理解。大數據征信不僅僅包括利用信用評估,還包括征信大數據的采集、征信大數據的管理、征信大數據的安全以及征信大數據的可視化等等。同時國外傳統的征信機構和新興的互聯網金融機構也都在探索大數據征信的不同方式。例如,FICO公司的研究表明,將社交媒體和電商網站擁有的在線數據、移動運營商的手機使用數據與傳統征信數據結合用于風險建模,提高了模型對客戶的區分度,在降低拒貸率的同時,提高了風險預測能力。FICO目前正在與少數金融機構合作,在小范圍內使用這種模型。美國的一家新的評分公司更是利用非傳統的數據和心理測量學的分析和建模方法來進行信用評估。

二、ZestFinance并非一個征信機構,其主要業務也是征信產品中的信貸申請評分。在其進行信用評估時,并沒有直接從征信機構獲取數據,建模中的30%數據來自于不同的數據代理商,這些數據和征信數據相似。而且ZestFinance并沒有向征信機構報送數據,主要的原因可能是ZestFinance所用的數據項維度太多,面向特定人群,時效性強,不符合征信機構的數據的通用、成熟、穩定、信用相關性強的特點。

三、對于征信大數據的利用并不僅限于機器學習。人工智能的其它分支、復雜科學、心理測算學都可能是未來利用大數據建模進行信用評估的理論基礎。

四、ZestFinance也面臨著合規性挑戰。由于從事的是金融業務,ZestFinance就需要像其競爭對手(例如傳統銀行)一樣,接受監管。目前美國借貸的監管環境非常復雜,聯邦法律下還有各州的法律并行。所以ZestFinance還在繼續研究監管機構和其他因素扮演的角色,在開展大數據征信的同時努力滿足合規性的要求。

關鍵字:ZestFinance信用評分模型

本文摘自:清華金融

x 大數據征信的應用和啟示:ZestFinance的基于大數據的信用評估技術 掃一掃
分享本文到朋友圈
當前位置:大數據業界動態 → 正文

大數據征信的應用和啟示:ZestFinance的基于大數據的信用評估技術

責任編輯:editor006 |來源:企業網D1Net  2014-12-28 20:48:37 本文摘自:清華金融

2014年11月,本文作者有機會和ZestFinance的創始人和首席執行官梅里爾(Douglas C.Merill)先生進行了面對面的交流。這位普林斯頓的認知學博士闡述了ZestFinance利用大數據進行信用風險管理的基本框架。基于和梅里爾梅里爾先生的交流,本文對ZestFinance的商業模式和大數據挖掘技術進行進一步的解讀,希望能夠對中國未來的大數據征信有一些啟示。

信息技術的進步驅動了消費者信用信息的可得性

征信(Credit reporting或者是Credit reference)是指依法收集、整理、保存、加工自然人、法人及其他組織的信用信息,并對外提供信用報告、信用評估、信用信息咨詢等服務,幫助客戶判斷、控制信用風險,進行信用管理的活動。征信的主要目的是解決交易雙方信息不對稱的問題,進行信用風險管理。征信業與信息技術聯系密切,在歐美甚至被歸類為信息產業。信息技術的進步驅動了信用風險管理水平的提高,促進了信用的可獲得性。

歐美發達國家的個人征信(或者是個人消費者的信用風險管理)的發展可以分為三個階段:

第一個階段(1950年以前):定性信用風險決策。1950年之前,審貸過程是根據放貸人的經驗和對借貸人的了解,靠人工來完成的。這是一種定性的決策,效率比較低,沒有一個客觀統一的標準,放不放貸款完全依賴于信貸員個人的經驗。審貸的標準因人而異,不具備客觀性和科學性。從圖一(以消費信貸為例)可以看出在這一階段信貸市場的發展緩慢,總的信貸金額規模較小。

第二個階段(20世紀50年代—70年代):局部風險量化分析。1956年信用評估數據挖掘公司費埃哲(FICO)成立,來自斯坦福的工程師費爾(William Fair)和數學家埃薩克(Earl Isaac)進行了數學分析模型和工程實現的整合,兩年之后FICO公司賣出了它的第一個評分系統。利用FICO評分模型,銀行等信貸機構可以進行自動化的批量審貸,增加了信貸的可獲得性,減少了違約率,促成了消費信貸的第一次革命。如圖一所示,在該階段,消費信貸市場得到了快速的發展。但由于銀行只是利用內部的數據進行FICO個人評分建模,因此FICO模型在解決信貸交易雙方信息不對稱問題上的作用仍有局限。

第三個階段(1980年以后):全局量化風險分析。1980年之后,征信機構Experian收集了不同信貸機構個人消費者的信貸信息,形成了消費者的全局信息。不同的信貸結構之間共享全局信息,可以全面地了解個人消費者的信用狀況,更好地解決了信息不對稱問題,促成了信用風險管理的又一次革命。從圖一可以看出,自1980年之后,消費信貸市場得到飛速地擴張。但在該階段,由于征信機構不能為缺少信貸信息的少量個人消費者提供全局信用記錄,因此這類消費者無法享受信貸機構的正常服務。

圖一美國消費信貸市場的發展過程

目前,信息技術(IT)的突飛猛進使人類社會進入了大數據時代,更多維度的數據和不同層次的數據都可以用來挖掘和分析。挖掘數據中大的價值,使其為我們的工作和生活服務,需要有更好的挖掘和分析能力。機器學習的算法和模型可以實現對大數據的深入挖掘和分析。機器學習是近20多年興起的一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法復雜度理論等多門學科。機器學習理論主要是設計和分析一些讓計算機可以自動“學習”的算法。梅里爾先生認為大數據技術加上機器學習算法使個人消費信貸的信用風險管理進入了第四個階段。在這個階段,可以從大數據中挖掘出更多的消費者信用信息。即使是傳統征信體系不能覆蓋的一些缺乏信貸記錄人群的信用信息,也能從大數據中挖掘出來。

ZestFinance的基本商業理念

作為一家創新型的科技金融公司,ZestFinance自創立以來,由于其獨特的商業理念而不斷受到投資界和互聯網金融領域的矚目。

為弱勢群體制造信用的普惠金融思想

ZestFinance認為,它的使命是為每一個人創造公平而且透明的信用信息。ZestFinance最初的服務對象是只能使用高利貸的人群(稱為借貸日貸款人群),通過大數據挖掘出他們的信用信息,幫助他們享受正常的金融服務。ZestFinance假定每一個消費者都是“好”人,希望通過搜集證據,證明信貸信息不完整人群的真正的信用狀況,,進而幫助他們實現享受正常金融服務的權利。

非傳統征信視角看信用

個人征信的目的是通過搜集數據來挖掘出消費者已有和潛在的信用信息,數據和具體的技術只是征信的手段和工具。消費者的信用狀況是和其信貸記錄聯系最緊密,是強相關的,所以傳統征信從消費者的信貸記錄挖掘其信用狀況。但是消費者的信用狀況和其信貸記錄并非是一一映射的關系。消費者的信用狀況還會和消費者的其它信息和行為有聯系,盡管這種聯系可能較弱。

圖二大數據征信視角和傳統征信視角的比較

圖二展示了ZestFinance公司的大數據征信的視角。和傳統征信相同,對消費者的信用評估也是基于兩個基本面的信息:消費者的還款能力和消費者的還款意愿。所不同的是,傳統征信中,數據依賴于銀行信貸數據,而大數據征信的數據并不僅僅包括傳統的信貸數據,同時也包括了與消費者還款能力、還款意愿相關的一些描述性風險特征,這些相關性描述風險特征的抽取與篩選是ZestFinance的技術核心。相比于傳統征信數據的強相關性,這些大數據征信的數據和消費者的信用狀況相關性較弱,ZestFinance就利用大數據技術搜集更多的數據維度來加強這些弱相關數據的描述能力。這樣就使大數據征信不依賴于傳統信貸數據,可以對傳統征信無法服務的人群進行征信,實現對整個消費者人群的覆蓋。

優于銀行的大數據挖掘技術

ZestFiance的優勢在于其強大的數據挖掘能力,能開發出新穎的信用評估模型,從大數據中挖掘出更多不易被發現的消費者信用信息。盡管ZestFinance公司自運營以來取得了不錯的業績,但梅里爾先生還是具有專業學術人士特有的謙遜嚴謹的風格,他闡述了一些ZestFinance的發展弱勢,即:公司規模還比較小,目前直接服務的人群只有10萬人左右;不擁有銀行豐富的個人消費者數據,但其本身所擁有的數據卻可以被銀行通過正常手段和渠道獲得。

對于大數據的理解和利用

不同的應用對大數據有著不同的理解,目前也沒有一個統一的概念。梅里爾先生認為“數據多”并不是“大數據”,能夠利用IT先進技術將碎片化的信息整合起來才能形成真正有用的大數據。這種對大數據的理解特別適用于征信業,因為征信的基本過程也是將分散于不同信貸機構看似用處不大的局部信息整合成為可以完整描述消費者信用狀況的全局信息。

值得指出的是,ZestFinance雖然利用大數據技術進行征信,但是主要利用的還是結構化的大數據,對于復雜的大數據類型,例如文本數據和社交網絡數據,利用得比較少,主要原因是由于這些復雜的大數據和ZestFinance所服務的消費者的信用風險相關性太弱了。這種現象其實也被其他互聯網金融的征信實踐所驗證,例如最大的互聯網P2P公司Lending Club最早從臉譜(Facebook)平臺登陸信貸市場,希望通過對社交網絡的數據進行信貸審批,結果效果很差,難以為繼,最后只好回歸傳統的信貸手段發展。

提文:ZestFinance的核心競爭力在于其強大的數據挖掘能力和模型開發能力,將機器學習領域比較成熟的技術創造性地用于傳統的信貸風險管理領域。

ZestFinance的技術分析

ZestFinane的核心業務是消費信貸審批,主要客戶是次級貸消費者,主要的競爭對手是銀行或典當行。ZestFinance的核心競爭力在于其強大的數據挖掘能力和模型開發能力,將機器學習領域比較成熟的技術創造性地用于傳統的信貸風險管理領域。

采用了基于多角度學習的評分預測模型

傳統的信用評分模型一般擁有500個數據項,從中提取50個變量,利用一個預測分析模型做出信用風險量化評估。而在ZestFinance的新模型中,往往要用到3500個數據項,從中提取70,000個變量,利用10個預測分析模型進行集成學習或者多角度學習,進而得到最終的消費者信用評分。如圖三所示,ZestFinance的數據源是大數據,可以生成數以萬計的風險變量,然后分別輸入不同的預測模型中,例如欺詐模型、身份驗證模型、預付能力模型、還款能力模型、還款意愿模型以及穩定性模型等。每一個子模型都從不同的角度預測個人消費者的信用狀況,克服了傳統信用評估中一個模型考慮因素的局限性,使預測更為細致。

機器學習方法在生產、科研和生活中有著廣泛應用,而集成學習則是機器學習最近的熱門研究方向。集成學習是使用一系列算法模型進行分析預測,并使用某種規則把各個模型分析結果進行整合從而獲得比單個算法模型更好的預測效果的一種機器學習方法。如果把單個模型比作一個決策者的話,集成學習的方法就相當于多個決策者共同進行一項決策。由于融合多種信息和綜合多種決策機制,經過集成學習得到的分析預測要明顯優于單一模型。不同角度的信息存在關聯,各自包含互補信息、多角度學習的過程,相當于一個不斷搜集證據的過程,加強互補信息,進行信息融合。例如,兩個獨立的評分模型對利潤提升的能力分別是16.9%和9.4%,傳統信用評估中,第二個模型可能被棄用,但如果發現這兩個模型分別包含互補信息,將這兩個模型的結果進行融合,可以將利潤提高至38%。

這些多角度學習中每一個子模型也沒有采用傳統的邏輯回歸, 而是機器學習中的其它的預測模型(該模型的細節對于ZestFinance是核心機密)。ZestFinance的信用評估中沒有利用邏輯回歸模型的原因是大數據征信的數據比較零碎,而且變量過多;以及所抽取的風險變量分布不能滿足正態分布。

圖三ZestFinance的信用評估模型解讀

評分模型不斷更新

當ZestFinance不斷地進行數據搜集和增加新數據源的同時,評分模型也在不斷更新。如表一所示,從2012年到目前,差不多每一個季度就會新推出一個新的信用評估模型。而且模型是以每一位不同的開發者命名,目前已經有14個模型。ZestFinance評分模型的改進也提高了其信用風險評估水平。雖然這些新的模型仍然會遇到數據充足性和數據可得性的挑戰,但是模型的持續改進還在進行中。

評分模型不斷地細化

ZestFinance最早從事的是信貸審批,僅有信貸審批評分模型,隨后不斷細化其評估模型來支持不斷推出新的信用風險業務。如表三所示,2013年第一季度推出了催收評分,2014年第二季度推出了市場營銷評分;2014年推出了汽車貸款和法律催收,目前已經開發出八類信用評估模型,用于不同信用風險評估服務。

(原始參考資料,以ZestFinance公司的研發工程師命名的算法模型)

表一ZestFinance的信用評估模型基本情況(來源于ZestFinance公司資料[a1] ,表中列出的是ZestFinance公司的算法模型,都是研發出該模型的工程師命名)

挖掘丟失數據,變廢為寶

丟失數據(Missing data)指的是機器學習中某一些數據項因為種種原因造成了缺失,較多的丟失數據會給建模過程帶來挑戰。由于ZestFinance利用多維度的大數據,所以丟失數據的現象更加突出。ZestFinance處理丟失數據也有其獨特之處。首先ZestFinance不斷改進其評分模型,增強其處理丟失數據的能力,最新的評分模型可以處理超過30%的丟失數據。其次,ZestFinance另辟蹊徑,充分利用丟失數據之間的關聯、和正常數據的交叉,探尋數據丟失的原因。通過這樣的深耕細作,獲得了一些有用的消費者信用信息。當然,這種做法要求使用于特定環境,要結合信貸業務,并對消費者的行為模式有深入的理解。

ZestFinance和競爭對手的比較

根據調查,80%左右的信貸風險來自信貸審批環節,一旦消費者獲得信貸,后續的管理只能控制20%的風險,由此可見科學的信貸審批管理十分重要。開發高質量的信貸審批評分模型,進行科學的審批風險管理,可以大幅降低壞賬率,并取得比較好的經濟效益。雖然ZestFinance并未透漏其壞賬率,但在實際應用的過程中,和其競爭對手銀行或典當行的放貸者相比,還是取得了一些不錯的結果。

1.獲得貸款顧客的成本是競爭者的25%。根據JMP2012的行業報告,對于一個在線的借貸者來說,獲取一個顧客的平均花銷應該在250美元和500美元之間。如圖四所示,2014年,通過ZestFinance的服務,獲得顧客的成本穩定在100美元左右。

圖四ZestFinance獲得顧客的成本(圖四至圖七來源于ZestFinance公司資料)

2.首次還貸違約率(First pay default, FPD)低于競爭者。如圖五所示,藍色曲線為ZestFinance的首次還貸違約率,紅色、灰色和黑色的曲線表示其他競爭對手(對于銀行放貸者來說,FPD已經比較穩定)。從圖五可以看出,從2012年初起,ZestFinance的首次還貸違約率還在不斷波動,有時高于第三個競爭對手,隨著模型的不斷改進,到2013年已基本穩定,明顯低于三個競爭對手。

圖五ZestFinance的首次還貸違約率和其競爭對手比較

3.不斷提高客戶的投資回報率。ZestFinance最初的投資回報率在100%左右,隨著模型的不斷改進,目前的客戶投資回報率達到了150%以上,如圖六所示。

圖六ZestFinance不斷提高客戶投資回報率

4.投資回報率高于競爭對手。圖七展示了ZestFinance在不同時間和其競爭對手在投資回報率方面的比較,可以看出ZestFinance的投資回報率明顯高于行業標準和其競爭對手。

圖七ZestFinance的投資回報率高于競爭對手

相比而言,目前國內的信用風險管理,懲罰性太強,一種類似“有罪推理”的思路大行其道,這種方式可能簡單有效,但是并沒有把征信的作用全面發揮出來。征信的真正作用不僅僅是懲戒失信,更重要的是褒揚誠信。

對中國的征信業的啟示

ZestFinance通過技術創新和金融風險管理的創新,帶來新穎的商業理念和技術路線,對于正在起步的中國征信業以及互聯網金融中的風險管理有一定的啟示作用。

一、征信勿以“懲罰性”為目的。ZestFinance以大數據征信技術,假定每一個消費者都是“好”人,不隨便設黑名單進行“有罪推理”。ZestFinance為所有的消費者挖掘信用,用科技的力量推動普惠金融的發展,打破信貸機構為富人服務的怪圈。相比而言,目前國內的信用風險管理,懲罰性太強,一種類似“有罪推理”的思路大行其道,這種方式可能簡單有效,但是并沒有把征信的作用全面發揮出來。征信的真正作用不僅僅是懲戒失信,更重要的是褒揚誠信。

二、定位于特定的服務人群。ZestFinance的主要服務對象是約占人口5%的、信用評分在500分以下的次級貸人群。通過對這部分消費者的深入理解,篩選大數據描述信息,所開發的也是針對這部分人群有效的信貸審批模型。在機器學習領域沒有特別通用的分析模型,但是往往有對特定范圍內有效的模型。所以,合理地定位服務人群和深入理解服務對象是開發征信分析模型乃至開展征信服務業務成敗的關鍵。

三、加強信用分析模型的研發。ZestFinance優于其競爭對手和傳統信貸機構的一個重要的原因是強大的信用評分模型的開發能力:基于多角度學習的預測模型,模型及時更新而且不斷細化。相比而言,中國的信貸審批,或信用風險管理,層次不齊,從定性判斷到簡單的量化決策都有,總的來說量化分析不足,而且征信機構的信用評分還未推出。只有加強對量化的信用風險分析技術研發投入,才能真正實現對消費信貸的專業風險管理。同時,值得強調的是,大數據時代,沒有現成的免費午餐,數據和模型需要提煉,需要數據科學家的人工參與,即使把ZestFinance的模型拿到中國來,也不能直接用。對數據和消費者的理解和數據挖掘技術的掌握都是建模過程中不能省掉的功課。

同時我們也要對大數據征信以及ZestFinance有一個全面的認識:

一、征信數據是天然的大數據,無論是從Gartner提出4V理論還是本文中梅里爾先生對于大數據的理解。大數據征信不僅僅包括利用信用評估,還包括征信大數據的采集、征信大數據的管理、征信大數據的安全以及征信大數據的可視化等等。同時國外傳統的征信機構和新興的互聯網金融機構也都在探索大數據征信的不同方式。例如,FICO公司的研究表明,將社交媒體和電商網站擁有的在線數據、移動運營商的手機使用數據與傳統征信數據結合用于風險建模,提高了模型對客戶的區分度,在降低拒貸率的同時,提高了風險預測能力。FICO目前正在與少數金融機構合作,在小范圍內使用這種模型。美國的一家新的評分公司更是利用非傳統的數據和心理測量學的分析和建模方法來進行信用評估。

二、ZestFinance并非一個征信機構,其主要業務也是征信產品中的信貸申請評分。在其進行信用評估時,并沒有直接從征信機構獲取數據,建模中的30%數據來自于不同的數據代理商,這些數據和征信數據相似。而且ZestFinance并沒有向征信機構報送數據,主要的原因可能是ZestFinance所用的數據項維度太多,面向特定人群,時效性強,不符合征信機構的數據的通用、成熟、穩定、信用相關性強的特點。

三、對于征信大數據的利用并不僅限于機器學習。人工智能的其它分支、復雜科學、心理測算學都可能是未來利用大數據建模進行信用評估的理論基礎。

四、ZestFinance也面臨著合規性挑戰。由于從事的是金融業務,ZestFinance就需要像其競爭對手(例如傳統銀行)一樣,接受監管。目前美國借貸的監管環境非常復雜,聯邦法律下還有各州的法律并行。所以ZestFinance還在繼續研究監管機構和其他因素扮演的角色,在開展大數據征信的同時努力滿足合規性的要求。

關鍵字:ZestFinance信用評分模型

本文摘自:清華金融

電子周刊
回到頂部

關于我們聯系我們版權聲明隱私條款廣告服務友情鏈接投稿中心招賢納士

企業網版權所有 ©2010-2024 京ICP備09108050號-6 京公網安備 11010502049343號

^
  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 安龙县| 来宾市| 浠水县| 汪清县| 厦门市| 视频| 社旗县| 浠水县| 邓州市| 滨州市| 华宁县| 社旗县| 昔阳县| 泾川县| 长泰县| 洛浦县| 盱眙县| 泸定县| 新民市| 郸城县| 长武县| 大港区| 太谷县| 库伦旗| 远安县| 庆城县| 莫力| 平乡县| 宁德市| 安图县| 姜堰市| 藁城市| 二手房| 吉隆县| 晋江市| 尼玛县| 托克逊县| 铁力市| 望城县| 马龙县| 崇信县|