大數據資信評估拓展了信用信息的內涵,豐富了信用信息的內容,提高了資信評估的決策質量,降低了傳統資信評估的數據門檻,彌補了傳統資信評估市場的不足。大數據資信評估市場空間巨大,最終會占據主導地位,但會加劇該市場的壟斷性。本文主要結合企業信用評級和個人信用評分探討大數據對傳統資信評估的影響,這對于推進中國評級市場和征信市場的跨越式發展,完善社會信用體系具有非常重要的理論意義與實踐意義。
1830年,英國倫敦第一家現代征信機構的出現標志著資信評估行業的誕生。到20世紀初,資信評估行業逐漸形成了信用評級和征信兩大相對獨立的分支。前者主要服務于資本市場,如美國的標普、中國的大公國際等公司;后者主要服務于借貸市場,如美國的FICO公司、中國的中國人民銀行征信中心等機構。從1830年到21世紀初,資信評估行業基本上可以劃分為20世紀中期之前的前電子化資信評估和之后的電子化資信評估兩個階段。為便于對比分析,接下來本文將電子化資信評估定義為傳統資信評估,將目前依托大數據的資信評估簡稱為大數據資信評估,如Zest Finance、Kreditech、Wecash閃銀等公司均是采用大數據資信評估。資信評估對于揭示經濟金融市場中的信用風險,提高資源配置和金融市場效率具有十分重要的意義。
大數據是信息時代發展到數字化階段的結果與體現,盡管對于大數據以及大數據時代的定義還存在一些爭議,但是大數據對人類社會、經濟、思想、文化等領域的影響與沖擊則是有目共睹,并且這種影響日益深刻與廣泛[1]。大數據時代的一個突出特征就是信息量及增長速度的飛速提高,同時信息傳輸方式越來越便捷。而揭示信用風險的資信評估正是以信用信息為加工和分析的載體,當前大數據對傳統資信評估尤其是在企業信用評級和個人信用評分方面產生了巨大的沖擊。
一、拓展了傳統資信評估的信用信息基礎
(一)拓展了信用信息的內涵
信用信息指反映或描述信用主體信用狀況的相關數據和資料等,主要包括政府信用信息、企業信用信息和個人信用信息。在傳統資信評估中,企業信用信息主要指資產負債信息、經營信息等,個人信用信息主要指銀行記錄以及負債等信息(見表1)[2]。無論企業還是個人,財務信息都在傳統資信評估中居于核心地位。而大數據資信評估中,信用主體的任何信息都是信用信息,如客戶屬性、網上交易記錄、網上信用評價、網上交易習慣、社交網絡信息以及財務信息等。信用信息的范圍和類型沒有邊界,財務信息不再是最主要的部分,只是信用信息的一部分,甚至是很小的一部分。以Zest Finance為例,傳統信用數據最多占30%~40%。相反,許多傳統資信評估排除在外的信息,反而成為重要的信用信息,如拼寫習慣、設備終端品牌,填寫問卷的時間、瀏覽網絡的時段、輸入差錯頻率、手機的使用情況和位置數據等。信用信息內涵的無限制拓展全方位改變了傳統資信評估的運行模式,這也是大數據資信評估不同于傳統資信評估的最基本前提。
表1:FICO公司個人信用評分參考的主要因素及比重
息類別 | 內容 | 評分比重 |
償還歷史 | 各種信用賬戶的還款記錄;公開記錄及支票存款記錄;逾期償還的具體情況 | 35% |
信用賬戶數 | 30% | |
使用信用的年限 | 15% | |
新開立的信用賬戶 | 新開立的信用賬戶數;新開立的信用賬戶賬齡;目前的信用申請數量;貸款方查詢客戶信用的時間長度;最近的信用狀況 | 10% |
正在使用的信用類型 | 信用賬戶類型;每種類型的信用賬戶數 | 10% |
資料來源:根據FICO公司網站信息等整理。
(二)拓展了資信評估信用信息的內容
1.拓展了信用信息的來源
傳統資信評估的信用信息來源主要是以銀行為主的金融機構,如私營商業銀行、上市商業銀行、開發銀行、信用合作社、財務公司、信用卡發卡公司、貸款公司等,另外也有部分公用事業單位。因此,其信用信息主要是金融交易記錄信息,這一點在中國人民銀行征信報告中體現得也非常明顯。而大數據資信評估的信息來源比較廣泛,除了通過征信機構獲得傳統資信評估信息以外,主要借助現代通信技術,從社交網絡、電商網絡、移動終端等獲得各種信用信息[3],并且這些網絡來源的信息量非常大。
2.擴展了資信評估的參考變量
美國FICO信用評分指標不超過50個,一般包含15~20個變量,當前中國人民銀行的個人信用報告也包含20個左右的變量。而美國的Zest Finance公司進行信用評估時,采集貸款人1萬多條信息,最后遴選出7000條指標變量;德國的Kreditech,采集15000多個數據點;中國的Wecash閃銀軟件,采集用戶的6000個數據點。
3.增加了信用信息的數據類型
根據存儲特征,可以將數據分為結構化數據、非結構化數據。結構化數據具有一定的邏輯結構和物理結構,一般存儲在數據庫中,大多存儲在關系數據庫中。結構化以外的數據即為非結構化數據,大多以文本的形式存在,不能存儲到數據庫中,而非結構化數據中,有一部分又具有一定的邏輯結構和物理結構,如HTML、XML中的一些數據,即屬于半結構化數據。傳統信用信息對應的數據基本是結構化數據,可以用二維表描述,而大數據時代的信用信息大多是非結構化數據,難以用傳統的數據庫儲存[4],這就使得大數據資信評估的數據分析手段與傳統資信評估區別較大(見表2)。
表2:傳統資信評估與大數據資信評估在信用信息上的比較
傳統資信評估 | 大數據資信評估 | ||||
內涵 | 以資產負債類信息為主 | 一切信息都是信用信息 | |||
來源 | 私營商業銀行、上市商業銀行、開發銀行、信用合作社、財務公司、信用卡發卡公司、貸款公司、零售商、公用事業單位等 | 社交網絡、電商網絡、移動終端、征信機構 | |||
數量 | 數量有限 | FICO評分只有 15~20條變量 |
數量很多 | Zest Finance | 10000多條信息 |
Wecash閃銀 | 6000個數據點 | ||||
Kreditech | 15000個數據點 | ||||
類型 | 以結構化數據為主 | 以非結構化數據為主 |
資料來源:根據Zest Finance公司網站等資料整理。
二、優化了資信評估的決策過程
(一)數據分析從邏輯回歸到機器學習
無論企業信用評級還是個人信用評分,傳統資信評估的技術手段側重于對抽樣的計量回歸分析,尤其是正態分布假設下的線性回歸,因為傳統信用數據多是橫截面數據、時間序列數據和面板數據等結構化數據。而大數據資信評估所面對的信息量非常大,并且大多是非結構化數據,這就決定了其資信評估的技術手段側重于機器學習,以全樣本為對象進行如因素分析、判別分析、分群分析、決策樹、類神經網絡以及規則歸納等。而且大數據資信評估對計算機的運算能力要求和依賴程度非常高,如在Zest Finance公司,Hilbert模型中有7000多條變量,75%依靠計算機處理,只有25%依靠人工干預。另外,數據分析的目的也更加體現實用性、可操作性。傳統資信評估的計量分析側重于假設檢驗,包括參數檢驗,而大數據資信評估數據分析的目的以預測為主,包括具體數值的預測和場景預測。[4]
(二)提高了資信評估的決策效率
上述數據分析技術手段變革的結果之一,是資信評估的時間成本大大降低。以Wecash閃銀為例,5000元人民幣以內的微授信在借款人登錄和提交資料以后,10分鐘內可以完成授信決策,借款人可以即刻提現;50萬元以內大額授信需2~3個工作日可以提現。而Zest Finance對借款人的上萬條數據分析在5秒鐘內全部完成。Kreditech從各種公開來源的信息判斷借貸者欺詐、欠賬與及時還款的可能性只需35秒,15分鐘之內完成貸款發放。而在傳統資信評估最頂尖的FICO評分中,完成抵押貸款的審批需要0.5個至2個工作日,汽車貸款在1小時左右,小額消費信貸需要15分鐘。其決策時長遠遠高于大數據資信評估。
大數據資信評估的另一個優勢就是申請人可以隨時借助互聯網終端進行申請信貸,不受時間與設備的限制,而傳統資信評估需要一些現場操作,并主要局限在工作日和工作時段(見表3)。
表3:大數據資信評估的決策時間
授信決策時間 | 提現時間 | 申請時間 | |
Wecash閃銀 | 10分鐘 | 2小時~3個工作日 | 隨時 |
Zest Finance | 5秒鐘 | 15分鐘 | 隨時 |
Kreditech | 35秒鐘 | 15分鐘 | 隨時 |
Avant Credit | 3分鐘 | 即刻提現 | 隨時 |
資料來源:根據上述公司網站等來源信息整理。
三、引起了資信評估行業的深刻變革
(一)突破了傳統資信評估的數據門檻
進入傳統資信評估行業的數據門檻體現在兩方面:一是數據庫規模要足夠的大。這是由信用信息的成本收益特征決定的。比如益佰利公司擁有全球4億家企業和1.3億家庭及個人的信用信息,環聯公司擁有2.2億個消費者的信用信息,鄧白氏公司擁有全球2億多家企業的信用信息[5]。二是數據分析模型的準確性高,能經受住市場的檢驗。傳統資信評估不僅在橫向上需要有足夠大的數據庫規模支撐開發資信評估模型,而且在縱向上需要數據庫有足夠長的時間跨度以檢驗校正資信評估模型,以建立一個較高違約預測準確度并且比較穩定的資信評估模型。所以,盡管一些發展中國家建立公共征信機構,依托行政力量可以在較短的時間內建立龐大的信用數據庫,但是很難在短時間內開發出能經受市場檢驗的資信評估模型。如果資信評估模型的準確度不高,則無法建立良好的市場聲譽,沒有良好的市場聲譽,資信評估機構也就沒有市場。
大數據資信評估分別借助網絡平臺、機器學習突破了上述兩大限制。第一,借助網絡平臺,大規模獲取客戶信用信息,短時間內建立一個龐大的數據庫規模。以Zest Finance為例,通過第三方組織、訪問互聯網系統,如個人社交賬戶等可以從多領域、多機構獲取和整合個人信用信息,再加上客戶提交的數據,大數據資信評估公司可以在非常短的時間內建立一個非常完整的而且極其詳細的個人信用資料庫(見表4)。Zest Finance公司從2012年至今至少積累了10億條個人信用信息,速度非常快、規模非常大。第二,通過機器學習、數據挖掘建立了比較準確的信用評估模型,大大加快了市場聲譽積累的時間過程。如Zest Finance比傳統評分方法的違約率下降了40%。又如中國的金電聯行2007年成立,截至2014年第一季度,通過大數據資信評估,已累計為1000多家企業提供超過40億元的信用融資,最高授信達6800萬元,截至目前未發生一筆不良貸款。正是由于其準確的違約預測,大數據資信評估公司市場發展非常迅速。
表4:Zest Finance的數據獲取渠道
第三方數據 | 傳統信貸數據、搬家次數、司法記錄 |
用戶提交的數據 | 電話賬本、水電煤氣賬單、調查問卷 |
互聯網數據 | IP地址、網絡行為、社交行為 |
資料來源:根據Zest Finance網站等信息整理。
(二)彌補了傳統資信評估市場的不足
在服務的客戶群體上,大數據資信評估主要針對信用不良以及缺乏信用記錄的群體。由于傳統資信評估主要依托財務信息,尤其是銀行信貸信息,所以其主要客戶是擁有銀行信貸記錄并且信用良好的群體。以美國為例,評分高于650分的群體在向大銀行融資時主要借助傳統資信評估,而低信用評分的群體由于很難從大銀行機構融資,因此也很少應用傳統資信評估。但大數據資信評估主要針對低評分群體。如Zest Finance主要針對的是FICO評分低于500分的群體,Avant Credit主要針對FICO評分低于600分的群體。盡管一些大數據資信評估公司定位為任何人提供服務,但是目前主要的服務群體仍然集中在信用記錄缺乏乃至不良的群體。
在服務的金融市場上,大數據資信評估主要針對的是小額信貸,并且期限較短。傳統資信評估大多集中在額度較大、期限較長的信貸市場,如汽車貸款、住房貸款參考FICO評分定價后,可以發放高達上百萬元長達數十年的信貸。而大數據資信評估主要針對小額度、短期信貸。如Wecash閃銀分別發放6000元以內微授信和6000~500000元的大額授信兩個檔次2~18期的貸款,Avant Credit發放100~1000美元,1~4年期的貸款(見表5)。
表5:大數據資信評估的服務特征
公司 | 服務群體 | 提供的金融服務 | 還款期 |
Wecash閃銀 | 任何人 | 6000元內、6000~50萬元 | 2~18期 |
Zest Finance | 低于500分,10萬美國人 | - | - |
Avant Credit | 中產階層、信用評分低于600分 | 100~1000美元 | 1~4年 |
Kreditech | 任何人都可以,包括沒有信用評分的人,市場已經擴展到8個國家 | 小額貸款、分期付款、虛擬信用卡、一般信用卡 | - |
資料來源:根據上述公司的網站等信息整理。
注:以上數據均截至2014年12月。
(三)延長了傳統資信評估行業的產業鏈
大數據資信評估與互聯網金融合二為一,信息征集、資信評估、銀行信貸三者合一。傳統資信評估公司的信息征集、信用評級、信貸融資業務通常分別由不同的公司獨立經營,如在美國,300多家小征信公司以及三大征信公司從事個人信用信息征集,FICO公司從事個人信用評分業務,銀行利用FICO評分從事信貸融資業務。而從事大數據資信評估的公司,集信息征集、數據分析、資信評估、信貸融資于一體,大大延長了傳統資信評估的產業鏈條,改變了傳統資信評估行業的產業形態。甚至部分大數據資信評估公司,在發展戰略上以替代銀行為目標,如Kreditech在2014年已經開始發行信用卡。
四、大數據資信評估的評價
(一)市場空間巨大
目前,德國73%的人群享受不到銀行服務,美國有4400萬人沒有銀行信用記錄,全球有25億成年人沒有得到過正規金融服務,有40億人沒有信息記錄和信用評分[6]。這些人群都是大數據資信評估的首要目標市場。如果這些人群沒有登錄互聯網,這些人群只能是潛在的市場。所幸的是,全球網民數量快速增加。根據市場研究公司eMarkete的研究,2015年全球網民逼近30億,2018年將達到36億,占全球人口的50%。從某種程度上說,網民有多少,大數據的市場規模就有多大。依據當前的貸款利率,大數據資信評估公司擁有非常豐厚的利潤收入,Avant Credit信用貸款的年化利率高達397%,遠遠高于正規金融的貸款利率水平。
(二)將逐漸替代傳統資信評估的主導地位
大數據資信評估以彌補傳統資信不足為切入點進入市場,在最近3~7年,如上文所述,大數據資信評估將與傳統資信評估并行不悖,相互補充。但是,著眼未來,大數據資信評估將替代傳統資信評估的市場主導地位。原因如下:第一,從大數據資信評估公司成立2年來的融資速度與規模看,傳統資信評估市場將很快被大數據資信評估占領。中國的Wecash在2014年8月獲得IDG資本4000萬元人民幣的融資[7];截至2014年12月,美國的Zest Finance公司,已經獲得3輪、累計1.12億美元的融資,業務范圍橫跨美英兩國[8];截至2014年6月,德國的Kreditech公司已經獲得2輪、累計1500萬美元的融資,還在波蘭、西班牙、捷克及俄羅斯等8個國家開展業務(見表6)。第二,從業務范圍看,大數據資信評估提供的服務產品逐漸覆蓋傳統資信評估。如德國的Kreditech公司目標客戶定位為所有群體,并且其融資產品已從小額貸款、分期付款擴展到虛擬信用卡、一般信用卡。傳統資信評估的市場在未來10年左右將被大數據資信評估占領。
(三)資信評估市場將更加壟斷
大數據資信評估雖然打破了傳統資信評估的數據門檻,但是其技術進入門檻更高。由于其依托機器學習、數據挖掘處理數據,使得其對計算機載體及后臺人力資源有更高的要求,也需要巨額的資本投資。大數據資信評估與融資市場結合在一起,融資市場的進入門檻將會提高大數據資信評估的行業進入難度。因此,資信評估行業的進入門檻將會更高。較高的市場進入門檻會導致資信評估市場更加壟斷,而不是提高競爭。Kreditech公司成立2年就已經擴展到8個國家,并且還在不斷地擴張市場。可見,大數據資信評估公司具有非常強的市場擴展傾向,必然導致更高程度的壟斷。
表6:部分大數據資信評估公司的融資概況
公司 | 成立時間 | 注冊地點 | 融資額 | 融資時間 | 投資方 |
Wecash閃銀 | 2013年 | 中國北京 | 4000萬人民幣 | 2014年8月 | IDG資本 |
Zest Finance | 2012年 | 美國洛杉磯 | 7300萬美元(其中2300萬股權、5000萬債務) | 2012年1月 | Matrix Partners, Victory Park Capital等 |
2000萬(累計1.12億美元) | 2013年8月 | Pay Pal聯合創始人Peter Thiel | |||
Avant Credit | 2012年 | 美國芝加哥 | 3400萬美元(其中900萬股權,2500萬債務) | 2013年5月 | |
2000萬美元 | 2013年8月 | Tiger Global Management、August- | |||
2.25億美元(截至目前,融資規模已達10億多美元) | 2014年12月 | Capital、Peter Thiel | |||
Kreditech | 2012年 | 德國漢堡 | 800萬 | 2012年 | Samwer兄弟、Blumberg Capital |
700萬美元(累計1500萬) | 2013年9月 | 歐洲基金Kreos Capital |
資料來源:根據互聯網等來源信息整理。
(四)帶來了理論與實踐上的挑戰
第一,在理論上,信息不對稱理論面臨挑戰。以往的經典經濟學理論中,信貸市場中的借款方是代理方,擁有私人信息優勢,而貸款方是委托方,處于信息劣勢,面臨借款人的道德風險和逆向選擇。但是在大數據資信評估中,不但借貸雙方的信息不對稱問題幾乎消除,甚至委托方與代理方的地位發生逆轉。在大數據背景下,借款方的許多私人信息,如上網行為信息,可能借款方都沒有注意到,但是已經為貸款方所收集和掌握,并加以分析。在這一過程中,似乎借款方成為委托方,貸款方成為代理方。經典的信息不對稱理論如何解釋這一現象,如何提出相應的規制對策是一個十分重要的理論問題。第二,在實踐上,金融監管機制應如何調整。大數據資信評估首先與普惠金融結合,繼而沖擊商業銀行系統乃至整個金融系統,這將對傳統貨幣政策工具的傳導機制產生影響。作為金融監管當局該如何調整金融監管機制是一個非常具有挑戰性的問題,尤其是在大數據資信評估迅速發展的背景下。
作者,河南大學經濟學院 耿得科 中國地質大學人文經管學院 梁文