“我不知道你們說的‘征信’是指什么。”2015年7月11日,在“互聯網金融與征信市場發展”的專題討論會上,坐在主持人右手邊的第一位嘉賓、央行征信中心副主任王曉蕾直接講出了她的困惑。在王曉蕾的眼中,目前征信領域的種種創新,和她腦海中的“征信”概念并不相符。
技術的加速發展,使得征信從原本放貸機構之間信息報送和共享的范疇中跳了出來,一躍而至五彩斑斕的生活場景。在當今中國市場,即將發放的個人征信牌照,加速了這個趨勢的到來。互聯網公司背景的征信機構更是將大數據征信作為抓手,希望利用電商、社交、金融交易等廣泛的數據來源,開啟“大數據征信”的嶄新時代。
但在傳統征信人看來,大數據只是工具,生活領域的行為數據對于征信的作用尚待驗證。
盡管存在對“征信”含義的不同理解,但是各界對于中國個人征信領域的廣闊前景抱有高度的共識。在這個新的領域面前,各家民營征信機構可謂“八仙過海、各顯神通”。擺在從業者面前的,不僅是一個萬億元規模的藍海市場,還有中國建設誠信社會的美好藍圖。而中國的征信行業,即將迎來創新大爆炸的時代。
2015年,中國征信元年已經大幕開啟。
“八仙過海”
在王曉蕾參加的那個討論會上,芝麻信用管理有限公司(下稱“芝麻信用”)總經理胡滔也在其中。對于胡滔來說,2015年是其職業生涯的轉折點。年初,她離開了供職多年的招商銀行,加入了螞蟻金服旗下的芝麻信用。巧合的是,在其入職的第二天,1月5日,央行下發了《關于做好個人征信業務準備工作的通知》,要求芝麻信用等八家征信機構做好個人征信業務的準備工作,期限為六個月。
騰訊征信有限公司(“騰訊征信”)、深圳前海征信中心股份有限公司(“前海征信”)、鵬元征信有限公司(“鵬元征信”)、中誠信征信有限公司(“中誠信征信”)、中智誠征信有限公司(“中智城征信”)、拉卡拉信用管理有限公司(“考拉征信”)、北京華道征信有限公司(“華道征信”)等其他七家民營征信機構也在首批發牌的范圍內。目前,六個月的準備期已過。
《財經》記者獲悉,在這六個月的時間里,央行完成了對八家機構的調研驗收。在調研過程中,央行對每家機構都提出了意見,各家機構也在技術體系、法律體系、商業模式、業務規劃方面做了準備。但是截至目前,個人征信業務的牌照尚未下發。
在這八家中,芝麻信用、騰訊征信、考拉征信、前海征信定位于“互聯網+大數據”的征信公司;中誠信征信和鵬元征信的大股東是以企業信用評級業務起家,這兩家主要面向機構提供服務:中智誠征信和華道征信則以反欺詐業務見長。目前,八家征信機構之間的差別主要在于業務側重和數據來源。
其中,最受市場關注的無疑是芝麻信用和騰訊征信兩家。1月28日,芝麻信用首先開始公測,其推出了中國公民個人首個信用評分“芝麻分”。除了快速積累用戶,在公測這段時間,芝麻信用還接入了租車、酒店、簽證等場景,這使得芝麻分應用場景更為廣泛。與此同時,芝麻信用還對征信的數據模型進行了檢驗。
“芝麻分”只是芝麻信用整體業務的冰山一角。未來,芝麻信用希望通過共享其技術能力,一方面為合作機構提供征信服務;另一方面,可以借助阿里系在大數據和云計算方面的優勢,與更多的合作伙伴在數據共創的基礎上,挖掘數據中所包含的信息,并針對每一個行業提供具體的解決方案。
與芝麻信用采取評分的方式不同(注:芝麻信用分最低350分、最高950分、分數越高代表信用程度越好),騰訊征信將采用星級標注的方法來評價個人信用,最高為7顆星,5顆星以上就算優秀。
基于騰訊多年在社交領域上的積累,騰訊征信未來的業務將集中于金融反欺詐和個人信用評價兩個領域,而社交數據是其有別于其他征信機構重要的數據來源。
騰訊征信總經理吳丹表示,騰訊征信主要的服務對象是個人和金融機構,通過征信,個人用戶未來在租車、婚戀、網購、酒店里都享受更快捷的服務。另一方面,有信用評級的客戶可以更方便地得到貸款。
雖然高信用評分可以為個人帶來各種生活便利,但是征信說到底是為了放貸機構貸款服務。因此,征信機構的主要客戶仍是商業銀行、互聯網金融企業、P2P網貸平臺、消費金融機構等事實上從事放貸的機構。
很多公司也對第二批個人征信牌照躍躍欲試。比如,國內知名的電商京東就于近日宣布入股美國新興的大數據征信公司ZestFinance,以期在大數據征信領域進行技術和人才儲備。
根據媒體報道,除了京東金融以外,百度金融、小米、快錢、宜信等企業也有意競逐第二批征信牌照。此外,北京安融征信、拍拍貸等機構也表現出了對牌照濃厚的興趣。有消息稱,目前已經有30多家企業有意申請第二批征信牌照。
大數據征信之辯
“征信”的英文對應單詞是CreditReporting或者CreditSharing,可以理解為信用報告或者信用分享,這種報告和分享的需求最早來自于放貸機構,它們在放貸之前需要了解借款人的信用狀況,而征信中心就是這樣一個信息交流和共享的平臺。
從1992年到2006年,在央行的主導下,中國逐漸建立起來全國統一的企業和個人征信系統。它基本覆蓋所有征信機構、覆蓋了每一個有信用活動的企業和個人。目前,這個征信系統已經成為我國重要的金融基礎設施。
2013年,國務院發布了《征信業管理條例》,《條例》的公布為中國征信業的發展奠定了法治的基礎。《條例》對從事個人征信業務的征信機構和企業征信業務的機構規定了不同的設立條件,前者采用審批制,后者采用備案制。
央行個人征信中心在數據的覆蓋面上也有不足之處。目前個人征信中心的數據,主要是放貸數據,對于那些沒有貸款記錄的人,征信中心并沒有數據,從這個角度上說,很多互聯網征信機構都將自己定位為央行征信中心的有益補充。
新技術給了新興民營征信機構新的發展契機。目前,大數據和云計算已經被廣泛地應用在了包括征信在內的各個金融領域,這有望給征信業帶來新的變化。從更大的背景來看,一個以數據驅動經濟的DT時代正在悄然到來。
芝麻信用總經理胡滔對此深有感觸。原本在銀行工作的她,深知銀行支持小微的痛處。由于沒有可用的數據和技術,首次放貸只能采取線下盡職調查的方法,但是這種方法成本太高。即便如此,也沒有辦法確定客戶還款的概率。事實上,解決這個問題的初心,也是促使其來芝麻信用的原因之一。
也有業內觀點指出,互聯網征信機構都在片面強調自己手頭上有的數據,這難免有王婆賣瓜之嫌。在他們看來,目前很多數據模型中“只有X、沒有Y”。換句話說,就是只分析行為,卻忽視了數據分析的效果。
在7月9日于北京舉行的“2015銀行業發展論壇”上,中智誠征信CEO李萱就表示,沒有任何一個機構,包括國內的和國外的能用純互聯網的數據,做出來個人征信的評分。
一個核心的問題隨之而來,生活場景的行為數據多大程度上可以為征信所用?換句話說,一個人在生活場景中的行為與他在金融場景的還款行為是否具有一致性?生活場景數據是否能判斷一個人的還款能力和還款意愿?
芝麻信用首席數據科學家俞吳杰說,在公測之前,芝麻信用對于這個問題也沒有底,但半年的實踐表明,生活場景數據和金融場景數據有非常強的一致性。比如在租車領域有不良表現的用戶,在金融領域上也通常會有逾期。在他看來,雖然征信機構做的是對用戶在經濟信用上的風險識別,但最終的本質還是刻畫人性。
甚至社交數據的有效性也可能會超出預期。
“社交數據有沒有用對我們已經不是問題了。”騰訊征信總經理吳丹說,騰訊征信開發的模型能夠證明社交判斷信用的能力強過傳統支付行為。
“舉個例子,如果我們借五千、一萬塊錢,現在這套風險評估的方法非常有用,如果我們只借兩百、三百、五百塊錢,沒有太多人會覺得我會真正還不起這些錢,但這個時候仍然會發現有很多沒有及時還款的。”吳丹表示,如果加入社交方面的考慮,對模型效果會有20%以上的提升。
先行一步的芝麻信用在總結公測數據后發現,用戶的芝麻分越高,其貸款的違約率也就越低,二者呈現單調、線性的關系,這初步證明了芝麻分在信用評分上的有效性。
技術決勝
這僅僅只是一個開始。面對海量的數據,技術能力是各家機構決勝的關鍵。各家在人才、技術和資本上的比拼已經展開。
芝麻信用130多人的團隊中,數據和技術團隊占比超過三分之二。目前,其團隊主要由數據科學家、國外征信公司華人精英和本土培養的數據技術和風險管理人才等三部分構成。
在胡滔看來,芝麻信用最為核心能力在于三點,一是具有充分的數據源;二是在數據源完善情況下的建模能力,即在海量的數據中利用算法找到核心變量、揭示規律的本領。前兩點可以歸納為大數據的能力;三是云計算的能力。因為云計算一方面提供了更為強大、靈活、可拓展的計算能力。另一方面,又使得芝麻信用能夠在云端更便利地與合作機構交互。
未來,各家征信機構的數據來源都將更加豐富。特別是一些線下采集的、來自政府等機構的數據將陸續接入。以芝麻信用為例,目前,其除了有阿里系數據、個人身份特征數據、合作伙伴數據之外,還在支付寶9.0版本中,新增了用戶上傳信用資料的功能。
而由拉卡拉發起設立的考拉征信則希望通過采用引入股東的方式,獲取股東所留存的數據,并成為征信領域中類似“銀聯”這樣的機構。有平安背景的前海征信在數據來源上,則有來自平安系內部、合作伙伴、用戶上傳和外部網絡公開獲取的數據。
數據之上還要有算法。面對如此龐大的數據,如果沒有算法,數據就可能是廢料。對于征信機構來說,傳統和主流的算法是邏輯回歸,而前沿的方法則包括決策樹、隨機森林、神經網絡等。運行算法要有強大的數據處理和計算能力作為保證。很多的數據交叉比對,就是靠機器和數據跑出來的。比如,要考察一個有家庭責任感、又同時經常愛心捐助人的信用水平,就要靠這兩個因子進行組合驗證運算,而更多的情況下,變量不止兩兩組合,這就要求更復雜的運算。
但征信的過程還不止于此。對于眾多的大數據征信機構來說去,在此基礎上,其還要經歷一個與各個合作伙伴一起的數據共創,只有這樣,才能更好地運用數據,并從數據中獲得知識、尋找行業規律。
有業界人士將大數據的來源比喻成礦石,挖掘數據就像從礦石中提煉金屬元素(比如金或者銅),在這個過程中需要云計算所提供的大數據分析能力,但在這個過程結束之后,得到的東西仍然還不是最終產品。如果想要數據指導實踐的話,還需要靠各個公司的業務模型將其落地,就好比將礦山中提煉出的金屬最終變成合金,最后的一步還是要看各個機構的看家本領。
廣發銀行信用卡中心決策管理總經理龍雨表示,銀行內部都會有一套比較嚴謹的評級機制,外部的征信可能變成銀行內部評分的變量或者決策的節點,銀行不會單純因為一個人外部評分高就作出信貸決策,但外部的評級會增加銀行考察客戶的維度,為信貸決策提供重要的參考。
如何保護隱私?
大數據對人們的畫像越來越精確,隱私保護的問題也愈發迫切。
央行征信中心副主任王曉蕾在2015年上海新金融峰會上表示,從整個中國來講,一方面,從信息來源、數據加工處理方式還是對外服務范圍來講,征信突破了最傳統、最狹義的征信范疇。另一方面,個人數據保護的問題也非常迫切。
在可見的未來,數據將是每一個個人和機構最有價值的資產。然而,對于這個資產的歸屬和定性卻仍然存在著模糊的地方。甚至包括在多大程度上能夠使用這個數據,仍然存在著模糊地帶。
近期阿里云發布的《數據保護倡議書》提供了一個看待問題的視角,《倡議書》寫道,任何運行在云計算平臺上的開發者、公司、政府、社會機構的數據,所有權絕對屬于客戶,客戶可以自由安全地使用、分享、交換、轉移、刪除這些數據。也就是說,數據的最終所有權是屬于用戶的。
央行征信中心副主任王曉蕾建議,應當把個人和其所產生的數據分割開來。當個人所產生的數據不和他本人“掛鉤”的時候,這個數據就成為了整個社會的資源和財富。但是,如果要把個人產生的數據跟本人“掛鉤”的時候,則一定要尊重他本人的意愿,這就是所謂“同意原則”。
《征信業管理條例》規定,除依法公開的個人信息外,采集個人信息應當經信息主體本人同意,未經同意不得采集;向征信機構提供個人不良信息的,應當事先告知信息主體本人;征信機構對個人不良信息的保存期限不得超過五年,超過的應予刪除;除法律另有規定外,他人向征信機構查詢個人信息的,應當取得信息主體本人的書面同意并約定用途,征信機構不得違反規定提供個人信息。
《征信業管理條例》還對數據的采集進行了限制,比如不允許采集宗教信仰、基因、指紋、血型、疾病和病史等信息采集。而對于大數據在征信領域的使用,美國的監管者也正在討論,讓所謂的數據控制者,符合個人信息保護、個人權利保護等的監管要求。
騰訊征信宣布不會使用用戶任何內容方面的信息,包括聊天記錄、發送的圖片等,其原則是不使用用戶任何敏感、涉及隱私方面的信息。
中國銀行資深研究員王永利撰文指出,巨量的信息中也有“廢料”,無論個人還是機構信息,涉及的地域、領域越廣,“廢料”也就可能越多。倘若每家民間征信機構各自為營地處理信息,很可能出現最終產品不符合經濟、社會總體發展的情況。因而,成立并完備國家級征信信息中心這一機構的重要性,再次凸顯。
王永利建議國家從統籌整個社會信息的角度出發,盡快建立起統一的公民身份信息采集標準,避免各機構數據在后期加工時遭遇技術瓶頸。并且,應該在此前提下構建出公民身份的認證和信用體系。
芝麻信用總經理胡滔表示芝麻信用從信息的調用、運算、應用等方面全方位全流程保護用戶個人隱私安全,為隱私數據設置防火墻。同時認為監管在保護用戶隱私和提高數據使用效率上做出了積極的平衡,一方面避免大數據可能導致的對個人隱私的破壞,另一方面也避免讓數據成為“孤島”。