導讀
互聯網征信業務有很多雷區,比如不能采集敏感的個人信息,數據的安全與透明度,不同機構間數據的交換難題等。此外,騰訊征信、芝麻信用等公司雖具備大量的用戶行為數據,但這些數據與個人的借貸行為關系并不大,因而其建立的模型不一定準確,很難被主流的金融機構引用。
千呼萬喚之后,個人征信業務市場終于放開。1月5日,央行發布了《關于做好個人征信業務準備工作的通知》,要求八家機構做好個人征信業務的準備工作,準備時間為六個月。
這八家機構中,最受關注的入局者是螞蟻金服旗下的“芝麻信用”,以及騰訊旗下的“騰訊征信”。 螞蟻金服和騰訊也表示,將通過海量的在線數據分析,建立模型來判斷用戶的信用程度。
事實上,隨著互聯網金融業務的高速發展,個人征信體系的建設顯得極為迫切。但需要指出的是,盡管互聯網征信將極大地豐富傳統征信數據,又具有實時性,但該系統的建立仍面臨諸多困境。
有業內人士稱,互聯網征信業務有很多雷區,比如不能采集敏感的個人信息,數據的安全與透明度,不同機構間數據的交換難題等。此外,騰訊征信、芝麻信用等公司雖具備大量的用戶行為數據,但這些數據與個人的借貸行為關系并不大,因而其建立的模型不一定準確,很難被主流的金融機構引用。
眼下,這些征信機構尚沒有完整的產品推出,而6個月的準備時間也難有實質性操作。“沒有三五年的數據積累和產品開發,互聯網征信很難有成熟的產品推出。”一位互聯網金融人士告訴21世紀經濟報道記者。
海量數據的煩惱
螞蟻金服方面稱,芝麻信用有著非常廣泛的信用數據來源,日數據處理量在30PB以上,相當于5000個國家圖書館的數據總量,其中包含了用戶網購、還款、轉賬以及個人信息等方方面面的數據。通過分析大量的電商交易及行為數據,芝麻信用可以對用戶進行信用評估,判斷用戶的還款意愿及還款能力,繼而為用戶提供快速授信及現金分期服務。
作為螞蟻金服的子品牌,芝麻信用體系將包括芝麻分、芝麻認證、風險名單庫、芝麻信用報告、芝麻評級等一系列信用產品。
而騰訊的財付通團隊早在2年前就開始推進征信業務的探索,幫助用戶建立個人信用。據悉,騰訊征信將基于騰訊現有的QQ、微信活躍用戶,以及在SNS、門戶、娛樂等眾多領域的群眾基礎,通過海量數據挖掘和分析技術來預測其風險表現和信用價值。
但是,數據量大并不一定是一件好事,因為數據的篩選和清洗是一個非常枯燥復雜的過程。況且,數據量越大,審核維度越多,由此帶來的“數據噪音”也越多,模型越失真。
在P2P平臺“點融網”共同創始人、聯合CEO郭宇航看來,海量的網絡數據意味著互聯網征信機構一是得找到技術非常強的牛人,二是要不斷地試錯。
“美國征信公司FICO針對個人采集了100多個數據維度,但真正納入征信模型的只有十幾個維度。這其中也是經歷了大量的分析運算。”郭宇航稱。
此外,在信息采集的過程中,這些民間征信機構又會面臨諸多限制。
出于對信息安全的保護,2013年1月出臺的《征信管理條例》,對個人信息的采集做了明確的限制:比如禁止征信機構采集個人的宗教信仰、基因、指紋、血型、疾病和病史信息以及法律、行政法規規定禁止采集的其他個人信息。那么,如何在法律許可的范圍內,盡量掌握每個用戶完善、豐富的數據信息,又不侵犯用戶隱私,就變得非常重要。
在郭宇航眼里,法律禁止采集的數據恰恰是能反映個人信用的比較關鍵的數據,這意味著,騰訊征信、芝麻信用等公司必須在大量的“邊緣化”數據的基礎上,通過反復比對和計算,找出一定的規律。
而在隱私保護層面,螞蟻金服相關人士向記者稱,公司在處理用戶數據時會先進行“脫敏”處理,即將數據清洗、加工后再使用。“我們在搜集用戶數據前會先得到用戶的授權,并且對于那些電話、地址等敏感信息,也絕對不會透露出去。”此外,在數據存儲中,螞蟻金服也會對數據進行加密處理,并根據數據的重要程度采取不同的存儲方式。
實際上,民營征信機構眼下在用戶隱私問題上,面臨的壓力還不大。郭宇航坦言,在中國,針對隱私的保護很弱,在互聯網金融領域更是對隱私缺乏實質性的管理。另一廂,一些90后的年輕人本身對隱私的泄露也不是很在意,一些年輕人為了一些優惠券,就能輕易地把自己的手機號、身份證號泄露出去。郭宇航甚至聽說有的用戶會將信用卡號和密碼提供給一個小型APP,只是為了讓這個軟件為其做賬單的整合。
“當用戶自己都不介意隱私的時候,又談何隱私保護呢?”他反問道。
數據的短板
值得一提的是,民營企業開展的個人征信業務能否順利對接央行信用報告的核心數據(如工資收入、社保記錄、信用卡記錄、貸款記錄等),還存在很多不確定性。此前,許多P2P平臺就是由于無法對接央行信用數據,而不得不親力親為地做征信。眼下,騰訊等企業在一定程度上與銀行有競爭關系,要將核心數據共享給競爭對手,對銀行來說并不容易。
假使騰訊征信、芝麻信用等企業拿不到央行的核心數據,那么其信用報告便不太可能被主流的金融機構所引用。由于缺乏金融數據,騰訊等民營機構必須不斷地試錯,再用自己體系內的數據慢慢替代傳統的金融數據。而這一過程,通常需要三五年之久。
以P2P為例,一個信貸周期通常需要1.5-3年,換言之,要摸清用戶的還款情況,民營征信機構必須等上一年半以上。這一結果還需要反復驗證。
況且,央行本身的數據也不完整。目前,我國提供個人征信服務的“正規軍”只有央行征信中心及其下屬的上海資信公司。截至2014年10月底,征信系統收錄1963萬戶企業及其他組織和8.5億自然人信用信息。值得一提的是,有征信記錄的個人大多是與銀行有業務往來的優質客戶,而騰訊等公司的用戶中,有相當多是在央行征信范圍之外的,即“草根”用戶。換言之,央行的征信系統也無法覆蓋主流用戶之外的個人的信用情況,騰訊等公司仍需要親自摸索。
郭宇航指出,騰訊掌握的用戶信息,在網絡營銷推廣方面會比較有效,但這些數據對金融信用的驗證則不那么有用。事實上,利用社交數據來驗證金融信用,在美國也只是剛剛起步。郭宇航在與一些美國同行交流的時候,對方稱社交數據對于驗證欺詐有一定的作用,但在信用評級方面的作用還十分有限。
一個明顯例子是,美國最大的P2P平臺Lending club,曾嘗試通過用戶在Facebook上的表現來確定其信用度,結果遭遇慘痛的滑鐵盧。之后,Lending club轉而向美國征信局這一傳統機構獲得數據,平臺上的壞賬率隨之下降了許多。
“阿里掌握大量的交易信息,對個人信用還有一定價值。而那些瀏覽行為、在線時長、活躍度等,一定是非主流的數據。”郭宇航稱。正因為此,點融網目前的風控人員大多是傳統銀行業出身,用的也是傳統的風險檢驗標準。
這種情況下,互聯網企業出具的信用報告,很多時候對商業機構只能起到較小的輔助作用。拍拍貸CEO張俊此前向記者稱,芝麻信用曾來洽談征信方面的合作事宜,但拍拍貸在驗證芝麻信用的模型后,發現其準確度并不高。
張俊解釋說,數據里缺乏用戶的違約數據,即沒有用戶真實的貸款記錄,因此其模型的精準度大約只有拍拍貸的70%左右。在拍拍貸的風控模型里,用戶的社交數據大約只占8%到9%的權重,消費數據的權重也不到10%。相比之下,用戶的還款記錄、還款行為占到50%到60%的權重。
抵押類P2P企業速貸邦總經理萬劍鈞告訴記者,作為信用報告的需求方,他最看重的信息是用戶之前在民間借貸行為中的不良率和違約率。這一信息是央行征信報告中所不具備的。
“對我們來說,互聯網企業出具的征信報告可以作為傳統征信報告的一種補充,提供過去涉及不到的信息。”萬劍鈞稱,“但互聯網征信報告必須有自己獨特的競爭力,有實打實的評估,而不是去粉飾一些內容。”
他指出,像螞蟻金服試運行的消費信貸產品“花唄”,以及“京東白條”等產品可以捕捉到一些用戶的違約情況,但前期用戶不足,運行時間也較短。一段時間后,它們或許能提供有價值的個人信用信息。相比之下,那些和社交、娛樂相關的數據與金融就不大相關。“我以后會試著用一下互聯網公司出具的報告,再決定是全用,還是部分用,還是增加哪部分數據的比重。”萬劍鈞表示。
合作的困境
除了缺乏金融數據外,純線上采集數據同樣有著無法回避的劣勢。試想一下,如果沒有實地探訪,沒有線下的審核機制把關,單憑身份證和第三方機構出具的報告,哪個銀行或金融機構敢放幾百上千萬的貸款呢?
眾所周知,2014年初,阿里和騰訊都曾計劃與中信銀行合作發行網絡信用卡,但之后被央行叫停。其中,支付寶計劃的授信額度是200起步,沒有上限;而騰訊打算推出的“微信信用卡”,額度分為三個檔次:50元、200元和1000-5000元。
不難發現,網絡信用卡的信用額度非常低,原因之一,就是機構無法在授信前對用戶的風險系數進行詳細、完整、全面的追蹤和評估。換言之,僅僅擁有網上數據遠遠不夠。
對此,螞蟻金服相關負責人告訴記者,芝麻信用可以與外部機構合作,獲取線下數據,或由用戶主動提供線下數據,以此豐富數據的種類。
在此基礎上,芝麻信用的數據偏交易,而騰訊的數據偏社交,其他的6家機構也各有特點。而要讓不同企業之間互相合作,打通數據,似乎又很難做到。
“事實上,美國的三大征信機構都是獨立的第三方機構,且互相之間有合作。但在中國,數據的共享和交換并不現實。”郭宇航指出,“這是因為,考慮到騰訊和阿里的背景,你很難把它們的征信機構當做一個獨立的公允的平臺。”
進一步說,騰訊和阿里“什么都做”,在征信之外有其龐大的主體業務。一旦其他的業務與征信業務產生沖突,外部合作就變得十分艱難。舉例來說,新浪微博雖已式微,但仍擁有大量的用戶行為數據。然而,考慮到阿里第二大股東的身份,新浪微博或許很難和其他征信機構合作。
另一種情況是,假使芝麻信用和騰訊征信與外部的商業機構合作,但外部商業機構與阿里、騰訊旗下的其他業務正好是競爭對手的關系,那么阿里、騰訊又如何平衡好內部的關系呢?外部第三方機構,又如何愿意將核心數據提供給芝麻信用與騰訊征信呢?
而阿里和騰訊本身,對另一方出具的數據報告也可能難以認可。此前,淘寶屏蔽了微信鏈接,微信又屏蔽了快的紅包,之后新浪微博又禁推微信公眾號。如此簡單粗暴的競爭,不斷地上演著。盡管各家企業都高呼“平臺性思維”,但可以預見的是,未來在互聯網征信領域的商戰又會再次上演。
而騰訊征信、芝麻信用出具的征信報告,短期內也很難在更多外部的應用場景中占到主流地位,往往只能在騰訊、阿里各自的體系內發揮效應。