這兩年,互聯(lián)網(wǎng)金融的成長速度讓傳統(tǒng)金融這個(gè)向來不可一世的巨人也不禁打了個(gè)冷戰(zhàn)。倒不是因?yàn)榛ヂ?lián)網(wǎng)金融業(yè)務(wù)的規(guī)模真的威脅到了傳統(tǒng)金融,而是伴隨它而來的這股創(chuàng)新力量讓傳統(tǒng)金融行業(yè)中存在的問題和局限性暴露無余。所幸,已經(jīng)有一些人開始意識到問題的緊迫性,當(dāng)然,還有問題背后所蘊(yùn)藏的巨大機(jī)遇。
Joyce Zhang就是這些人中的一個(gè)。Joyce是宜信的CEO唐寧從美國挖來的一位資深大數(shù)據(jù)專家,現(xiàn)在擔(dān)任宜信大數(shù)據(jù)創(chuàng)新中心的總經(jīng)理。在來宜信之前,Joyce曾經(jīng)服務(wù)過Hulu、Microsoft等公司,主要負(fù)責(zé)的是基于大數(shù)據(jù)的推薦引擎、搜索平臺、廣告精準(zhǔn)投放等技術(shù)系統(tǒng)的開發(fā)。Joyce說:“一直想做些跨界的事情,而金融與大數(shù)據(jù)結(jié)合后會有很多可能性,這些可能性讓我充滿期待。”
問題出在哪兒?
目前,互聯(lián)網(wǎng)金融的體量還非常小。以P2P網(wǎng)貸業(yè)務(wù)為代表,截至11月其規(guī)模為2450億,而傳統(tǒng)金融行業(yè)擁有的資產(chǎn)卻是百萬億的量級。雖然在規(guī)模上的沖擊幾乎可以忽略不計(jì),但這幾千億的背后卻是傳統(tǒng)金融不曾服務(wù)到的那些小微人群。當(dāng)金融開始走向普惠,問題也隨之暴露出來。金融的本質(zhì)在于通過風(fēng)險(xiǎn)管理實(shí)現(xiàn)資本價(jià)值,可傳統(tǒng)金融的征信手法卻不能完全滿足互聯(lián)網(wǎng)金融業(yè)務(wù)的風(fēng)控需求,這既包括覆蓋人群的局限,也包括風(fēng)控手段上的局限。我國缺失多年的社會信用體系正在加速現(xiàn)形。來看看下面幾點(diǎn):
1、在央行有征信記錄的人不足全國人口1/4
按照央行最新數(shù)據(jù),目前央行征信系統(tǒng)中共有8.4億人,但其中有實(shí)際征信記錄的只有3.2億人。也就是說,全國13億多人口,有5億人在征信系統(tǒng)中只是一個(gè)身份證號碼,還有5億人完全不在系統(tǒng)內(nèi)。有征信記錄的人只占到全國人口數(shù)的23.7%,遠(yuǎn)低于美國征信體系對人口的85%的覆蓋率。而在P2P蜂起之前,很多人并沒有注意到這件事。
2、央行征信中心的數(shù)據(jù)不是你想用就能用
目前,可以接入央行征信中心的金融機(jī)構(gòu)有銀行、持牌照的第三方征信服務(wù)商以及部分地區(qū)的小貸公司(第一批于6月在上海獲批),P2P平臺尚沒有接入資格。這無疑將加大P2P平臺的風(fēng)控難度。不僅如此,P2P平臺上的貸款人信息也不能被錄入央行征信系統(tǒng),各家P2P成了一個(gè)個(gè)信息孤島,他們手中信用數(shù)據(jù)的價(jià)值也得不到充分開發(fā)。
3、傳統(tǒng)征信手段存在諸多局限
在數(shù)據(jù)范疇上,傳統(tǒng)征信數(shù)據(jù)來自于借貸領(lǐng)域,最典型的就是信用卡消費(fèi)記錄,這就大大限制了征信數(shù)據(jù)的來源。 在征信思路上,傳統(tǒng)征信是用昨天的信用記錄來判斷今天的信用價(jià)值,這未見得就是最合理的思路。在征信技術(shù)上,傳統(tǒng)的方法是從線下采集信用數(shù)據(jù),即使在P2P網(wǎng)貸業(yè)務(wù)中,也只能暫時(shí)照搬這套方法。
來看看目前國內(nèi)P2P平臺的征信邏輯:先考慮用戶的數(shù)據(jù)拼圖里需要哪些資料,能夠電子化獲取的就電子化,不能做到的,就讓用戶自主上傳,然后通過其他線上或線下手段驗(yàn)證。目前,以有利、積木盒子等為代表的與線下小貸公司或擔(dān)保公司合作的 P2P 網(wǎng)貸平臺更多是通過合作的小貸公司或擔(dān)保公司來獲取借貸人的征信數(shù)據(jù),主要是電話征信和實(shí)地考察征信,這都是傳統(tǒng)金融機(jī)構(gòu)的風(fēng)控方式,效率比較低。當(dāng)然,也有積極踐行線上征信的P2P平臺,比如宜人貸、拍拍貸。可以說,傳統(tǒng)的線下征信技術(shù)限制了數(shù)據(jù)來源和信用評估思路,而互聯(lián)網(wǎng)的技術(shù)、工具和思維具備了改變這一切的可能性。
其實(shí),信用數(shù)據(jù)不僅僅是應(yīng)用在金融領(lǐng)域中,生活中各種涉及履約的場景都需要人們的信用數(shù)據(jù)。在一個(gè)成熟的信用社會中,人們的每一項(xiàng)商業(yè)行為都應(yīng)與他的信用數(shù)據(jù)相掛鉤,從而形成一個(gè)信用數(shù)據(jù)的良性循環(huán)。也正因?yàn)槿绱耍芏嘣诿绹龅娘L(fēng)生水起的商業(yè)模式搬到中國來卻無法成功,比如各種短租業(yè)務(wù),其核心問題之一就是國內(nèi)缺乏一套完善的信用評估體系。
宜信“大數(shù)據(jù)金融”的玩法
當(dāng)金融遇上大數(shù)據(jù),這個(gè)缺失已久的信用體系有了搭建的可能性,這也是唐寧成立宜信大數(shù)據(jù)中心的初衷。Joyce將宜信在大數(shù)據(jù)金融上的探索方向描述為“金融云平臺”。
顧名思義,這會是一個(gè)開放的平臺架構(gòu):既能支撐宜信自己的P2P業(yè)務(wù)(比如宜人貸、與eBay合作的商通貸),也能開放給其他生態(tài)合作伙伴,讓這個(gè)生態(tài)中的伙伴們共同建設(shè)、共同受益。
金融知識圖譜是平臺的基礎(chǔ)
金融云平臺擁有一般云平臺的特點(diǎn):分布式存儲、分布式計(jì)算框架、虛擬化環(huán)境,但與一般的云平臺的差別在于,這是一個(gè)基于金融業(yè)務(wù)的云平臺,其中必然包含特定的業(yè)務(wù)邏輯。宜信將風(fēng)控、反欺詐、獲客能力等核心的金融邏輯抽象出來,作為金融云平臺的內(nèi)核。
金融知識圖譜是平臺的基礎(chǔ),在這個(gè)基礎(chǔ)上能長出很多應(yīng)用場景,比如獲客、實(shí)時(shí)授信、產(chǎn)品個(gè)性化推薦、貸后管理等。
知識圖譜這個(gè)概念最早是由Google提出的,是搜索引擎往下一階段演進(jìn)的過程中發(fā)展出來的。這其中包含兩個(gè)方面:實(shí)體的畫像,實(shí)體間的關(guān)系。
實(shí)體的畫像其實(shí)就是我們常說的“用戶畫像”,很好理解。而實(shí)體間的關(guān)系是Joyce特別強(qiáng)調(diào)的一點(diǎn)。原來做用戶畫像時(shí),畫像之間是彼此獨(dú)立的,但這并不符合現(xiàn)實(shí)生活中的場景:人并不是獨(dú)立存在的,人與環(huán)境中的萬物都是有關(guān)聯(lián)的。如果說每個(gè)人是知識圖譜中的節(jié)點(diǎn),那么人與環(huán)境所形成的關(guān)系就是兩點(diǎn)間的線。當(dāng)把“點(diǎn)和線”綜合起來分析時(shí),我們對個(gè)人的性格特征、信用狀況、財(cái)富屬性都會有更深層、更全面的理解。
豐富的數(shù)據(jù)來源是平臺的養(yǎng)分
互聯(lián)網(wǎng)技術(shù)和工具的引入使得數(shù)據(jù)采集從線下逐漸轉(zhuǎn)移到了線上,也使得數(shù)據(jù)體量迅速變大。目前,宜信金融云平臺所采集的數(shù)據(jù)主要是以下幾類:
1、宜信已有的數(shù)據(jù)
宜信在P2P行業(yè)有8年積累,用戶已過百萬。實(shí)際上,只要與宜信有過接觸的用戶,不管是在哪個(gè)環(huán)節(jié)終止了接觸,都被視為宜信的重要數(shù)據(jù)資產(chǎn)。他們有的曾提交過信用報(bào)告、聯(lián)系人信息、教育水平、工資單、銀行流水等一系列傳統(tǒng)征信數(shù)據(jù),有的則僅僅留下了一些搜索和訪問數(shù)據(jù)。
值得慶幸的是,宜信自成立以來便非常重視數(shù)據(jù)的電子化,因此大大減輕了將線下數(shù)據(jù)進(jìn)行數(shù)字化的工作量。不過,宜信業(yè)務(wù)線眾多,Joyce告訴我們,將不同業(yè)務(wù)線里沉淀下來的數(shù)據(jù)打通也是一件很費(fèi)勁的事情。
2、搜索引擎抓取
Zest Finance的CEO Merill認(rèn)為,信貸記錄屬于強(qiáng)變量,而當(dāng)強(qiáng)變量缺失的時(shí)候,就可以參考多種弱變量(比如互聯(lián)網(wǎng)上的行為數(shù)據(jù)),將這些弱變量組合起來也可以服務(wù)于信用評估。
同樣是基于這種思路,宜信自己做了一個(gè)叫做“宜搜”的搜索引擎。在獲得用戶授權(quán)許可的情況下,搜索引擎會抓取用戶在互聯(lián)網(wǎng)上留下的電商購買數(shù)據(jù)、搜索引擎數(shù)據(jù)、社交數(shù)據(jù)等多個(gè)維度的數(shù)據(jù)。除此之外,還有大量散落在網(wǎng)上的公開數(shù)據(jù),這些數(shù)據(jù)也會被宜搜所抓取。這兩類數(shù)據(jù)將通過特定的算法模型轉(zhuǎn)化為信用評估數(shù)據(jù)。
3、來自合作伙伴的數(shù)據(jù)
這里的合作伙伴既包括線上的也包括線下的,不過Joyce并沒有透露現(xiàn)在正在參與合作的公司有哪些。我猜測,線下的合作機(jī)構(gòu)可能包括小貸公司、租車公司、房屋中介等可能產(chǎn)生業(yè)務(wù)協(xié)同的機(jī)構(gòu),線上的合作對象則有更多可能性了,比如各種互聯(lián)網(wǎng)金融服務(wù)商。
有一個(gè)繞不開的問題,那就是如何保證數(shù)據(jù)的真實(shí)性,其實(shí)這是所有的大數(shù)據(jù)分析都會遇到的問題。其實(shí),任何人也無法保證數(shù)據(jù)完全真實(shí)、沒有噪音,可以做的就是對不同的數(shù)據(jù)源進(jìn)行關(guān)聯(lián)和交叉驗(yàn)證。Joyce說:“我們并不是在盲目的追求線上實(shí)時(shí)授信,如果沒有足夠的數(shù)據(jù)來做交叉驗(yàn)證,我們還是會采取線上線下相結(jié)合的方式。”
機(jī)器學(xué)習(xí)是平臺的核心
采集數(shù)據(jù)的目的是通過相應(yīng)的數(shù)據(jù)分析和挖掘技術(shù)輸出每個(gè)人的信用評估結(jié)果。在傳統(tǒng)的數(shù)據(jù)處理領(lǐng)域,分析師們處理的主要是結(jié)構(gòu)化數(shù)據(jù),而如今我們面對的是從網(wǎng)上抓取的大量非結(jié)構(gòu)化數(shù)據(jù),如社交網(wǎng)絡(luò)的評論、用戶上傳的音視頻等。這些數(shù)據(jù)存在于包括文本、圖片、視頻、音頻等眾多的數(shù)據(jù)格式中,其中蘊(yùn)藏的信息需要深度計(jì)算才可以分析出來。這就需要通過機(jī)器學(xué)習(xí)進(jìn)行智能化分析。
根據(jù)過往的業(yè)務(wù)經(jīng)驗(yàn),Joyce團(tuán)隊(duì)會給這個(gè)“挖掘機(jī)系統(tǒng)”預(yù)設(shè)一些規(guī)則引擎(可以理解為一些基礎(chǔ)的算法),引導(dǎo)系統(tǒng)做出一些基本的判斷和決策。比如,沒有收入的人會被直接排除在借款人群之外。
但是,這都是些基礎(chǔ)規(guī)則,而且是基于現(xiàn)有數(shù)據(jù)和經(jīng)驗(yàn)生成的。一旦充入大量新數(shù)據(jù),這些既有規(guī)則引擎則會發(fā)生變化。無論是修訂現(xiàn)有規(guī)則還是獲得新的規(guī)則,都需要通過機(jī)器學(xué)習(xí)來實(shí)現(xiàn)。
當(dāng)然,機(jī)器學(xué)習(xí)是一個(gè)動態(tài)的過程——要通過不斷加大數(shù)據(jù)變量來修正機(jī)器學(xué)習(xí)的模型。只要池子里變量的維度多到一定程度,模型就會趨于穩(wěn)定。舉個(gè)例子,如果你買一支股票,你的收入就全都取決于這只股票的漲跌;但如果你分散投資1000支股票,從統(tǒng)計(jì)學(xué)角度,即使其中一只股票暴跌,也不會對你的整體資產(chǎn)走勢產(chǎn)生影響。只要數(shù)學(xué)邏輯正確,采用的變量越多,模型就越準(zhǔn)確。而且,數(shù)據(jù)維度的不斷豐富也能讓機(jī)器在不斷學(xué)習(xí)的過程中變得越來越智能。
宜信的第一批機(jī)器是在今年4月上線的,里面正跑著數(shù)以萬計(jì)的變量。未來,收集和整理數(shù)據(jù)的門檻會降低,而利用機(jī)器學(xué)習(xí)進(jìn)行數(shù)據(jù)分析和挖掘的能力會成為關(guān)鍵。
數(shù)據(jù)的價(jià)值
人人有信用,信用有價(jià)值。大數(shù)據(jù)能改變的不僅是金融行業(yè)。在一個(gè)真正市場化的社會中,各行各業(yè)都對個(gè)人信用評估有訴求,因此,基于大數(shù)據(jù)的個(gè)人信用評估結(jié)果可以成為很多商業(yè)活動的基礎(chǔ)。如今,通過將用戶的互聯(lián)網(wǎng)行為數(shù)據(jù)轉(zhuǎn)化為 “互聯(lián)網(wǎng)信用”后,這些數(shù)據(jù)也開始變得有價(jià)值起來。
數(shù)據(jù)定價(jià)
既然數(shù)據(jù)都是有價(jià)值的,那么是否可以給數(shù)據(jù)定價(jià)?“應(yīng)該理解為價(jià)值交換”,Joyce更正了我的說法,“數(shù)據(jù)的價(jià)值剛剛被喚醒,現(xiàn)在談定價(jià)、收費(fèi)還為時(shí)過早。”
目前,宜信已經(jīng)與一些線下機(jī)構(gòu)和線上互聯(lián)網(wǎng)服務(wù)商建立了數(shù)據(jù)合作關(guān)系,但各家的合作方式都不太一樣。尤其是對于不同行業(yè)來說,服務(wù)提供商的訴求差異巨大。Joyce說:“我們也希望與不同合作伙伴來探討適合彼此的價(jià)值交換方式。經(jīng)過一段時(shí)間的合作,我們會逐漸建立一套針對不同數(shù)據(jù)提供商的價(jià)值交換模型和方法論。”
數(shù)據(jù)變現(xiàn)
Joyce好幾次都提到了“數(shù)據(jù)變現(xiàn)”的概念。互聯(lián)網(wǎng)行業(yè)里有很多這樣的服務(wù)提供商:他們有用戶、有流量、有數(shù)據(jù),但卻找不到自己的商業(yè)模式。又或者,即使有自己的商業(yè)模式,很多服務(wù)提供商手中的數(shù)據(jù)也遠(yuǎn)沒有發(fā)揮什么作用。“數(shù)據(jù)變現(xiàn)”為他們提供了一個(gè)通過數(shù)據(jù)完成價(jià)值增值的思路。舉兩個(gè)例子:
為商家提供額外的變現(xiàn)渠道。以宜信與eBay合作的“商通貸”為例:eBay可以專注的做自己的電商生意,而如果eBay上的用戶或商家有分期或者融資的需求時(shí),eBay只需開通相應(yīng)的頻道,并把用戶數(shù)據(jù)授權(quán)給宜信進(jìn)行處理,宜信來完成用戶信用的評估并完成分期產(chǎn)品推薦、貸款實(shí)時(shí)授信等。
幫商家提高用戶轉(zhuǎn)化率。中國有很多租賃場景都是需要交押金的,而交押金往往會影響平臺的轉(zhuǎn)化率。因此,宜信在與各種租賃公司嘗試一種合作:租賃公司把用戶的信息給宜信,宜信再結(jié)合自己抓取的一部分?jǐn)?shù)據(jù)對用戶進(jìn)行信用評估,給出一個(gè)“信用價(jià)值”,從而免去用戶的押金,并扮演平臺的擔(dān)保方,甚至能提供租后管理服務(wù)。
不是競爭對手,是盟友
國內(nèi)想通過大數(shù)據(jù)做開放金融云平臺的不止宜信一家,別忘了最有名的那家——螞蟻金服。在螞蟻金服的成立活動上,其CFO井賢棟曾說過:“螞蟻金服將以小微企業(yè)和普通消費(fèi)者為主要用戶,建立以數(shù)據(jù)、技術(shù)、交易這三個(gè)開放平臺為核心的金融生態(tài),支持和幫助合作伙伴,共同為用戶創(chuàng)造價(jià)值。”
這和宜信的愿景不謀而合,不過,在Joyce看來,談彼此間的競爭還為時(shí)過早。在國內(nèi),通過大數(shù)據(jù)搭建信用體系這件事還處于非常早期的探索階段,大家各自有優(yōu)勢,但還沒有誰已經(jīng)走通了這條路。“如果未來有可能,我們非常樂意與螞蟻金服合作。”
其實(shí),除了宜信、阿里這樣打算做“生態(tài)系統(tǒng)”的平臺,大數(shù)據(jù)金融場內(nèi)的玩家還有不少。比如各種尚未走到生態(tài)系統(tǒng)層面的第三方大數(shù)據(jù)平臺,舉幾個(gè)例子:國內(nèi)最早提出做大數(shù)據(jù)征信的閃銀(類似Zest Finance)、從SaaS系統(tǒng)切入數(shù)據(jù)服務(wù)領(lǐng)域的中科柏誠、為線下P2P公司提供大數(shù)據(jù)服務(wù)的數(shù)信網(wǎng)。另外,還有一些在利用大數(shù)據(jù)支撐自身互聯(lián)網(wǎng)金融業(yè)務(wù)的公司,比如拍拍貸(類似Lending Club)、元寶鋪(類似Kabbage)。
但是,所有機(jī)構(gòu)手中的數(shù)據(jù)都是片面的數(shù)據(jù),尤其是對于BAT這樣的巨頭來說。這也是為什么,在Joyce看來,平臺間的合作遠(yuǎn)比盲目的競爭更有利于行業(yè)的成長。“這個(gè)市場非常大,完全可以容納多個(gè)開放平臺同時(shí)存在。如果有更多的人愿意踏踏實(shí)實(shí)的做金融開放平臺,這對行業(yè)、乃至整個(gè)小微人群是非常有益的。”
即使是在未來的金融生態(tài)中,合作也應(yīng)該大于競爭。“生態(tài)系統(tǒng)” 本身便是一種商業(yè)模式。金融業(yè)的生態(tài)系統(tǒng)長什么樣?它將以云計(jì)算、大數(shù)據(jù)為底層,信用體系為基礎(chǔ),支撐包括支付、投融資、理財(cái)、保險(xiǎn)、銀行等在內(nèi)的多種業(yè)務(wù)。
“在美國,信用是一張個(gè)人通行證。而對于中國來說,這是我們走向一個(gè)真正市場化的商業(yè)社會的過程中必然會達(dá)到的階段。未來,我們會有多個(gè)信用評估機(jī)構(gòu),每個(gè)機(jī)構(gòu)都有自己的一套信用評估體系,而大家對信用的認(rèn)識能夠嵌入到各行各業(yè)的商業(yè)活動中。”
這大概就是在國外大數(shù)據(jù)領(lǐng)域鉆研了15年后卻帶著團(tuán)隊(duì)義無反顧回到國內(nèi)的Joyce想看到的一天吧。