馬化騰在深圳科技中心南山區建立的騰訊成為了這座城市的標志,如今這位溫文爾雅的領導人又將視線轉移到了離騰訊總部不遠處的前海新區,后者是深圳市政府試圖打造繼上海之后的另一個“金融曼哈頓”。為了實現金融帝國的夢想,馬化騰此次押注的籌碼是微眾銀行。
已經有確切的消息得知,微眾銀行將于明年一季度正式開業,騰訊與百業源、立業等將攜手打造這家位于新經濟區下的新型銀行。這將是一家重點服務于個人消費者和小微企業的民營銀行,而騰訊也將憑借自身的互聯網優勢,為這家銀行注入更多的新鮮血液。
大數據征信正是騰訊將大劑量注入的重點之一。
在上月底在博鰲舉辦的騰訊合作伙伴大會上,騰訊支付平臺財付通首次介紹籌備兩年的“征信”業務,并對騰訊的征信體系進行了高調的路演。
騰訊方面稱,征信體系將利用其大數據平臺TDBANK,在不同數據源中,采集并處理包括即時通信、SNS、電商交易、虛擬消費、關系鏈、游戲行為、媒體行為和基礎畫像等數據,并利用統計學、傳統機器學習的方法,得出信用主體的信用得分。
財付通信用產品和業務中心高級總監吳丹曾對外宣傳,騰訊是最有可能和能力做征信的公司,并將通過社交數據提供一個全新角度的信用體系,并組建了一支富有經驗的數據分析和建模團隊,除了應用傳統金融機構的統計學方法,還在設計運用新的算法。
雖然不能否認騰訊作為中國最大的互聯網公司,數據實力確實不容小覷。當是對于一個毫無金融信貸經驗的公司來說,龐大的數據是其優勢,也將是衡量征信的真實性和全面性的噩夢。如果就這樣單純地認為騰訊將最適合成為征信公司,這也未免有些天真。
無論技術多么發達,金融的本質仍是以信用為基礎對風險進行嚴密管理的行業,互聯網與金融的結合或融合都未改變其金融本質,所以,所謂大數據征信,應該優先服務在嚴肅的金融框架下執行。很顯然,騰訊在此前的業務中并無真正的金融信貸經驗。
相比而言,對于目前市場非常火爆的P2P公司來說,金融與互聯網的雙重經驗,會讓其更適合趟在大數據征信浪潮。今年12月12日,Lending Club作為全球首個在資本市場上市的P2P平臺,不僅提升了公眾對P2P行業的認知與理解 ,也引發了大洋彼岸——中國P2P平臺的集體騷動。在多重利好的催化之下,是市場和政策開始對P2P的金融專業化進行認可的趨勢。
反觀技術層面,P2P公司在數據方面挖掘表現的不錯。
據了解,國內最大的P2P平臺之一宜信為了搭建大數據征信體系,重金從美國挖來了資深大數據專家Joyce,后者曾經服務過 Hulu、Microsoft 等公司,負責基于大數據的推薦引擎、搜索平臺、廣告精準投放等技術系統的開發。
為了更好的收集收據,宜信的策略是首先把數據分享出去。宜信把大數據金融上的探索方向描述為“金融云平臺”:既能支撐宜信自己的 P2P 業務,也能開放給其他合作伙伴。
基于征信的要素和維度的要求,宜信通過分布式存儲、分布式計算框架、虛擬化環境,建立了金融知識圖譜作為數據的底層架構,而由其衍生出了實時授信、產品個性化等服務。就在不久前,宜信還推出了1分鐘授信的P2P服務。
知識圖譜這個概念最早是由Google提出的,是搜索引擎往下一階段演進的過程中發展出來的。這其中包含兩個方面:實體的畫像,實體間的關系。做用 戶畫像時,畫像之間是彼此獨立的,但這并不符合現實生活中的場景:如果說每個人是知識圖譜中的節點,那么人與環境所形成的關系就是兩點間的線。當把“點和 線”綜合起來分析時,對個人的性格特征、信用狀況、財富屬性都會有更深層、更全面的理解。
在數據的來源上,依照目前國內的征信體系,宜信早前的布局顯然更具有利用價值。
按照央行最新數據,目前央行征信系統中共有 8.4 億人,但其中有實際征信記錄的只有 3.2 億人,有征信記錄的人只占到全國人口數的 23.7%,遠低于美國征信體系對人口的 85% 的覆蓋率。在數據的范疇和征信技術上,國內的傳統的方法也是從線下采集信用數據,即使在 P2P 網貸業務中,也只能暫時照搬這套方法。
創辦于2006年的宜信經過8年的積累,覆蓋了150個城市,50個農村,并擁有上萬名線下信貸員工。這種積累為當下數字數據確實的國內征信體系提 供了巨大了先前優勢。實際上,只要與宜信有過接觸的用戶,不管是在哪個環節終止了接觸,曾提交過信用報告、聯系人信息、教育水平、工資單、銀行流水等一系 列將作為傳統征信數據。
當傳統的信貸記錄缺失的時候,用戶互聯網的交易數據就會顯得尤為重要,而這也是像騰訊這樣的互聯網公司所在行的技術。宜信方面招募大數據的專家正是 為了加強技術性的研發,目前宜信在獲得用戶授權許可的情況下,搜索引擎會抓取用戶在互聯網上留下的電商購買數據、搜索引擎數據、社交數據等多個維度的數 據。除此之外,還有大量散落在網上的公開數據,這些數據也會被所抓取。這兩類數據將通過特定的算法模型轉化為信用評估數據。
除此之外,線下的合作機構也將成為宜信獲取數據的手段。這些合作伙伴可能包括小貸公司、租車公司、房屋中介等可能產生業務協同的機構,也可能是互聯網金融服務商。
在金融框架下探索技術的先進性無論如何都不能擺脫的一個問題是,如何保證數據的真實性。但宜信也認為任何人也無法保證數據完全真實、沒有噪音,可以做的就是對不同的數據源進行關聯和交叉驗證。
宜信曾經坦言,大數據征信并不是在盲目的追求線上實時授信,如果沒有足夠的數據來做交叉驗證,還是會采取線上線下相結合的方式。很顯然,以技術起家的互聯網公司騰訊并沒有深刻意識到這一點,當其真正步入金融征信行業,挑戰可能才剛開始。