P2P網絡貸款是互聯網發展的產物,大數據則是互聯網時代最重要的研究工具之一,起著舉足輕重的作用,成為現階段行業重點研究的問題。本文從挖掘大數據的來源和特征出發,探索其在互聯網金融領域的應用。根據目前網貸平臺的情況來研究分析大數據在互聯網金融領域應用存在的問題、創新方向以及未來面臨的挑戰。
包括P2P網絡借貸在內的互聯網金融近年之所以得到快速發展,部分原因與大數據的應用密切相關。換而言之,以大數據為基礎、互聯網為媒介,為金融行業帶來了顛覆性的變革,促進了“普惠金融”時代的來臨。在去擔保化熱潮來襲的P2P網貸市場,各大平臺開始重視通過大數據建立信用評估體系,進行信息采集、信息分析和信用評估。但實踐中,遇到很多問題和挑戰。即便行業第一家開發自有征信系統的P2P平臺拍拍貸,其信息采集渠道和可信度也讓很多人感到質疑,其他起步稍晚的平臺對于大數據更是無從下手。大數據的機遇和挑戰如何把握,是每一家網貸平臺需要思考的問題。
一、大數據的來源
大數據分為結構化數據與非結構化數據,其占比分別為15%和85%,它們大量存在于社交網絡、互聯網和電子商務等領域。隨著社交網路日益壯大,大量的用戶內容、音頻、文本信息、視頻、圖片等非結構化數據不斷地涌現。用戶在線的每一次點擊、每一次評論都是大數據來源的一個方面。此外,社交軟件的定位服務和朋友圈業務能更快速的搜集用戶的常居地址和生活信息等數據。
近年來,量化自我運動(Quantified Self)成為大數據的新來源。通過帶著UP、Nike+或Googleglass來搜集數據,搜集的數據不僅包括生理活動數據,而且包括各種行為數據。在全球對其應用最為突出的是印象筆記(Evernote),其用戶數量已突破1億大關。其使命是讓每一個人都能記錄生活中的每一個時刻、每一個靈感、每一次心動、每一種經歷,隨時隨地在平臺上記錄所思所想、所見所得。
云計算的出現讓大數據信息的存儲不再是瓶頸,更多數據挖掘項目可以得到更大的施展空間。例如:金融領域的精準信息服務的創新就是通過社交網絡得到的個人數據和需求分析,將合適的金融產品推送給個人的同時,也將個人需求精準的匹配給相應的機構。
二、大數據的特征
大數據的內涵包括海量數據并對信息有快速高效處理的能力,具有多樣性和高效性。
(一)多樣性
最初大數據的出現是電商為了統計商品的點擊率、成交率來確定每個商品的進貨比例的。從消費者第一次點擊到完成訂單支付,其中間經歷了復雜的點擊、瀏覽、收藏、對比等過程,在這個復雜操作的過程中,大量信息被遺漏,只記錄了銷量信息。伴隨著近幾年移動互聯網和便捷社交軟件的開發與發展,大數據在悄然生變。社交媒體將人與人的關系、個人的心理性格在海量大數據的支撐下呈現給了各網貸平臺,只有在多樣化并且復雜的大數據下才能盡量減少結論的誤差,而在傳統的模式下是根本無法實現的。
(二)高速性
高速性主要表現為數據流和大數據的移動性。現實應用中則體現在對數據及時更新的需求上。隨著移動網絡的發展,人們對數據的實時應用需求更加普遍,比如通過手持終端設備關注新聞、交通情況、物流進度等信息。高速性要求具有時間敏感性和決策性的分析,要求能在第一時間抓住重要事件發生的信息。
三、大數據在P2P網貸領域的應用
大數據在蓬勃發展的互聯網金融領域的應用非常廣泛,企業可以通過大數據反映的客戶需求提前預測企業的未來及發展趨勢、通過統計點擊率和整理評論來分析網絡金融民意、通過對大數據進行歸類和分析來進行風險控制等。其中最為創新性的應用歸征信和產品研發莫屬。網貸平臺諸如拍拍貸對個人信息搜集整理,結合個人的社交信息和網購行為來綜合的對一個人的信用進行評估并推算其可能違約的成本。產品研發是打破了傳統的生產線,逆向的通過確定的需求量來進行產品的生產,避免了傳統模式下的生產過剩和供不應求的現象。
(一)信用征信
運用大數據進行信用征信,主要基于3個元素展開分析,包括個體狀況、社交網絡行為、網絡購物行為。
1.個體狀況分析
個體狀況主要包括個人基本信息(姓名、身份證號、住所等)、教育及技能信息(學歷、資格證書等)、個人收入及資產信息(工資、房產、汽車等)、個人工作信息(行業、單位、職位)、個人關系信息(婚姻子女狀況等)。最早對個體狀況進行分析的平臺是拍拍貸,2009年公安信息平臺開放,居民身份證信息開始對外開放,提高了拍拍貸的個人信息統計的準確度和效率,使拍拍貸的交易規模得到了迅猛增長。目前網貸平臺也可以通過教育部主辦的學信網對借款人的學歷進行查詢。除了這些公開信息外,平臺還要求借款人提交收入證明和工作信息,通過社交軟件提取關系圈信息以確保能準確的判斷借款人的身份是否真實,是否有基本還款能力等,借助個人狀況排除P2P網貸平臺上的大多數詐騙分子、惡意借款人等,保證網貸平臺的基本穩定與安全。
2.社交網絡行為分析
社交網絡行為分析是從高科技的社交軟件如微信、微博、人人網、論壇等網站出發,通過記錄好友數量、粉絲數量、發帖內容等因素對其進行信用評估。其認為在社交網絡越活躍的人,朋友越多的人其違約風險越低。例如微博加V,微信升級公共賬號等都是對大數據有效的搜集渠道。而如今人們對這些網絡社交軟件的依賴高于電話短信,導致越來越多的社交網絡信息可以被采集并利用起來對一個人的信用進行評估,使P2P信用評估體系將愈發完善、準確,從而帶動整個網貸行業的發展。
3.網絡購物行為分析
網絡購物行為是征信評估中唯一一個把行為與金錢密切相連的重要因素。通過分析個人購物行為及電子帳戶資金流水來了解一個人的消費能力及資金狀況,并在此基礎上進行信用評估。2014年2月,京東商城推出“京東白條”,在京東商城購物時,消費者可申請最高1.5萬元的個人貸款支付,京東白條類似于虛擬信用卡,不過與銀行發放信用卡煩瑣的審核程序不同,京東完全根據用戶以往的購物行為來授予信用額度。目前1000多家網貸平臺中,積木盒子也著手通過平臺的個人消費標的搜集客戶的網絡購物行為,在快樂時代平臺項目中鏈接其他網商平臺,為客戶提供分期付款的網購服務。快樂時代總部位于北京,目前已經在全國數百個城市開展分期購物業務,也是國內首家支持全網商品分期的商家。拍拍貸也以主打網商標的和網購標的來間接搜集網絡購物信息,其平臺上50%左右的借款人為電商用戶,以天貓用戶居多。其它P2P平臺即使沒有自己的信息搜集渠道,在對借款人資料進行審核時也要求提供網購憑證或流水單來對其進行評估。
(二) 產品研發
在傳統模式下,企業要開發新產品、新產業鏈要進行很高成本的市場調查調研工作,最終的產品設計是由產品部經理所決定的,但是再有能力的經理也不能確保自己創新的產品完全符合消費者的意愿。而在大數據時代,是根據大數據來分析客戶的習慣和偏好,按照客戶自己的意愿對產品和服務進行升級和更新的。使用大數據進行產品研發的主要的優勢是產品的創新點是由客戶自己互動提供的,按其大眾人群的特點設計,融洽的將生產方與需求方緊密的聯系起來。從傳統的生產產品—尋找客戶群變為確定客戶群體—產品生產,既節省了人力、物力、財力,又效率、便捷的得到了超預期的結果。
表1 傳統模式與大數據時代的比較
四、大數據應用的困境
在大數據的推動下,網貸平臺起飛式迅速增長,為個人和小微企業的貸款提供了渠道,很大程度的擴寬了金融行業的服務范圍。但由于大數據應用在P2P行業存在的問題,未能準確的對違約概率進行評估,出現多家平臺跑路事件。因此,P2P行業應用大數據效率低的原因成為了行業關注的焦點。
(一) 網絡信息很難還原現實中的信息
目前大數據的來源主要依賴于互聯網,而人們在網絡中的表現并不能完全反映其真實的一面。在互聯網上人性是被放大的,現實生活中不敢說的話,不敢抱怨的事情,在互聯網上卻敢說,導致現實中內向的人在互聯網上卻給人展現了外向的一面。例如有些人不善與人接觸,卻將自己做的美食展現在了微博上,導致吃貨們頻頻關注,從而使得粉絲暴增。因此通過網絡,并不能確切的說明此人的有多廣泛的社交圈子。也就是說互聯網的數據很難還原用戶現實中的信息。
(二) 金融信用與社會信用的相關性不確定
在我國現階段的互聯網發展中,并沒有對金融信用與社會信用的相關性進行細致的研究。個人信用體現是多方面的,其包括朋友信用、愛情信用、事業信用、其他社會信用和金融信用等等。而每個方面不一定與金融信用緊密相關。一個人有很好的朋友信用,但不代表其在金融方面的信用就很好,也就是說不能單憑日常生活的信用來給個人的違約風險進行定位。
(三) 缺失“閉環的交易數據”
目前在國內的金融行業,成功運用大數據做風控只有阿里小貸等有限幾家,主要是通過賣家累計的海量的交易信息及資金流水,在幾秒內完成對商家的授信。如今在P2P網貸行業,一些平臺都以用大數據來做風控審核這樣虛無縹緲的定義來吸引投資者,但其模式為應收賬款質押融資或貨物抵押融資,并未真正的應用了大數據。因為依賴大數據風控主要靠及時更新的數據和對客戶的約束力來實現其有效性。這兩個因素也被稱為閉環數據,目前國內的P2P平臺缺乏閉環的交易數據,對借款人的約束力也不強硬,所以使其風控很難有效的和大數據結合起來,很難單憑大數據來對借款人的違約風險進行評估。
五、大數據創新——私人訂制
在互聯網迅速崛起的現代社會,P2P依靠大數據做風控弊端涌現,但不代表大數據在此行業失效,而是可以對大數據的應用進行創新,例如用大數據來改變平臺的營銷手段,對客戶實行私人定制。私人定制是指通過個人在平臺兩次及以上的貸款記錄和良好的還款記錄的數據進行分析,用系統的方式為其量身制定貸款方案、利率、手續費、還款方式等相匹配的產品。首先通過歷史借貸記錄推算出客戶在什么時間需要資金周轉,并根據其從事行業分析其資金的用途和預計還款時間,提前推送定制的服務方案,準確的滿足貸款人心里需求,避免客戶被動接受他不一定適合的信貸產品。然而大數據的及時更新,能夠更效率的通過更新的數據對資金需求者的額度、利率、還款方式進行調整。
六、大數據金融的兩大挑戰
(一)金融數據開放挑戰
美國征信系統的完善是因為其政府對其擁有的大數據資源的開放程度日益透明化。而我國現階段一些權威的政府數據能否向民間開放,比如中國人民銀行的政信系統,是大數據時代互聯網金融發展面臨的首要挑戰。只有建立一個開放的數據規則,才能有利于未來大數據產業生態的建設。而不是各個平臺通過自己的渠道,記錄不同客戶集體、不同維度、不同時間序列的數據混合起來應用,大部分的數據因為沒有特定的規則而產生了“噪音”效果,使征信模型失效。目前,我國出現150家左右平臺跑路現象,其原因之一也與大數據信息的不透明緊密相關,數據的封閉使平臺捕捉的項目公司信息偏離了大數據的特性,不能及時的預測風險的來臨,連帶的導致投資者對網絡借貸乃至互聯網金融的創新失去信心,形成行業發展的瓶頸。
(二)大數據人才短缺
麥肯錫公司的《大數據:下一個創新、競爭和生產力的前沿》指出,具備大數據高級分析技能的人才供應量,2008年為15萬人,預計2018年將翻倍增長,達到30萬人。而現階段對這類人才的需求高達50萬左右,這意味著將產生20萬左右的人才缺口。目前平臺大量吸收有相關專業知識和技能豐富的人才,對其進行大數據的思維和分析思路的培養。例如:今年4月,拍拍貸完成了數千萬的B輪融資,這輪融資主要是用于加強網絡征信系統建設、IT技術水平提升和高級人才招聘。為了滿足各大行業對大數據人才的需求,中國科學院大學開設首個“大數據技術與應用”專業方向,該專業將面向于科研發展及產業實踐,培養信息技術與行業需求結合的復合型的大數據人才,并得到了IBM、微軟、騰訊、阿里巴巴、NEC、58同城等在大數據分析及應用領域具有前瞻性的企業專家的大力支持。