大數據在金融行業的典型應用場景
大數據涉及的行業過于廣泛,除金融外,還包括政治、教育、傳媒、醫學、商業、工農業、互聯網等多個方面,各行業對大數據的定義目前尚未統一。大數據的特點可歸納為“4V”。第一,數據體量大(Volume),海量性也許是與大數據最相關的特征。第二,數據類型繁多(Variety),大數據既包括以事務為代表的傳統結構化數據,還包括以網頁為代表的半結構化數據和以視頻、語音信息為代表的非結構化數據。第三,價值密度低(Value),大數據的體量巨大,但數據中的價值密度卻很低。比如幾個小時甚至幾天的監控視頻中,有價值的線索或許只有幾秒鐘。第四,處理速度快(Velocity),大數據要求快速處理,時效性強,要進行實時或準實時的處理。
金融行業一直較為重視大數據技術的發展。相比常規商業分析手段,大數據可以使業務決策具有前瞻性,讓企業戰略的制定過程更加理性化,實現生產資源優化分配,依據市場變化迅速調整業務策略,提高用戶體驗以及資金周轉率,降低庫存積壓的風險,從而獲取更高的利潤。
當前,大數據在金融行業典型的應用場景有以下幾個方面:
在銀行業的應用主要表現在兩個方面:一是信貸風險評估。以往銀行對企業客戶的違約風險評估多基于過往的信貸數據和交易數據等靜態數據,內外部數據資源整合后的大數據可提供前瞻性預測。二是供應鏈金融。利用大數據技術,銀行可以根據企業之間的投資、控股、借貸、擔保及股東和法人之間的關系,形成企業之間的關系圖譜,利于企業分析及風險控制。
在證券行業的應用主要表現為:一是股市行情預測。大數據可以有效拓寬證券企業量化投資數據維度,幫助企業更精準地了解市場行情,通過構建更多元的量化因子,投研模型會更加完善。二是股價預測。大數據技術通過收集并分析社交網絡如微博、朋友圈、專業論壇等渠道上的結構化和非結構化數據,形成市場主觀判斷因素和投資者情緒打分,從而量化股價中人為因素的變化預期。三是智能投資顧問。智能投資顧問業務提供線上投資顧問服務,其基于客戶的風險偏好、交易行為等個性化數據,依靠大數據量化模型,為客戶提供低門檻、低費率的個性化財富管理方案。
在互聯網金融行業的應用,一是精準營銷。大數據通過用戶多維度畫像,對客戶偏好進行分類篩選,從而達到精準營銷的目的。二是消費信貸。基于大數據的自動評分模型、自動審批系統和催收系統可降低消費信貸業務違約風險。
金融大數據的典型案例分析
為實時接收電子渠道交易數據,整合銀行內系統業務數據。中國交通銀行通過規則欲實現快速建模、實時告警與在線智能監控報表等功能,以達到實時接收官網業務數據,整合客戶信息、設備畫像、位置信息、官網交易日志、瀏覽記錄等數據的目的。
該系統通過為交通銀行卡中心構建反作弊模型、實時計算、實時決策系統,幫助擁有海量歷史數據,日均增長超過兩千萬條日志流水的銀行卡中心,形成電子渠道實時反欺詐交易監控能力。利用分布式實時數據采集技術和實時決策引擎,幫助信用卡中心高效整合多系統業務數據,處理海量高并發線上行為數據,識別惡意用戶和欺詐行為,并實時預警和處置;通過引入機器學習框架,對少量數據進行分析、挖掘構建并周期性更新反欺詐規則和反欺詐模型。
系統上線后,該銀行迅速監控電子渠道產生的虛假賬號、偽裝賬號、異常登錄、頻繁登錄等新型風險和欺詐行為;系統穩定運行,日均處理逾兩千萬條日志流水、實時識別出近萬筆風險行為并進行預警。數據接入、計算報警、案件調查的整體處理時間從數小時降低至秒級,監測時效提升近3000倍,上線3個月已幫助卡中心挽回數百萬元的風險損失。
百度的搜索技術正在全面注入百度金融。百度金融使用的梯度增強決策樹算法可以分析大數據高維特點,在知識分析、匯總、聚合、提煉等多個方面有其獨到之處,其深度學習能力利用數據挖掘算法能夠較好地解決大數據價值密度低等問題。百度“磐石”系統基于每日100億次搜索行為,通過200多個維度為8.6億賬號精確畫像,高效劃分人群,能夠為銀行、互聯網金融機構提供身份識別、反欺詐、信息檢驗、信用分級等服務。該系統累計為百度內部信貸業務攔截數十萬欺詐用戶,攔截數十億不良資產、減少數百萬人力成本,累計合作近500家社會金融機構,幫助其提升了整體風險防控水平。
金融大數據應用面臨的挑戰及對策
大數據技術為金融行業帶來了裂變式的創新活力,其應用潛力有目共睹,但在數據應用管理、業務場景融合、標準統一、頂層設計等方面存在的瓶頸也有待突破。
一是數據資產管理水平仍待提高。主要體現在數據質量不高、獲取方式單一、數據系統分散等方面。
二是應用技術和業務探索仍需突破。主要體現在金融機構原有的數據系統架構相對復雜,涉及的系統平臺和供應商較多,實現大數據應用的技術改造難度很大。同時,金融行業的大數據分析應用模型仍處于起步階段,成熟案例和解決方案仍相對較少,需要投入大量的時間和成本進行調研和試錯。系統誤判率相對較高。
三是行業標準和安全規范仍待完善。金融大數據缺乏統一的存儲管理標準和互通共享平臺,對個人隱私的保護上還未形成可信的安全機制。
四是頂層設計和扶持政策還需強化。體現在金融機構間的數據壁壘較為明顯,各自為戰問題突出,缺乏有效的整合協同。同時,行業應用缺乏整體性規劃,分散、臨時、應激等特點突出,信息價值開發仍有較大潛力。
以上問題,一方面需要國家出臺促進金融大數據發展的產業規劃和扶持政策,同時,也需要行業分階段推動金融數據開放、共享和統一平臺建設,強化行業標準和安全規范。只有這樣,大數據技術才能在金融行業中穩步應用發展,不斷推動金融行業的發展提升。