近日,中國人民銀行成立金融科技(FinTech)委員會,旨在加強金融科技工作的研究規(guī)劃和統(tǒng)籌協(xié)調。隨著金融科技在業(yè)務層面滲透率的逐步提升,大數(shù)據(jù)技術在金融機構中的應用日益廣闊,對于商業(yè)銀行如何在金融科技時代使用、提取、管理好大數(shù)據(jù)的討論也更加深入。
一、大數(shù)據(jù)技術在銀行業(yè)中應用的前景
20世紀以來,信息技術在金融業(yè)中的大量廣泛使用,使其累積了體量龐大的數(shù)據(jù)和信息,金融機構當中存儲著數(shù)以萬計的數(shù)據(jù),這種情況迫使金融機構必須要考慮如何將這些數(shù)據(jù)轉換為可以創(chuàng)造實際價值的內容,為企業(yè)盡可能多的創(chuàng)造利潤。然而,這些數(shù)據(jù)并不是為了分析目的而專門生產,僅僅是隨商業(yè)活動產生,盡管數(shù)量龐大,但難于直接產生價值,因此需要借助大數(shù)據(jù)挖掘技術進行深度挖掘,使之成為有價值的信息。隨著數(shù)據(jù)收集能力逐步提高,金融企業(yè)將形成時間連續(xù)、動態(tài)變化的面板數(shù)據(jù),其中不僅包括用戶的交易數(shù)據(jù),也包括用戶的行為數(shù)據(jù)。簡單的數(shù)據(jù)搜集和歸并對金融企業(yè)來說不足以有效利用這些數(shù)據(jù),只有對其進行深度挖掘,才可以發(fā)現(xiàn)其中的隱性信息并利用其為客戶提供更加優(yōu)質的金融產品和服務。如何對多源數(shù)據(jù)實現(xiàn)快速高效的海量數(shù)據(jù)處理?如何應對互聯(lián)網金融產生的碎片化數(shù)據(jù)、快速響應需求引發(fā)的風險問題?如何充分利用數(shù)據(jù)分析、挖掘來獲取更大的經濟效益?是金融企業(yè)在進行大數(shù)據(jù)分析時面對的幾大挑戰(zhàn)。
互聯(lián)網的發(fā)展催生了大數(shù)據(jù)技術的誕生。在21世紀初,全球網頁內容大規(guī)模增長,網頁內容每日增長速度超百萬。截止2001年末,全世界網頁個數(shù)達50億個[1],互聯(lián)網用戶檢索有用信息的難度越來越大。谷歌(GOOGLE)等擁有較高搜索引擎技術的公司開始建立搜索系統(tǒng),其內容覆蓋數(shù)十億網頁,提高了人們對互聯(lián)網內容的使用效率,大數(shù)據(jù)技術由此誕生。由于網頁內容當中需要處理的數(shù)據(jù)包含大量的非結構化內容,傳統(tǒng)的搜索技術無法完成檢索。谷歌公司提出了以“分布式”為基礎的存儲和檢索系統(tǒng),包括分布式文件、分布式并行計算和分布式數(shù)據(jù)庫等系統(tǒng),實現(xiàn)了非結構化數(shù)據(jù)的檢索,并奠定了大數(shù)據(jù)技術的基礎。伴隨著互聯(lián)網產業(yè)的崛起,這種創(chuàng)新的海量數(shù)據(jù)處理技術在電子商務、定向廣告、智能推薦、社交網絡等方面得到應用,取得巨大的商業(yè)成功。這啟發(fā)全社會開始重新審視數(shù)據(jù)的巨大價值,金融、電信等擁有大量數(shù)據(jù)的行業(yè)也開始嘗試這種新的理念和技術,取得初步成效。與此同時,業(yè)界也在不斷對谷歌提出的技術體系進行擴展,使之能在更多的場景下使用。2011 年,麥肯錫、世界經濟論壇等知名機構對這種數(shù)據(jù)驅動的創(chuàng)新進行了研究總結,隨即興起了一股大數(shù)據(jù)熱潮。
雖然大數(shù)據(jù)已經成為全社會熱議的話題,但到目前為止,“大數(shù)據(jù)”尚無公認的統(tǒng)一定義。筆者認為,認識大數(shù)據(jù),要把握“資源、技術、應用”三個層次。大數(shù)據(jù)是具有體量大、結構多樣、時效強等特征的數(shù)據(jù);處理大數(shù)據(jù)需采用新型計算架構和智能算法等新技術;大數(shù)據(jù)的應用強調以新的理念應用于輔助決策、發(fā)現(xiàn)新的知識,更強調在線閉環(huán)的業(yè)務流程優(yōu)化。因此說,大數(shù)據(jù)不僅“大”,而且“新”,是新資源、新工具和新應用的綜合體。
現(xiàn)代金融機構當中,數(shù)據(jù)資產成為其區(qū)別于傳統(tǒng)金融機構的最大生產要素之一。對于數(shù)據(jù)資產的管理、運用、挖掘,成為現(xiàn)代銀行業(yè)加快創(chuàng)新、增強管理能力等業(yè)務的最重要工作。大數(shù)據(jù)挖掘分析決策的主要流程見下圖1。銀行業(yè)海量的數(shù)據(jù)內容,需要從“數(shù)據(jù)清理/整合——>數(shù)據(jù)倉庫——>數(shù)據(jù)選擇——>數(shù)據(jù)挖掘——>模式評價——>知識”多次的循環(huán)反復,才有可能達到預期的效果。
銀行業(yè)監(jiān)管機構對于數(shù)據(jù)管理和監(jiān)測的要求也在不斷提高,金融監(jiān)管部門在多個指導文件中指出[2]“加快銀行信息資源的集中,實現(xiàn)數(shù)據(jù)視圖在全行范圍的共享,充分利用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術,實現(xiàn)資產負債管理、財務績效管理、風險管理和客戶關系管理等主題應用,建立面向主題、面向市場、面向決策、滿足內部管理及外部政策要求的銀行管理信息系統(tǒng)建設”。“大中型銀行要把數(shù)據(jù)治理作為重要的制度性建設與基礎性工作,加強組織保障、制度保障與流程保障,有序推進、重點強化;統(tǒng)一數(shù)據(jù)標準,提高數(shù)據(jù)質量,深化數(shù)據(jù)應用,有效支撐銀行業(yè)務發(fā)展,有效提升銀行管理水平[3]。” “十二五”末期,大部分銀行均開始著力解決數(shù)據(jù)質量較差的問題,開始加強數(shù)據(jù)管理、管控,提高數(shù)據(jù)信息質量,采用數(shù)據(jù)挖掘和大數(shù)據(jù)技術深層利用、提煉數(shù)據(jù)以提升經營管控效能。
大數(shù)據(jù)技術的產生本身就有其強烈的應用需求背景,它從一開始就是面向應用的。數(shù)據(jù)挖掘技術在決策支持方面有著廣泛的市場前景,并可用于業(yè)務管理方應用,是實現(xiàn)CRM和BI的重要技術手段之一。具體涉及商業(yè)化應用的有數(shù)據(jù)挖掘技術中的數(shù)據(jù)庫營銷(Database Marketing)、客戶群體劃分(CustomerSegmentation& Classification)、背景分析(ProfileAnalysis)、交叉銷售(Cross-selling)等市場分析行為,以及客戶流失分析(ChurnAnalysis)、客戶信用評分(Credit Scoring)、甄別(Fraud Detection)等應用手段。目前,諸多商業(yè)領域(銀行、保險、證券、超級市場、電信等)均有大數(shù)據(jù)技術成功應用的案例。在金融機構中,由于其除了提供儲蓄、投資和信用卡業(yè)務之外,保險、股票、基金投資等也是其重要業(yè)務。因此,大數(shù)據(jù)技術和數(shù)據(jù)挖掘技術在金融業(yè)中的主要運用有:1.數(shù)據(jù)分析和設計構造的數(shù)據(jù)倉庫;2.特征數(shù)據(jù)變量選擇、關聯(lián)屬性相關數(shù)據(jù)用于預測客戶信用狀況;3.聚類、分類分析識別目標客戶和市場;4.數(shù)據(jù)可視化過程及歸并、聚類分析甄別洗錢等金融犯罪行為。
將大數(shù)據(jù)技術應用于金融業(yè)不僅是技術發(fā)展的需要,也是金融業(yè)提高自身盈利能力的需要。在當前“以客戶為中心、以市場為導向”的激烈競爭時代,在各大金融機構準備“二次轉型”的改革進程中,要想提高核心競爭能力、防范業(yè)務風險、提高業(yè)務分析數(shù)據(jù)的時效性及準確性,就必須懂得如何利用現(xiàn)代管理信息系統(tǒng)進行綜合分析,挖掘客戶的潛在價值,利用有價值的信息改進服務手段,運用數(shù)據(jù)挖掘技術實現(xiàn)職能化的決策支持功能管理。一直以來,金融行業(yè)對數(shù)據(jù)的重視程度非常高。隨著移動互聯(lián)網發(fā)展,各種金融業(yè)務和服務的多樣化和金融市場的整體規(guī)模擴大。對于大數(shù)據(jù)帶來的主要業(yè)務價值,參加調研的金融企業(yè)表示,大數(shù)據(jù)的價值是他們可以根據(jù)商業(yè)分析實現(xiàn)更加智能的業(yè)務決策,讓決策的制定更加理性化和有根據(jù)。依靠有前瞻性的決策,實現(xiàn)生產過程中資源更優(yōu)化的分配,能夠根據(jù)市場變化迅速做出調整,提高用戶體驗以及資金周轉率,從而獲取更高的利潤。
二、大數(shù)據(jù)技術在銀行業(yè)中的主要應用場景
(一)大數(shù)據(jù)時代下銀行的精準營銷
按照單個客戶個性化的營銷方案和溝通服務體系,金融機構依照信息化技術手段可以建立起精確的營銷方案以實現(xiàn)對個人客戶的精準營銷(Precision Marketing)。這種建立在精準定位基礎之上的營銷活動,包含著對個體的關注和差異化的認同,可以最大限度地攤平企業(yè)的成本。精準營銷對于每一位金融客戶的興趣、愛好、購買能力均可以做出預測和判斷,根據(jù)綜合化的評分向顧客推薦金融服務及產品,以保障推薦產品在其財力范圍和興趣半徑之內。精準營銷的基本理念如圖2所示:
傳統(tǒng)銀行業(yè)當中,認識產品、產生興趣、付款購買三個環(huán)節(jié)是金融消費者在購買過程當中必然出現(xiàn)的環(huán)節(jié)。由于在認知產品的過程當中,消費者會通過網絡、私人渠道進行檢索,對產品信息、類別進行了解以確定其購買信息,在此過程當中產生的搜索數(shù)據(jù)便可以定位消費者的收入水平、興趣和愛好,企業(yè)借助分布式存儲和云計算深度挖掘這一系列關于該類消費者的信息,形成完整的客戶關系系統(tǒng)(CRM系統(tǒng)),從而設計出各種序列的營銷方案,推送給消費者,實現(xiàn)精準化營銷[5]。
(二)大數(shù)據(jù)時代下銀行的精細化管理
大宗交易數(shù)據(jù)是傳統(tǒng)銀行最為重視的業(yè)務內容,由于受制于銀行較弱的數(shù)據(jù)處理能力,體量龐大、細節(jié)更多的精細化交易數(shù)據(jù)無法得到有效處理。例如,傳統(tǒng)銀行經營模式之下,商業(yè)銀行僅能記錄每次的銀行卡消費信息,卻無法實現(xiàn)實時的消費信息反饋,歸集整理;在存款、貸款風險管控過程當中,銀行也對于對小額貸款實施有效的風險管控。一般的商業(yè)銀行在記錄了客戶消費和挑選產品的數(shù)據(jù)后,亦沒有利用好這些并不是為商業(yè)銀行經營活動(風控、催收)而產生的數(shù)據(jù)。顧客的每筆投資和消費都被記錄分析之后,運用數(shù)據(jù)挖掘技術將產生信息化決策,有助于提升用戶體驗,精細化管理水平將不斷提高。
(三)大數(shù)據(jù)時代銀行的低成本管理
傳統(tǒng)銀行業(yè)中的信息數(shù)據(jù)是手工化產生的,容易產生錯誤。特別是在信貸活動過程當中,對于銀行客戶信息在記錄過程中產生的錯誤將會給銀行經營的有效性造成損失,這種傳統(tǒng)的手工信息處理方式效率低下、準確度差、成本高。在商業(yè)銀行的貸款業(yè)務當中,銀行需要對客戶的個人信息、財務狀況和抵押品等內容進行盡職調查,信息獲取的成本較高。但在大數(shù)據(jù)時代,商業(yè)銀行對客戶信息的采錄過程完全自動,通過客戶自填、自報,收錄客戶的個人信息,從而更加精確地了解到客戶的實際情況,降低人工處理成本,提高辦事效率。對于個體、小微層面的關注將有效解決長期以來困擾中國企業(yè)的“小微融資難”問題。
(四)大數(shù)據(jù)時代的集中化管理
商業(yè)銀行的傳統(tǒng)業(yè)務模式當中,跨地區(qū)、跨國經營成本極高,商業(yè)銀行不僅要承擔開設實體機構的成本,還要承擔與代理行之間產生的摩擦經營成本。在大數(shù)據(jù)技術的幫助之下,商業(yè)銀行總部機構將可以更加便捷地獲取更多有價值的信息,不僅局限于當?shù)氐姆种C構,跨越了地域、時空限制。對各個條線的集約化管理,使得銀行總部的經營權利更加集中,分支行的執(zhí)行功能將被強化,銀行管理職責、風控策略將被集中于總行層面,有助于進一步提高機構總體執(zhí)行力,避免上傳下達過程當中的摩擦成本。
三、大數(shù)據(jù)技術在銀行業(yè)應用中的主要優(yōu)勢與難題
經濟社會的三個重要組成要素:產品、信息、資金滲透于互聯(lián)網時代的諸多環(huán)節(jié),互聯(lián)網時代的激烈競爭當中,電商、銀行、物流三大類別企業(yè)代表著三種要素的重要占有者,三者都希望成為主宰著三種要素的利益獲得者。雖然在互聯(lián)網技術、平臺層面商業(yè)銀行有所落后,但從長期發(fā)展趨勢來看,商業(yè)銀行具有重要的優(yōu)勢同時也存在著諸多困難,主要包括以下幾個方面:
(一)商業(yè)銀行的信息與人才優(yōu)勢
商業(yè)銀行不僅掌握著大量資金,而且在信息搜集方面也擁有獨特優(yōu)勢,不管是甄別優(yōu)、劣客戶進行授信貸款,還是金融服務用戶交易活動留下的交易痕跡都是其重要數(shù)據(jù)資產。尤其是商業(yè)銀行的信息化建設也居于各行業(yè)前列,信息處理與建設已經根植入商業(yè)銀行的“思維”。商業(yè)銀行不僅有信息化建設的意愿,而且具備建設優(yōu)質信息化系統(tǒng)的條件。特別是在2000年之后,中國的商業(yè)銀行提出建立數(shù)據(jù)集市的思路。各大商業(yè)銀行紛紛建立了數(shù)據(jù)中心和備份中心,提高了數(shù)據(jù)的存儲利用效率和風險防控能力。另外,由于在貸款和金融業(yè)務開辦之前,各自然人都需要在商業(yè)銀行開戶并填寫個人基本信息,社會上的資金劃轉要以商業(yè)銀行為媒介,因此商業(yè)銀行有著廣泛的渠道獲取客戶信息和資金流信息,同時POS機和ATM也可以獲取個人的消費信息。多年的積累,使商業(yè)銀行已形成海量的信息數(shù)據(jù)庫,其結構化程度優(yōu)于電商等企業(yè)。
中國的商業(yè)銀行均設有科技開發(fā)中心、數(shù)據(jù)測試和收集中心以便于商業(yè)銀行開發(fā)擁有自主知識產權的個性化業(yè)務、功能。在二十世紀初提出的建立數(shù)據(jù)集中項目過程當中,商業(yè)銀行累積了大量建設復雜數(shù)據(jù)信息系統(tǒng)的經驗,涉及軟件開發(fā)、數(shù)據(jù)倉儲等具體實操項目,這些項目鍛煉了商業(yè)銀行的科技開發(fā)隊伍,為商業(yè)銀行積累了許多軟件開發(fā)、管理人才。金融人才和信息科技人才的結合是商業(yè)銀行構建有效物流、信息流的重要基礎保障。
(二)商業(yè)銀行的資金與制度優(yōu)勢
商業(yè)銀行的利潤率普遍較高,近幾年來的業(yè)績增長較快,許多商業(yè)銀行的盈利能力開始超過國外商業(yè)銀行。因此,商業(yè)銀行內部擁有充足的資金,有利于商業(yè)銀行建立大規(guī)模的資金、物流、信息流操作系統(tǒng)。資金優(yōu)勢使商業(yè)銀行在構建三網融合過程當中可以建立先進的數(shù)據(jù)操作系統(tǒng)、存儲系統(tǒng)和計算系統(tǒng),有利于大數(shù)據(jù)技術的發(fā)展和應用。
中國的商業(yè)銀行一方面自負盈虧,另一方面與政策存在著千絲萬縷的聯(lián)系。我國的商業(yè)銀行牌照較難獲得,電商和物流商的資格相對都比較簡單。我國大型商業(yè)銀行已基本實現(xiàn)集團化經營,全國十五家上市銀行資產占到中國商業(yè)銀行總資產的60%以上,其經營管理經驗、理念、方式、方法都強于電商和物流企業(yè),容易形成跨界、跨區(qū)域經營。
(二)商業(yè)銀行大數(shù)據(jù)應用的難題
在利用大數(shù)據(jù)幫助商業(yè)銀行進行問題解決的同時,信貸客戶個人信息保護、隱私保護的邊際在哪里,客戶的哪些數(shù)據(jù)可以收集,可以通過什么樣的方式收集?個人數(shù)據(jù)是不是可以全部收集,收集在一起引起的副作用也要考慮。例如:美國有法律規(guī)范禁止教育部門的數(shù)據(jù)與移民局數(shù)據(jù)聯(lián)通,移民局不得利用教育部門數(shù)據(jù)來查獲非法移民,目的是為了防止這些移民由于害怕移民局而不將兒童送去上學,如果存在大量的失學青年可能會對美國社會的安定和未來不利。
哪些數(shù)據(jù)可以收集?是否可以追蹤公司高管個人的信息?這些問題均涉及到道德與法律層次的重要問題。數(shù)據(jù)資產的合理利用也需規(guī)范,數(shù)據(jù)結果能用于哪些方面,是否會違背非歧視原則?在證券交易與商業(yè)銀行數(shù)據(jù)應用過程中必然涉及到方方面面的內容亟待解決。另外更大規(guī)模的數(shù)字化對于資本市場、信貸市場的長遠影響究竟如何?對各種參與者都是公平的嗎?對于商業(yè)銀行的存在本質是有益的嗎?
以上種種問題,只是冰山一角,大數(shù)據(jù)對社會、對金融、對個人的影響還需細致分析和推演,需制定在金融領域的數(shù)據(jù)收集、數(shù)據(jù)分析和利用規(guī)則,制定底線。
四、大數(shù)據(jù)技術在銀行業(yè)應用中的對策建議
商業(yè)銀行應當繼續(xù)使用大數(shù)據(jù)和數(shù)據(jù)挖掘技術及時、準確、全面地掌握自身資產質量、數(shù)量及分布、頭寸調度、信貸情況,提供給客戶安全、可靠及強有力的技術支撐。數(shù)據(jù)倉庫、大數(shù)據(jù)、數(shù)據(jù)集市通過深度挖掘可以獲得“深度效益”;同時,大數(shù)據(jù)技術還搜集了大量的商戶、用戶資料,可以為開發(fā)新的產品、業(yè)務及綜合化服務,讓銀行在不同的平臺、層面上為用戶提供異質化業(yè)務變得更加容易,而且為商業(yè)銀行的經營管理決策提供了支持與依據(jù),讓商業(yè)銀行可以隨時根據(jù)與自已有歷史經驗往來的商戶數(shù)據(jù)信息推斷出客戶的信用狀況,有助于銀行風險的防范。
隨著各種新技術的發(fā)展,大數(shù)據(jù)與數(shù)據(jù)挖掘技術也隨研究的深入而不斷進步,以后將更加便捷、有效地應用于未來的實踐當中去,結合新的理論、技術和模型評價方法,以增加數(shù)據(jù)挖掘的有效性,進一步提高數(shù)據(jù)分析工具的實用性。數(shù)據(jù)挖掘在未來商業(yè)銀行中的研究焦點和需要進一步開展的工作在于以下幾個方面。
(一)完善商業(yè)銀行信息系統(tǒng)總體架構設計
傳統(tǒng)商業(yè)銀行的數(shù)據(jù)應用信息系統(tǒng)搜集與保存系統(tǒng)在大數(shù)據(jù)應用環(huán)境背景下仍需進一步完善,本文根據(jù)商業(yè)銀行大數(shù)據(jù)的業(yè)務基本需求和監(jiān)部部門的監(jiān)管要求,結合我國金融機構當前的實際情況,采用企業(yè)級分層架構思想,構建出如圖3所示的金融機構大數(shù)據(jù)信息系統(tǒng)體系架構圖:
該大數(shù)據(jù)系統(tǒng)體系結構的特點包括:①層次化清晰。系統(tǒng)共分為應用層、服務層、網絡層和數(shù)據(jù)層,在系統(tǒng)體系結構中,每層將具有相同服務功能的部分封裝在一起,相鄰層之間調用服務;②在傳統(tǒng)三層網絡體系結構的基礎上,該體系結構加入了網絡層,通過金融機構專用網絡將服務層和數(shù)據(jù)層相連接,并設置了防火墻,充分保證金融機構業(yè)務數(shù)據(jù)的安全性;③各個商業(yè)金融機構可以通過金融機構專用網絡共享數(shù)據(jù)庫信息,同時各監(jiān)管部門與業(yè)務條線可以實時查看銀行經營業(yè)務數(shù)據(jù),提高業(yè)務開展效率與監(jiān)管可行性。
(二)加強數(shù)據(jù)挖掘應用系統(tǒng)和算法測試的研究
不斷重視數(shù)據(jù)挖掘技術的實際應用。盡管國內關于大數(shù)據(jù)技術和數(shù)據(jù)挖掘理論對算法模型的研究較多,但實際應用案例和算法應用改進案例卻比較少,缺乏可以借鑒的經驗數(shù)據(jù)。如何引入國外的先進經驗、技術,改進算法的性能并進行有效性測試,檢驗算法合理性和功能系統(tǒng)的穩(wěn)定性?結合多種數(shù)據(jù)挖掘算法實現(xiàn),提高數(shù)據(jù)挖掘的效率和技術功效仍是亟待解決的問題。
(三)加強傳統(tǒng)數(shù)據(jù)與非結構化數(shù)據(jù)挖掘過程中的可視化方法的研究
加強人機交互,可以把用戶需要解決的問題方便地轉化為數(shù)據(jù)挖掘技術人員能夠理解并解決的問題,然后將結果以更直接的表現(xiàn)形式被用戶理解。完善解釋機制,將各種算法的研究趨向于簡單化和易于理解。
從多媒體數(shù)據(jù)庫中發(fā)現(xiàn)有意義的模式,包括對文本數(shù)據(jù)、圖形數(shù)據(jù)、音頻數(shù)據(jù)以及超文本數(shù)據(jù)的挖掘等。基于內容的檢索和相似度搜索、概化和多維分析、分類和預測分析對復雜數(shù)據(jù)進行挖掘,使數(shù)據(jù)挖掘技術發(fā)展的整體趨勢由處理簡單的挖掘問題逐步到解決復雜的挖掘問題。
(四)加強對數(shù)據(jù)挖掘結果的有效性研究
用科學的方法加以評估。目前許多算法所花費的時間很短,但其挖掘結果的數(shù)據(jù)卻遠遠超出了可理解的范圍。隨著信息技術的高速發(fā)展,今后的算法研究需要集中在挖掘結果的有效性上,便于用戶快速得到自己所需要的、有價值的信息。包括對算法的動態(tài)維護、基于約束的挖掘算法和提高算法的可伸縮性等都將是主要的研究方向。
(作者:華夏銀行總行資產管理部 李虹含)