2014年巴西世界杯之前,除了各國的球員以外,恐怕最為緊張當屬各大博彩公司了,開賽前,很多科技公司就宣傳引入大數據的分析,已經成功推測出這屆世界杯的冠軍,而且言之鑿鑿,志在必得。而事實卻并非單純的模型公式推算那樣簡單,大數據分析出的這屆世界杯冠軍巴西隊,不僅沒有奪得冠軍,甚至半決賽就被德國隊打成篩子,最終連季軍都拱手相讓,博彩公司松一口氣的同時,也讓我們不免質疑,大數據真的靠譜嗎?
英國人維克托·邁爾·舍恩伯格的《大數據時代》為我們展現了大數據的魅力,也開啟了一個全新的大數據時代,于是乎,一時間大數據成為一個熱門詞匯,以至于不提大數據就感覺落伍了。銀行更是如此,特別是阿里系為代表的互聯網金融借助大數據積累的崛起,更加挑動了銀行的神經,開始言必大數據,創新必大數據,甚至將原有的一些基礎業務稍加粉飾,生拉硬拽般冠以“大數據”,就打包推出,預言銀行試水大數據,銀行業的大數據時代來臨了等等。然而,銀行業本身就是靠數據積累起家的,何以牽強附會,跟風盲從呢?
回歸大數據理論,大數據的產生,原本就是由于一些行業、領域不能提供精確的節點數據,而只好退而求其次繞過關鍵點的具體數據,轉而通過擴大數據規模,直到無限大,總結規律,從而推斷出所需節點的數據值。簡言之,這應該就是一個統計推斷的過程,這一過程往往會舍棄、忽略掉一些異常數據,轉而倚重依賴出現頻率高、符合走勢的數據,而隨著數據規模的不斷擴大,這些被舍棄、忽略掉的異常數據變得微乎其微,于數據而言,愈加漂亮,愈加符合預期,而于研判結果而言,卻并非如此。縱然,隨著數據規模的不斷擴大,被舍棄、忽略掉的數據越發顯得微乎其微,但是,往往數據走向出現異常,恰恰是有這些微乎其微的改變開始的。
回到銀行業,銀行自身就是一個擁有精準大數據的行業,再來通過數據走勢來推斷有些舍本逐末,事實上,我們要做的不是將異常數據忽略掉,而是將這些數據找回來!這不僅是實現風控的基礎思想,也是實現業務拓展的關鍵所在。
一、數據永遠是片面的
大數據理論的核心所在是數據樣本的數量規模,規模越大,所能推斷出的結果與真實表現之間的誤差越小,準確度越高。然而,理論中的數據是沒有條件限制的無限擴大的數據,這等于是在真空狀態下談論地心引力,雖然,我們都知道鐵球和羽毛在同一高度上,理應是同樣時間落地的,但是我們卻不能指望在現實中這一現象一定發生,受制于自身密度、體積、風阻等因素,你永遠不可能看到鐵球和羽毛同時落地。
同樣的,銀行業所獲知的數據,也不是沒有條件附加的,或者簡單說來,銀行業所獲得的數據,都是客戶想要展示給你的數據,而一定不是數據的全部。在原本就不可能實現數據樣本無限擴大的前提下,談大數據是一個偽命題。以銀行個人貸款審批為例,銀行所獲知的客戶的信息,大部分都是客戶想要展示的有利于審貸結果的信息,這就從某種程度上將大數據的規模將為理論規模的50%,在一般數據的基礎上談論大數據,顯然是沒有意義的。
二、永遠不變的是變化
人不能兩次踏進同一條河流。對于銀行而言,客戶是無時無刻不再變化的,企業前一時期的經營狀況與當下是會有不同的,客戶兩個不同時期的資產狀況也是有區別的,而這一變化放到業務受理的全程中,相較于之前的數據表現,無疑是容易被忽略掉的。特別是對于老客戶而言,往往輕微的改變,容易為歷史數據所掩蓋,而恰恰真是這一突變容易演變成風險點。
5月份與一位資深財經記者溝通時,曾得到他一個看似不怎么高大上的結論,那就是凡是貸款的,沒有想還錢的。諸多貸款者,大到壟斷企業,小到個體戶,小商販,凡是貸款的,都是寄希望于用貸款能帶來的財富升值償還貸款,說到底是借雞生蛋,而沒有是寄希望于用自己的即有資金償還的。于是,企業無法償還貸款時,會申請破產,甚至會出現企業家跑路,房貸客戶房價下降,房屋市價低于貸款額時就會斷供。
所以,銀行面對的客戶狀況是瞬息萬變的,用日常數據來推斷客戶的未來走向是極其片面的,這點在合規風險控制角度是極為重要的。從銀行角度,關注客戶的新動態,而不僅僅是躺在以往數據上睡大覺,這才是規避風險的態度。
三、以人為本
大數據的理論,將一切抽象成數據,如同在實驗室做試驗,無論是物理試驗、化學試驗,還是生物試驗等等,所面對的都是可以重復雷同的物體,而人則不同,人是具有思想的,有感情的,人的行為也就當然受到影響。銀行所面對的客戶,說到底是面對的一個一個的個人,以及取得企業信用背書的個人,既然如此,那么談論大數據就要考慮到人性的東西。
以消費為例,馬斯洛理論把需求分成生理需求、安全需求、歸屬與愛的需求、尊重需求和自我實現需求五類,而往往日常消費中,人是將這些需求復雜而又簡單的糅合到一起來釋放的。例如,高中生的消費習慣跟大學生是不同的,而大學生與剛工作的新員工又有不同,并非簡單的消費能力的不同,這其中涵蓋了他在不同時期對于五類需求的側重程度。而從大數據理論出發,銀行如果向這位新人發放信用卡可能會側重于既往的數據,而對于依然身份改變的客戶而言,這張信用卡可能就不能再滿足他的需求。我們可以預見,他有可能會繼續純真,保持原有的消費習慣,也有可能會急于擺脫校園氣息,重新塑造自己,當然,更有可能將以往的消費習慣完全顛覆掉,將自己的消費全部升級,而這每一種風格的改變,所需求的信用卡服務是截然不同的。
同樣的,人隨著年齡的增加,閱歷的增加,觀念也會發生潛移默化的改變,可能在以往表現的數據中不會顯露端倪,但是由量變到質變,他的下一刻動向也將超出原有大數據以外。例如,剛工作的新員工不會有住房、汽車的需求,他所需要的是特約商戶、增值服務等信用卡功能,而一旦結婚,組成新的家庭,他所需要的可能是理財投資需求,這些都是大數據所不能給出的結論。
所以,對于銀行業而言,要在利用大數據理論的同時,融入人性化的關注提升,才能以開放式的思維伴隨客戶成長。
四、大數據的生命周期
產品、行業,世間萬物都有其生命周期,對于大數據而言,也是如此。對于大數據而言,縱然數據不會消亡,但是它也一樣擁有時效性,從這個角度而言,大數據所要面對的“從搖籃到墳墓”用Life Cycle的直譯更為貼切,應該是“大數據的生命循環。
如何理解這一概念呢?因為客戶自身及金融服務需求是在變化的,客戶在經歷著不同的投資、融資需求,而每個階段的特性是一個數據生命周期,上一個大數據周期內的數據,對于下一個大數據周期是沒有任何意義的。
如果具體到業務中,這就很好理解,一個企業,在上市之前的金融服務需求跟上市之后是完全不一樣的,我們在用大數據理論來研判企業需求時,就需要對企業分階段分析,這樣才能為企業提供量體裁衣式的方案。個人而言,一個人在不同的年齡階段,他的資產狀況和需求也是不一樣的,我們不能拿這個人貸款買房周期內的數據來推斷他退休后的需求,也不能拿他無房貸時的數據來推斷他買房后的服務需求。
對于大數據而言,每一個階段性發展就是一個生命循環,我們不能混淆不同階段的大數據概念,更不能一味貪圖數據規模的擴大而盲目忽略不同階段時期的數據間隔。
無論是大數據理論也好,還是互聯網思維也好,對于銀行業來講,只是自身業務外的一種理念嘗試,歸根結底,銀行業依然還是要在立足自身業務的前提下,探索新的發展思路,而不是見風是雨般人云亦云。