中國(guó)銀行業(yè)監(jiān)督管理委員會(huì)特邀顧問(wèn)、中國(guó)工商銀行原行長(zhǎng)楊凱生5月14日出席”2016年中國(guó)金融科技創(chuàng)新論壇”,并發(fā)表題為《關(guān)于大數(shù)據(jù)的認(rèn)識(shí)誤區(qū)及其在互聯(lián)網(wǎng)金融中的表現(xiàn)》的演講。
楊凱生認(rèn)為,互聯(lián)網(wǎng)金融近期出現(xiàn)一系列問(wèn)題反映了我們對(duì)互聯(lián)網(wǎng)、大數(shù)據(jù)技術(shù)的理解存在偏差。在大數(shù)據(jù)時(shí)代更要注意處理好碎片化信息和完整性數(shù)據(jù)的關(guān)系,處理好結(jié)構(gòu)性數(shù)據(jù)和非結(jié)構(gòu)性數(shù)據(jù)的關(guān)系,作為企業(yè)包括銀行還要處理好客戶(hù)個(gè)性化意識(shí)和社會(huì)化共同需求的關(guān)系。
楊凱生指出,應(yīng)該更多地注意到互聯(lián)網(wǎng)思維有另一層含義,就是互聯(lián)網(wǎng)、大數(shù)據(jù)技術(shù)的發(fā)展和進(jìn)步給人類(lèi)提供的是從更寬視野、更多維度、更全方位來(lái)認(rèn)知問(wèn)題和分析問(wèn)題的工具和方法。
他舉例說(shuō),有的機(jī)構(gòu)掌握了一定量的客戶(hù)信息數(shù)據(jù),就以為是掌握了大數(shù)據(jù),而忽視了對(duì)數(shù)據(jù)分析工具和方法論的研究,這在金融業(yè)務(wù)中就很有可能影響對(duì)風(fēng)險(xiǎn)的識(shí)別和防控,造成風(fēng)險(xiǎn)的積聚和擴(kuò)散。這一階段一些從事互聯(lián)網(wǎng)金融業(yè)務(wù)的公司尤其是一些P2P網(wǎng)貸公司頻頻出現(xiàn)的失敗,除了一部分是蓄意欺詐行騙外,多數(shù)正是因?yàn)檫@些機(jī)構(gòu)并沒(méi)有真正搞清楚究竟什么是大數(shù)據(jù),自己究竟獲得的是什么數(shù)據(jù),自己究竟有沒(méi)有掌握好所需要的數(shù)據(jù)挖掘技術(shù)、建模技術(shù)和分析評(píng)估技術(shù)。
也有人總是以為在一個(gè)樣本范圍內(nèi)得出了結(jié)論,就等同于掌握了對(duì)某個(gè)問(wèn)題全部的規(guī)律性認(rèn)識(shí)。其實(shí)在一個(gè)范圍內(nèi)的結(jié)論(即便是正確的結(jié)論)也不一定能夠簡(jiǎn)單外推,這就是在所謂機(jī)器學(xué)習(xí)中需要嚴(yán)格防止的模型“過(guò)度擬合”問(wèn)題。模型越是復(fù)雜、需要納入的變量越是多,就越容易出現(xiàn)這樣的問(wèn)題。這也正是在金融風(fēng)險(xiǎn)管控中必須注意的“模型風(fēng)險(xiǎn)”問(wèn)題。
楊凱生說(shuō),強(qiáng)調(diào)大數(shù)據(jù)的重要性,不能丟掉小數(shù)據(jù)。傳統(tǒng)的小數(shù)據(jù)有經(jīng)典的數(shù)理模型,有比較成熟的數(shù)據(jù)分析統(tǒng)計(jì)理論、方法,數(shù)據(jù)挖掘的技術(shù)早就成形。但是大數(shù)據(jù)到今天為止,管理理論、分析方法都還處在快速發(fā)展更迭的階段,并沒(méi)有十分的成形。大數(shù)據(jù)數(shù)量越大,噪音相應(yīng)也就越大。甚至往往是數(shù)據(jù)大幅增加的時(shí)候,它的噪音的增長(zhǎng)幅度要快于數(shù)據(jù)量的增長(zhǎng)幅度。因而大數(shù)據(jù)的挖掘成本是比較高。再比如大數(shù)據(jù)更容易反映出一些相關(guān)關(guān)系,而小數(shù)據(jù)通過(guò)分析比較容易直接得出因果關(guān)系。在許多情況下相關(guān)關(guān)系并不能簡(jiǎn)單地取代因果關(guān)系。
因此,大數(shù)據(jù)和小數(shù)據(jù)各有特點(diǎn),各有它的長(zhǎng)處、短處。簡(jiǎn)單的想以此來(lái)取代彼,不是一種科學(xué)的看法。只有把它融合起來(lái),把小數(shù)據(jù)分析方法的完備性、準(zhǔn)確性和大數(shù)據(jù)的多維性、即時(shí)性融合起來(lái),才能對(duì)管理真正帶來(lái)一種質(zhì)的改變。“應(yīng)該說(shuō),前一階段一些互聯(lián)網(wǎng)金融企業(yè)出現(xiàn)的問(wèn)題,就與這方面思想認(rèn)識(shí)上的片面性有關(guān)。”楊凱生說(shuō)。
楊凱生總結(jié)說(shuō),數(shù)據(jù)是一種財(cái)富,因?yàn)樗侨祟?lèi)活動(dòng)的記錄與結(jié)晶。但數(shù)據(jù)多了有時(shí)也會(huì)帶來(lái)挑戰(zhàn),記錄中可能摻雜噪音,結(jié)晶旁也許陷阱縱橫,對(duì)于數(shù)據(jù)信息的不當(dāng)理解,對(duì)于分析方法的盲目應(yīng)用,以及數(shù)據(jù)使用者本身的目的以至品性如果存在問(wèn)題,那就有可能使得人們?cè)诿鎸?duì)世間萬(wàn)象時(shí)變得比以往缺乏數(shù)據(jù)信息的年代更加迷惑。只有學(xué)會(huì)客觀地看待數(shù)據(jù),合理地選擇工具,科學(xué)地進(jìn)行分析,才能夠從紛繁復(fù)雜的社會(huì)經(jīng)濟(jì)生活中提煉出那些有價(jià)值的結(jié)論。