《企業(yè)網(wǎng)D1Net》2月28日訊
2014年,從開年以來,就喜事頻頻,可以看出,2014年是不平凡的一年,就大數(shù)據(jù)而言,2014年將是大數(shù)據(jù)的回歸之年。之前讓人感覺無所不能的大數(shù)據(jù),將真正面對實施階段的考驗。
而大數(shù)據(jù)與金融之間的關(guān)系,也人們最為關(guān)注的。
金融大數(shù)據(jù)的四步走
金融大數(shù)據(jù),目前有四個階段。第一階段是基于數(shù)據(jù)存儲;第二階段是分布式計算;第三階段是大數(shù)據(jù)挖掘與分析;第四階段是數(shù)據(jù)服務。對于商業(yè)銀行,包括工商、建設(shè)、農(nóng)業(yè)、交通和中行這國有五大行來說,都處于第一階段。其中,建行處于平臺選型階段。農(nóng)業(yè)銀行已經(jīng)完成數(shù)據(jù)存儲方面的工作,但還未上線。
銀行的大數(shù)據(jù)處理
銀行等金融機構(gòu),對大數(shù)據(jù)的處理需求有其特殊性。第一個就是結(jié)構(gòu)化數(shù)據(jù)存儲,第二個是數(shù)據(jù)挖掘。下面我們將逐一為您解開
結(jié)構(gòu)化數(shù)據(jù)存儲,商業(yè)銀行有實時查詢數(shù)據(jù)庫,用來處理歷史金融數(shù)據(jù)。受限于傳統(tǒng)ROE(Oracel、DB2、Sybase等)數(shù)據(jù)庫的單表數(shù)據(jù)量瓶頸。銀行數(shù)據(jù)超過一定上限就會影響查詢效率。解決瓶頸的方法只能通過提高成本,大量購買高性能硬件和應用軟件來解決。雖然銀行IT部門預算豐富,但也還是需要平衡性能與成本的關(guān)系。
另一方面,銀行需要在現(xiàn)有的數(shù)據(jù)上進行增值挖掘。如果依靠傳統(tǒng)VR,對成本的影響巨大。采用大數(shù)據(jù)技術(shù)、采用分布式集成框架、采用開源框架,一方面滿足了成本依賴,另外一方面運算性能方面有所提升。
在業(yè)務數(shù)據(jù)模型方面,商業(yè)銀行分為兩個層面。第一個層面就是面向業(yè)務層面,我需要選擇哪些參數(shù)來構(gòu)成我參與預算的數(shù)據(jù)模型。這是業(yè)務層面上面,這一部分是與以前的模型一致。
另外一部分就是針對數(shù)據(jù)模型還有什么樣的計算方式,需要哪些數(shù)據(jù)的輸入,這方面發(fā)生了變化。因為你傳統(tǒng)離岸模式是單機的,運算性能始終都是它無法突破的東西。所以說它對數(shù)據(jù)處理的時候,往往是基于銷量數(shù)據(jù)的,基于出讓數(shù)據(jù)做小批量的數(shù)據(jù)嘗試,然后得出一些規(guī)律性的東西,然后再反向推導到其它數(shù)據(jù),這是傳統(tǒng)的模式。在這個環(huán)境里面有了一種突破,就是我可以去全量數(shù)據(jù),構(gòu)建數(shù)據(jù)模型的參考體系,這個數(shù)據(jù)量更大。另外一塊性能更高一些,比單機模式要快。
D1Net評論:
大數(shù)據(jù)與金融之間的關(guān)系,是很多人都關(guān)注的,隨著大數(shù)據(jù)的不斷發(fā)展,大數(shù)據(jù)在金融行業(yè)的應用也日益廣泛,無論是大數(shù)據(jù)四步驟戰(zhàn)略,還是銀行大數(shù)據(jù)的處理,都可以看出,大數(shù)據(jù)在金融行業(yè)的作用是無可替代的。