多年來,在大數(shù)據(jù)時(shí)代正式開始之前,企業(yè)級數(shù)據(jù)倉庫領(lǐng)域推動這個(gè)“全放在一個(gè)籃子里”的觀點(diǎn)。但是如今,這個(gè)觀點(diǎn)已經(jīng)不再適用,在大數(shù)據(jù)時(shí)代,數(shù)據(jù)安全已經(jīng)成為重中之重。即使是已經(jīng)在數(shù)據(jù)挖掘領(lǐng)域成為領(lǐng)頭羊的Hadoop也不能讓我們放心。
數(shù)據(jù)安全
歷史提醒我們,不要忘記過去的教訓(xùn)。具體地說,Hadoop在某些方面權(quán)力過度,長期困擾著市場。我指的概念,Hadoop可以并且應(yīng)該中央整合數(shù)據(jù)中心所有業(yè)務(wù)的分析數(shù)據(jù)。
盡管一些企業(yè)顧客不希望把錢、時(shí)間、資源整合到一個(gè)完全不同的分析數(shù)據(jù)庫平臺,為此許多公司已經(jīng)合并一些核心數(shù)據(jù),但是這還依然遠(yuǎn)遠(yuǎn)不夠。
事實(shí)上,大數(shù)據(jù)時(shí)代的時(shí)代精神已經(jīng)開始轉(zhuǎn)向 “混合”部署模型,混合企業(yè)級數(shù)據(jù)倉庫,Hadoop NoSQL、內(nèi)存和其他數(shù)據(jù)平臺異構(gòu)。
混合體系結(jié)構(gòu)的上下文中,這“數(shù)據(jù)湖”的夢想似乎是特定于一個(gè)大數(shù)據(jù)部署角色:一個(gè)探索性的“沙箱”。很多數(shù)據(jù)科學(xué)家都涌向Hadoop作為a全部數(shù)據(jù)的“沙箱”, 正如此前討論的那樣。
毫無疑問,Hadoop正成為一個(gè)關(guān)鍵的應(yīng)用程序開發(fā)和大數(shù)據(jù)分析平臺。 但這并不意味著Hadoop將是唯一這樣的平臺。 事實(shí)上,每一個(gè)大數(shù)據(jù)平臺Hadoop,MPP EDWs,NoSQL,內(nèi)存,和流媒體,都可以作為一個(gè)應(yīng)用程序開發(fā)和執(zhí)行平臺。
任何人認(rèn)為將所有數(shù)據(jù)放在一個(gè)籃子里,靠唯一的應(yīng)用程序來保證和開發(fā)都是完全錯誤的。