91精品国产闺蜜国产在线闺蜜,成人中文字幕在线观看,国产香蕉成人综合精品视频

如何保證Hadoop數據湖不變成“數據洪水”

責任編輯：jackye

作者：賈凱強

2016-07-11 09:23:29

摘自：中關村在線

數據湖的提出距今已經有了幾年時間了，特別是在當今時代中，基于Hadoop建立的數據湖在大數據處理中占有的位置越來越重要。而好消息是，一些相關的生態鏈已經在Hadoop領域開始形成，相信解決數據湖管理難題的工具將在不久后出現。

數據湖的提出距今已經有了幾年時間了，特別是在當今時代中，基于Hadoop建立的數據湖在大數據處理中占有的位置越來越重要。但是如何保證數據湖不像南方水災一樣泛濫，依然是一個耐人尋味的話題。

如何保證Hadoop數據湖不變成“數據洪水”

數據湖已滿，如何防泛濫

數據湖洪水泛濫

數據湖十分靈活，同時具備可擴展和低成本的特點。其最初建立的目的十分簡單，就是將所有形式的數據集中在同一處，這些數據包括了結構化數據、非結構化數據以及半結構化數據。這些數據可以是日志文件、點擊流、郵件、圖像、音頻視頻或者文本文件。

如何保證Hadoop數據湖不變成“數據洪水”

數據湖中數據類型繁雜

在這些數據中，非結構化和半結構化數據占據了很大一部分，但是由于我們的處理能力不同，一些數據可能在數據湖中存儲了很長時間而不能被處理掉，這樣就會一直積攢下來保留的現在。

誠然，數據湖可以幫助處理各種形式的數據，這其中以結構化數據為主。而且數據湖具備數據庫的大部分特質，可以提供數據查詢、結構化數據處理報告等業務。數據湖的最大價值在于數據利用、探索大數據的價值，預測未來結果并為企業提出相關建議，進而指導企業的進一步決策和行動。

如何保證Hadoop數據湖不變成“數據洪水”

“數據洪”一觸即發

但是，問題也就發生在這里。因為基于Hadoop部署的數據湖的能力并不足以應付一切，而用戶對數據湖又疏于管理。數據量隨時間而增加，數據湖開始泛濫，進而有逐步發展成洪水的趨勢。數據不能得到有效的分配，“數據洪”隨時可能沖潰堤壩，水漫金山。

抗洪還得靠管理

那么數據湖要如何才能避免成為數據洪的悲劇呢？首先應該從根本上改變傳統對數據湖的看法。把數據湖當作一個整體庫存來管理是存在問題的，對于管理人員來講，基于數據類型需要把數據湖分成一個個的區，分別處理管理。

如何保證Hadoop數據湖不變成“數據洪水”

基于Hadoop的數據湖需要分類

基于Hadoop的數據湖的區域劃分歸類對其而言十分重要。管理者需要對其需要提取的數據進行原始數據的保留，并且對其進行元數據標記，標明數據源、數據類型等。當被提取的數據處理完畢之后要對其統一規劃并進行后續處理。

如果用戶需要選擇一些特定應用程序的數據，那么可以通過收集、轉換，將來自不同數據源的數據全部帶走并進行處理。最后，在處理工作完成后可以通過數據軌跡、處理日志等工具對處理過程進行審核，保障數據處理的完成度。

如何保證Hadoop數據湖不變成“數據洪水”

數據分類管理

這些問題說起來簡單，但是做起來卻是一件相當麻煩的事情。這要求企業擁有一套十分成熟的數據提取工具，用于數據轉化、分類、標記以及其他任務。

而且不僅僅是企業關注這一問題，在Apache的Hadoop社區也有好多團隊在致力于開發此類工具。事實上，此類工具更趨向于數據管理專業，這些對于企業來講并不熟悉。而好消息是，一些相關的生態鏈已經在Hadoop領域開始形成，相信解決數據湖管理難題的工具將在不久后出現。

數據湖 Hadoop

2/28

2025全国医药大健康CIO大会

北京报名

3/1

2025全国消费零售CIO大会

北京报名

3/22

2025央国企CIO及数科公司峰会

北京报名

1/4

第九届中国制造业上市公司价值500强大会

北京结束

11/29

2024全国甲方IT选型大会

南京结束

9/14

2024全国制造业数智化大会

杭州结束

9/13

2024全国汽车业数智化大会

杭州结束

7/27

2024央国企CIO及数科公司大会

北京结束

6/5

2024CIOC全国CIO大会

银川结束

1/20

2024北京CIO大会

北京结束

熱門專題

邊緣創新數智向實

2023英特爾智能邊緣行業應用巡展·智慧協同站

飛利浦商用顯示器:智能科技助力高效工作

智能科技助力高效工作

破內卷“出海”勢在必行數字化為全球業務保駕護航

破內卷“出海”勢在必行，數字化為全球業務保駕護航

邊緣創新數智向實

2023英特爾智能邊緣行業應用巡展·智慧協同站

飛利浦商用顯示器:智能科技助力高效工作

智能科技助力高效工作

高端訪談

海爾智家技術總監高麗：云原生加速企業數字化轉型

海爾智家全球數字化平臺用到了哪些云原生技術產品?如何實現降本增效?在云原生技術應用方面有哪些實踐和探索?云原生技術發揮了哪些價值?在本期“云原生降本增效大咖說”中，企業網D1Net采訪了海爾智家全球數字化平臺技術總監高麗。

國藥國際CIO馮偉：數字化轉型要打破信息化建系統的固有思維

中國國際醫藥衛生有限公司數智化中心總經理馮偉在接受企業網D1Net專訪時提到：“回過頭來看，數智化建設最難的是轉思維，必須打破信息化總想去建系統的固有思維，要以平臺化思維、站在運營和業務的角度思考問題。思維轉變后，很多問題將迎刃而解。”

創維集團信息總監寧江：數據治理是數字化轉型的必由之路

創維集團信息總監寧江在接受企業網D1Net采訪時提到：“如今，站在數字化轉型的全局之下回顧過去幾十年的信息化建設，似乎建了很多煙囪，系統之間、流程之間不能共享數據，孤島林立。不同時期有不同時期的特征，都有其合理性和必要性，如今再來解決這些問題為時未晚。

海爾智家技術總監高麗：云原生加速企業數字化轉型

國藥國際CIO馮偉：數字化轉型要打破信息化建系統的固有思維

熱文推薦

精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

如何保證Hadoop數據湖不變成“數據洪水”

業務服務

網站地圖

友情鏈接

合作伙伴