精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

Hadoop和企業信息管理:利用大數據的解決方案

責任編輯:ycao

2018-03-09 15:40:38

摘自:51CTO

今天,Hadoop可以提供一個能容納大型復雜的業務應用程序數據處理基礎設施。以大數據為處理模型的核心,運行在Hadoop上的典型業務系統包括三個不同的層:基礎結構層、數據層和分析層。

過去幾年,大數據在全球商業環境中的重要性已得到堅定的確認。2017年看起來是 Apache Hadoo pimplementation (在開源開發和更多的商業選擇方面)在企業層面上,由于企業信息管理(EIM)仍然需要更多改進的大數據解決方案。

數據倉庫現代化、Hadoop項目級的采用和數據湖泊的使用的早期(和持續)趨勢可能會繼續以更快的速度向前發展。在版本1和2之間,Hadoop已經從一個主要面向批處理的處理器發展為一個強大的、實時的數據處理器,它可以處理企業級的大數據應用程序以及更傳統的遺留數據集。

今天,Hadoop可以提供一個能容納大型復雜的業務應用程序數據處理基礎設施。以大數據為處理模型的核心,運行在Hadoop上的典型業務系統包括三個不同的層:基礎結構層、數據層和分析層。因此,諸如MapR或Cloudera這樣的商業平臺供應商可能會發現很容易將Hadoop架構定位為滿足大多數企業需求的全方位實用平臺。

現代企業中的數據爆炸

“福布斯”的一篇標題為Hadoop為企業黃金時段做好準備的5個原因的博文,解釋了數據爆炸如何迫使組織通過第三方來擴展他們的業務應用程序,而不需要進行大量投資。在托管服務場景中,企業不必擔心基礎設施、內部數據中心或專家人力--從而將全部時間和精力用于加快交付速度。

最新的“錦上添花”是Hadoop的開源解決方案的穩定供應,它將這個獨特的數據平臺的功能和能力擴展了幾倍。對于供應鏈系統,這個故事有點不同。Hadoop是什么?它對供應鏈管理意味著什么?一文認為,作為供應鏈的基礎,風險評估應用程序是大量的“非結構化數據”,“Hadoop與MapReduce和HDFS為供應鏈項目中的風險評估和緩解提供了一個強大的組合。

面向企業信息管理的Hadoop

商業數據集已經超越了數據庫,擴展到了網絡軌跡、GPS數據、傳感器數據和社會數據。新的“數據環境”需要先進的技術和工具來利用大量的多結構數據,如果使用正確的工具處理,就能產生有利可圖的智能和視覺效果。文章還強調,龐大的數據量使我們有必要找到節省成本的技術解決方案來存儲和處理這些數據。Hadoop是支持大數據的技術的極好解決方案,可以為業務用戶提供真正的好處。

Seed分析小組探索EIM面臨的大數據挑戰,在那里,大數據分析被證明是在激烈競爭中取得成功的核心區別因素。像LinkedIn這樣的公司已經利用“大數據分析”領先于競爭。有趣的觀察是,許多領先的軟件供應商已經將Hadoop作為他們首選的大數據應用程序平臺。

在全球范圍內,鼓勵企業開始規劃Hadoop上的大數據和大數據分析,如果它們還沒有這樣做的話。在這里,企業數據框架已經被明確地定義為四個連續的步驟:數據采集、數據清理、數據處理和智能收集。一篇題為“大數據分析時代企業數據倉庫的角色演變”的行業白皮書試圖解釋大數據技術需要適應傳統的進入企業信息管理模式。

“數據庫趨勢與應用”雜志報道了2017年數據和信息管理中的趨勢設定產品,最近,云已經成為組織間一個頂級的數據存儲平臺。參加本次2016年DBTA調查的大多數組織有超過100TB數據。

Hadoop上的大數據

Apache的Hadoop最流行的開源版本需要高級的技術技能,而訂閱Hadoop -as-a- service可以減輕客戶機的維護負擔。HP與HortonWorks合作,在Hadoop和它自己的大數據技術之間建立了一個堅實的技術聯盟。

在這一廣譜的另一端,IBM提供了在云中的基于前提和托管的Hadoop版本。到目前為止,許多想要管理多結構的大數據的組織可能會依賴Hadoop來交付理想的結果。真正的挑戰在于為Hadoop數據庫和它們的內部應用程序選擇合適的分析解決方案。

數據湖:獨特的Hadoop倉庫

數據湖有能力以不同的格式攝取原始數據,并且可以很容易地擴展到pb級。在數據湖中存儲原始數據的最大好處是,數據可以反復地重新定義業務需求和需求。這允許以最靈活的格式保存數據以適應任何新的應用程序。

在Hadoop上構建大數據用例

構建Hadoop基礎設施的一個有效方法是通過大數據用例。為了建立最佳用例,組織首先需要人力——一組能干的數據架構師和能夠根據現有數據可視化和構建解決方案的數據科學家。與這些專家一起,組織還需要數據分析師和商業情報專家從數據中提取洞見。在理想的情況下,這是一個多努力的練習,需要廣泛的技能和經驗。

2017年的數據管理趨勢表明,Hadoop存儲設備的巨大成本優勢使其成為現代企業數據存儲的首選。DataLake保存原始格式數據的強大功能使其能夠在不同的應用程序中重復使用該數據。

Gartner發布了一張有用的信息圖表,以幫助理解Hadoop為什么能夠提供企業信息管理系統提出的大部分數據需求,這就需要適當地整合領域、路線圖、流程、工作流程,并充分關注數據治理,從而推動所希望的結果。

這張圖還試圖描述首席數據官的作用,他最好能領導大型企業信息網絡中的數據治理和數據管理工作。

展望未來

隨著企業數據量在戰略上的重要性不斷提高,傳統的企業數據倉庫將繼續演化為更大更復雜的數據架構。從高層管理人員到車間經理,每一個商業用戶都可能開始利用大數據應用程序來審查、分析和報告日常業務操作中的關鍵任務信息。

此外,如機器學習和深度學習等先進技術包含在企業大數據應用程序中,用于預測建模、針對客戶、產品定價或建議,像Hadoop這樣的開源平臺可能是成本高效的企業信息管理解決方案的完美答案。這些趨勢將持續到2017年(及以后),并將通過Hadoop的sql化以及物聯網(物聯網)的增長而得到加強。

鏈接已復制,快去分享吧

企業網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 黄浦区| 民县| 偃师市| 肃南| 东海县| 增城市| 南漳县| 长岛县| 苍山县| 密山市| 武安市| 井研县| 宁武县| 凤冈县| 石楼县| 云阳县| 辽阳县| 衡东县| 乌兰县| 临猗县| 田阳县| 合水县| 新宾| 珲春市| 博罗县| 望都县| 遵化市| 兴和县| 罗城| 墨竹工卡县| 富宁县| 咸宁市| 绥化市| 乌苏市| 肥城市| 阿坝县| 九寨沟县| 黄浦区| 凤台县| 洮南市| 营口市|