精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

云時代企業數據挖掘面臨的挑戰

責任編輯:sjia

2011-12-21 16:08:55

摘自:CSDN

隨著云時代的到來和SaaS概念的引入,越來越多的企業開始選擇由SaaS應用提供商、運營商等通過互聯網平臺提供SaaS應用服務,SaaS應用的數據量面臨著TB級的增長速度。

隨著云時代的到來和SaaS概念的引入,越來越多的企業開始選擇由SaaS應用提供商、運營商等通過互聯網平臺提供SaaS應用服務,SaaS應用的數據量面臨著TB級的增長速度;不同的SaaS應用體系,提供的數據結構也不完全相同,數據有文本、圖形甚至小型數據庫;SaaS應用數據隨著云服務平臺的分布性特點,有可能分布在不同的服務器上,如何對這些異構異源的數據進行數據挖掘,是云時代的企業面臨的難題。

云時代企業數據挖掘面臨的挑戰

挖掘效率:進入云計算時代后,BI的思路發生了轉換。以前是基于封閉的企業數據進行挖掘,而面對引入互聯網應用后海量的異構數據(據預計到2020年,爆發式增長的數據量將突破35ZB(1ZB=10億TB))時,目前并行挖掘算法的效率很低。

多源數據:引入云計算后,企業數據的位置有可能在提供公有云服務的平臺上,也可能在企業自建的私有云上,如何面對不同的數據源進行挖掘也是一個挑戰。

異構數據:Web數據的最大特點就是半結構化,如文檔、報表、網頁、聲音、圖像、視頻等,而云計算帶來了大量的基于互聯網模式提供的SaaS應用,如何梳理有效數據是一個挑戰。

SaaS應用的數據挖掘希望能夠通過海量數據存儲平臺,引入快速并行的挖掘算法,提高數據挖掘的質量。

如何選用合理的基礎架構

對于企業而言,如何將各種應用數據進行整合挖掘,提煉出適合其使用的商業信息是企業的一大急迫需求。傳統的BI模式大多基于數據倉庫,是關系型數據庫的模式。面對急劇增長的異構數據,傳統的數據倉庫和原有的并行計算技術由于挖掘效率低,已經不能解決海量數據挖掘工作,影響著數據的及時提取。

一直以來,商業智能系統往往基于傳統的SMP架構小型機而構建。隨著近年來X86平臺的性能與日俱增、可用性日漸提升、擴展性飛速增長,X86平臺在越來越多的市場領域開始侵蝕小型機份額,商業智能也成為X86架構向RISC小型機發起進攻的另一個戰場。例如,Oracle推出的基于英特爾至強平臺的Exadata數據庫云服務器,通過獨有的smartscan技術,以及數據處理過程下移的設計,在X86架構基礎上同時提供了較高的OLAP性能(數據倉庫應用)和OLTP性能。此外,IBM也推出了基于X86平臺的商業智能解決方案,基于IBM獨有的EX5架構服務器和XIV網格存儲系統提供了不輸于小型機的智能信息處理能力。

選購要點:

1、高可用性:BI的基礎架構層,需要建立起數據挖掘云服務平臺,而這個平臺,必然是高可用性的。

從高可用性來看,需要集中解決三個方面的問題:一是數據保護,需要利用CRC、ECC等硬件機制來對傳輸的數據進行校驗、糾錯,如果無法糾正,就將損壞的數據進行隔離,以保證不造成更大的數據,避免系統的重啟和宕機。

目前英特爾至強7500或E7合作的方案擁有諸多優勢,如成本低、性能高、可靠性(RAS)高、可擴展性好等優勢。在可擴展性能上,X86平臺橫向的向外擴展功能,即由兩臺以上的機器構成集群。能滿足大多數企業關鍵應用環境的負載需求,包括對內存和CPU要求都較高的數據庫、商業應用和虛擬化。進而避免傳統UNIX雙機方案“成本高昂,備機資源平時嚴重閑置浪費,主機故障切換期間用戶服務被迫停頓”等諸多困境。

此外,7500一些設計已經將計劃宕機時間最小化,這當中包括系統分區管理技術、CPU和內存的熱添加和熱移除等,將系統維護時間降低到最小。

2、虛擬化:數據挖掘云服務還是要依賴于虛擬化技術,要計算資源自主分配和調度,也就是說虛擬化技術是數據挖掘云服務技術的支撐。

千萬不要被概念忽悠

大數據有很多不同的使用情況。因此,企業需要根據自身業務情況采用不同的的數據挖掘平臺。對于那些注重應用分析和處理要求的客戶來說,有很多專門的解決方案,例如惠普Vertica,此外還有很多高性能NAS或者目標系統。

同樣地,對于注重視頻、安防監控、閉路電視、模擬仿真、大帶寬或吞吐量的話,可以考慮惠普Ibrix、戴爾Exanet、BlueArc、HDS、NetApp、Data Direct Networks、Oracle 7000、EMC Isilon和VNX等。

總的來說,用戶可能會面對一大堆勸說你遷移到更昂貴系統的市場炒作。可能你現在的系統已經足夠好的——如果可以擴展的話,廠商提供給你的并不一定可能很好地運行在你目前的環境下。

對用戶而言,需要警惕各種關于大數據的炒作,他們也許想要縮小你的選擇范圍。除了大數據所能帶來的機遇之外,還有很多不同的方面需要考慮,例如它的特性、應用、使用實例以及部署方案。 

鏈接已復制,快去分享吧

企業網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 城固县| 阿巴嘎旗| 耒阳市| 鄂托克前旗| 汤阴县| 子洲县| 永州市| 德安县| 枣庄市| 汾西县| 兰州市| 崇仁县| 武强县| 林芝县| 吉安市| 紫阳县| 七台河市| 湘乡市| 万山特区| 屯昌县| 吉木乃县| 绥棱县| 会昌县| 紫金县| 新兴县| 花垣县| 赣州市| 项城市| 大庆市| 东阳市| 建平县| 崇文区| 东源县| 丰台区| 攀枝花市| 晋中市| 太谷县| 泽州县| 宁武县| 冀州市| 宁国市|