精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

大數據處理一定需要Hadoop嗎?

責任編輯:editor005

2015-03-26 13:58:53

摘自:中國大數據

Google強大的搜尋引擎每天處理龐大的搜尋數據,靠的是數十萬的伺服器同時作工。一般企業并無法使用Google所用的內部搜尋引擎工具,所以,擁有處理大數據工具的分散式運算平臺Hadoop應運而生。

處理海量資料一定要用Hadoop?開放原始碼專家想出更簡單的解決方案!

Google強大的搜尋引擎每天處理龐大的搜尋數據,靠的是數十萬的伺服器同時作工。然而一般企業并無法使用Google所用的內部搜尋引擎工具,所以,擁有處理大數據工具的分散式運算平臺Hadoop應運而生。

  但問題是Hadoop使用上有難度,數據處理公司Cloudera決心要解決這個問題。

  過去的公司企業仰賴傳統的關聯式資料庫和數據倉儲就可應付所需,然而,今日電子商務、社交媒體和行動運算不斷成長使得資料量暴增,許多企業便開始使用Hadoop等的工具處理數據?,F在,Cloudera現在更針對Hadoop平臺推出類Google的搜尋引擎:Cloudera Search。

  搜尋引擎讓Hadoop更平易近人

  Cloudera希望客戶能在Hadoop壯大之前就將資料儲存進去,并將之整合入平臺。但使用Hadoop平臺與資料互動必須要懂得MapReduce運算技術,也就是說你得會寫Java語言,這對許多使用者來說并不方便。

  雖然Hadoop已經推出許多工具讓使用上更便利,但Cloudera希望更進一步建立一個Hadoop的搜尋引擎。產品經理澤德勒維斯基(Charles Zedlewski)說:「數萬開發者可能知道怎么用MapReduce,執行SQL指令,但會使用搜尋引擎的人有數十億人?!?br />
  Cloudera Search能夠與Hadoop分散式檔案系統(HDFS)或資料庫系統Hbase整合,使用者可以輸入搜尋字串后就找到一串搜尋結果。這項搜尋工具是以Apache Solr搜尋器為基礎。

  市場研究公司RedMonk分析師歐葛瑞迪(Stephen O’Grady)表示:「每多一項數據處理工具對Hadoop都有好處……從寫MapReduce程式到支援SQL語法的Hive或Pig等套件,每項工具都讓數據處理更有效率?!?br />
  所有大數據都該放入Hadoop嗎?

  這對改善Hadoop可用性的確幫助不少,但問題是:客戶是否真的有需要將它們所有的數據都放入Hadoop?微軟今年稍早發表一份報告,主張大多數的公司只需要增加叢集伺服器的使用數量,不須嘗試用單臺伺服器處理數據,報告指出,甚至雅虎和臉書兩家最需要數據處理效能的公司,也是透過增加伺服器叢集解決效能問題。

  但許多公司正面臨數據不斷增長的問題,一開始就加入Hadoop是不錯的選擇,RedMonk過去也是Hadoop的使用者,但最近轉用BigQuery等其他的Google資料庫工具,原因是他們的數據在量上本質就比較小,而且成長的速度也沒有分析師原本預測得快。

  但歐葛瑞迪說:「如果我們能夠更快速地獲得數據,就一定會使用Hadoop!

原文鏈接:http://www.thebigdata.cn/YeJieDongTai/13818.html

鏈接已復制,快去分享吧

企業網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 高阳县| 黑水县| 澎湖县| 广饶县| 根河市| 河间市| 进贤县| 甘孜县| 浦县| 左贡县| 乌什县| 西畴县| 安岳县| 双牌县| 错那县| 石城县| 桦南县| 玉树县| 兖州市| 铁岭市| 石渠县| 靖西县| 禄劝| 怀仁县| 宿迁市| 苍梧县| 盖州市| 卢湾区| 寻乌县| 吉安县| 潮安县| 尤溪县| 奉化市| 柳河县| 丰台区| 天柱县| 乌兰浩特市| 湖州市| 广水市| 三原县| 长治县|