精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

五個不容忽視的“非主流”大數據技術工具

責任編輯:editor007

作者:Cashcow

2017-02-13 20:42:13

摘自:IT經理網

大數據的生態系統如今已經非常龐大,涌現大量主流數據處理框架如Hadoop、Spark、Flink、Google的Tensorflow以及其他不計其數的Apache開源項目(最受歡迎的十個開源大數據技術)。

大數據的生態系統如今已經非常龐大,涌現大量主流數據處理框架如Hadoop、Spark、Flink、Google的Tensorflow以及其他不計其數的Apache開源項目(最受歡迎的十個開源大數據技術)。

今天我們要推薦的五個“非主流”開源大數據技術項目,在某些特定的應用場合,往往能助您出奇制勝。

一、Luigi

Luigi

Luigi是Spotify開發的數據管線批處理工具,熱度正在不斷飆升。Luigi的定位不是取代底層數據處理工具如Hive或者Pig,而是在眾多任務間創建工作流。Luigi原生支持Hadoop,這對于很多用戶來說非常有吸引力。

近日創業公司Mortar就將Spotify開發的開源大數據工具Luigi搬上云端,在亞馬遜云上提供復雜的,涉及大量工具和數據庫的大數據流水線處理服務,不論是否使用Hadoop,用戶都可以用Luigi管理復雜的大數據工作流。

二、Lumify

Lumify是一個開源大數據分析和可視化平臺,開發者Altamira認為當前的大數據分析工具并不完善,因此開發了Lumify來聚合、管理和洞察數據,此外,Lumify還可以用來分析數據內部之間的關系,進行地理圖形數據分析,并實時組織和協調數據。Lumify的官網由比較完整的文檔和介紹視頻,還提供了了一個在線應用示例。

三、Google 云平臺Hadoop互操作工具

google-cloud-platform

  這個技術項目來自Google Cloud Platform的官方Github賬號,描述如下:

為實現Hadoop相關開源軟件、Google云平臺之間互操作的代碼庫和工具集。如果你打算在Google云平臺上運行基于HDFS數據的Map-Reduce任務,那么這些工具值得投資。

四、Presto

presto-og

Presto是一個分布式的大數據SQL查詢引擎,支持所有數據源格式,以及從GB到PB級別的數據規模。Presto主打的賣點是速度和可擴展性,如果你想提升SQL查詢速度又不愿對數據源存儲系統進行投資或改動,或者需要對存儲在多個平臺的數據源進行查詢,Presto都是值得考慮的選擇。Presto的官網由比較詳細的資料,這里還有一個Teradata的五分鐘視頻介紹(youtube),以及Facebook的Presto設置應用指南(youtube)。

五、Clusterize

clusterize

來自Denis Lukov的這個項目是今天介紹的“非主流”中的非主流,與前面介紹的四個后端數據科學/工程工具不同,Clusterize是一個Javascript寫成的前端開發小項目,目的是提高大數據集的瀏覽效率,降低延遲,這算得上是一個大數據工具嗎?也許吧,至少對于很多開發者來說是如此。

鏈接已復制,快去分享吧

企業網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 芜湖市| 澄城县| 郎溪县| 通江县| 抚松县| 江口县| 吴堡县| 黄平县| 麻阳| 合川市| 丰顺县| 武平县| 襄垣县| 阿巴嘎旗| 南雄市| 临朐县| 新源县| 二连浩特市| 南靖县| 合江县| 夏河县| 左云县| 临邑县| 壤塘县| 黑水县| 汕头市| 荆州市| 商城县| 靖安县| 东辽县| 论坛| 西昌市| 石狮市| 玛纳斯县| 崇州市| 五寨县| 江西省| 新宁县| 恩施市| 深州市| 新巴尔虎左旗|