亚洲精品乱码在线播放,日本理伦片和搜子同居的日子 ,91av精品视频

Spark大數據框架驅動快速分析

責任編輯：editor007

作者：Ed Burns

2015-07-28 17:46:31

摘自：TechTarget中國

Spark大數據分布式計算框架得到數據工程師的極大關注，但是到目前為止它的吸引力僅限于此。Spark的內存處理功能使客戶端能夠給研究人員提供快速的數據訪問，無論他們使用哪一種前端工具都一樣。

Spark大數據

Spark大數據分布式計算框架得到數據工程師的極大關注，但是到目前為止它的吸引力僅限于此。但是，用戶認為它有一個主要特性可以幫助它擴大影響力：速度。

企業越來越多地使用自助分析應用程序，它們變得很容易操作。簡單易用通常是在組織范圍內成功應用的一個最大因素，但是在上周舊金山舉行的Spark Summit 2015大會上，這個計算框架的早期使用者指出，速度可能才是讓一線人員使用數據的最大賣點。

谷歌最近收購的智能調度服務制造商Timeful的副總裁Gloria Lau說：“它們必須快速失敗，它們必須迭代。它們要可視化，然后再失敗。迭代是最有價值的。你必須相信非工程師也才做得很好。”

雖然Spark可能要求較同的技術能力才能管理其后臺的集群，但是開源技術的前端用戶友好性相對較好。ApacheSpark帶有一個Spark SQL庫，它給用戶提供了查詢各種數據存儲的工具，包括使用SQL、Java和R分析語言，而開發者甚至可以開發在Spark上更加簡單的前端應用程序來使用這些工具。

內存技術提升應用速度

由于Spark在內存中處理數據，運行在環境中的任何應用都能受益于速度。它的發明者指出，它處理數據的速度要比MapReduce快100倍，后者是Hadoop原來的處理引擎，而且在內存中運行作業時，Spark的速度相當于在磁盤中運行的10倍速度。

Lau指出，對于技術一般的用戶而言，這種速度是至關重要的。典型的數據用戶并不喜歡那些需要10分鐘才能處理完的作業。他們習慣了像谷歌這樣幾乎即時返回結果的查詢服務。

Lau說：“你想要的是普及數據。你希望所有人都能夠訪問數據，然后形成他們自己的洞察力。速度是你現在唯一應該關心的問題。”

豐田汽車美國銷售公司的高級數據科學家BrianKursar指出，Spark的速度幫助他和他的團隊開發出廣泛使用的報表，它們可以量化豐田品牌在社交媒體中的公共認知度。他們基于Spark的機器學習庫(MLlib)內置的算法開發了一個機器學習應用程序。但是，它也經過了幾次迭代才達到較高的精確度。

Kursar指出，快速完成這個過程，然后交付一個精確的結果，這種能力在幫助項目獲得主管支持并將其結果應用于實踐的過程中發揮著重要作用。

他說，“當你在開發一個產品時，你嘗試改進模型的準確性，這時計算能力和速度不高的技術會影響你的發揮。”

NASA使用Spark實現數據訪問

NASA噴氣推進實驗室的首席架構師Chris Mattmann指出，他和他的團隊正在開發一個基于Spark的數據處理系統，它旨在幫助研究人員訪問存儲在分散文件系統中的數據。

NASA及其合作伙伴生成的許多科學數據位于不同的數據系統中，并且使用科學社區中專用的文件類型，一般的工具很難訪問這些數據。此外，訪問當前數據存儲的研究人員在執行處理作業時耗時很長，因為每一個查詢都需要從各個數據存儲中拉取數據。所有數據都不在內存中。

但是，Spark的內存處理功能使客戶端能夠給研究人員提供快速的數據訪問，無論他們使用哪一種前端工具都一樣。

Mattmann說：“我們應該要能夠以交互試執行這些查詢。它應該能夠執行ETL，然后自動地將數據加載到內存中。”

谷歌數據訪問 Hadoop

2/28

2025全国医药大健康CIO大会

北京报名

3/1

2025全国消费零售CIO大会

北京报名

3/22

2025央国企CIO及数科公司峰会

北京报名

1/4

第九届中国制造业上市公司价值500强大会

北京结束

11/29

2024全国甲方IT选型大会

南京结束

9/14

2024全国制造业数智化大会

杭州结束

9/13

2024全国汽车业数智化大会

杭州结束

7/27

2024央国企CIO及数科公司大会

北京结束

6/5

2024CIOC全国CIO大会

银川结束

1/20

2024北京CIO大会

北京结束

熱門專題

邊緣創新數智向實

2023英特爾智能邊緣行業應用巡展·智慧協同站

飛利浦商用顯示器:智能科技助力高效工作

智能科技助力高效工作

破內卷“出海”勢在必行數字化為全球業務保駕護航

破內卷“出?！眲菰诒匦?，數字化為全球業務保駕護航

邊緣創新數智向實

2023英特爾智能邊緣行業應用巡展·智慧協同站

飛利浦商用顯示器:智能科技助力高效工作

智能科技助力高效工作

高端訪談

海爾智家技術總監高麗：云原生加速企業數字化轉型

海爾智家全球數字化平臺用到了哪些云原生技術產品?如何實現降本增效?在云原生技術應用方面有哪些實踐和探索?云原生技術發揮了哪些價值?在本期“云原生降本增效大咖說”中，企業網D1Net采訪了海爾智家全球數字化平臺技術總監高麗。

國藥國際CIO馮偉：數字化轉型要打破信息化建系統的固有思維

中國國際醫藥衛生有限公司數智化中心總經理馮偉在接受企業網D1Net專訪時提到：“回過頭來看，數智化建設最難的是轉思維，必須打破信息化總想去建系統的固有思維，要以平臺化思維、站在運營和業務的角度思考問題。思維轉變后，很多問題將迎刃而解?！?/span>

創維集團信息總監寧江：數據治理是數字化轉型的必由之路

創維集團信息總監寧江在接受企業網D1Net采訪時提到：“如今，站在數字化轉型的全局之下回顧過去幾十年的信息化建設，似乎建了很多煙囪，系統之間、流程之間不能共享數據，孤島林立。不同時期有不同時期的特征，都有其合理性和必要性，如今再來解決這些問題為時未晚。

海爾智家技術總監高麗：云原生加速企業數字化轉型

國藥國際CIO馮偉：數字化轉型要打破信息化建系統的固有思維

熱文推薦

精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

Spark大數據框架驅動快速分析

業務服務

網站地圖

友情鏈接

合作伙伴