精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

英特爾開源BigDL,可直接在Spark框架下運行深度學習

責任編輯:editor007

作者:恒亮

2017-01-17 20:19:03

摘自:雷鋒網(wǎng)

近日,英特爾開源了基于 Apache Spark 框架的分布式深度學習庫 BigDL。通過使用BigDL,用戶可以將他們的深度學習應用程序作為標準的 Spark 程序發(fā)布(即將基于BigDL的深度學習代碼直接嵌入已有的Spark程序中),

英特爾開源BigDL,可直接在Spark框架下運行深度學習

 

近日,英特爾開源了基于 Apache Spark 框架的分布式深度學習庫 BigDL。通過使用BigDL,用戶可以將他們的深度學習應用程序作為標準的 Spark 程序發(fā)布(即將基于BigDL的深度學習代碼直接嵌入已有的Spark程序中),同時,BigDL還簡化了基于Hadoop框架的數(shù)據(jù)加載過程。

據(jù)團隊在GitHub平臺上的介紹,BigDL具有如下三大特點:

1. 豐富的深度學習支持。

BigDL的源代碼基于Scala語言實現(xiàn),同時從Torch框架中汲取了諸多先進的理念。比如像Torch一樣,BigDL也為用戶實現(xiàn)了一個Tensor類,該類基于英特爾MKL庫實現(xiàn),可以進行各種常見的高階數(shù)學運算。另外,受到 Torch 框架下的神經(jīng)網(wǎng)絡包(這里指 nn 包,neural network package) 的啟發(fā),BigDL還提出了Module類的概念,同時還模仿Torch實現(xiàn)了Table類和Criterion類。

雷鋒網(wǎng)注:這里MKL庫的全稱是“Math Kernel Library”,即英特爾的數(shù)學核心函數(shù)庫,其中包含了諸多常規(guī)數(shù)學計算的最優(yōu)實現(xiàn),包括快速傅里葉變換和矩陣乘法等,這些計算在深度學習領域的模型訓練中有著非常廣泛的應用。

2. 極高的性能表現(xiàn)。

BigDL基于一種同步小批量的隨機梯度下降法(Stochastic Gradient Descent,SGD)對模型進行訓練,該方法的能夠支持單個 Spark 任務的跨平臺運行,每個平臺的執(zhí)行器(executor)都可以執(zhí)行一個多線程引擎并處理其中一小部分的批量數(shù)據(jù)。

正式由于引入了英特爾MKL和多線程,使得BigDL庫在英特爾 Xeon 服務器上的表現(xiàn)要優(yōu)于Caffe、Torch 或 TensorFlow 等其他的開源框架,甚至達到了主流GPU的運算速度。

3. 強大的擴展能力。

BigDL 可以通過利用 Apache Spark 框架、同步的隨機梯度下降算法,和 Spark 框架下的 all-reduce 通信進行有效的擴展,以“大數(shù)據(jù)的規(guī)模”執(zhí)行數(shù)據(jù)分析任務。外媒報道稱,BigDL 可一次支持幾十個 Xeon 服務器的擴展。

根據(jù)上述特點,團隊在GitHub平臺上給出了如下三點BigDL最適合的應用場景:

1. 直接在Hadoop/Spark框架下進行大數(shù)據(jù)分析(即將數(shù)據(jù)存儲在HDFS、HBase、Hive等數(shù)據(jù)庫上);

2. 在Spark程序中/工作流中加入深度學習功能;

3. 利用現(xiàn)有的 Hadoop/Spark 集群來運行深度學習程序,然后將代碼與其他的應用場景進行動態(tài)共享,例如ETL(Extract、Transform、Load,即通常所說的數(shù)據(jù)抽取)、數(shù)據(jù)倉庫(data warehouse)、功能引擎、經(jīng)典機器學習、圖表分析等。

值得一提的是,BigDL提供了一個基于亞馬遜AWS EC2服務器實現(xiàn)的完整鏡像,并附帶諸多可以直接運行的用例:包括使用卷積神經(jīng)網(wǎng)絡實現(xiàn)的文本分類用例、圖像分類用例,以及將 Torch/Caffe 中經(jīng)過預訓練的模型加載到 Spark 中進行預測計算的用例等,感興趣的朋友可以在這里查看: https://github.com/intel-analytics/BigDL/wiki/Running-on-EC2

目前,社區(qū)討論中的大多數(shù)用戶都表示希望 BigDL 的后續(xù)版本加入對 Python 的支持,以及開發(fā)基于MKL的深度學習擴展包。

BigDL庫在GitHub平臺上的開源地址如下: https://github.com/intel-analytics/BigDL 感興趣的朋友可以在頁面下方找到團隊給出的各種教程,包括如何在各個操作系統(tǒng)平臺上安裝和運行BigDL,以及BigDL在谷歌討論組的地址等。

鏈接已復制,快去分享吧

企業(yè)網(wǎng)版權所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 陆河县| 虞城县| 安福县| 辛集市| 古交市| 长子县| 安阳县| 绩溪县| 台安县| 荔波县| 鹰潭市| 易门县| 德惠市| 淳安县| 呼图壁县| 张掖市| 济阳县| 北海市| 平湖市| 三门峡市| 从化市| 潢川县| 成武县| 合肥市| 商都县| 慈溪市| 大丰市| 镇安县| 花垣县| 迭部县| 桐乡市| 嘉义县| 石城县| 尼木县| 佳木斯市| 英德市| 德昌县| 麻城市| 祁东县| 东平县| 西畴县|