精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

厲害了!雅虎開源TensorFlowOnSpark

責任編輯:editor006

作者: zyy

2017-02-14 16:22:01

摘自:it168網站

去年雅虎結合了大數據和機器學習領域的兩大明星,將內存數據處理框架Spark與深度學習框架Caffe集成。當使用遠程直接內存訪問(RDMA)時,集群機器學習框架運行速度更快。

去年雅虎結合了大數據和機器學習領域的兩大明星,將內存數據處理框架Spark與深度學習框架Caffe集成。在Spark中編寫的應用程序將使用Caffe的訓練功能,或者使用經過訓練的模型來進行Spark本地機器學習無法實現的預測。

厲害了!雅虎開源TensorFlowOnSpark

今年,雅虎又發了一波大招,最新的Yahoo開源項目TensorFlowOnSpark(TFoS)(Github地址:https://github.com/yahoo/TensorFlowOnSpark)再次融合了深度學習和大數據框架,據說能夠更有效地大規模運行,并且幾乎沒有改變現有的Spark應用程序。

在一篇博客文章中,雅虎的Big ML工程師團隊描述了為什么要實現深層思維和大數據的混合,這是為了讓TensorFlow更易分布式部署在現有集群上。Databricks的TensorFrames,它同時使用了GPU加速和SparkNet項目,正好與Spark在同一個伯克利實驗室創建的。雅虎說:“雖然這些方法是正確的,但在檢查完代碼后,發現無法使TensorFlow進程直接進行通信,無法實現異步分布式學習 ,我們將不得不花費大量精力來遷移現有的TensorFlow程序。TFoS就是為了應對這類項目中的不足。

TFoS被設計為在現有的Spark和Hadoop集群上運行,并使用現有的Spark庫,如SparkSQL或Spark的MLlib機器學習庫。雅虎聲稱現有的TensorFlow程序不需要大量修改就可以使用TFoS。通常,這種改變少于10行Python代碼,TensorFlow的并行實例可以直接相互通信,而無需通過Spark本身。數據可以從TensorFlow的本地設備中獲取,以便從HDFS或通過Spark讀取。

當使用遠程直接內存訪問(RDMA)時,集群機器學習框架運行速度更快。原來的TensorFlow項目不支持RDMA作為核心功能,雅虎選擇創建自己的RDMA支持,并將其添加到TensorFlow的C ++層。

即使沒有雅虎的貢獻,TensorFlow也取得了飛躍式的進步。第一個完整的1.0版本的框架也引入了優化,使其可以部署在智能手機級硬件上,IBM選擇TensorFlow作為其自定義機器學習硬件的深度學習系統。

當涉及到大規模運行時,TensorFlow最直接的競爭對手就是MXNet,亞馬遜推出的一款深度學習系統。亞馬遜聲稱MXNet在跨越多節點上更有競爭優勢,所以如果你的問題處理過程需要投入硬件,MxNet訓練模型速度會更快。這將是值得與TensorFlowOnSpark比較的地方——在大集群上的運行情況和工作便利度。

鏈接已復制,快去分享吧

企業網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 叶城县| 南京市| 偏关县| 瓦房店市| 惠东县| 陇西县| 洱源县| 鄂州市| 纳雍县| 肃宁县| 长沙县| 甘洛县| 类乌齐县| 鹿泉市| 栾城县| 天峻县| 长岭县| 黑龙江省| 富顺县| 沙坪坝区| 北海市| 永丰县| 循化| 集贤县| 永吉县| 思茅市| 呼伦贝尔市| 保德县| 株洲县| 台北市| 公安县| 宣汉县| 萨迦县| 阿拉善左旗| 灵川县| 建水县| 临清市| 无极县| 东丽区| 阿克| 西林县|