精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當前位置:新聞中心行業動態 → 正文

金山云新一代GPU云服務器上線 基于Tesla T4性能提升350%

責任編輯:cres |來源:企業網D1Net  2019-06-04 17:56:59 本文摘自:北國網

近日,金山云基于Tesla T4的GPU云服務器正式對外商用,這也是繼去年國內首家商用Tesla V100之后,金山云在GPU云服務器領域再一次拔得頭籌,代表金山云在新技術應用上始終處于行業領先水平。

  作為全面升級的新一代GPU云服務器,T4采用了最新的Turing架構,單卡提供8.1 TFLOPS的單精浮點計算能力和65 TFLOPS的混合精度(FP16/FP32)矩陣計算能力。Tesla T4相比于上一代產品Tesla P4,其整體性能有了較大的提升,在給定場景下,T4的推理性能提升超過350%。

  震撼的多精度推理性能為AI全面加速

  Tesla T4基于Turing架構,提供了更加強大的訓練和推理能力,在原有對FP32和FP16支持的基礎上,Turing架構中的Tensor Core新增了對INT8和INT4的支持,并探索性地推出了INT1精度模式。通過對多種精度模式的支持,T4能夠有效縮短在線預測和離線訓練時長。根據Nvidia公布的測試數據,在語言推理的場景中(NLP: GNMT Model),T4相對于P4,其性能提升超過350%。

  Tesla T4使用TU104核心,搭載136億個晶體管,共40個SM(stream multiprocessor),每個SM單元中有64個CUDA Core和8個混合精度的矩陣運算單元Tensor Core,共2560個CUDA core和320個Tensor core,提供8.1 TFLOPS的單精度性能和65 TFLOPS的混合精度(FP16/FP32)性能。此外,T4中還集成了Turing架構首次引入的RT Core,可實現高效的光線追蹤(Ray Tracing)功能,在圖形圖像渲染方面有著廣泛的應用。目前,金山云基于T4的GPU加速計算服務已全面商用,為諸多客戶提供著高性能的計算支撐。

  優異的機器學習能力讓技術更智能

  T4針對深度學習應用場景,進行了全方位的優化。首先,T4卡配備了320個Tensor Core。Tensor Core作為專門用于執行張量/矩陣運算的計算單元,能夠為訓練和推理場景中的矩陣運算提供極大的加速,被廣泛用于各種深度學習的場景中。Turing Tensor Core相對于先前的Volta版,強化了推理的功能,支持了INT8和INT4兩種精度模式,算力分別高達130TOPS和260TOPS。其次,T4繼承了Volta架構中首次引入的Multi-Process Service(MPS)功能,優化了對batch較小時推理的性能,減少啟動延遲,從而能夠支持更多的并發請求。

  及時響應是提升用戶參與度的關鍵,隨著模型準確性和復雜性的提高,快速交付正確答案所需的計算能力也在呈指數級提升。T4擁有先進的實時推理性能,在會話式人工智能、推薦系統和可視化搜索等場景的處理上,可提供低延時、高吞吐量的計算能力,進而實時滿足更多的處理請求。T4通過優異的機器學習推理能力讓技術應用更為智能。除了深度學習外,T4在視頻轉碼和虛擬桌面等諸多場景中都能夠發揮重要的作用。

  作為中國領先的云計算服務提供商,金山云始終致力于通過最前沿的技術、最高效的產品為客戶提供更加安全、穩定、便捷的云服務。目前基于T4的 GPU云服務器已經開放商用,卓越的深度學習推理性能,讓用戶能夠更加快速、高效地構建AI業務,運行大規模模型推理應用。同時,基于Tesla T4的實例具備易擴展和高性價比的特性,能夠為用戶節省大量計算成本,有效提升AI產品迭代的速度,提高企業AI競爭力。

關鍵字:金山云

本文摘自:北國網

x 金山云新一代GPU云服務器上線 基于Tesla T4性能提升350% 掃一掃
分享本文到朋友圈
當前位置:新聞中心行業動態 → 正文

金山云新一代GPU云服務器上線 基于Tesla T4性能提升350%

責任編輯:cres |來源:企業網D1Net  2019-06-04 17:56:59 本文摘自:北國網

近日,金山云基于Tesla T4的GPU云服務器正式對外商用,這也是繼去年國內首家商用Tesla V100之后,金山云在GPU云服務器領域再一次拔得頭籌,代表金山云在新技術應用上始終處于行業領先水平。

  作為全面升級的新一代GPU云服務器,T4采用了最新的Turing架構,單卡提供8.1 TFLOPS的單精浮點計算能力和65 TFLOPS的混合精度(FP16/FP32)矩陣計算能力。Tesla T4相比于上一代產品Tesla P4,其整體性能有了較大的提升,在給定場景下,T4的推理性能提升超過350%。

  震撼的多精度推理性能為AI全面加速

  Tesla T4基于Turing架構,提供了更加強大的訓練和推理能力,在原有對FP32和FP16支持的基礎上,Turing架構中的Tensor Core新增了對INT8和INT4的支持,并探索性地推出了INT1精度模式。通過對多種精度模式的支持,T4能夠有效縮短在線預測和離線訓練時長。根據Nvidia公布的測試數據,在語言推理的場景中(NLP: GNMT Model),T4相對于P4,其性能提升超過350%。

  Tesla T4使用TU104核心,搭載136億個晶體管,共40個SM(stream multiprocessor),每個SM單元中有64個CUDA Core和8個混合精度的矩陣運算單元Tensor Core,共2560個CUDA core和320個Tensor core,提供8.1 TFLOPS的單精度性能和65 TFLOPS的混合精度(FP16/FP32)性能。此外,T4中還集成了Turing架構首次引入的RT Core,可實現高效的光線追蹤(Ray Tracing)功能,在圖形圖像渲染方面有著廣泛的應用。目前,金山云基于T4的GPU加速計算服務已全面商用,為諸多客戶提供著高性能的計算支撐。

  優異的機器學習能力讓技術更智能

  T4針對深度學習應用場景,進行了全方位的優化。首先,T4卡配備了320個Tensor Core。Tensor Core作為專門用于執行張量/矩陣運算的計算單元,能夠為訓練和推理場景中的矩陣運算提供極大的加速,被廣泛用于各種深度學習的場景中。Turing Tensor Core相對于先前的Volta版,強化了推理的功能,支持了INT8和INT4兩種精度模式,算力分別高達130TOPS和260TOPS。其次,T4繼承了Volta架構中首次引入的Multi-Process Service(MPS)功能,優化了對batch較小時推理的性能,減少啟動延遲,從而能夠支持更多的并發請求。

  及時響應是提升用戶參與度的關鍵,隨著模型準確性和復雜性的提高,快速交付正確答案所需的計算能力也在呈指數級提升。T4擁有先進的實時推理性能,在會話式人工智能、推薦系統和可視化搜索等場景的處理上,可提供低延時、高吞吐量的計算能力,進而實時滿足更多的處理請求。T4通過優異的機器學習推理能力讓技術應用更為智能。除了深度學習外,T4在視頻轉碼和虛擬桌面等諸多場景中都能夠發揮重要的作用。

  作為中國領先的云計算服務提供商,金山云始終致力于通過最前沿的技術、最高效的產品為客戶提供更加安全、穩定、便捷的云服務。目前基于T4的 GPU云服務器已經開放商用,卓越的深度學習推理性能,讓用戶能夠更加快速、高效地構建AI業務,運行大規模模型推理應用。同時,基于Tesla T4的實例具備易擴展和高性價比的特性,能夠為用戶節省大量計算成本,有效提升AI產品迭代的速度,提高企業AI競爭力。

關鍵字:金山云

本文摘自:北國網

電子周刊
回到頂部

關于我們聯系我們版權聲明隱私條款廣告服務友情鏈接投稿中心招賢納士

企業網版權所有 ©2010-2024 京ICP備09108050號-6 京公網安備 11010502049343號

^
  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 新晃| 霞浦县| 洪江市| 临泉县| 全椒县| 东港市| 河源市| 元氏县| 溧水县| 旬邑县| 闽侯县| 高青县| 东丰县| 斗六市| 梧州市| 盐城市| 津市市| 鄂伦春自治旗| 开平市| 绍兴市| 越西县| 长泰县| 云安县| 罗平县| 丰县| 浮山县| 保德县| 客服| 肃南| 白银市| 襄城县| 邢台县| 麦盖提县| 阿瓦提县| 阿拉善盟| 宜良县| 咸宁市| 永和县| 泸定县| 房产| 积石山|