8月23日,華為正式發布算力最強的AI處理器Ascend 910(昇騰910),同時推出全場景AI計算框架MindSpore。
除了發布新產品,華為公司輪值董事長徐直軍還介紹了華為AI戰略布局,主要是圍繞以下幾個方面:
1、投資AI基礎研究,在計算視覺、自然語言處理、決策推理等領域構筑數據高效(更少的數據需求)、能耗高效(更低的算力和能耗),安全可信、自動自治的機器學習基礎能力;
2、打造面向云、邊緣和端等全場景的、獨立的以及協同的、全棧解決方案,提供充裕的、經濟的算力資源,簡單易用、高效率、全流程的AI平臺;
3、投資開放生態和人才培養,面向全球,持續與學術界、產業界和行業伙伴廣泛合作;
4、把AI思維和技術引入現有產品和服務,實現更大價值、更強競爭力;
5、應用AI優化內部管理,對準海量作業場景,大幅度提升內部運營效率和質量。
以下為徐直軍講話全文:
感謝大家參加今天的發布會,在去年華為HC大會上,我首次正式發布了華為AI戰略和華為全棧全場景AI解決方案。
同時,我也分享了十個有關人工智能技術、人才、產業的重要變革方向。期望產業界圍繞十個變革方向,來解決人工智能“輝煌”與“冷靜”之間的巨大落差,開創未來。華為也圍繞幾個變革方向一直在努力實踐。
首先,請允許我回顧一下華為的AI戰略:
1、投資AI基礎研究,在計算視覺、自然語言處理、決策推理等領域構筑數據高效(更少的數據需求)、能耗高效(更低的算力和能耗),安全可信、自動自治的機器學習基礎能力;
2、打造面向云、邊緣和端等全場景的、獨立的以及協同的、全棧解決方案,提供充裕的、經濟的算力資源,簡單易用、高效率、全流程的AI平臺;
3、投資開放生態和人才培養,面向全球,持續與學術界、產業界和行業伙伴廣泛合作;
4、把AI思維和技術引入現有產品和服務,實現更大價值、更強競爭力;
5、應用AI優化內部管理,對準海量作業場景,大幅度提升內部運營效率和質量。
同時也利用此次機會,再次介紹一下華為全棧、全場景解決方案。我們提出的全場景,是指 包括公有云、私有云、各種邊緣計算、物聯網行業終端以及消費類終端等部署環境。我們說的全棧是技術功能視角,是指包括芯片、芯片使能、訓練和推理框架和應用使能在內的全堆棧方案。華為的全棧方案具體包括:
Ascend: 基于統一、可擴展架構的系列化AI IP 和 芯片,包括Max,Mini,Lite,Tiny和Nano等五個系列;
CANN: 芯片算子庫和高度自動化算子開發工具;
MindSpore:支持端、邊、云獨立的和協同的統一訓練和推理框架;
應用使能:提供全流程服務(ModelArts),分層API和預集成方案。
首先是基于Ascend310 的產品和云服務的商用情況。
1、基于昇騰310的Atlas、MDC產品:MDC和國內外主流車廠在園區巴士、新能源車、自動駕駛等場景深入合作;Atlas系列板卡、服務器和AI相關的數十家伙伴,在智慧交通、智慧電力等數十個行業落地AI行業解決方案;
2、基于昇騰310的華為云服務:華為云圖像分析服務、OCR服務、視頻分析服務 超過50+ API都已經基于Ascend 310服務,日均調用量超過1億次,而且在快速增長,預計年底日均調用量 >3億。
其次是ModelArts的商用進展。ModelArts全流程模型生產:打通、覆蓋了從數據獲取-模型開發-模型訓練-模型部署的全鏈條,日均作業量以及在線開發者:日均訓練作業任務超過4000個,32000小時,其中:視覺類作業占85%,語音類作業占 10%, 機器學習5%,ModelArts已經擁有開發者超過3萬。
我宣布:算力最強的AI處理器 Ascend 910 正式推出。去年10月,我們發布了Ascend 910的技術規格,今天我向大家介紹最新的實際測試結果。
在算力方面,測試結果表明,昇騰910完全達到了設計規格,即:半精度 (FP16): 256 Tera-FLOPS;整數精度 (INT8) : 512 Tera-OPS。其次重要的是,達到規格算力所需功耗僅310W,明顯低于設計的350W。
應當說,昇騰910總體技術表現超出預期。我們已經把昇騰910用于實際AI訓練任務。其中,在典型的ResNet-50 網絡的訓練中,昇騰910與MindSpore配合,與現有主流訓練單卡配合TensorFlow相比,顯示出接近2倍的性能提升。每秒訓練的圖片數量從965張提升到1802張。
面向未來,針對不同的場景,我們將持續投資,推出更多的AI處理器,面向邊緣計算場景,在已經商用Ascend 310基礎上,計劃2021年將推出Ascend 320。
現有MDC是基于Ascend 310的,有效支持了自動駕駛的開發,未來面向規模商用,我們將陸續推出Ascend 610/620。針對AI訓練,今天正式推出Ascend 910,未來還將計劃推出Ascend 920。
今天還要發布全場景AI計算框架MindSpore。能否大大降低AI應用開發的門檻,能否實現AI將無處不在,能否在任何場景下確保用戶隱私得到尊重和保護,這些都與AI計算框架息息相關。
為此,在去年HC會上我們提出:AI框架應該是開發態友好(例如顯著減少訓練時間和成本)和運行態高效(例如最少資源和最高能效比),更重要的是,要能適應每個場景包括端,邊緣和云。
經過近一年的努力,全場景AI計算框架MindSpore在這三個方面都取得了顯著的進展:在原生適應每個場景包括端,邊緣和云,并能夠按需協同的基礎上,通過實現AI算法即代碼,使開發態變得更加友好,顯著減少模型開發時間,降低了模型開發門檻。通過MindSpore自身的技術創新及MindSpore與Ascend處理器協同優化,實現了運行態的高效,大大提高了計算性能;MindSpore也支持GPU、CPU等其它處理器。
很多人問我,現在已有了TensorFlow、PyTorch框架,華為為什么還要開發并推出MindSpore框架。我告訴他們,由于沒有任何一個現有框架支持全場景,而華為的業務覆蓋端-邊緣-云,且在隱私保護日漸重要的背景下,需要一個能支持全場景的框架,實現AI無所不在越來越基礎的需求,這也是MindSpore的重要特色。針對不同的運行環境,MindSpore框架架構上支持可大可小 ,適應全場景獨立部署。同時,MindSpore框架通過協同經過處理后的、不帶有隱私信息的梯度、模型信息,而不是數據本身,以此實現在保證用戶隱私數據保護的前提下跨場景協同。除了隱私保護,MindSpore還將模型保護Built-in到AI框架中,實現模型的安全可信。
為了降低AI開發者的開發門檻,MindSpore創造性地實現了AI算法即代碼,使開發態變得更加友好,顯著減少模型開發時間。以一個NLP(自然語言處理)典型網絡為例,相比其他框架,用MindSpore可降低核心代碼量20%,開發門檻大大降低,效率整體提升50%以上。
我們通過MindSpore框架的技術創新及把MindSpore框架與昇騰處理器的協同優化,有效克服AI計算的復雜性和算力的多樣性挑戰,實現了運行態的高效,大大提高了計算性能。除了昇騰處理器,MindSpore同時也支持GPU、CPU等其它處理器。
為了更好促進AI的應用,MindSpore將在2020年Q1開源,助力每一位開發者。
隨著昇騰910 AI處理器以及 MindSpore 全場景AI計算框架的推出,華為全棧全場景AI解決方案各重要組成部分悉數登場,因此可以說,華為已完成了全棧全場景AI解決方案的構建。
這對華為的AI業務,已是一個新的里程碑,更是一個新的開始,期待與伙伴更加深入、廣泛的合作,讓AI無所不及,造福于每個人、每個家庭、每個組織。更震撼的AI新品,敬請關注HC2019。