【2021 re:Invent觀察之一】自研芯片成就亞馬遜云科技的算力優勢
在re:Invent上,亞馬遜云科技重磅推出了三項自研底層技術。
新推出自研通用計算處理器。亞馬遜云科技宣布新一代基于Arm的自研CPU處理器Amazon Graviton3。這是亞馬遜云科技自研設計的第三顆CPU處理器。
由Amazon Graviton3處理器支持的C7g實例與由 Graviton2 處理器支持的當前一代 C6g 實例相比,可將計算密集型工作負載性能提高多達25%。Amazon Graviton3處理器與Graviton2相比,為科學計算、機器學習和媒體編碼工作負載提供高達2倍的浮點運算性能,為加密工作負載速度提升高達2倍,為機器學習工作負載提供高達3倍的性能。
Amazon Graviton3處理器的能效也更高,在相同性能下,與同類型EC2實例對比,可節省高達60%的能源消耗。C7g實例是云中第一個采用最新DDR5內存的實例,與基于Amazon Graviton2的實例相比,它提高了50%的內存帶寬,從而提高了科學計算等內存密集型應用的性能。
與基于Amazon Graviton2的實例相比,C7g實例的網絡帶寬也高出20%。C7g 實例支持 Elastic Fabric Adapter (EFA),允許應用程序直接與網絡接口卡通信,提供更低且更一致的延遲,提高需要大規模并行處理(如高性能計算和視頻編碼)的應用程序的性能。
中橋調研咨詢(Sino-bridges)首席分析師王叢指出:“5G和IoT的加速對于低能耗高性能AI推理算力提出新需求。亞馬遜云科技剛剛發布的Amazon Graviton3讓實例性能在上代Amazon Graviton2基礎上進一步提升20%, 能耗效率提高60%。對于中國用戶,不僅加快AI資源和AI創新能力的適配效率,同時,能夠支持持續技術升級,優化AI/ML的長期投資保護。”
新推出自研機器學習訓練芯片。亞馬遜云科技去年re:Invent 上宣布研制機器學習訓練芯片Amazon Trainium,在今年的re:Invent上宣布提供基于Trainium的實例。
由Amazon Trainium芯片支持的Trn1實例為在Amazon EC2中進行深度學習模型訓練提供最佳性價比以及最快的訓練速度,與P4d實例相比,通過Trn1實例訓練深度學習模型的成本降低多達40%。Trn1實例提供800Gbps EFA網絡帶寬(比最新基于GPU的EC2實例高兩倍),并與Amazon FSx for Lustre高性能存儲集成,讓客戶可以啟動具有EC2 UltraClusters功能的Trn1實例。通過EC2 UltraClusters,開發人員可以將機器學習訓練擴展到一萬多個與 PB 級網絡互連的 Trainium 加速器,讓客戶按需訪問超算級性能,即便是最大型和最復雜的模型,訓練時間也可以從幾個月縮短到幾天。
弗若斯特沙利文(Frost & Sullivan)咨詢總監李慶評論說:“對于亞馬遜云科技發布的兩款定制芯片,我并不認為其核心目的是為了與傳統芯片廠商進行競爭。按照亞馬遜云科技一貫以用戶需求為先的準則,兩款芯片的發布也是自下而上的需求所致,兩大核心用戶需求首先是性能、其次是成本。目前對于計算場景的應用復雜程度已經倒逼芯片處理性能的提升。多重負載,尤其是在機器學習方面,芯片性能直接制約了算法的應用,而在這方面亞馬遜云科技有先天的優勢,批量數據處理,以及各類算法模型的積累都為自研新一代芯片提供了扎實的基礎。與現有的云服務一起打包軟硬一體的方案推向用戶顯然是可行的。但的確也對用戶提出了更大的挑戰,要重新調整原先軟件的架構適配新型芯片。所以比起對過去傳統業務的調整,更多的用戶應該是在新業務場景下的全新部署。當然相對應的亞馬遜云科技應該也會陸續發布相關產品協助用戶實現新舊的遷移或者聯動。”
新推出自研固態硬盤。亞馬遜云科技還發布了采用全新Amazon Nitro SSD固態硬盤的Im4gn/Is4gen/ I4i實例,可為I/O密集型工作負載提供超高存儲性能。通過自研的 Amazon Nitro SSD,Im4gn/Is4gen/I4i實例提供高達 30 TB 的 NVMe 存儲,與上一代I3實例相比,I/O 延遲降低了 60%,延遲可變性降低了 75%,從而最大限度地提高了應用程序性能。Amazon Nitro SSD通過優化存儲堆棧、虛擬化管理程序和硬件與Amazon Nitro 系統緊密集成。與使用商用SSD相比,亞馬遜云科技同時管理Amazon Nitro SSDs的硬件和固件,使SSD更新交付速度更快,讓客戶可以從改進的功能中獲益。Im4gn 實例(現已可用)采用 Amazon Graviton2 處理器,與 I3 實例相比,性價比提高多達 40%,每 TB存儲成本降低多達 44%。Is4gen 實例(現已可用)也采用 Amazon Graviton2 處理器,與 I3en 實例相比,每 TB 存儲成本降低多達 15%,計算性能提高多達 48%。
亞馬遜云科技首席執行官 Adam Selipsky 表示,“盡管我們已經如此努力地創新,我們依然意識到,如果希望針對所有可能的工作負載徹底變革計算的性價比,我們需要徹底重新思考實例。為了實現這個目的,我們需要深入底層技術,一直到芯片。因此,我們開始自己設計基于Arm的芯片。”
加大底層技術自研,對亞馬遜云科技在這樣的領先者來說,其意義在于實現“我有人無,人有我優”。縱觀云計算業界,基礎設施服務成為所有云服務商的基礎服務,未來制勝的關鍵在于,誰能以更高的性能、更高的效率、更低的成本、更低的能耗提供這些服務。
【2021 re:Invent觀察之二】大云無疆,無限拓展
作為全球覆蓋超級廣泛的云,亞馬遜云科技基礎設施遍及25個地理區域的81個可用區,并計劃新建9個區域和27個可用區,有14個本地擴展區域、17個Wavelength區域,有108個Direct Connect光纖直連站點,有310個邊緣站點和13個區域緩存站點。
在此基礎上,亞馬遜云科技宣布,2022年將在21個國家建設超過30個本地擴展區,讓客戶以更低的延遲服務其終端用戶。亞馬遜云科技2020年開始在美國建立了兩個本地擴展區,2021年增加了12個本地擴展區。2022年,建立本地擴展區的步伐將進一步加大。
不僅如此,亞馬遜云科技還通過一系列技術,將云延伸到亞馬遜云科技的基礎設施之外,包括Amazon Outposts、IoT 服務、Snow 家族服務,一直延伸到 Amazon Ground Station,讓云擴展到了太空的衛星數據。Outposts將亞馬遜云科技的云體驗延伸到客戶的本地數據中心,跟云端無縫連接。IoT服務、Snow家族將云的能力延伸到地球上各個角落。 Amazon Ground Station是衛星地面站服務,通過衛星地面站接收數據到亞馬遜云科技區域進行處理。
亞馬遜云科技推出新的托管服務Amazon Private 5G,則是讓企業方便利用5G專網來連接企業內的聯網傳感器和邊緣設備,并且通過亞馬遜云科技控制臺統一管理。
亞馬遜云科技還發布了新服務Amazon Cloud WAN,將亞馬遜云科技全球網絡的優勢帶給企業,讓企業的廣域網跟云融為一體。
Amazon Cloud WAN讓企業可以在全球的亞馬遜云科技廣域網絡上建立、管理統一的云網絡和監控全球流量。所有的遠程用戶和站點以及數據中心將使用 VPN 或直接連接到地理位置最近的地方,實際上在幾分鐘內亞馬遜云科技就可以構建一個全球化網絡服務。
【2021 re:Invent觀察之三】一切為數據服務,數據創造價值
在re:Invent 全球大會上,亞馬遜機器學習副總裁 Swami Sivasubramanian的主題演講以《如何通過數據與人工智能進行創新》為題。Swami 指出,“數據是推動洞察的潛在力量,有助于更好地開展業務。”他列舉了飛利浦醫療、納斯達克等多種大數據的例子,”從大數據走向海量非結構化數據,事實上80%的數據是非結構化的。”
亞馬遜云科技為數據服務提供了完整的、端到端的工具,從數據存儲、到計算、分析、人工智能創新。利用廣泛而深入的云服務,憑借在數據領域的產品創新與前瞻眼光,亞馬遜云科技將助力企業實施現代化的端到端數據戰略,實現數據驅動的創新。
現代端到端數據戰略有三個要素:
● 數據架構現代化。不同的場景需要使用專門構建的工具,專門的工具需要專業的現代化托管平臺,在這方面,亞馬遜擁有無與倫比的成熟度和經驗。
在已經很豐富的數據服務組合之上,亞馬遜云科技又發布多個數據工具。
Amazon DevOps Guru for RDS是一個數據庫性能工具,它利用機器學習,可以在幾分鐘內自動檢測、診斷和解決難以發現的數據庫性能問題。
Amazon RDS Custom 提供了 SQL Server支持,它通過托管式服務節省時間,幫助實現自動化版本維護與補丁升級,將寶貴的資源專注于更重要的業務。
另外一個重要的發布是Amazon Dynamodb 的新功能Standard-Infrequent Access表類,它可以將不頻繁訪問的表數據進行分類,DynamoDB 的存儲成本降低60%。
Amazon Database Migration Service Fleet Advisor 是一個數據庫遷移工具,它可以幫助客戶選擇最佳可用的計算實例和配置,用以部署機器學習模型,獲得最佳的推理性能和成本,并且將過去數周才能完成的工作縮短到數小時。
● 統一分析數據。通過云上專門工具實現數據有機整合與統一,助力企業打破數據孤島。
通過在亞馬遜云科技上運行的數據湖,能夠收集、存儲和分析來自一系列分散系統的數據,助力業務發展。
亞馬遜云科技為在 Amazon S3 上構建數據湖提供了無與倫比的耐用性、可用性和可擴展性,以及強大的安全性和分析工具,使用亞馬遜云科技最新發布的數據湖構建工具,可以快速構建適合的數據湖,Amazon Athena 提供了一種有用的方法來分析所有數據,獲得見解。
利用 Amazon QuickSight Q,客戶可以快速、輕松地獲得答案,所有用戶無需培訓即可訪問 BI。
● 基于數據進行業務創新。幫助數據進行創新的內核是“從客戶角度出發”,企業植根于自身業務的創新訴求是創新的原動力,而人工智能等技術為創新提供了手段與方法。
本次re:Invent,亞馬遜云科技業界聞名的機器學習平臺Amazon SageMaker又添六項新功能。
亞馬遜云科技新推出的Amazon SageMaker Ground Truth Plus,讓用戶無需編寫任何代碼即可快速交付高質量的訓練數據集。數據是機器學習的燃料。不過,準備數據的過程令人沮喪甚至令人憤怒。有了這項新功能,極大地解決了數據科學家準備數據的痛點問題。
在模型構建與算法編寫環節,新推出的Amazon SageMaker Studio Notebook 允許用戶訪問廣泛的數據源,在一個記事本中執行數據工程、分析和機器學習工作流。
新推出的Training Compiler 模型訓練編譯器,讓機器學習模型培訓速度提高50%。Inference Recommender 模型推理推薦程序,可將部署時間從數周減少到數小時。Serverless Inference 無服務器推理,通過按使用付費的定價降低擁有成本。
【2021 re:Invent觀察之四】千方百計降低門檻,讓更多人用云計算進行業務創新
為了幫助客戶最大限度實現數據價值,亞馬遜云科技千方百計降低數據使用的門檻。無論是開發人員、運維人員、數據科學家、行業用戶,還是即將進入云計算行業的初學者,亞馬遜云科技都在不斷推出新的服務和功能,降低他們的使用門檻。
本次re:Invent上推出的很多新服務和新功能都具有這樣的意圖。前面介紹的QuickSight Q是一個例子。新推出的Amazon SageMaker Canvas又是另一個例子。它讓業務分析師能夠使用點擊式界面生成更準確的機器學習預測,從而擴展了對機器學習的訪問,無需編碼。
IDC中國助理研究總監盧言霞指出:“在大數據方面,亞馬遜云科技在數據融合、統一治理等方面幫助用戶管理數字化旅程,并加速將機器學習和人工智能加入到數據旅程。在機器學習方面,發布了Amazon SageMaker Canvas,無需代碼,通過簡單點擊即可完成整個機器學習工作流,值得沒有技術背景的分析師,以及聚焦業務分析層面但希望實時數據洞察的分析人群關注。”
新發布的Amazon SageMaker Studio Lab 是一項免費、無需配置的服務,開發者、學者和數據科學家,只要有創新的想法,立即就可以動手實踐機器學習。它也讓客戶將能夠專注于實踐機器學習與數據科學,無需設置或配置任何環境與機器。
為了將機器學習能力交到更多的人手中,亞馬遜云科技還將通過DeepRacer冠軍杯賽、培訓與認證、機器學習大學、機器學習納米學位等項目,計劃到 2025 年全球培訓 2900 萬人。
亞馬遜云科技也宣布了1000萬美元亞馬遜云科技人工智能和機器學習獎學金(Amazon AI & ML Scholarship),用于獎勵全球范圍內弱勢群體和服務設施欠缺地區的學生,幫助他們做好準備,在未來從事機器學習相關工作。
艾瑞咨詢研究副總監王成峰認為,此次re:Invent大會一如既往地體現了亞馬遜云科技的卓越創新力和以客戶需求為導向的產品研發能力,場景賦能更加多元化、精益化,并致力于數字技術紅利的“普惠化”,面向更多非IT人群的終端應用,令人印象深刻。
【2021 re:Invent觀察之五】低碳環保提上云開發者的議事日程
在re:Invent上,亞馬遜CTO Werner Vogels發布了亞馬遜云科技架構完善(Well Architecture) 的第六個支柱:可持續發展,倡導用環保的最佳實踐來學習、測量、改進云端計算工作負載。
亞馬遜云科技架構完善是一個設計和評估云上架構的參考設計,旨在幫助云架構師為應用程序和工作負載構建安全、高性能、高效的彈性基礎設施。AWS 架構完善的框架最初只是一個白皮書,現在已經發展成為一整套方法體系,包括特定于域的詳解、動手實驗和 AWS 架構完善工具。
亞馬遜云科技架構完善的框架為客戶和合作伙伴提供了一致性的方法,供他們評估架構,實施能夠在使用中擴展的設計。
此前,亞馬遜云科技架構完善有卓越運營、安全性、可靠性、性能效率、成本優化五個支柱。現在增加了可持續發展作為第六個支柱。
在亞馬遜云科技的倡導下,越來越多的構建者在構建云上應用時,將把低碳環保作為衡量因素,不是一味追求最高性能、最低延時、最高畫質等等,而是在低碳環保跟性能、延時、畫質等因素做一個最佳的平衡。
亞馬遜云科技還提出了可持續發展的責任共擔模式:亞馬遜云科技負責云本身的可持續性,客戶要承擔在云上應用的可持續性。
亞馬遜云科技義不容辭地為地球的可持續發展承擔責任。
科學家指出,全世界需要在 2050 年前將全球變暖限制在 1.5 攝氏度以內,時間非常緊迫,必須取得前所未有的進展。為了推動集體的跨部門行動,應對氣候危機,由亞馬遜和Global Optimism共同發起了《氣候宣言》,呼吁簽約各機構采取緊急行動,在 2040 年前實現凈零碳排放,提前十年達成《巴黎協定》目標。亞馬遜以身作則,承諾到 2030 年100% 使用可再生能源為公司運營提供動力。現在,亞馬遜將計劃再次提速,希望到 2025 年實現這一目標。
全球權威調研機構——451 Research 的研究結果,亞馬遜云科技運營的基礎設施能源效率,是受調查的美國企業數據中心中位數的 36 倍。進一步調查來自法國、德國、愛爾蘭、西班牙和瑞典各行各業的 300 多家公司。研究發現,亞馬遜云科技的數據中心能源效率比普通歐盟公司高出 5 倍。在亞馬遜云科技運行商業應用的公司,可以減少近80%的能源消耗。如果將 1 兆瓦的典型工作負載轉移到 亞馬遜云科技,每年可以減少1000多公噸的碳排放。
現在,亞馬遜云科技希望利用自身在云計算領域的優勢,倡導云上應用的可持續發展,為應對全球氣候變暖做出貢獻。
對于可持續發展,亞馬遜云科技效用計算和應用程序高級副總裁Peter DeSantis說過,“最綠色的能源就是你沒有使用的資源。通往綠色云的道路就在面前,我們得一起朝著這個目標努力。”
亞馬遜云科技還將推出一個碳足跡工具,幫助客戶在云端追蹤應用的碳排放足跡,讓云上的低碳環保變得可衡量,以便更多的開發者和企業加入到低碳環保的行列中來。