越來越多的AI應用發生在云端,尤其是對于智能技術需求高的行業而言,他們甚至可以說是被AI逼上公有云,而那些原本使用私有云的企業用戶,也由私有云躍遷到了混合云。
數據和算力是維持AI的兩大要素,而傳統的計算環境是難以滿足二者的指數級增長的。舉個例子,數據的類型大體可分為結構化數據、非結構化數據、半結構化數據。一個數據從產生到落地要經過收集、傳輸、分析、檢索、挖掘等階段。如果要讓機器像人一樣去“看”數據,恐怕窮盡一生也無法分析完。
如果在云端借助Hadoop集群和Spark這樣的通用計算引擎,或者是Storm等計算框架,就可以將數據分解為多個部分,對每一部分的數據進行分析,之后將效果匯總經過多輪計算篩選出結果。對于機器學習來說,它們或許會找到一些新的特征,并對這些特征進行歸納來識別出一把新的椅子。這一過程中,需要有海量、不同的椅子照片供給計算機去學習。而這一切,沒有數據中心的龐大算力支持是無法實現的。
當人工智能走向云端,開發者既是第一批受益者,又成為了云服務商手中的核心資源。微軟將在AI領域20多年的研究成果匯聚成Azure云端的認知服務,以API的形式開放給開發者,開發者只需要幾行代碼,即可調用認知服務API獲得對應的能力,并將這樣的能力跨設備、跨平臺應用到Windows、iOS、Android上。這些API包括人臉識別API、情緒識別API和計算機視覺API等等。拿情感識別來說,開發者可以通過人臉API針對圖像中的每張人臉返回情感集的檢測置信度以及人臉的范圍框,檢測到的情感可以是快樂、悲傷、意外、憤怒、恐懼、蔑視、厭惡或中性。
此外,就像微軟不惜重金收購GitHub、谷歌開源TensorFlow一樣,核心的開發者群體或社區貢獻著數以萬計的應用資源,而背后的這些數據資源如果悉數運行在Azure或谷歌云平臺上,對于微軟和谷歌的云業務發展勢必是不錯的助力。
就像當下比較火熱的AI芯片TPU方案,作為谷歌自主研發的針對深度學習加速的專用人工智能芯片,專為TensorFlow設計,AlphaGo使用的就是TPU 2.0芯片。在TPU 3.0中,其計算能力最高可達到100PFlops,是TPU 2.0的八倍多。為了更快地訓練和運行機器學習模型,谷歌還推出了Cloud TPU,單個Cloud TPU的計算能力達到180萬億次浮點運算,具備64 GB高帶寬內存,為云端超算打下了基礎。
落地到行業,對云上智能先知先覺的傳統企業深有感觸。以物流為例,物流企業比拼的已不止是車隊數量和倉儲空間,而是學會借助大數據、物聯網和AI技術,深入到每一個環節打造智慧的物流平臺。這一過程中,云計算扮演著至關重要的角色。過去,寫一套完整的物流系統需要調動研發、運維、安全、網絡等多個部門的人。如今一個顯著的現象是,管理數千輛車規模車隊的運營負責人已經可以是學算法專業的年輕人。為什么會有這種變化?原因是這些人會利用算法處理大數據,通過優化運輸環節從而提升物流運轉的效率。
對于物流企業來說,每天會產生數億條數據,對海量信息進行處理離不開云計算。具體到實際場景中,車載設備從位置定位、油耗傳感器、溫度、速度搜集的數據會交由云端處理,例如IoT組件可以通過規則引擎組件中編寫類SQL語句無縫對接大數據套件,進行車輛路徑、車輛規劃、司機排班等的優化,而兼容MySQL協議和語法的騰訊云分布式云數據庫DCDB還支持自動水平拆分的高性能分布式數據庫,即業務顯示為完整的邏輯表,數據被均勻拆分到多個分片中,每個分片默認采用主備架構,可以提供涵蓋災備、恢復、監控、不停機擴容的全套方案。
當然,并不是任何一家傳統企業都會先嘗試公有云,但他們也會為獲得全棧的AI能力去嘗試部分上云。工業互聯網時代產生的數據量比傳統信息化要多數千倍甚至數萬倍,并且是實時采集、高頻度、高密度的,動態數據模型隨時可變,甚至良品率的細微變化都會帶來數據模型重建。這樣一來,如果做不到工業數據實時更新,智能制造就無從談起。
以福耀玻璃為例,其借助IBM云平臺重構了端到端的競價流程,通過開放API讓客戶實時看到訂單的執行狀況將原來分散在ERP、CRM、采購、物料等數十個系統中的成本因素進行智能分析,并在云端建造了1:1尺寸的3D可視化虛擬工廠,將研發、工藝、生產、制造、優化、仿真、服務等環節的狀態以三維建模的形式實時模擬出來,未來更有望在虛擬端解決80%的質量、效率、成本問題。將敏感數據放在本地,把重資產業務放在云端快速處理,利用混合云環境的微服務、容器、API來獲取商業智能的能力,這也是源于AI的推動。
各行各業的數據指數級增長,使得人們對于信息的處理方式有了重新思考,將其智能化當前是重要途徑之一,而背后的基礎支撐離不開云計算。也可以說,企業對智慧化轉型的迫切需求推動了云計算的發展。