從技術上看,大數據與云計算的關系就像一枚硬幣的正反面一樣密不可分。大數據必然無法用單臺的計算機進行處理,必須采用分布式計算架構。它的特色在于對海量數據的挖掘,但它必須依托云計算的分布式處理、分布式數據庫、云存儲和虛擬化技術。在人工智能時代,大數據不再只是一次“機遇”,而是成為“標配”。大規模存儲和計算平臺支撐了大數據挖掘和機器學習的復雜而耗費資源的算法與處理。云計算已成為推動智能時代諸多企業創新及信息產業發展的引擎。
云計算支撐大數據應用
云計算、移動互聯網與社交網絡是大數據的三大推進器。在過去不到20年的時間里,個人計算設備生成的數據量呈現出驚人的增長態勢。而要想處理好這些激增的數據,就需要強大的云存儲與計算平臺。當大數據和云遇見深度學習,這一計算機科學家朝思暮想了數十載的科技終于不再是無本之木。隨著深度學習技術的潛能被充分釋放,弈棋程序的勝利以及人們在圖像識別、語音識別等領域的連番突破也就順理成章了。
圖像識別
智能手機支持某些看起來很酷很智能的功能,比如人臉檢測、根據面孔特征實現身份識別和分類編目等,若沒有一流云平臺在背后支持,也是不可想象的。
小米手機相冊有一些對用戶而言相當便利和人性化的功能,例如:用戶可以從合影中找到每一張人臉并看到年齡標簽;點擊“面孔”分欄,所有包含人物的照片便被歸入“姓名”影集中;選擇其中一張合影,應用還能標示出畫面里每個人的姓名……這些功能對于“患有”臉盲癥和健忘癥的朋友來說非常有用,而且也讓手機看起來很“聰明”。但其實,相關的運算過程并不是在手機硬件平臺上進行,而是依托于遠端的“小米云相冊”。
支撐人臉檢測與識別這個應用的是其背后的大數據,尤其是強大的云計算和存儲能力。其中,人臉識別需要對已知人臉的數據庫進行提取,也就是需要依靠強大的存儲能力作為支撐。而對于輸入的人臉圖像或者視頻流進行判斷,則需要依靠云計算技術才能得以實現。
深度學習
以圍棋人機大戰為例,圍棋軟件AlphaGo和人類六至九段棋手16000次的對局中獲得3000萬個布點數據,其動用了1920個CPU和280個GPU的高性能計算資源,在一場比賽中消耗的能量是人的300倍。如此巨大的數據存儲和計算量,是以前的技術所無法實現的。
無人駕駛
如果沒有大數據,世界將會變成什么樣呢?讓我們在不久前特斯拉無人駕駛汽車車禍中尋找答案。大數據的方法是采用“足夠多的數據+簡單的模型”來得到更好的結果。因此,想要提高性能,就必然依賴于大數據。數據越多,覆蓋量、精密度越高,對模型的依賴就越低,人工智能就變得足夠可靠。
“大數據+云”助推ICT騰飛
2015年,我們見證了云計算如何推動消費產品和企業級產品領域的偉大創新,成為不同規模企業的部署對象。如今,云計算已成為推動諸多企業創新的引擎。小米正通過云計算服務全球范圍的智能手機用戶;獵豹移動通過云計算為全球的用戶提供手機安全的保障;WPS通過云為全球的辦公用戶提供文件的存儲和分享。金山云作為國內頂級的云服務商,提供大規模存儲和計算平臺,支撐大數據挖掘和機器學習的復雜而耗費資源的算法與處理,成為諸多企業創新的引擎。金山視頻云平臺被視為全球最專注的公有視頻云,金山游戲云平臺成為國內最大的游戲云平臺,已形成完善的游戲產業生態。金山云更多的垂直領域云平臺,如醫療云、政務云平臺正在成為智慧城市的核心和基礎。與此同時,金山云在美國和香港設立了數據中心,以滿足美國和東南亞客戶的需要。
大數據和云計算將極大地推進我國信息產業發展。當前,人工智能時代正在來臨,對于存儲和計算能力將產生更大需求。最近五年,人工智能在數據本身已經有了很大的突破。當擁有了海量數據并在算法上有所突破之后,人工智能水平將進一步突破。未來,人們將在人工智能上持續挖掘需求和應用,這需要數據存儲和計算能力的支撐。
人工智能已成為信息技術產業的主流與傳統行業升級、轉型和變革的關鍵。而算法、大數據、計算資源不僅構成了人工智能的堅實支點,還將成為現實中構建通往全新“智能”之路的能量之源。人工智能飛速發展,大數據和云共存共生、相互促進,一種不一樣的思考方式正在成長成熟。大數據和云正在推動人工智能時代的來臨,同時擁有大數據和云計算技術儲備的企業將在智能時代發揮更大作用,助力ICT產業騰飛。