從技術上看,大數據與云計算的關系就像一枚硬幣的正反面一樣密不可分。大數據必然無法用單臺的計算機進行處理,必須采用分布式計算架構。它的特色在于對海量數據的挖掘,但它必須依托云計算的分布式處理、分布式數據庫、云存儲和虛擬化技術。在人工智能時代,大數據不再只是一次機遇,而是成為了標配。大規模存儲和計算平臺支撐了大數據挖掘和機器學習的復雜而耗費資源的算法和處理。云計算已成為推動智能時代諸多企業創新及信息產業發展的引擎。
一. 云計算、移動互聯網與社交網絡是大數據的三大推進器
在過去不到20年的時間里,個人計算設備生成的數據量呈現出驚人的增長態勢。而要想處理好這些激增的數據,就需要強大的云存儲與計算平臺。而當大數據和云遇見深度學習,這一計算機科學家朝思暮想了數十載的科技終于不再是無本之木。隨著深度學習技術的潛能被充分釋放,弈棋程序的勝利以及我們在圖像識別、語音識別等領域的連番突破也就是順理成章的事。
二.大數據應用已成為標配(介紹大數據應用)
1、圖像識別技術史=人臉數據庫+計算能力的擴張史!
手機這種設備支持某些看起來很酷很智能的功能,比如人臉檢測、根據面孔特征實現身份識別和分類編目等,若沒有一流云平臺在背后支持,也是不可想象的。 小米手機相冊有一些對用戶而言相當便利和人性化的功能,例如:用戶可以從合影中找到每一張人臉并看到年齡標簽;點擊“面孔”分欄,所有包含人物的照片便被歸入“姓名”影集中;選擇其中一張合影,應用還能標示出畫面里每個人的姓名……這些功能對于“患有”臉盲癥和健忘癥的朋友來說非常有用,而且也讓手機看起來很“聰明”。但其實,相關的運算過程并不是在手機硬件平臺上進行,而是依托于遠端的“小米云相冊”——至于小米云相冊,其實是由金山云做支撐。
支撐起人臉檢測與識別這個應用的背后是大數據,更重要的是背后的強大的云計算和存儲能力!其中,人臉識別需要對已知人臉的數據庫進行提取,也就是需要依靠強大的存儲能力作為支撐。而對于輸入的人臉圖像或者視頻流進行判斷,則需要依靠云計算技術才能得以實現。
2、深度學習:讓機器勝過人
以圍棋人機大戰為例,圍棋軟件AlphaGO和人類六-九段棋手16000次的對局中獲得30M個布點數據,其動用了1920個CPU和280個GPU的高性能計算資源,在一場比賽中消耗的能量是人的300倍!如此巨大的數據存儲和計算量,是以前的技術所無法實現的。
3、無人駕駛:大數據從一次機遇成為必須品
如果沒有大數據,世界將會變成什么樣呢?讓我們回顧近日舉世矚目的特斯拉無人駕駛車禍來尋找答案。大數據的方法是采用“足夠多的數據+簡單的模型”來得到更好的結果。因此,想要提高性能,就必然依賴于大數據。數據越多,覆蓋量、精密度越高,對模型的依賴就越低,人工智能就變得足夠可靠。
三.大數據和云共同推進我國信息產業發展
2015年,我們見證了云計算如何推動消費產品和企業級產品領域的偉大創新,而成為不同規模企業的新常態。如今,云計算已成為推動諸多企業創新的引擎。小米正通過云計算服務全球范圍的智能手機用戶;獵豹移動通過云計算為全球的用戶提供手機安全的保障;WPS通過云為全球的辦公用戶提供文件的存儲和分享。金山云作為國內頂級的云服務商,提供大規模存儲和計算平臺,支撐大數據挖掘和機器學習的復雜而耗費資源的算法和處理,成為諸多企業創新的引擎。金山視頻云平臺被視為全球最專注的公有視頻云,金山游戲云平臺成為國內最大的游戲云平臺,已形成完善的游戲產業生態。金山云更多的垂直領域云平臺,如醫療云、政務云平臺正在成為智慧城市的核心和基礎。大數據和云將極大地推進我國信息產業發展。
目前中國的云市場整個規模相當于美國市場的3.5%,中國市場對我們來說還如此之大,金山云在本身規模并不是非常大的情況下,在美國設立了自己的數據中心,在香港設立了我們的數據中心,針對東南亞和美國的客戶。
人工智能方面這五年的突破就是在數據本身足夠了,建模本身需求不是那么重要,而計算量也夠了,當你有了很大數據,有很大計算資源之后,一旦算法上有所突破,自然整體來說就有很好突破。當你越來越多人工智能需求,當你有越來越多數據挖掘需求,其實背后需要大量的存儲和計算能力。
人工智能已成信息技術產業的主流與傳統行業升級、轉型和變革的關鍵。而算法、大數據、計算資源不僅構成了人工智能的堅實支點,還將成為現實中我們構建通往全新的“智能”之路的能量之源。人工智能飛速發展,大數據和云共存共生、相互促進,一種不一樣的思考方式正在成長成熟,大數據和云正在推動人工智能時代的來臨。金山云,必將成為智能時代的基石!大數據和云必將極大地我國信息產業的發展!