說到貴陽,你會想到什么?這里有文峰塔、陽明書院,然而毫無疑問,這兩天這座城市擁有了一個別樣的關鍵詞:大數據。街道兩旁的宣傳廣告隨處可見。2016年5月25日,第一屆大數據科學與工程國際會議——大數據科學認識與理解在貴陽召開。據說此前貴陽已陰雨連綿數日,而雨停,也許就是一種美好的昭示。
上午8:30,大會準時開始,清華大學教授,原中國計算機學會理事長鄭緯民先生擔任本次大會主持人。出席大會的嘉賓有:中國工信出版集團董事長,人民郵電出版社社長季仲華;
中國計算機學會大數據專家委員會秘書長,中國科學院計算機技術研究所研究員、所長助理、副總工程師程學旗;中國工程院院士鄔賀銓;美國伊利諾伊大學芝加哥分校特聘主任教授,清華大學數據科學研究院院長,ACM/IEEE Fellow俞士綸;美國特拉華大學電子與集散機工程學院終身教授,ETI公司的創始人與首席科學家,ACM/EEE Fellow高光榮;英國帝國理工學院數據科學研究所終生教授/所長郭毅可;香港中文大學常務副校長,偉倫計算器科學與工程學講座教授,ACM/EEE Fellow華云生;中國科學院院士,上海交通大學副校長,IEEE,Fellow梅宏。
貴陽市政協副主席孫袁為大會作為開場嘉賓發表致辭。她在現場表示:“此次數博會來自全國嘉賓和國際嘉賓預計達到2萬人次,作為2016年的重磅學術活動,貴陽非常重視,我們要發展大數據,就應該對于大數據理念、內涵,關鍵數據以及人才培養的研究。我們希望本次會議在國家行業專家學者及全體人員的共同努力下,有效推動貴陽、貴州、中國乃至全球的大數據發展,為使我國走在大數據前端而共同努力奮斗。”
共八位專家在本場大會上分享了自己的觀點,快和小編去現場看看,和大數據來一場“零距離”的接觸吧!
鄔賀銓:大數據總量巨大
大數據從結構上來看可以分成結構化、半結構化、非結構化。大數據是多來源的。大數據之大,這是全世界網民平均每個月上網的流量,2013年全球互聯網流量每年為2.7EB,全年達到1ZB。2015年和2016年全世界新產生的數據量等于人類有歷史以來一直累計到2014年全球數據重量的總和,量非常大。
高光榮:大數據系統軟件前沿的幾個開放問題
高性能并非計算的“又一春”,接著是高性能計算/大數據面臨的挑戰,既有挑戰也有機遇。接著是大數據系統和軟件,搞的開放問題。往往是你腦子里有一個思路,要怎么做。絕對不能忽悠,忽悠解決不了問題。二十五年以前認為計算機不用再發展了,已經很前沿了,但是現在這個觀點已經不適用了。你想解決的問題,人工智能沒有達到效果。二十五年以后情況不一樣。山窮水盡無疑路,柳暗花明又一村,為什么這個事又活了?并非結構活了,并非數據活了,人工智能進入第二春。沒有經過頭一次死的人,現在看到的是第二次的出現。
俞士綸:對異構數據源的思考
把不同數據庫聯在一起,這些數據來自不同的領域,合并在一起的話,使我們能做更好的預測。現在是大數據時代,一個重要的事情是我們要怎么融合不同的數據?數據是很值錢的事情,其實IBM做氣象預測,有不同的應用可以預測天氣,根本賺不了什么錢。像運輸路線怎么走的話,一定要知道天氣,如果不知道天氣的話,他可能開到一半,被大風吹走了,也可能會淹水。如果做奇貨買賣的話一定要知道天氣,比如這個地方有干旱、洪澇等等。像做農業的話也需要知道天氣,天氣這個數據可以應用在不同方面,知道這個數據可以改變很多細節。要了解到什么數據是很有意義的數據。
張曉東:大數據分析將對人類社會本身的了解達到前所未有的高度
算機是為網絡研制的,互聯網和無線上網是一個數據世界的基礎。從1986年281PB,到2013年667EP,增加了2.9倍。這支持了我們的數據結構。計算機是一個數據中心,這個數據中心主要來源,這些數據,進去出來的數據相當多。所以從這個角度來講,當數據量這么大,對我們數據處理有很多新的挑戰。
郭毅可:數據科學與科學數據
我們知道科學研究有三個主要要素,理論、計算、實驗。這三個理論是這樣的,從理論出發,我們可以建立模型。對這個模型的模擬可以產生數據。我們理論至上,對事件進行假設,并進行觀察,得到數據。我認為數據科學是當代科學的重要基礎和方法論。實際上數據科學在當代的用處極其廣泛,而且推動了許多技術的研究和發展。我們就是基于這個基礎上做努力。
華云生:大數據研究的戰略思考
數據特性的多樣性,不同的應用有不同的特性,有些數據可能有規律的,有一些是沒有規律的。他們的概念,表示方法也不一樣,也有多樣性。數據的目標也有多樣性。數據的原因。不同的數據、不同的應用有不同的目標。算法的多樣性,有不同的算法。基建的多樣性,所以數據也有不同的地方。理論基礎多樣性。不像以前做做法有很好的規律、很好的算法。大數據其實是個現象。?現在從做大數據來講,很多沒有辦法從一個應用上面找出一個規律,找出一個方法,很容易應用到其他應用上。
方濱興:云監控與云加密——打造可信的云
云安全的四個層面,第一個是可靠的云,能夠始終可靠地提供服務。安全云,保障用戶及租戶在云中不會因攻擊而受到損害。可信云,保障云服務商不會對租戶的運行進行侵害。客戶把資料傳到云上?怎么保障信息的安全?這是一個很大的問題。云加密,降低泄密風險。上網前把個人信息提交給網絡才能上網,這叫上網實名制。不作為怎么辦?我們能怎么辦?無縫數據加密傳輸、支持任意云端平臺。云監控,你不作為,不能亂作為,所以我要監督你,發現你是不是做了不該做的事情。
梅宏:對大數據熱潮的若干反思
我們看到了很多數據應用的成功案例,在商業智能、在智能交通、在自然語言處理、在自動問答系統、下棋機器人等等。我想機器替代人做勞動、做體育、做計算到現在幫助人下棋,毫無疑問,還會繼續往下走。在這個意義下,我們對大數據高度重視。大數據的應用仍處于初級發展階段。現在的很多案例都很難被看作典型的大數據應用案例,很多都屬于初級階段。真正的大數據應用應該體現在數據挖掘的深度和多源(跨界)數據的融合的廣度,絕不是數據的“海量”,這才是所謂的大數據。