“通過技術資源引進、創業公司扶持、大數據產業鏈公司扶持等方式從全國范圍引入有經驗的大數據人才。中期來看,鼓勵小象學院這樣的企業在貴州落地,開展大數據專業技能教育,為高校、企業等機構快速培養最早的一批本地人才。長期來看,鼓勵貴州高校開設大數據專業方向,建立長期穩定的人才供應通道。”
今年初,國內知名大數據在線教育平臺小象學院與貴州高校產生“交集”——與貴州大學、貴州財經大學等貴州高校商談合作開設大數據專業。雙方擬分擔師資力量試點開班,吸收來自計算機、統計學乃至視覺設計等不同專業背景的學生進行大數據人才培養。此后,合作迅速推進——北京小象科技有限公司派出多名核心技術人員來筑,舉辦面向高校教師、為期三天的大數據培訓班。小象科技CTO(首席技術官)冼茂源作為培訓教師,向參會人員介紹了目前國際上主要的大數據技術和大數據時代面臨的問題與挑戰。培訓會后,就大數據時代的隱私安全、人才培育等問題,冼茂源接受了本報記者的專訪。
大數據時代,網絡安全的攻防游戲更有意思,比拼上升到更高層次
記者:鐵道部12306購票網站在去年底遭黑客“撞庫攻擊”,大量用戶身份信息外泄。在大數據時代,我們能否利用大數據更快地確定潛在網絡攻擊來源,或通過其他途徑進一步提升網絡信息的安全性?
冼茂源:網絡安全問題就像互聯網的孿生兄弟,在現實世界中一直存在。所謂的“撞庫攻擊”等黑客技術,也并非有了大數據之后才有的事物。借助大數據、并發計算等技術,黑客可以調動更多的計算和數據資源,優化過去的攻擊算法,加強攻擊的效果。從這個角度看,大數據時代的網絡安全更為艱巨。
當然,在大數據時代,防守一方也有了比過往更豐富的、借助于大數據的手段,比如通過基于大數據的挖掘算法,預測可能發生的攻擊行為。從這個方面看,防守方也有了更有利的武器。可以說,在大數據時代,網絡安全的攻防游戲更有意思,雙方在數據量、計算資源方面的比拼上升到比以往更高的層次。
記者:云儲存是常用的數據儲存技術之一,海量的用戶信息被儲存到大型互聯網公司的數據中心,使其極易成為被攻擊的目標。用戶、數據存儲方以及政府部門監管方如何保障數據的安全?
冼茂源:云服務提供商為用戶提供了數據托管服務,監管部門首先應在法律層面規范其對于用戶隱私數據保護不可推卸的職責,指引公司在資金及人力投入上,給予數據安全足夠的重視。
其次,對于隱私數據的使用(云服務商的數據去隱私化處理)、秘鑰的存儲以及對云服務商的安全審查,制定統一、透明且切實可操作的規范準則和審查制度,以保障數據使用的規范性和安全性。
對于我們每個使用者來說,在當前云服務初期的時候,要意識到網絡的不安全性,采用一些必要手段,比如重要的資料使用不同的秘鑰保護以避免撞庫攻擊等,以保護自己的關鍵信息。
大數據場景下,數據加密方式已經從全量加密演變成分塊加密
記者:原有的計算機數據加密方式能否適應大數據時代的數據安全風險?新的數據加密方式工作原理與原來的數據加密方式有何不同?
冼茂源:相對于原有的數據規模,大數據場景下對加密方式最大的改變在于,原有的針對全量數據的加密,需要演變成對數據進行分塊加密的方式。數據加密算法本身的安全級別不會因為數據量變大而產生太大的變化,關鍵在于攻擊者利用大數據技術進行攻擊,才使數據安全受到了挑戰。
記者:您認為普及大數據教育對大數據安全是否有積極作用?具體可能從哪些方面產生積極影響?
冼茂源:大數據教育的普及對大數據安全有積極作用。通過了解大數據技術的特點,我們可以更清晰地認識在大數據環境中數據安全領域面臨的挑戰及機會。一方面,企業將來在大數據方面發力,需要更多有大數據意識和基本技能的參與者。另一方面,通過培訓奠定大數據基礎技能的學員,在深入大數據安全,或者將自己以往的數據安全知識應用于新興的大數據安全領域時,通過培訓獲得的知識具備更積極的作用。
主動開放公共數據,貴陽應借鑒國外經驗解決好數據安全問題
記者:貴陽市將主動開放交通、教育、旅游、醫療等一批關注度高、影響面大的重點民生領域公共數據。開放這些公共數據存在哪些安全隱患?
冼茂源:大數據隱私問題一直被業界人士稱為大數據頭上的達摩克利斯之劍。在公共數據開放之前,需要做好基本的政策及技術準備。公共數據的開放,最主要的隱患在于隱私泄露,對于稀疏行為數據的深度挖掘與分析,一些個體的隱私有可能會被泄露。比如,通過對某些醫療數據的挖掘與分析,某些患者的個人隱私被熟人得知。
記者:公共數據是否可能成為黑客利用的目標,用以挖掘個人隱私或公共安全信息等?
冼茂源:黑客或者別有用心之人肯定會打公共數據的主意。這些數據在公開之前,需要做去隱私化的預處理,以防止黑客還原隱私信息,在技術上這點并不難做到。大數據領域真正困難的,是大量的稀疏數據被黑客用做數據挖掘,將挖掘結果與一些其他渠道獲取的行為特征作比對,獲取個人用戶的行為隱私。
記者:政府應當通過哪些手段強化開放信息過程中的數據安全?
冼茂源:我們應借鑒國際領先的市場經驗。比如,像歐盟的A29委員會一樣,制定隱私保護協議,規范大數據領域的數據使用。另外,在技術層面,對企業使用大數據提供指導意見,引進先進地區的技術經驗,鼓勵企業探索大數據新時代的技術手段,如k-anonymity,解決大數據領域面臨的新的數據安全問題。
解決貴州大數據人才短缺,短期可以靠引進,長期還是要靠本地培養
記者:您對貴州吸引和培養大數據人才有什么建議?
冼茂源:貴州省發展大數據產業必然需要大量的大數據人才儲備,而在這方面,中國甚至全球都正面臨著巨大的人才缺口。我們建議貴州省采取如下措施來吸引和培養大數據人才。短期來看,通過技術資源引進、創業公司扶持、大數據產業鏈公司扶持等方式從全國范圍引入有經驗的大數據人才。中期來看,鼓勵小象學院這樣的企業在貴州落地,開展大數據專業技能教育,為高校、企業等機構快速培養最早的一批本地人才。長期來看,鼓勵貴州高校開設大數據專業方向,建立長期穩定的人才供應通道。
記者:小象學院與貴州各大高校有什么進一步的合作打算?雙方將如何培養大數據人才?
冼茂源:貴州高校響應省政府的大數據產業發展戰略,在全國范圍內積極尋找大數據專業教育內容。小象學院是中國最大、最活躍的大數據在線教育機構,通過最近的貴州省計量經濟學會的學術報告會及貴州省大數據產業發展應用研究院的大數據培訓班,已經和貴州本地大數據產業界和高校建立了穩定的合作關系。雙方將進一步深入合作,逐步引進落實大數據專業課程、大數據實驗室、大數據實訓基地、大數據咨詢服務等內容。
小象學院和貴州高校的大數據人才培養將會遵循以下原則:聚焦大數據領域的前沿技術,知識體系對接工業界的現實需求;以職業發展目標為導向,培養應用型人才;引入大數據實驗室和大數據實訓基地,提升學生實操的專業技能。目前,小象學院正在和貴州高校規劃設計具體的落地執行細節。
■人物名片
冼茂源
2005年,從北京郵電大學碩士畢業后進入全球主要通信技術的發源地——朗訊貝爾實驗室任軟件開發工程師。2006年,作為項目帶頭人進入美國太陽計算機系統(中國)有限公司Sun中國工程研究院。2010年,進入北京搜狗科技并成為云平臺部創建人之一。2013年至今,任Apache hama開源項目項目管理委員會(PMC)成員。2014年8月至今,擔任北京小象科技有限公司CTO。