導語:近日,一篇題為《警惕阿里巴巴的大數據造成國家安全威脅》①的文章在網上流傳,作者是中國人民大學公共管理學院教授劉太剛。在流傳過程中,也有左翼輿論將其包裝為知名軍方強硬派將領戴旭的觀點,還改成了《阿里未來國有化是一種必然》這樣的題目。這篇“大數據威脅國家安全論”靠譜嗎?且看《較真》欄目查證。
在微博和微信上,稱“阿里巴巴大數據將嚴重威脅國家安全”的文章都流傳頗廣
查證1、阿里巴巴并不能掌握“各種戰略資源的流轉”這篇“大數據威脅國家安全論”的一個核心觀點是,阿里巴巴可以“通過大數據挖掘建立起中國戰略資源的流轉及節點圖”。——“阿里的大數據本身就包含各種商品流轉的數據,通過各種商品的流轉很容易分析出國家各種資源的流轉,由此繪制出中國各種戰略資源的流轉及節點圖……有了這樣一份戰略資源的流轉及節點圖,中國戰略資源的薄弱環節就會清晰地展現出來。顯然,無論戰時還是平時,這樣一份戰略資源的流轉及節點圖都可用作瓦解國家安全的導航圖。”
首先,雖然阿里巴巴在中國電商中占據主導地位,但據國家統計局和商務部數據顯示,2014年全國網上零售額為2.8萬億元,還只占國內全年社會消費品零售總額26.2萬億元的10%出頭。②而至于達到10萬億元規模的B2B電子商務市場,據中國電子商務研究中心發布的《2014年度中國電子商務市場數據監測報告》,阿里巴巴的份額是38.9%。③換言之,阿里巴巴還遠未達到掌握絕大多數商品流轉數據的程度。
更重要的是,阿里巴巴即便掌握商品流轉的數據,距離分析出各種資源的流轉也很遠,更不要說在目前的占有規模下分析出“各種戰略資源的流轉”。
事實上,在今年稍早些時候,在藥品領域,阿里巴巴曾面臨過更具體的指責。南方周末報道稱,按照國家食藥總局的監管要求,中國各類藥品從生產、流通、經營和消費等所有節點的全部信息,將會儲存在“阿里云”上。當時就有人認為,阿里健康將就此“運用大數據的研究方法,分析藥品電子監管碼所蘊含的信息,能夠繪制出國內的疾病發生的時間、地域、周期,進而掌握國人的健康情況;甚至還能通過藥品流轉,繪制出中國各種戰略資源節點圖。”④
然而這一說法在當時就被權威人士否定。中國疾病預防控制中心原副主任楊功煥認為,健康數據中更重要的是患者數據、醫生診斷數據,然后才是相應的藥物數據。“一種藥品可以治療很多種疾病,藥品和疾病的一一對應關系本就存疑。”“單憑這個數據,得到戰略節點是不可能的。”她認為藥品相關數據最多只屬于公共數據,沒有達到涉及國家安全類數據的范疇。
所以,僅憑阿里巴巴掌握了很多電子商務數據,就認為這些數據有可能被制作成“瓦解國家安全的導航圖”,是聳人聽聞的說法。
曾有人擔心阿里健康掌握藥品流通信息后,通過大數據分析,掌握國人健康資料
2、大數據的能力不應該被過度夸大聲稱“大數據威脅國家安全”的這篇文章,還一個說法是,“阿里巴巴的大數據和云計算簡直就是有史以來最為強大的情報搜集和分析系統——通過其大數據和云計算,中國人的一舉一動及行為偏好都可以盡在其掌握之中。”這種說法完全是過分虛夸了大數據的能力。
2014年國際著名的《連線》雜志曾刊登了一篇關于大數據的評論文章。作者認為,如果缺乏對人們現實生活的實地調查,大數據沒有什么意義。文章舉了“谷歌流感趨勢”為例子說明了大數據并沒有那么強悍。谷歌公司推出的“谷歌流感趨勢”是一個有明確目的的大數據分析案例,目的是:找出人們在流感季節常用的搜索詞,然后實時跟蹤這些搜索詞的使用高峰期。這樣,谷歌就可以在新流感爆發之前發出警報,而且預警時間要比官方疾病防治中心的預警時間早大約兩周。但著名的《科學》雜志刊登的一篇文章告訴我們,自2011年8月以來,“谷歌流感趨勢”幾乎每周都會高估流感的盛行率。而在2009年,就在“谷歌流感趨勢”推出后不久,它完全沒有察覺豬流感的爆發。作者認為這并不是算法不夠成熟的問題,而是“大數據”的能力不應被過分高估。⑤
事實上,要通過大數據分析出有價值的東西向來不是那么容易。數據一是收集難,二是存儲難,三是處理難,四是呈現難。國際知名咨詢公司Gartner的分析師Svetlana Sicular就曾因為大數據很難讓用戶得到滿意的結果,就唱衰過大數據,認為“大數據熱潮即將有所回落”。他引用了一個評論稱,“一旦跟大數據扯上關系,我們就需要克服更多難題、投入更多精力,因為整個過程完全是在摸著石頭過河”。還可以舉一個知名的例子,著名在線影視內容提供商Netfilx曾舉辦了一個獎金一百萬美金的比賽,netflix開放了一部分數據庫的用戶數據,要求每個參賽者根據這些數據預測這些用戶未來對影視作品的打分。結果是,在賽事中排名第一的算法,其效果也不理想,Netflix也從未應用過,理由是認為這算法還不足以滿足實際使用的需求。⑥所以,盡管阿里巴巴的系統公認結構化數據做得很好處理,但也不可能僅通過購物數據,就掌握出“中國人的一舉一動及行為偏好”。
3、大數據對個人隱私的威脅的確存在,但并不是沒有解決的辦法聲稱“大數據威脅國家安全”的這篇文章,還有一個比較唬人的說法,“通過大數據挖掘建立起中國要害人員的個人檔案——檔主的社會關系、性格稟賦、興趣愛好、隱私緋聞甚至生理周期和心理缺陷都盡在其中。”由此我國的士兵、外交官等的弱點就被盡在掌握,“甚至可以這樣說,如果阿里的大數據能以現在的規模再累積30年,三十年后的中國領導人或許會從阿里的用戶中產生。若此,阿里的大數據和云計算,差不多能披露三十年后領導人的個人隱私。”
相比前面提到的說法,大數據對個人隱私的威脅是比較貼近實際情況的。美國人同樣也有這樣的擔心,2008年美國國家學術出版社出的一本《反恐戰爭中的個人隱私保護》就明確提到對數據的深度挖掘可能會威脅到隱私保護和公民自由。⑦《連線》雜志也稱,“大數據是一把任何一面都鋒利無比的雙刃劍。盡管它有驚人的潛力讓我們的世界變得更加美好,但是也可以被輕易地濫用于以贏利為目的的跟蹤,甚至被用來跟蹤并消除異己。”⑧
但對于這一點也并非沒有辦法解決。美國政府的思路就值得參考。在美國政府看來,大數據時代已經來臨,數據收集變得無處不在,通過“告知與同意”框架來阻止企業收集、分析、使用個人數據乃至隱私變得日益困難,因此應該轉換思路,要提出政策主張,發揮行業自律作用,并且強調事后責任,來解決這一問題。具體來說,就是要求企業注重數據采集與使用的透明度,“企業應當清楚地說明如下信息:收集個人數據的種類;收集個人數據的原因;所收集的個人數據的用途;在何種條件下刪除數據或者刪除數據中消費者的身份信息;是否與第三方分享個人數據以及分享的目的等。法案重點要求企業公開與個人數據原定使用情境不一致的行為,公開與消費者的預期不一致的個人數據使用行為。”強調事后問責,就是指一旦發生數據或隱私外泄,不僅公司內部需要控制和問責機制,更要對消費者和執法機構承擔外部責任。《消費者隱私權利法案》提出了十分詳細具體的問責事由,涵蓋企業員工行為控制、內部數據使用監督、向第三方公開數據等方面,使事后問責更為明確具體。 ⑨
4、即便擔憂對國家安全產生威脅,也不必動輒高呼“國有化”這篇認為“大數據威脅國家安全”的文章最后得出的結論是,“如果往前走,阿里的未來只有一條路,就是國有化。”這一個非常粗暴的思路,以國家安全為由干涉市場經濟,干涉企業自主。實際上即使大數據真的威脅到了國家安全,首先考慮的方式也應該是加強監管,而不是在所有權方面動腦筋,損害企業效率。從美國政府“大數據白皮書”來看,美國人對大數據帶來的可能風險,采取的是更為積極的態度,更為看重大數據為經濟社會發展所帶來的創新動力,產生問題是想辦法解決,而不是對其抱著洪水猛獸的態度。⑨
圖為某數據中心的機房