有一種說法,我們人類現在每天大概會創造出近13萬億字節的數據,而且這個速度還在與日俱增。如果你對這個天文數字沒有具象的概念,那么換一個說法,在我們當下,時鐘的秒針每轉一圈,即在每一分鐘,谷歌搜索引擎就會收到人類發起的380萬次以上的搜索請求,亞馬遜網站會寄出1000個以上的包裹,推特上新增47萬篇以上的推文。
這些高頻跳躍的數字,正是我們這個時代最鮮明的寫照,也是最能反映我們這個時代特征的一個縮影。在這個寫照中,最為重要的角色便是“信息”。正是對信息的開發與利用,塑造了這個“大數據與智能”時代。
信息為王
作為一種時代標定性的資源,信息如同水一樣,成為人類生存的一種必需品。一方面,人們的生活方式越來越依賴信息,越來越多的人通過手機或電腦等智能終端進行學習,獲取新聞,進行網絡購物等。另一方面,“存在即可表征”,人的存在都是“數字化”的。人們前所未有地重視自己在網絡上、在社交媒體上的數字身份,人類在網絡空間中的一舉一動、一言一行都被記錄下來,不斷豐富自己的數字個性與畫像。
也有人將信息比喻為大數據與智能時代的“石油”,是一種戰略性的資源。信息之于數字經濟,猶如石油之于工業經濟。以信息與通信為核心的ICT技術成為驅動數字經濟發展的新動能,以信息為主要生產資料的數字經濟日益成為主導性和支柱性國民經濟組成部分。根據中國信息通信研究院發布的《中國數字經濟發展白皮書(2017年)》所公布的數據,2017年,中國數字經濟規模達27.2萬億元,占國內生產總值(GDP)的32.9%。此外,2017年中國數字經濟領域就業人數達到1.71億人,占2017年總就業人數的22.1%。
除了在社會和經濟領域中扮演著重要角色之外,信息甚至成為人類科學研究和創新活動的關鍵要素。縱觀科學研究歷程,人類在經歷了實驗科學、理論推演和計算機仿真三種科研范式之后,正在邁入以“信息”為核心的數據密集型科學研究范式,也被稱為“第四范式”。
在第四科研范式下,人類的科研活動以信息為核心,以信息的加工與處理作為主要手段,尤其隨著近些年以深度學習為代表的新一波人工智能技術的發展,進一步提升了人類對信息處理和利用的水平。2018年以來,第四科研范式在化學、材料科學、生物學、醫學乃至天文學領域不斷取得突破性的進展。
信息洪泛
信息如此重要、如此寶貴、又如此之有價值,引來無數“英雄豪杰”爭相開采。在人們享受信息所帶來的效率和便利的同時,也引發了一些信息亂象。由于信息本身復制成本接近于零,同時隨著信息技術的應用與滲透,使得信息摩擦也趨向于零。這樣,如果不進行理性和倫理的約束,信息的開發會如同“野馬脫韁”和“洪水決堤”一般,導致信息洪泛。信息洪泛會帶來許多的問題,其中典型的問題有兩個:一是信息過度的開發所引發的信息爆炸,另一個是信息的無邊界滲透與蔓延侵蝕到個人的隱私。
信息爆炸是相對于人類的處理能力而言的。大數據的困擾核心在于我們當前對信息的處理以及有效地利用趕不上信息開采的速度,人類暴露在泛濫的信息之中難免迷失。用一句通俗的話來講,信息供給量已經超出了人類信息胃所能消化的量。這種“消化不良”給人類一種非常不適的感覺,并由此帶來各類煩惱和問題。我們所面對的信息比上世紀80年代末要多出數十個量級。出于本能,當人類面對這種超出其認知舒適邊界的大量信息的時候,會不知所措,產生信息疲勞、信息焦慮,甚至信息恐慌。
另一個更大的問題是個人信息泄露。許多的廠商以為用戶提供更好的服務之名,大肆地收集個人信息。個人信息猶如“案板上的魚肉”,任人宰割。當我們在手機中安裝移動應用(APP)時,很多不良移動應用都如饑似渴,恨不能攫取你手機中包括地理位置信息、通訊錄信息、瀏覽行為信息等所有信息,并控制你的通信、控制你的音視頻設備(例如攝像頭,麥克風等)。它們如同一雙雙隱藏在你手機背后的眼睛,如影隨形般地窺視著你的一舉一動,你的個人隱私在它們眼中暴露無遺。除了移動應用的重災區,窺視個人隱私的信息暴徒已經遍布在世界的每個角落,記錄并監視你在網絡中的行為軌跡、購物記錄、搜索歷史、交友記錄、點贊與閱讀信息等各種搜索引擎、網絡商店和社交網站等。
信息濫用
當不良的應用獲取到你的個人信息時,它們不僅可以隨意地使用這些信息,還可以在黑市上廉價地、肆意地販賣你的個人隱私。許多人都有過這種糟糕的經歷:當你剛在某個網站注冊并輸入個人的手機號碼,隨后你就會收到許多騷擾和推銷的電話。除了干擾到你的生活,個人隱私的泄露導致財產損失,甚至喪失生命的案件也是層出不窮。
相比于一些不良的應用,眾多大型互聯網企業的信息濫用問題更不容小覷。2013年美國“棱鏡門事件”曝光美國政府一直在通過互聯網公司監控電郵、即時消息、視頻、照片、存儲數據、語音聊天、文件傳輸、視頻會議、登錄時間、社交網絡資料,并從中分析個人的聯系方式與行動。棱鏡門事件所涉及的互聯網公司幾乎囊括了微軟、雅虎、谷歌和蘋果等所有在美的互聯網巨頭。2018年3月,社交網站臉書被曝光其數據濫用,一家名為“劍橋分析公司”的數據分析企業,在未經授權的情況下,獲取了臉書上多達5000萬用戶的信息,并涉嫌利用這些信息操縱選民投票。
如果說,信息的泄露和販賣還只是一個非常初級的“濫用”,那么,當信息與以深度學習為代表的人工智能技術相結合后,信息會產生“深度濫用”。信息及信息技術曾被人類寄予厚望,期望它們能夠解決人類所面臨的一些問題。然而,事實上,由于信息的濫用,反而在某些情形下加劇了一些問題。
事實上,信息并非我們最初所認為的那么“客觀”,所有的信息在開發和利用過程中,都將人類的一些主觀性思維,包括偏見和錯誤都編碼到數據標簽和智能算法中。正是意識到信息及其濫用將會對社會所產生的深遠影響,2018年來自14家機構的26位作者聯名撰寫了一篇題為《人工智能的惡意使用》的報告,在報告中,作者將基于信息的人工智能技術與核能、炸藥和黑客工具相類比,并分別在數字安全、物理安全和政治安全幾個場景下,分析了濫用人工智能所帶來的一些后果。最后,作者呼吁人工智能研究者需要在研究初期就考慮潛在的對人工智能技術的錯誤使用,并嘗試建立適當的監管框架,防止人工智能的惡意使用。
信息治理
“水能載舟,亦能覆舟”。在大數據和智能時代,“信息”無疑是一把雙刃劍。信息已經展現了其巨大的威力,倘若任其野蠻擴張,不加以引導,信息或許會將人類拖入一個窘迫而危險的境地。如果能夠加以有效地治理,信息及信息技術的應用會將人類引入到一種新的文明——數據與智能文明。
信息的治理猶如治水,不能僅靠堵,更要用疏。信息的治理,要掌握信息的規律、信息的本質與特征。
“沒有規矩,不成方圓”。對于信息的治理,首先要出臺對于信息,尤其是個人信息保護的相關法律。信息的安全,如果涉及個人的生物乃至基因信息,關乎國家和種族的安全。在現代社會中,簡單拒絕信息的交互是行不通的,信息已經重構了經濟和社會體系,務必要將信息的權力關進法律的牢籠中。值得一提的是,2018年5月25日,歐盟頒布并實施《通用數據保護條例》(GeneralData ProtectionRegulation),《通用數據保護條例》明確要求:所有能直接或間接識別的種族、健康狀況、政治傾向、性取向等敏感信息,在未經當事人授權的情況下,企業不得使用。
“本末源流,班班可考”。對于信息的治理,還要加快明晰數據權屬關系。數據權屬不清晰容易導致數據交易的邊界不清,也容易引發個人隱私泄露和知識產權糾紛等問題。應該明確界定數據主體資格,明晰數據交易分類和評定規則。要強化一些大型互聯網平臺與企業的信息保護責任,人們為了獲取這些大型平臺提供的服務,將自己的個人信息讓渡給這些平臺,并授權其就相關信息進行某種開發利用,以期獲得更加優質的服務。因此,這些平臺在進行商業開發和創新過程中,應該嚴格遵守信息的開發利用邊界,肩負信息保護的責任。此外,要通過技術創新來解決技術問題。例如,加快區塊鏈技術的研究與創新,促進其在數據權屬的認定、交易和流通中發揮重要作用。
“綱常倫理,必也正名”。對于信息的治理,必須考慮倫理準則。許多涉及人類福祉的社會和經濟決策功能現在都由基于信息和智能的技術系統所肩負,因此,信息及信息系統的建設不單單是工程問題,更涉及倫理問題。尤其在涉及一些種族、貧困群體、障礙群體以及婦女兒童等的問題中,信息及信息系統的構建更應該遵循人類的倫理準則進行設計、開發和應用。例如,IEEE(電氣和電子工程師協會)關于自主和智能系統的倫理發出全球倡議,在《以倫理為準則的設計(第二版)》中,IEEE為信息技術的倫理設計提供了上百條的推薦與建議。
“規圓矩方,準繩嘉量”。對于信息的治理,最后還要實施算法審計和校勘,規范信息的有效與合規利用。對于信息利用中所采取的算法要做到“可問責、負責任、可解釋、精確、可審計和公平”。尤其是類似深度學習這類“黑盒”算法,人類尚未完全理解其邏輯,也還沒完全掌握這個“黑盒”模型,因此,在采用這類算法的過程中,我們尤其要加以審慎地分析與校勘,確保該算法符合相關法律法規,符合設計者的初衷。