經過處理的大數據才有價值
大數據是來源于網絡和各種傳感器對特定對象的記錄,它是關于人、組織和物(機器和自然界)在特定時間、地點的行為、過程、事件的事實數據。作為技術,大數據是抓取和分析世界和人們生活的一種數據技術,它使人類具有全過程、全方位記錄各種事件和行為的能力,具有透析過去和預測未來的能力。
在大數據時代,任何數據均具有潛在的價值。過去人們重復利用的數據資源主要是人類觀察、思考、創作完成的成果,比如文章、文件、論文、著作等,而如今人類可以利用的各種機器運行軌跡、人類活動記錄、自然界變化觀測等信息,過去需要大量觀察訪談、調查統計、測量等完成,現在可以借助計算機系統、各種數據采集器完成,并通過大數據分析工具實現全樣本、自動化處理和分析。在過去,沒有人在意我們自己的行為軌跡,也無法記錄大量的事件和過程,可以說作為“垃圾”自覺或不自覺地扔掉了,而現在的數據技術使我們具有變廢為寶的能力,因而大數據技術可以說是一種在浩瀚的數據海洋中發現“寶貝”的技術。
正因此,數據正在成為人類可擁有和控制的資源。我們已經進入到數據生存時代,大數據正在提供新的研究范式,重新認識宇宙、物質、生命和社會,并在此基礎上帶來科技技術、管理決策、社會發展的巨大變革。如今我們提到的智能制造、人工智能、機器學習、分享經濟、個性化定制或服務等技術和商業模式的創新無不建立在數據資源基礎上。著名大數據公司Gartner認為,大數據是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。可以毫不夸張地說,未來經濟和社會發展是建立在大數據技術普遍應用基礎上,數據不僅成為經濟創新轉型發展的引擎,而且是所有企業市場競爭的重要資源。因而,數據利用秩序成為未來社會的第一秩序。
傳統的財產權不適合大數據
如果說所有權(排他支配權)是構筑物質資源利用秩序的法律工具的話,那么它是否可以移植到數據世界,建構數據的利用秩序呢?答案是否定的。這是因為數據的非物質性,很難實現排他使用。其一,數據使用的非排他性,一個占有使用并不妨害他人占有使用;其二,數據使用具有非消耗性,數據的使用不消耗本體,反而豐富數據,使數據具有新含義或增值。因而數據天然地不適合于所有權體系,通過數據上設置排他支配權不適用于大數據時代。
在《民法總則》制定過程中,數據信息曾被納入知識產權的客體,試圖設立類似知識產權的專有權,但最終出臺的《民法總則》并沒有將數據信息列為知識產權的客體。這是因為,大數據背景下的數據更多的是事實記錄,其數據的收集(采集)和聚合本身并不能實質性改變數據的價值。數據具有價值或者能夠實現價值需要一系列的篩選、分類、處理、合并,形成主體數據、專題數據,使數據變成可用的數據產品,通過數據產品交易或服務,實現數據的價值。那么,數據產品化或商品化的過程,是否可以被賦予類似于知識產權的專有權呢?
知識產權是保護創造性勞動成果的一種制度,而創新勞動成果多表現為思想、技術方法、標識等,而這些離不開信息或數據。不過,知識產權并沒有建立對創新成果(思想或信息)本身的支配權,而是將思想或信息置于公共領域,僅賦予權利人一定期間的商業化使用創新成果的專有權。也就是說,在知識產權體系下,仍然堅持信息(思想)公開和自由原則,數據及其所承載的科學文化成果被認為是社會活動的公共要素,置于公共領域。
顯然,在大數據時代,我們仍然應當堅持將數據產品或信息視為公共資源的原則,而不允許信息私權化或成為私權客體。因為這樣會妨礙科學文化進步,妨礙社會正常交往和運行。數據賦權仍然應當堅持數據的公共資源屬性,不應當賦予數據持有者對數據的所有權,我們也不應當突破知識產權制度理念和框架,賦予數據持有人對數據本身的某種支配權。
因此,無論以有形物為基礎財產權,還是以無形物為基礎財產權體系,均難以解決數據時代的數據利用秩序問題。
數據該如何賦權
數據從原生數據到有價值的數據產品需要投入,這不僅僅是勞動投入,而且還有資本投入,只有當這些投入得到足夠的回報時,才有人從事數據的收集、處理和加工,將數據轉化為產品或服務。解決數據產品制作者激勵是數據賦權要解決的核心問題。
根據前面的論述,即使是數據產品,也要保持社會公眾對該產品的可接觸或可學習的公共屬性,僅僅賦予數據產品制作者以商業化使用數據產品的權利。數據產品的制作者權利應當包括自己使用和許可他人使用的權利,或者利用數據提供服務的權利,同時有權制止他人商業目的的使用該數據產品的權利。這種基于對數據分析加工勞動而取得的數據使用,屬于一種新類型財產權,不妨可以稱為數據使用權。它區別于傳統的物權之處,在于它不是對數據的支配權,而區別于傳統知識產權之處在于,它并不要求獨創性或創新性。這樣,可以給數據產品制作者實現其收集和加工數據的激勵,促進數據產品的生產和流通,滿足社會對數據產品的需要。這里賦權的正當性在于保護數據上存在合法利益,使數據產品持有人可以收回勞動投入甚至獲取利潤,但并不能絕對地排除他人使用相同的數據。當然,如何確保數據產品制作者商業化使用權,又使數據保持一定的開放性,使公眾可獲取性,需要精細的法律制度設計。
數據主體利益的保護原則
在大數據環境下,一切數據皆有源。當數據來源于個人或者是對個人的描述時,就屬于個人數據(又稱個人信息)范疇。個人數據包含隱私信息(個人的私密信息),隱私保護成為個人數據保護的重要組成部分。在這方面,國際社會關于個人數據使用的總體原則是合法、正當和必要原則,以不侵犯個人尊嚴或自由等基本權益,尤其是隱私利益為基本限制,只有法律規定的敏感信息需要征得個人的同意,而一般的個人信息則并不需要個人同意。我國現行規則為,除遵循合法、正當和必要原則外,還必須征得個人的同意,似乎給了個人對個人信息的控制權。這與個人信息的多樣化或多種法律屬性(許多個人信息是可以公開的并為企業組織使用的)事實不吻合。其實,僅僅識別特定個人并不足以給個人對該信息享有支配權,個人信息仍然是社會交往的工具。但是,個人信息的收集和使用必須尊重個人權利,必須確保個人知情和在必要時的干預(更正、刪除等)。
除了來源于個人外,企業數據還需要獲得其他企業和社會組織的數據。除非這些數據是公開可供他人自由獲取的狀態(成為公共數據),否則取得這些組織的數據也需要獲得數據實際控制人的同意,而不能夠隨意抓取、竊取或采取其他非法手段獲得。數據產品制作者權益的保護是建立在合法取得數據的基礎上。這種合法取得實際上也意味著法律對數據來源者利益的保護。在此方面除了保護個人信息外,還有企業信息的保護問題。
大數據應用最關鍵的是取得盡可能大而全的數據,而為取得他人的數據就必須合法合規,其中最為重要的是尊重和保護個人信息權益。由此,數據利用秩序歸根結底是要建立數據來源方(原材料提供者)到收集加工制作方(制作者)再到數據方(消費者)有關數據權利和義務配置秩序,在保護各方權益的前提下,保持數據開放性和流通性,使數據得到社會化的利用,實現數據的價值。
數據利用秩序關系大數據戰略
在過去,數據被作為公共資源,甚至許多數據被作為垃圾隨意地丟棄了,沒有討論數據產權問題。但是,隨著數據價值的重新發現,以及人們對數據掌控能力的提高,數據逐漸成為可以控制的對象。在數據可控制的情形下,要讓人們將掌握的數據拿出來分享和利用就必須要有激勵,就必須創制數據社會化利用的秩序。《國家信息化發展戰略綱要》明確提出要“探索建立信息資產權益保護制度”。由于數據本身仍然需要保持一定公共性,賦予任何主體對數據和數據產品的絕對支配權,都背離人類社會發展的基本理念,因而數據賦權仍然應當堅持信息自由原則。
數據總是處于不斷地脫離原來主體而流動,而正因為這樣的流動,才使數據產生價值,但脫離主體也意味著原主體喪失對數據的控制。既要保持數據的自由流動性,又要維護每個主體在數據上的權益,這是個空前的法律難題。而創制和維護這樣的數據利用秩序卻是大數據應用的前提,是大數據戰略得以實施的根本保證。