繼今年6月《廣州日報》起訴“今日頭條”并達成和解協(xié)議之后,近日又傳出“今日頭條”被圍剿的消息。6月24日搜狐高調(diào)起訴“今日頭條”侵犯著作權(quán)和不正當競爭。同時,國家版權(quán)局宣布對“今日頭條”立案調(diào)查。至此,作為新聞數(shù)據(jù)的聚集者與加工者的“今日頭條”,命運堪憂!然而,該事件對筆者的思考不僅于此,“大數(shù)據(jù)”模式的法律風險才是更值得關(guān)注的問題!
“大數(shù)據(jù)”模式
所謂“大數(shù)據(jù)”模式,其實是將巨量的數(shù)據(jù)資料通過擷取、分析,從而提取有價值的規(guī)律性信息,以供政府、企業(yè)、個人等決策使用。換句話說,“大數(shù)據(jù)”模式本質(zhì)上是巨量數(shù)據(jù)的“二次加工”。這種“二次加工”不僅存在于信息空間,也存在于傳統(tǒng)世界。
在信息空間,“大數(shù)據(jù)”模式的加工對象是各種各樣的“電子數(shù)據(jù)”。筆者認為,“今日頭條”就是一種典型的“大數(shù)據(jù)”模式。“今日頭條”并不生產(chǎn)新聞數(shù)據(jù),而是將各個新聞媒體發(fā)布的巨量新聞數(shù)據(jù)進行擷取、分析,進而根據(jù)新聞數(shù)據(jù)的重要性和關(guān)注程度推送給用戶閱讀。這其實是“大數(shù)據(jù)”模式在新聞行業(yè)的應(yīng)用。
傳統(tǒng)領(lǐng)域也有“大數(shù)據(jù)”模式。曾經(jīng)有人與筆者討論一個商業(yè)案例,某零售企業(yè)對商業(yè)圈內(nèi)的社區(qū)垃圾進行收集和數(shù)據(jù)分析,并以此判斷社區(qū)居民的消費需求。這種“大數(shù)據(jù)”商業(yè)模式無疑是成功的。然而,筆者更關(guān)心這種“大數(shù)據(jù)”模式是否侵犯社區(qū)居民的隱私權(quán)。
實際上,近日的“今日頭條”事件,已經(jīng)凸顯了“大數(shù)據(jù)”模式的法律風險。
“大數(shù)據(jù)”模式的法律問題
“大數(shù)據(jù)”模式的首要法律問題是數(shù)據(jù)本身的法律屬性。比如說,“今日頭條”所擷取的新聞數(shù)據(jù)可能是不受著作權(quán)保護的時事新聞,也可能是享受著作權(quán)保護的文字作品。那么文字作品的著作權(quán)或者傳播者權(quán)如何保護?如果“今日頭條”以商業(yè)目的對文字作品進行使用,恐怕需要取得著作權(quán)人或傳播者權(quán)人的“使用許可”。具體取得方式可以是“征求著作權(quán)人或傳播者權(quán)人的同意”或者“支付著作權(quán)或傳播者權(quán)的對價”。再如,前述商業(yè)案例中,社區(qū)垃圾的數(shù)據(jù)信息是否屬于公民的個人信息,是否屬于隱私權(quán)的保護范疇?這也是值得討論的。
大數(shù)據(jù)的取得方式也關(guān)系到“大數(shù)據(jù)”模式的合法性問題。就互聯(lián)網(wǎng)數(shù)據(jù)而言,目前主要的取得方式是利用“蜘蛛程序”(也叫“網(wǎng)絡(luò)爬蟲”)自動搜索并抓取數(shù)據(jù)。這種技術(shù)有一個專門的協(xié)議,即“robots協(xié)議”(也叫“爬蟲協(xié)議”、“ 機器人協(xié)議”)。該協(xié)議要求所有網(wǎng)站在其站點的根目錄下放置一個“robots.txt”文件。該文件告訴搜索者本站點哪些數(shù)據(jù)可以被“抓取”。如果站點根目錄下沒有這個文件,則被視為“本站點內(nèi)所有沒有口令保護的數(shù)據(jù)都可以被抓取”。這就意味著如果有人突破“robots協(xié)議”范圍抓取網(wǎng)站數(shù)據(jù)就要承擔“侵犯數(shù)據(jù)”的法律責任。同理,丟棄的社區(qū)垃圾是否意味著公民放棄社區(qū)垃圾的數(shù)據(jù)信息呢?
當然,“大數(shù)據(jù)”模式的使用目的不同,法律規(guī)制的要求也自然不同。企業(yè)以商業(yè)目的利用“大數(shù)據(jù)”模式進行生產(chǎn)、經(jīng)營的,應(yīng)當嚴格保護數(shù)據(jù)權(quán)利人的合法利益,不得隨意侵犯數(shù)據(jù)所附有的著作權(quán)、隱私權(quán)等權(quán)利。而對于非商業(yè)目的利用“大數(shù)據(jù)”的行為,則應(yīng)區(qū)別對待。比如,個人或科研部門以學習、研究為目的對“大數(shù)據(jù)”進行擷取、分析的,政府或司法機關(guān)以行政決策或打擊犯罪為目的對“大數(shù)據(jù)”進行擷取、分析的,則需要對數(shù)據(jù)權(quán)利進行必要的限制。當然,這種限制是相對的,絕不是說相關(guān)部門和人員可以隨意侵犯數(shù)據(jù)權(quán)利人的合法權(quán)益。
此外,像大數(shù)據(jù)的處理、分析這些“加工行為”如何定性,也是一個值得思考的法律問題。在“今日頭條”事件中,“今日頭條”只是對文字作品進行擷取、分析并重新整理,這像是文字作品的“匯編”行為。而前述商業(yè)案件中,零售企業(yè)在社區(qū)垃圾的數(shù)據(jù)信息基礎(chǔ)上,提取出消費需求信息及用戶消費規(guī)律,這更像是“大數(shù)據(jù)”的“創(chuàng)作”行為。
筆者寄語
作為一種新生事物,“大數(shù)據(jù)”模式所帶來的法律問題是值得思考的。從目前看來,“大數(shù)據(jù)”模式的法律風險主要來自于大數(shù)據(jù)的來源和取得方式上。然而,如何從法律上看待“大數(shù)據(jù)”的“加工行為”,以及如何保護“大數(shù)據(jù)”模式的“加工成果”,則是一個更加長遠的法律議題。
作者簡介:謝君澤,男,出生于1983年,本科畢業(yè)于通信工程專業(yè),碩士畢業(yè)于法律碩士專業(yè),具有信息技術(shù)與法律專業(yè)的交叉背景。現(xiàn)為中國人民大學法學院證據(jù)學研究所研究人員,中國人民大學物證技術(shù)鑒定中心副主任、國家司法鑒定人,中國電子學會計算機取證專家委員會專委,長期致力于計算機網(wǎng)絡(luò)取證、電子證據(jù)司法鑒定、職務(wù)犯罪偵查等研究,多次參加最高人民檢察院、中華全國律協(xié)等部門電子證據(jù)規(guī)則的起草與論證。