摘要:如果企業想要從大數據中獲益,那么,當涉及到數據存儲時,其必須有效的避免踏入法律監管的雷區。東盟企業的IT部門又是如何應對大數據存儲所帶來的挑戰的呢?
處理和理解大型且復雜的數據集——或當下已成為一大時髦術語的大數據,儼然已成為企業的當務之急,本文中,我們將為讀者介紹東南亞國家聯盟(東盟)的企業是如何應對這一現實問題的。為了能夠從中獲得有價值的洞察和見解,該地區的企業不僅需要面臨一系列法律監管的影響,同時還要處理如何龐大數據量存儲的技術挑戰。
存儲大數據的一大明顯的障礙就是如何存儲如此海量信息。傳統的數據存儲的方法,無論是從存儲空間還是從性能方面來說,其成本都是相當昂貴的。
“使用傳統的數據庫來處理海量的數據是不容易的;僅僅使用樣本數據早已不足以滿足用戶對于追求更準確的數據信息的胃口。” 新加坡最大的IT服務提供商,并在亞洲,澳大利亞和中東地區的10個國家設有辦事處的NCS公司首席顧問Andy Tan Choo Heng表示說。
為了應對和處理如此海量的數據信息,大數據存儲方面的技術創新就包括了Hadoop。
有各種不同的Hadoop技術來適應不同的需求,Tan說。高可用性的Hadoop使用商品級的計算機存儲數據和提供冗余,以實時的數據流查看和分析數據;還有在Hadoop的拼接機的完全成熟的RDBMS;在Hadoop中的Apache Tajo的低延遲數據庫;以及MongoDB的文檔型數據庫。
“東盟大多數國家使用的是開源軟件,如Apache Hadoop,而還要一些公司使用其他基于Hadoop或MongoDB的開放源碼。” Tan說。
總部位于馬來西亞的一家電子商務公司表示,他們當前所面臨的挑戰不只是數據的存儲,而且還包括數據的訪問。“我們需要確保數據庫的結構,同時,在設計存儲方法時要充分考慮兼顧到與企業的成長和發展相匹配。我們今天一個月的銷售就比我們過去三年前全年的銷售還多。因此,我們肯定需要強大而完善的方式來存儲數據和檢索信息。”據該公司一名希望匿名的發言人表示。
“除了處理數據的挑戰,數據的快速膨脹同時也帶來了數據庫的安全問題,因為我們需要確保數據的完整性、以及敏感數據信息的匿名化,因為這些都是關于我們客戶、產品,或關系到我們的盈利能力的數據信息。”
為了應對這些挑戰,該公司使用了安全套接層(Secure Sockets Layer,SSL)加密,以確保安全地連接其數據庫;并嘗試使用最新的工具和技術,以確保其使用強大而高效的商業智能工具來獲取和檢索信息并進行分析。
Gartner首席研究分析師Santhosh Rao認為,當個人或敏感數據被存儲時,數據匿名化技術應首先被部署,以便讓數據在被大數據系統攝取之前刪除個人數據。“另一種最好的做法是將個人數據保存在一個孤立的和安全的數據存儲,為匿名數據創建一個單獨的數據存儲,以便通過大數據平臺攝取匿名數據。”Rao說。
為了保證數據的穩定性,并確保數據長期以同一種安全狀態被存儲,用戶使用存儲和備份系統支持一次性寫入后的多功能讀取和加密。為了節省存儲成本,一些有使用分層存儲和壓縮技術,Rao補充說。
與大數據相關的法律挑戰
除了存儲大數據方面的技術難題,企業所面臨的另一大挑戰是數據保護和監管方面的擔心。整個東盟的不同國家的數據保護法律意味著要處理這些法律的監管難題可能會非常棘手,因為新加坡和馬來西亞都有數據保護法,但印度尼西亞,泰國和其他東盟成員國則沒有。此外,一些國家要求企業所收集到的數據必須獲得明確的同意許可,而有些國家則接受默認同意。新加坡Pinsent Masons法律事務所合作伙伴Bryan Tan說。
“大數據是利用已存儲的數據。而數據保護則限制了在哪些方面的數據可以被使用以及數據應該如何存儲。即使是一個隱匿過程,在不同國界也有不同的解釋。”Pinsent Masons的Tan說。
此外,某些行業必須遵守特定的數據規定。“一些金融監管機構看不慣云存儲,” Tan說。“在韓國和日本等國家,監管機構要求的個人資料必須被保存在其本國國土內——這意味著公司無法將數據集中在數據中心,這是大數據分析的一大挑戰。而印度尼西亞和中國也正在制定具有本地特色的監管法律,數據服務提供商只能在其各自國家使用服務器。”
除了法律和監管方面的挑戰,也有現實意義和歷史問題。數據質量便可以說是一大問題,因為在東盟,不同國家有不同的發展速度,并可能有其自己獨特的語言。其結果是,各管轄區的數據集保持不同,影響了數據的質量。
在開始實施大數據項目之前,企業需要考慮大數據項目的合規性問題。
“將個人資料暴露在公共領域,數據保留期和故意刪除數據都可能會導致不符合監管規定的問題。”Gartner的Rao說。
他說,某些國家已經就如何保護個人數據提供了有限指引。這些安全機制的預期是合理的,確保未經授權的數據并訪問和限制修改。例如,新加坡的一些數據保護法律強調了在特定行業的數據類型的保留期。
馬來西亞的電子商務企業的這名發言人同意對于他所在的企業而言,最重要的合規性問題是必須遵守馬來西亞的個人數據保護法(PDPA)。
“自2013年11月以來,馬來西亞已開始正在實施PDPA法案,以確保我們收集企業外部的數據信息必須要征得他們的同意。我們需要小心的使用這些信息,以尊重客戶和商家的隱私,當涉及到使用這些信息,并要做到盡可能明確。”他說。
“作為馬來西亞最大的在線電子商務平臺,我們要確保與我們合作的商家的合作合同是詳細完備的,然后將他們產品上架到我們的平臺進行銷售,這為重點保護個人數據、數據治理及確保我們用戶數據的安全性奠定了重要的基礎。”
盡管馬來西亞的數據保護法并沒有限制企業在馬來西亞針對其大多數數據存儲和數據服務器活動的開展,但他們仍必須嚴格遵循個人數據保護法。
現如今所正在生成和分析的數據的量和數據傳輸速度都在大幅增加,而這些問題在不久的將來將繼續構成顯著的存儲和合規性問題。目前,存儲供應商和各國企業都應積極的應對這些變化。
“大多數存儲供應商都在試圖嚴格遵守相關的監管法規,如證券交易委員會(SEC)的17a-4(f),薩班斯·奧克斯利法案(SOX),健康保險流通與責任法案(HIPAA)和商品期貨交易委員會監管法規(CFTC)。”Gartner的Rao說。“我們期待在東盟國家的數據保護框架也將進行修訂,以提供對數據安全性和存儲的具體指導方針。”