大數據對于很多企業來說,并不都意味著機遇或者商業上的無限潛力,在他們能夠很好的了解大數據、管理大數據之前,大數據就如同“白雪公主的蘋果”,只是看起來很美,實際上還同時意味著巨大的風險。對于像阿里這樣已經在大數據服務平臺操作上有了成功實踐的企業,也必須關注大數據的風險,否則極有可能將到手的市場份額拱手讓人。
1 技術風險
盡管大數據的產生多半是因為企業發展及數據產生的種類多元化這個“大環境”所致,但是面對這些快速增長的大數據所暴露出的問題還是讓企業管理者們不安。
通常情況下,按照數據被訪問頻率的高低,可以將這些大數據分為熱數據和冷數據,熱點數據放在昂貴的介質上沒有任何異議,但是冷數據放在昂貴的介質上面則會導致IT建設成本上升,是一種浪費。所以如何將冷、熱數據進行分層存儲,既能優化存儲系統的性能,又可以有效地降低存儲系統的整體擁有成本,實現一舉兩得是企業的突破方向。在數據備份方面,數據備份可謂“老生常談”,大家一直在談數據需要備份,備份是企業最后的保障、最后的一個利器,可以保護企業系統在崩潰或受到損害之后依然有數據可用。2001年的“9.11”事件中,世貿中心中大約2/3企業因為未做數據備份而導致徹底倒閉。無獨有偶,2012年6月20日,雅虎日本服務器系統發生故障,導致近5700家企業數據丟失,除了小林制藥這樣日常進行數據備份的用戶可以在幾天之內恢復數據外,其他用戶的數據絕無恢復的可能,其損失可謂“慘重”。
2 操作性風險
(一) 信息安全風險
隨著虛擬網絡的迅速發展,在線交易、在線對話、在線互動越來越多,社交網絡、智能終端已經是人們生活中不可或缺的一部分。數據量的激增以及社會各個領域對大數據重要性的認識提升,數據安全問題成為我們不得不關注的重要議題。
從個人的角度來說,每個人都實實在在的處于大數據的范圍之下,我們既是數據的提供者也是數據的應用者。利用大數據獲取商機顯然十分重要,但如何防止這些數據被過度濫用、被公開和被不法分子利用,則是大數據分析者們必須思考的新課題。大數據的獲取、存儲、保持、利用和展示,無一不涉及隱私權問題,隱私保護則成了最大的難題。與隱私權相對的則是信息的利用和共享。我們既不希望大數據的發展損害用戶的隱私權,也不希望以保護隱私權為名而妨礙信息的利用和共享,這兩者應當兼顧,取得合理的平衡。
大數據的信息安全問題也是數據的擁有者、使用者之間的平衡關系,是數據的所有權和使用權之間的平衡關系。大數據時代強調全社會信息資源的開放分享和開發利用,而個人信息涉及到個人隱私,但又具有社會經濟價值,其信息保護的邊界面臨調整。
(二) 數據分析風險
大數據平臺的模式是依托于從前在交易中積累的海量數據進行的對用戶的行為習慣、思維方式的總結,進而對其可能發生的行為的一個判斷。也就是說大數據分析方法依賴于大數據“過去決定未來”的特點。這一前提在大部分情況下都是成立的,但如果遇到需要突破性創新的情況就會暴露出弱點。因此,即使是《大數據時代》也不得不承認大數據仍將面臨一些局限,特別是:“卓越的才華并不依賴于數據”。
大數據分析是希望通過網絡中虛擬的信息將個人實體化,對每個人從職業、喜好、人脈等方面進行全方位的解讀。例如在電商平臺上,對用戶進行信用審核后進行貸款,這種數據審核的背后是希望通過數據了解企業的真實情況,通過了解雇傭職工數目估算企業真實營業收入,了解企業的還款能力。在數據封閉的情況下,電商企業不能夠接觸到平臺用戶以外的客戶群,也難以了解在平臺之外用戶的數據;經營社交網絡的企業,如新浪等占有用戶的大量非結構性數據,對于用戶的交易數據了解甚少。二者的融合既是解決預測風險的方法,也是大數據服務平臺的發展趨勢。
維克托·邁爾-舍恩伯格在其著作《大數據的時代》中指出,“數據量的大幅增加會造成結果的不準確,一些錯誤的數據會混進數據庫。”大數據意味著更多的信息,但同時也意味著更多的虛假關系信息,對數據的真實性提出了挑戰。斯坦福大學Trevor Hastie教授用“在一堆稻草里面找一根針”來比喻大數據時代的數據挖掘,問題是很多稻草長得像針一樣,“如何找到一根針”是現在數據挖掘的問題上面臨的最大問題。大數據對規律的挖掘上遵循“是什么”的現象關系,而不是遵循“為什么”的因果關系,使得分析思維和邏輯思維顯得并不重要。其實不然,對一個社會現象進行客觀深刻準確的分析,對事物的理解需要數據,但更需要分析思維,在大數據時代,理論并非不重要,而是變得更加重要。
沒有抽樣的擬合,直接面對大數據,將使我們失去對人的了解,對真實規律的追尋,畢竟不是所有的社會事實都像一場流感一樣易于預測,況且即便是谷歌被廣為贊譽的流感預測案例也被認為存在問題:在與傳統的流感監測數據比較之后,根據互聯網流感搜索實時更新的Google流感趨勢被發現明顯高估了流感峰值水平。科學家指出基于搜索有太多的噪音影響了它的精確度,這表明基于社交網絡數據挖掘的流感跟蹤將不是替代而只能補充傳統的流行病監測網絡。
3 法律風險
大數據金融服務平臺中,涉及到數據的采集、處理以及應用,也涉及到擁有大數據的企業跨界金融涉及金融監管的問題。從數據的采集、處理以及應用中,在互聯網相關企業,尤其是電商企業在為客戶提供金融服務的過程中,積累了大量的客戶個人信息,而其中所隱含的商業價值逐漸被人們發現和利用。在利益驅使下,越來越多的機構或個人采取種種手段獲取他人信息,加之部分企業保護意識和保護能力不強,導致近年來對個人信息的侵權行為時有發生,已引起社會廣泛關注。造成此種侵權行為發生的一個重要原因是,目前我國尚無一部專門的法律對個人信息數據特別是個人金融信息的收集、使用、披露等行為進行規范,立法散亂,呈零星、分散狀態,不成體系,目前主要通過憲法和相關法律法規對個人信息進行間接保護。近年來我國加快了個人信息安全保護的立法和修法進程,如《刑法修正案(七)》、《侵權責任法》、《居民身份證法(修訂)》等法律都相繼出臺,民事、行政和刑事責任三位一體的個人信息保護法律框架基本構筑。還有前面所提到的全國人大常委會于2012年12月28日通過的《關于加強網絡信息保護的決定》進一步強化了以法律形式保護公民個人信息安全,但這些法律法規仍然過于原則化抽象化,導致缺乏實際操作性,并存在規制范圍狹窄、公民舉證困難等不足。此外,現行“誰主張、誰舉證”的司法規則在大數據時代下存在著很大的局限性,由于現代信息技術環境下收集和濫用個人用戶信息的主體眾多、渠道隱蔽、方式先進,導致被侵害合法權益的個人用戶舉證難度極大,即使最后舉證成功,在請求損害賠償時也很難證明和評估個人的實際損失。
另一方面,大數據企業跨界金融,隨著政府本著金融創新、加快金融改革的理念對此在態度上表示支持,但是金融監管機構尚無明確的法律法規以及規章制度出來給予規范。而且大數據企業和金融機構從基因上的不同,使得二者的商業規范,運營模式都存在差異,這就要求大數據企業必須在認真學習傳統金融機構的監管政策的同時,也積極關注政府出臺的新的監管措施,對業務進行調整,不踩法律紅線,不打法律擦邊球。