當(dāng)從嚴(yán)格的安全角度談?wù)摯髷?shù)據(jù)時(shí),人們必須注意兩個(gè)主要問題。第一是確保公司和該公司所持有的有關(guān)客戶信息。第二個(gè)是如何正確使用大數(shù)據(jù)技術(shù)在安全風(fēng)險(xiǎn)來臨之前進(jìn)行分解和分析。
保護(hù)大數(shù)據(jù)
大多數(shù)企業(yè)已經(jīng)在使用大數(shù)據(jù)進(jìn)行研究和營(yíng)銷實(shí)踐。不幸的是,其中一些企業(yè)不了解基本原則,即安全性。與其他每一個(gè)開發(fā)和發(fā)布的新技術(shù)一樣,安全性是一個(gè)簡(jiǎn)單的事后考慮,但這卻是一個(gè)重大問題。
隨著越來越多的企業(yè)開始使用先進(jìn)技術(shù),需要更加強(qiáng)調(diào)在線業(yè)務(wù)安全。否則,人們將面臨大數(shù)據(jù)泄露失控,對(duì)許多企業(yè)造成嚴(yán)重的法律后果,并且他們的聲譽(yù)遭受重大損害。
一個(gè)主要的大數(shù)據(jù)問題是缺乏組織。隨著業(yè)務(wù)所有者開始尋找其他方法來對(duì)從客戶獲得的信息進(jìn)行分類,可以實(shí)施高級(jí)安全措施來幫助保護(hù)敏感數(shù)據(jù)。
部署大數(shù)據(jù)的安全措施
在日志系統(tǒng)上,管理傳統(tǒng)安全信息和事件管理(SIEM)系統(tǒng)的開銷所需的輸出需求對(duì)于許多IT部門來說太多了。因此,大數(shù)據(jù)通常被視為某種節(jié)約,因?yàn)樗梢杂糜趲椭墼p檢測(cè)和其他主要問題。但大數(shù)據(jù)本身不是答案,企業(yè)必須能夠始終保護(hù)自己的系統(tǒng)和信息。這是一個(gè)入侵檢測(cè)系統(tǒng)(IDS)像Snort發(fā)揮作用。通過跟蹤系統(tǒng)中的弱點(diǎn)并查看可疑活動(dòng),入侵檢測(cè)系統(tǒng)可以幫助加強(qiáng)企業(yè)的安全防御,并在問題變成高級(jí)安全風(fēng)險(xiǎn)之前解決問題。
風(fēng)險(xiǎn)和技術(shù)
像任何新技術(shù)或?qū)嵺`一樣,都會(huì)面臨風(fēng)險(xiǎn)。這些風(fēng)險(xiǎn)需要被識(shí)別和理解。一旦企業(yè)了解這些風(fēng)險(xiǎn),就可以采取措施來防止或克服這些風(fēng)險(xiǎn)。這里有一些應(yīng)該注意的風(fēng)險(xiǎn)。
•開源代碼-大數(shù)據(jù)實(shí)現(xiàn)通常包括某種類型的開源代碼。這允許以前無法識(shí)別的后門進(jìn)入系統(tǒng)。
•新的和未知的漏洞-大數(shù)據(jù)是許多企業(yè)所有者的一個(gè)新概念,因此,企業(yè)不知道他們?cè)谒麄兊南到y(tǒng)中引入了額外的漏洞。
•身份驗(yàn)證問題-來自各個(gè)位置的用戶身份驗(yàn)證和數(shù)據(jù)訪問可能會(huì)受到正確監(jiān)控和控制的問題。
•監(jiān)管要求-未受培訓(xùn)的企業(yè)主很容易無法滿足這些要求。在首先進(jìn)入大數(shù)據(jù)解決方案之前,請(qǐng)適當(dāng)?shù)嘏嘤?xùn)自己和員工。
•恒定監(jiān)控-集群中的節(jié)點(diǎn)表面可能未得到正確審查,并在網(wǎng)絡(luò)中留下軟件點(diǎn)以用于入侵。
如果企業(yè)花時(shí)間研究大數(shù)據(jù),就不可避免地要去了解Hadoop。Hadoop設(shè)計(jì)用于快速處理極大量的數(shù)據(jù),而不管其結(jié)構(gòu)如何。
Hadoop使用Google公司提供的MapReduce框架來解決生成網(wǎng)絡(luò)搜索索引和日志的問題。MapReduce通過多個(gè)節(jié)點(diǎn)委派信息,消除了數(shù)據(jù)文件太大而無法在單個(gè)機(jī)器上存儲(chǔ)和處理的問題。將此技術(shù)與當(dāng)前的Linux服務(wù)器合并為大規(guī)模計(jì)算陣列提供了具有成本效益的解決方案。
Hadoop分布式文件系統(tǒng)允許集群中的服務(wù)器失敗,并且不中止計(jì)算過程。這通過確保跨群集復(fù)制數(shù)據(jù)來完成。HDFS對(duì)其可以存儲(chǔ)的數(shù)據(jù)沒有限制。
專業(yè)技能
大數(shù)據(jù)是關(guān)于處理技術(shù)和輸出,那么它是關(guān)于數(shù)據(jù)本身的大小。這意味著需要特定的技能集才能正確使用大數(shù)據(jù)。大數(shù)據(jù)分析專家目前供不應(yīng)求,特別是在使用一些較舊的技術(shù)平臺(tái)時(shí)。
隨著Hadoop相關(guān)技術(shù)的不斷發(fā)展,對(duì)于一個(gè)企業(yè)的需求,雇傭一名優(yōu)秀的IT人員,這些非常具體的技能是至關(guān)重要的。數(shù)據(jù)挖掘,預(yù)測(cè)建模,內(nèi)容分析,文本分析,多變量統(tǒng)計(jì)分析和社交網(wǎng)絡(luò)分析等專家都非常需求。這些科學(xué)家和分析師與非結(jié)構(gòu)化和結(jié)構(gòu)化數(shù)據(jù)一起工作,為企業(yè)帶來新的見解和智慧。還需要高需求的平臺(tái)管理專家來啟動(dòng)Hadoop集群,以及管理,保護(hù)和優(yōu)化它們。
在決定采用大數(shù)據(jù)之前,請(qǐng)確定自己清楚地了解所期望的內(nèi)容,并預(yù)先了解人員和其他資源。通過制定明確的計(jì)劃和目標(biāo),可以幫助擴(kuò)展自己業(yè)務(wù)的信息安全的邊界。對(duì)大數(shù)據(jù)了解的越多,實(shí)際上可能就是可怕的。這里要記住的重要事情是,大數(shù)據(jù)可以控制,就像火一樣,既能為人提供方便,也有能力毀滅,需要得到人們的尊重。大數(shù)據(jù)就是如此,在可以利用其力量來改善業(yè)務(wù)之前,必須知道它能做什么和不能做什么。必須學(xué)會(huì)如何正確使用它,否則,可能會(huì)為企業(yè)業(yè)務(wù)帶來更大的損害。