作為咨詢師和顧問,有關(guān)各自數(shù)據(jù)、信息和網(wǎng)絡(luò)安全事務(wù)時(shí),重復(fù)“規(guī)模”問題挺有難度。不幸的是,上市公司的“外行”總監(jiān)和管理人員,以及政府高管,傾向于將“規(guī)模”(當(dāng)它屬于數(shù)據(jù)保護(hù)的時(shí)候)看做不好的東西,甚至是令人恐怖的事物。
原因部分在于,幾乎沒有什么實(shí)用的方法,可以向這些位置上的人解釋:某組織的安全運(yùn)營中心是有可能每天收到百萬個(gè)“事件”,以及,同時(shí)處理和調(diào)查這些事件的固有潛在危害,以及,適度保證沒有任何一起事件能夠溜過安全人員的檢測。
大數(shù)據(jù)分析作為商業(yè)工具是很妙的一招,因?yàn)槲覀兛梢詫⑦@些數(shù)字轉(zhuǎn)換成“商業(yè)利益”。但大數(shù)據(jù)也是網(wǎng)絡(luò)安全的需要(比如,使用網(wǎng)絡(luò)流量、數(shù)據(jù)、傳感器和其他反饋,幫助確定網(wǎng)絡(luò)正常模式和異常現(xiàn)象),問題在于網(wǎng)絡(luò)安全數(shù)據(jù)不太容易被轉(zhuǎn)換成我們能輕易概念化的東西。
那么,我們產(chǎn)生多少大數(shù)據(jù)呢?我們又該怎樣響應(yīng)這些數(shù)據(jù)?有幾個(gè)重要的基本問題必須得到很好的理解,否則更難的問題——我們怎樣保護(hù)數(shù)據(jù)?就得不到解答了。
一、我們產(chǎn)生多少數(shù)據(jù)?
先從一個(gè)基本的概念開始:時(shí)至今日,數(shù)據(jù)意味著所有東西,無論是個(gè)人的,還是工作上的。我們生活中的方方面面,都已經(jīng)轉(zhuǎn)換成了這些“0”和“1”的組合。我們?nèi)缃駥?shù)據(jù)的依賴是前所未有的,而且肯定還會(huì)越來越重,尤其是隨著IoT的爆炸式發(fā)展。而我們產(chǎn)生的數(shù)據(jù)——無論好數(shù)據(jù)、壞數(shù)據(jù)、垃圾數(shù)據(jù),也將持續(xù)增長(以驚人的速度),不斷吞噬全球網(wǎng)絡(luò)上的空間(意味著如果你能夠控制小小一部分這些數(shù)據(jù)流,就能發(fā)動(dòng)邪惡的DDoS攻擊)。
那么,到底有多少數(shù)據(jù)以近光速游蕩在網(wǎng)絡(luò)中?2016年6月思科的一份白皮書揭示:全球IP流量已進(jìn)入“澤字節(jié)(ZB:2^70字節(jié))時(shí)代”。很好,但ZB是個(gè)什么鬼?(下文會(huì)有解釋)
二、回到基本規(guī)律
為解答該問題,我們需要從一些基本規(guī)律開始,首先就是:人類是有認(rèn)知限制的。在試圖理解超級大或超級小的數(shù)字上,這種限制就特別明顯了。我們可以使用計(jì)數(shù)符號來表示大數(shù)字,比如 1 ZB(澤字節(jié))就是 1 x 10^21 字節(jié)。但是,這個(gè)計(jì)數(shù)法對你有任何意義嗎?
把100萬表示成 1 x 10^6 可能對你還有點(diǎn)意義,但那是因?yàn)槲覀儗?ldquo;100萬”的實(shí)際意義有著更好的理解。可以用美元來概念化“100萬”以創(chuàng)建一個(gè)參考點(diǎn):你的年薪是 $50,000,工作20年,只存不花,那就能攢下100萬美元了。看下表,可以給你的年薪來個(gè)“增幅”:
哪種表示法看起來更爽?$1 x 10^9 還是 $1,000,000,000?好吧,其實(shí)都一樣的數(shù)額,但后面的一串“0”顯然看起來舒服多了。而且,更重要的是,看著后一種表示法中的一串“0”,不僅可以幫助人類理解該數(shù)字,還能更好地理解這數(shù)字代表的意義。為什么呢?因?yàn)槲覀冇脝卧~代表數(shù)值,而這些數(shù)值必須被轉(zhuǎn)換成可感知的某些東西,我們才能在日常生活和網(wǎng)絡(luò)空間中加以使用,因?yàn)橐?guī)模、符號和認(rèn)知的限制,該問題變得更難了。
三、概念化ZB
我們知道十億(10^9)是什么,但我們管10^21叫什么?1,000的7次冪?現(xiàn)在覺得有個(gè)稱呼好點(diǎn)兒了么?未必!
想象一下我們可以捕捉的一瞬間,就2016年全球IP流量的一個(gè)快照吧——1澤字節(jié)。我們能把這類比成什么呢?
用下面的表格,我們用一些例子以類比的方式重寫了這些數(shù)字,概念化一下我們實(shí)際處理的東西。
注:本例中用 1.28 ZB (有些數(shù)字四舍五入了),出于數(shù)學(xué)上的方便,完整寫出數(shù)字時(shí)就用十進(jìn)制值而非二進(jìn)制了。不用過分糾結(jié)細(xì)節(jié),至于技術(shù)宅,記得:更多的人說話方式是“非技術(shù)”的。讓你的生活,以及他們的生活,更容易些吧,術(shù)語行話和煩人的細(xì)節(jié)什么的,能避免就避免。
嘗試在腦海中具象化下面的數(shù)字:
*注:1 萬億米相當(dāng)于1,000,000,000公里
如果地球到土星的距離對比很難概念化,不妨這么想:花8,000輩子一刻不停用腳走就走到了。如果這都還是難以想象,那就這樣:128 GB 之于 1.28 ZB,相當(dāng)于 20 美金的一張綠票票之于整個(gè)美國聯(lián)邦債務(wù)——20萬億美元。于是,假設(shè)聯(lián)邦債務(wù)以全球IP流量增長速率增加,到2020年美國總統(tǒng)大選之時(shí),我們要討論的就是46萬億的債務(wù)數(shù)字了。
四、概念化網(wǎng)絡(luò)安全警報(bào)過程
那么,既然我們現(xiàn)在對數(shù)據(jù)產(chǎn)生和流量問題的規(guī)模有了更好的理解,我們就要考慮一下怎么管理了。
毫不意外的,被問到最大的安全事件響應(yīng)挑戰(zhàn)時(shí),被調(diào)查的網(wǎng)絡(luò)安全從業(yè)者中,36%的人稱,“跟上安全警報(bào)的規(guī)模。”用上面20萬億美元來做類比,可以說,安全人員的任務(wù)就是每天從550億美元中篩選,找出其中多少是合法的,有多少被盜了,有多少是被洗的,有多少是假鈔。
FBI局長詹姆斯·科米在2014年 60 Minutes 的采訪中對該問題給出了一個(gè)非常有用的描述(談及中國網(wǎng)絡(luò)攻擊時(shí)說的):
實(shí)際上,他們沒那么強(qiáng)。我把他們比作喝醉的盜賊。他們一路踢開大門,撞倒花瓶,再順走你家電視機(jī)。他們僅僅是多勞多得而已。他們的策略似乎是:我們就是時(shí)時(shí)刻刻無處不在。而他們無法阻擋我們。
關(guān)鍵句是“時(shí)時(shí)刻刻無處不在”,因?yàn)檫@就是現(xiàn)狀。同一份調(diào)查中,42%的受訪者稱自家公司忽略掉了相當(dāng)大一部分的安全警報(bào),因?yàn)樗麄兺耆簧暇瘓?bào)的規(guī)模。當(dāng)然,被警報(bào)淹沒也存在無心之失的風(fēng)險(xiǎn):“狼來了”太多次的后遺癥。
但或許更令人擔(dān)憂的數(shù)字是:34%的人稱,1/4到一半的警報(bào)都被無視了,20%稱一半到3/4的警報(bào)被無視,11%稱超過3/4的安全警報(bào)被無視!額滴娘喂,這不就是無數(shù)大門被踢開,然后放任不管么。
再回到20萬億美元的對比,也就是每天要從550億美鈔中篩選的類比中。如果我們使用上述“忽略”數(shù)字,翻譯過來就是:警報(bào)告訴我們有些不對勁的事情在發(fā)生,但我們太疲于應(yīng)付了,我們不想撥冗查看價(jià)值150億的日產(chǎn)警報(bào)。這可真是很多很多錢啊。
很不幸,該問題由來已久。警報(bào)忽略似乎與警報(bào)本身一樣常見,而且如《思科2017年度網(wǎng)絡(luò)安全報(bào)告》中揭示的:不到一半的合法警報(bào)切實(shí)觸發(fā)了某種形式的修正,而僅不到1%的嚴(yán)重/關(guān)鍵警報(bào)被予以調(diào)查。2014年,企業(yè)每天處理10,000個(gè)警報(bào);2016年,政府部門每天處理50,000個(gè)警報(bào);誰知道2017年底隨著IoT爆炸式發(fā)展我們每天要處理多少警報(bào)呢。
不幸的是,盡管有良好建議,比如設(shè)置目標(biāo)、獲取正確的信息、鞏固整合等等,我們依然疲于奔命,因?yàn)槲覀冞€是沒解決“規(guī)模”問題。哦,還有,我們是不是還沒提到,有時(shí)候網(wǎng)絡(luò)安全分析師每天只能搞定10個(gè)調(diào)查?這就是AI和機(jī)器學(xué)習(xí)可以大展拳腳的地方了(也是為什么專注于網(wǎng)絡(luò)安全問題的AI初創(chuàng)公司,是最好利用我們當(dāng)前越來越脆弱的狀況的原因了)
五、到底意味著什么?
這意味著,我們還有很多工作要做,意味著如果沒有AI和機(jī)器學(xué)習(xí)幫我們解決網(wǎng)絡(luò)安全挑戰(zhàn)——感覺上是兩碼事而實(shí)際上就一碼事的東西(提示:網(wǎng)絡(luò)安全+信息安全=數(shù)據(jù)安全),我們就一條道走到黑了。只要有人能命令并控制僅僅1%的全球IP網(wǎng)絡(luò)流量,其后果都是災(zāi)難性的。
這想法聽起來挺難以置信的,但很可能就真是這樣,尤其是在想到IoT設(shè)備有多不安全(你的洗碗機(jī)有口令嗎?),以及向移動(dòng)設(shè)備的遷移分分鐘都不停腳的時(shí)候。這意味著只會(huì)有越來越多的人連接本就不安全的設(shè)備WiFi網(wǎng)絡(luò)。
這些困難不會(huì)變得更容易解決,特別是當(dāng)我們持續(xù)產(chǎn)生數(shù)據(jù),而黑客宣稱可以在12小時(shí)內(nèi)突破大多數(shù)目標(biāo)的時(shí)候。因此,我們需要盡可能多的工具(比如AI/LM),但我們也需要清醒且坦誠地面對手頭處理的對象。網(wǎng)絡(luò)安全是個(gè)技術(shù)問題,也是人的問題,但我們?nèi)祟愖陨韰s一直都理解錯(cuò)了這一點(diǎn)。對人類認(rèn)知限制的認(rèn)識,是領(lǐng)先對手和惡徒的重要一步。