如今企業(yè)開始部署機(jī)器學(xué)習(xí)。企業(yè)希望員工使用機(jī)器學(xué)習(xí)的三個(gè)主要原因包括:節(jié)省成本、更快處理海量數(shù)據(jù)以及更快發(fā)現(xiàn)新的漏洞。
大型零售商使用機(jī)器學(xué)習(xí)應(yīng)用來發(fā)現(xiàn)電子商務(wù)中的欺詐性交易,同時(shí)防止合法交易被阻止。他們利用機(jī)器學(xué)習(xí)來分析客戶對產(chǎn)品的態(tài)度,并找出冒充長期客戶的攻擊者。
金融機(jī)構(gòu)利用機(jī)器學(xué)習(xí)應(yīng)用或系統(tǒng)來預(yù)測貸款違約以及欺詐和洗錢行為;醫(yī)院可通過機(jī)器學(xué)習(xí)預(yù)測可節(jié)省的急診室等候時(shí)間、可預(yù)測的中風(fēng)和癲癇發(fā)作以及浪費(fèi)式的再次住院;大型律師事務(wù)所則可利用機(jī)器學(xué)習(xí)幫助律師更快決定選擇處理哪些案件,法律機(jī)器人被訓(xùn)練用以確定企業(yè)合同是否包含所有必備條款。
機(jī)器學(xué)習(xí)的其他應(yīng)用包括預(yù)測健康狀況和股票價(jià)格,以及電力負(fù)荷與太陽能發(fā)電。
機(jī)器學(xué)習(xí)自帶風(fēng)險(xiǎn)
即便是最好的機(jī)器學(xué)習(xí)模型也存在著風(fēng)險(xiǎn),這包括因糟糕學(xué)習(xí)算法導(dǎo)致的誤報(bào),這可能被攻擊者利用。同時(shí),機(jī)器學(xué)習(xí)模型還可能獲取來自最近被攻擊主機(jī)的受感染數(shù)據(jù),沒有誤報(bào)并不意味著沒有任何風(fēng)險(xiǎn),攻擊者可以利用運(yùn)行機(jī)器學(xué)習(xí)應(yīng)用平臺系統(tǒng)中的漏洞。
機(jī)器學(xué)習(xí)面臨的風(fēng)險(xiǎn)之一是攻擊者可利用偽造的生物識別指紋和虹膜以及面部特征來冒充合法用戶。另一個(gè)風(fēng)險(xiǎn)是攻擊者在測試或執(zhí)行期間可以騙過機(jī)器學(xué)習(xí)模型將惡意訓(xùn)練樣本分至合法類別。這可能導(dǎo)致機(jī)器學(xué)習(xí)模型產(chǎn)生與預(yù)期完全不同的結(jié)果。
機(jī)器學(xué)習(xí)風(fēng)險(xiǎn)管理
下面是降低機(jī)器學(xué)習(xí)應(yīng)用風(fēng)險(xiǎn)的五種方法:
1. 執(zhí)行道德攻擊
道德攻擊是指值得信賴的安全專家入侵系統(tǒng)以發(fā)現(xiàn)被防火墻、入侵檢測系統(tǒng)或其他任何安全工具忽視的機(jī)器學(xué)習(xí)漏洞。在獲取訪問權(quán)限方面,道德攻擊者利用的是合法用戶在設(shè)備上遺留的指紋所重構(gòu)的偽造指紋。在進(jìn)入系統(tǒng)后,道德攻擊者可潛入指紋數(shù)據(jù)庫,獲取另一位合法用戶的生物特征模板,再重建一個(gè)假的指紋。為了應(yīng)對這種風(fēng)險(xiǎn),設(shè)備讀取器必須在每次使用后進(jìn)行清理,數(shù)據(jù)庫應(yīng)被加密。
2.加密安全日志
系統(tǒng)管理員擁有超級用戶權(quán)限來分析機(jī)器學(xué)習(xí)日志文件,這樣做的原因包括:檢查是否遵守安全政策、對系統(tǒng)進(jìn)行故障排查以及取證。加密日志文件是防止日志文件被攻擊的一種方法。更改日志內(nèi)容所需要的加密密鑰不會暴露給惡意攻擊者,如果攻擊者試圖刪除日志文件,管理員會立即收到警報(bào)。
3. 清理訓(xùn)練數(shù)據(jù)
當(dāng)提供良好的訓(xùn)練數(shù)據(jù)時(shí),機(jī)器學(xué)習(xí)模型可良好地運(yùn)作。該模型開發(fā)人員必須知道這些數(shù)據(jù)從何而來,這些數(shù)據(jù)必須是干凈的數(shù)據(jù),而不是異常或受感染的數(shù)據(jù)。如果數(shù)據(jù)來源主機(jī)受到攻擊,則應(yīng)該停止使用這些數(shù)據(jù)。糟糕的數(shù)據(jù)可能導(dǎo)致機(jī)器模型無法良好運(yùn)作,最終導(dǎo)致系統(tǒng)關(guān)閉。當(dāng)使用機(jī)器學(xué)習(xí)工具來為特定目的評估數(shù)據(jù)時(shí),模型開發(fā)人員應(yīng)該將所有數(shù)據(jù)轉(zhuǎn)換為通用格式。
4. 對模型生命周期采用DevOps
攻擊者可利用來自機(jī)器學(xué)習(xí)平臺的誤報(bào)信息。對于這種風(fēng)險(xiǎn),我們可對機(jī)器學(xué)習(xí)模型生命周期應(yīng)用DevOps,DevOps讓開發(fā)和訓(xùn)練、質(zhì)量保證及生產(chǎn)團(tuán)隊(duì)相互協(xié)作。
DevOps會從開發(fā)和訓(xùn)練階段開始,然后進(jìn)入到質(zhì)量保障階段來看看模型的訓(xùn)練情況。不滿意的測試結(jié)果意味著需要返回到開發(fā)階段,為模型提供更好的數(shù)據(jù)。如果測試結(jié)果很好,模型則會進(jìn)入生產(chǎn)階段,處理真實(shí)世界的數(shù)據(jù)。如果結(jié)果不符合預(yù)期,DevOps應(yīng)該從開發(fā)或質(zhì)量保障階段再次重復(fù)。
5. 部署安全政策
最后,我們還應(yīng)該部署安全政策。在簡單的情況下,安全政策應(yīng)該包括五個(gè)部分:目的、范圍、背景、行動和限制。范圍會確定涵蓋哪些內(nèi)容:機(jī)器學(xué)習(xí)模型類型、訓(xùn)練數(shù)據(jù)和數(shù)據(jù)挖掘算法(回歸、聚類或神經(jīng)網(wǎng)絡(luò))。背景部分則會查看政策背后的原因,行動部分介紹如何利用DevOps來降低風(fēng)險(xiǎn),而限制部分則會查看機(jī)器學(xué)習(xí)的限制以及測試數(shù)據(jù)的可用性。