楊強表示,我們正處于大數據驅動的AI時代,人們將工作數字化,然后通過人工智能自動化,從而提高效率。但是,現在我們越來越多的遇到了數據的困擾,很多企業的數據都是孤島沒有辦法打通,同時受制于歐盟GDPR等法案的制約,增大了這種困境。
楊強教授具體講解了大數據面臨的兩大困境。
一大困境是面臨隱私、安全和監督。以歐盟的GDPR為例,GDPR明文規定了用戶的“被遺忘權”,對使用自動化模型決策全面禁止,這對機器學習有重大影響,因為讓用戶同意使用并不容易,使用自主決策合法要滿足三點,包括合同處理的必要性、其他法律另行授權,數據主體明確同意。
在數據隱私的監管的大趨勢下,解決這一問題并不容易。楊強教授提出了聯邦遷移學習思路,這種思路希望建立起機器學習的企業生態,各個企業自有數據不出本地,模型效果不變,在不違規的情況下建立一個虛擬模型。楊強教授表示,利用聯邦遷移學習加密技術,協同建模,學習模型過程不交換用戶數,不侵犯隱私。
另一大困境是小數據的困境,楊強教授提出了遷移學習,并列舉了跨領域輿情分析的案例。
楊強最后表示,面對數據發展的困擾,希望利用聯邦遷移學習技術建立聯合建模解決方案,克服數據障礙。在法律規范的基礎上,各個參與方理解一致的共識機制,保障安全合規性。比如在金融領域,可以建立金融業聯邦遷移學習聯盟