人工智能時代,深度學習和大數據成了密不可分的一對兒。深度學習可以從大數據中挖掘出以往難以想象的有價值的數據、知識或規律。簡單來說,有足夠的數據作為深度學習的輸入,計算機就可以學會以往只有人類才能理解的概念或知識,然后再將這些概念或知識應用到之前從來沒有看見過的新數據上。
《智能時代》的作者吳軍博士說:“在方法論的層面,大數據是一種全新的思維方式。按照大數據的思維方式,我們做事情的方式與方法需要從根本上改變。”
谷歌的圍棋程序AlphaGo已經達到了人類圍棋選手無法達到的境界。沒有人可以與之競爭,這是因為AlphaGo在不斷進行學習。AlphaGo不但從人類專業選手以往的數百萬份棋譜中學習,還可以從自己和自己的對弈棋譜中學習。人類專業選手的對局、AlphaGo自己與自己的對局,這些都是AlphaGo賴以學習提高的大數據。
基于大數據的深度學習到底如何在現實生活中發揮作用呢?一個非常好的例子是,計算機可以通過預先學習成千上萬張人臉圖片,掌握認識和分辨人臉的基本規律。然后,計算機可以記住全國所有通緝犯的長相。沒有一個單獨的人類警察可以做到這一點。這樣一來,只要通緝犯在公共場合一露面,計算機就可以通過監控攝像頭采集的圖像將通緝犯辨認出來。大數據和深度學習一起,可以完成以前也許需要數萬名人類警察才能完成的任務。
任何擁有大數據的領域,我們都可以找到深度學習一展身手的空間,都可以做出高質量的人工智能應用。任何有大數據的領域,都有創業的機會。
金融行業有大量客戶的交易數據,基于這些數據的深度學習模型可以讓金融行業更好地對客戶進行風險防控,或針對特定客戶進行精準營銷;電子商務企業有大量商家的產品數據和客戶的交易數據,基于這些數據的人工智能系統可以讓商家更好地預測每月甚至每天的銷售情況,并提前做好進貨準備;城市交通管理部門擁有大量交通監控數據,在這些數據的基礎上開發的智能交通流量預測、智能交通疏導等人工智能應用正在大城市中發揮作用;大型企業的售后服務環節擁有大規模的客服語音和文字數據,這些數據足以將計算機訓練成為滿足初級客服需要的自動客服員;教育機構擁有海量的課程設計、課程教學數據,針對這些數據訓練出來的人工智能模型可以更好地幫助老師發現教學中的不足……
需要注意的是,大數據和人工智能的結合也可能給信息流通和社會公平帶來威脅。在2016年的美國大選中,有一家名為Cambridge Analytica的公司就基于人工智能技術,用一整套分析和引導輿論的軟件系統來操縱選情。這個系統可以自動收集和分析互聯網上的選情信息,評估人們對兩位總統候選人的滿意度,并通過給定向用戶投放信息,自動發送虛假新聞等技術手段,宣傳自己所支持的候選人,還可以通過A/B組對照試驗,準確判斷每個州的選民特征,為自己所支持的競選團隊提供第一手的數據資料和決策依據。美國伊隆大學的助理教授兼數據科學家喬納森·奧爾布賴特不無憂慮地說:“這簡直就是臺宣傳機器。它一個個地拉攏公眾,使他們擁護某個立場。如此程度的社會工程,我還是頭一次見……”
此外,在大數據發揮作用的同時,人工智能研發者也一定不要忘了,大數據的應用必然帶來個人隱私保護方面的挑戰。為了給你推送精準的廣告信息,就要收集你的購買習慣、個人喜好等數據,這些數據中往往包含了許多個人隱私;為了獲得以人類基因為基礎的醫療大數據來改進疾病的診療,就要通過某種渠道收集盡可能多的人類基因樣本,而這些數據一旦保管不善,就可能為提供基因樣本的個人帶來巨大風險;為了建立智能城市,就要監控和收集每個人、每輛車的出行信息,而這些信息一旦被壞人掌握,往往就會成為案犯最好的情報來源……
有效、合法、合理地收集、利用、保護大數據,是人工智能時代的基本要求,需要政府、企業、個人三方共同協作,既保證大規模信息的正常流動、存儲和處理,又避免個人隱私被濫用或被泄露。