目前,人工智能發展所取得的大部分成就都和大數據密切相關。通過數據采集、處理、分析,從各行各業的海量數據中,獲得有價值的洞察,為更高級的算法提供素材。騰訊CEO馬化騰在清華大學洞見論壇上表示,“有AI的地方都必須涉及大數據,這毫無疑問是未來的方向”。李開復也曾在演講中談到“人工智能即將成為遠大于移動互聯網的產業,而大數據一體化將是通往這個未來的必要條件。”“人工智能離不開深度學習,通過大量數據的積累探索,在任何狹窄的領域,如圍棋博弈、商業精準營銷、無人駕駛等等,人類終究會被機器所超越。而AI技術要實現這一跨越式的發展,把人從更多的勞力勞動中徹底解放出來,除了計算能力和深度學習算法的演進,大數據更是其中的關鍵。”
與此同時,人工智能的出現也提高了可利用數據的廣度。大數據分為結構化數據與非結構化數據。結構化數據記錄了生產、業務、交易和客戶信息等;但大部分的數據,約有85%以上都是非結構化數據。在互聯網時代,隨著社交媒體的興起,非機構化數據的增長更為驚人。然而,大數據爆炸的時代不允許個人在研究的過程中讀懂每一篇論文,了解所有的觀點。因此這就對高級算法提出了要求,如何快速尋找真正適合有效的信息。人工智能輔助大數據利用一個典型的例子就是“預測未來”。鄧白氏高級副總裁兼首席數據科學家安東尼·斯克里費加諾曾分享過一個處理欺詐的案例。專業團隊可以根據傳統的欺詐類型設計成千上萬不同的算法,用于專業人員處理不同類型的欺詐行為。然而,現實中還存在一個“觀察者效應”,也就是說如果這個人知道有別人在觀察他,他就會不自主地改變自身的行為,直接導致了被觀察對象的行為與其真實表現的差異性,但這一點沒有辦法通過傳統的建模方法進行行為檢測。所以這就需要更為高級的人工智能手段和更加先進的調查方法來進行解決,去建模未來可能發生欺詐的行為。
今年9月,“人工智能與大數據論壇”的召開,更是凸顯了人工智能與大數據在發展過程中的密切關系。來自中外多個國家和地區的政府官員、商界領袖與專家學者等共500余人出席了論壇,探討大數據與人工智能時代背景下的發展機遇,開展合作交流,推動產業高質量發展。