近幾年來,得益于大數據的積累、計算能力的提升,深度學習從學術到工程領域均取得了非常顯著的發展與突破,尤其是諸如圖像識別、語音識別等實際場景應用。但是,依賴于海量的訓練數據、靈活的模型、足夠的運算能力以及足以對抗維度災難的先驗經驗,從很大程度上來講妨礙了深度學習技術更為廣泛的運用。為此,在全球范圍內,眾多人工智能領域的學術大師及業界專家上下求索,也由此催生了小數據學習(Learning from limited information),通過更少的數據以及更確定的方法讓 AI 學習更加高效。
然而什么是小數據?機器怎樣從小數據中學習?小數據學習將從哪些方面改變人工智能的研究與應用?在即將于 7 月 22 - 23 日舉行的中國人工智能大會(CCAI 2017)上,特別邀請到日本理化學研究所先進智能研究中心主任 Masashi Sugiyama,現場為所有參會者一解小數據學習之惑,并分享其團隊在監督弱化分類方面的最新研究進展。在會前,CSDN 記者特別采訪了 Masashi Sugiyama 教授,接下來,讓我們一起先睹為快。
Masashi Sugiyama 是日本理化學研究所先進智能項目組主任( Director of RIKEN Advanced Intelligence Project)。RIKEN 成立于 1917 年,是日本最大的綜合研究機構,其中,由 Masashi Sugiyama 領導的先進智能項目組成立于 2016 年,主要著眼于研發下一代 AI 技術,如小數據學習、因果推理(Causal inference)、不確定性學習(Learning with uncertainty)以及假設檢驗等,同時,還有加速醫學、材料科學、制造業的科研進程,解決基礎設施管理、社會抗災能力、老年醫療保健等社會問題。而 Masashi Sugiyama 教授本人的研究領域則包括機器學習的理論和算法(如協變量適應、密度比預估和強化學習等),及其在實際問題中的應用。
CSDN:什么是小數據學習?為什么要使用小數據學習?如何實現?
Masashi Sugiyama:雖然現在大數據學習仍是主流,但在很多應用領域,收集到足夠機器用來學習的龐大的數據是非常昂貴的。在這種情況下,使用小數據進行學習是一個理想的解決方式。但也有它的弊端,因為當進行小數據學習時,我們需要目標領域中強大的先驗知識作為支撐,過多先驗知識的介入意味著犧牲掉機器學習的靈活性。所以使用有限信息進行學習的精髓在于,使用領域知識之外的相對便宜的數據進行學習。
CSDN:若小數據學習能夠成功,將對哪些 AI 領域造成改變,進而對哪些行業產生影響?
Masashi Sugiyama:利用小數據進行學習是大數據學習的母集,所以說它一方面可以解決大數據學習不能解決的問題,另一方面在大數據學習已經得以應用的領域也能有所發揮,因為使用小數據學習能夠在避免使用昂貴數據的同時達到更優的效果。
CSDN:您和您的團隊在小數據學習方面已經取得了哪些進展?
Masashi Sugiyama:多樣性對于小數據學習至關重要,因為對于不同的應用場景,收集數據的局限性是不同的。我們正在研發一種通用的算法使其解決機器學習過程中的不同問題,例如將很多不同種類的未標注數據集進行分類、將標注與未標注數據進行分類、半監督學習中的分類問題、充分標注的數據的分類問題等。
CSDN:日本的科研機構更傾向于哪些 AI 技術及應用的研究?哪些 AI 應用在日本已經落地?
Masashi Sugiyama:日本的機器學習研究人員更多地關注基礎研究,當然,同時也會有一些人在科學及工程領域從事應用科學相關的研究工作。在基礎研究與應用之間存在很大的鴻溝,如何搭建鴻溝上的橋梁至關重要。所幸,這些建橋的工作在一些領域已經逐漸展開,例如對癌癥及老年癡呆的研究、再生醫學、制造業、基礎設施管理以及抗災能力提升的研究等方面。
CSDN:您認為當前 AI 技術發展的瓶頸在哪兒?并請展望 AI 未來的發展方向。
Masashi Sugiyama:私密性、安全性、以及倫理問題會成為人工智能系統發展的瓶頸。在 AI 技術發展之外,如何分析及管理 AI 可能帶來的社會問題也是需要重視的方面。
CSDN:在本屆 CCAI 現場,您將帶來的演講主要關于哪些方面?希望觀眾從中收獲怎樣的啟發?
Masashi Sugiyama:我的演講題目是《弱監督學習的最新研究進展》,在演講中我將介紹我們對于弱監督學習下的分類問題的研究成果,包括將兩種類別的無標簽數據進行分類、將有標簽與無標簽數據進行分類、一個對于半監督分類問題的通用方法、以及對于有標簽數據的分類。最后,我將簡單介紹日本理化學研究所先進智能項目組(RIKEN AIP)。
關于 CCAI中國人工智能大會(CCAI),由中國人工智能學會發起,目前已成功舉辦兩屆,是中國國內級別最高、規模最大的人工智能大會。秉承前兩屆大會宗旨,由中國人工智能學會、阿里巴巴集團 & 螞蟻金服主辦,CSDN、中國科學院自動化研究所承辦的第三屆中國人工智能大會(CCAI 2017)將于 7 月 22-23 日在杭州召開。
作為中國國內高規格、規模空前的人工智能大會,本次大會由中國科學院院士、中國人工智能學會副理事長譚鐵牛,阿里巴巴技術委員會主席王堅,香港科技大學計算機系主任、AAAI Fellow 楊強,螞蟻金服副總裁、首席數據科學家漆遠,南京大學教授、AAAI Fellow 周志華共同甄選出在人工智能領域本年度海內外最值得關注的學術與研發進展,匯聚了超過 40 位頂級人工智能專家,帶來 9 場權威主題報告,以及“語言智能與應用論壇”、“智能金融論壇”、“人工智能科學與藝術論壇”、“人工智能青年論壇”4 大專題論壇,屆時將有超過 2000 位人工智能專業人士參與。
目前,大會 8 折優惠門票正在火熱發售中,掃描下方圖片中的二維碼或直接點擊鏈接火速搶票。