圖為第四范式創始人、首席執行官戴文淵演講
人工智能是被各行各業寄予厚望的未來技術,談及人們最關心的AI在企業的落地問題,戴文淵指出,目前公眾關注得最多的AI集中在感知層,例如人臉識別、語音識別、無人車等。但是,走在AI前端、享受著AI紅利的企業,如BAT,沒有哪家是靠人臉識別在經營的。戴文淵指出,企業真正需要的AI應該是決策層的AI,。
戴文淵把企業內部的角色分成三種,高層做的是戰略制定,中層的工作是策略制定,基層是策略執行。互聯網和移動互聯網改變的是基層的工作,也就是策略執行,越來越多交給機器去做了。今天,人工智能在企業內部改變的是,策略制定正在交給機器來做。決策AI化才能實實在在提升企業經營效率,無論是百度的鳳巢系統,今日頭條的推薦系統,支持其享受AI紅利的技術不是人臉識別、語音識別和無人車,而是決策的智能化。
人工智能技術已經實實在在地為頭部企業創造了巨大的價值,但我們在將這項技術推廣到更多領域的經營生產層面,也需要面對各種困難和挑戰。戴文淵表示,企業AI落地要直面認知、數據、算法三道門檻:
構建機器學習圈,破解AI落地的認知門檻
首先,AI落地的第一道門檻是認知門檻。 談到AI,我們首先要正視一個問題:深度學習不是普通人能理解的交互方式,業務人員所關心的業務也不是科學家擅長的。怎樣將業務人員關注的風險管控業務和科技人員關注的深度神經網絡技術結合到一起呢,戴文淵認為,需要把公眾可認知的交互方式和科技結合起來,形成一個門檻比較低的人工智能構建過程,使算法與業務進行對接。
第四范式把這樣的AI構建的過程標準化了,借鑒教育學的“庫伯學習圈理論”,總結成為四步標準動作,分別是“行動”、“反饋”、“反思”、“理論”。通過構建起閉環,形成機器學習的學習圈。AI應用應該像學習圈一樣,將業務閉環與AI產生的過程融合到一起。以電子銀行轉賬反欺詐為例,第四范式結合銀行、支付行業反欺詐場景,從反欺詐專家幾十條規則,通過機器學習提升到了八千萬條,準確率提升2.5倍以上。隨著自學習系統持續優化模型效果,這個數字還將不斷提高。
構建面向AI的大數據系統,破解AI落地的數據門檻
其次,在闡述認知門檻時提到機器的反思、總結,這其實就是深度學習的過程,但如果缺乏有效數據,效果就會受影響,這就涉及到第二個門檻——數據門檻。
AI是基于大數據的,但很多企業有數據卻不能產生AI,這是因為有大數據不等于就有AI。大數據分為兩種,BI的大數據和AI的大數據,過去的大數據多數是為BI設計的,BI大數據主要是幫助人去總結一些經驗,例如數據庫,強調查詢和統計。AI大數據是給機器看的數據,主要不是考慮查詢和統計,需要的是完整和實效性高。因此兩個大數據系統的設計理念天然會不同。我們經常會看到企業由于過去建設了面向BI的大數據系統,又將AI建設在這個大數據系統之上,非但沒有幫到AI的落地,反倒成為AI落地的障礙。面向AI的大數據系統,要能存取PB級甚至更大量的日志,一定要支持實時存儲,可以不需要實時查詢和統計,但又需要極其高效的批量存取能力。正是因為傳統的BI大數據系統限制了AI的發展,第四范式自主研發一套面向AI的大數據系統。其次,基于面向AI的大數據系統,我們需要建立起學習圈中的行為數據和反饋數據的收集體系:收集行為數據,收集反饋數據,讓機器自學習。
自主研發世界領先的AutoML技術,破解AI落地的算法門檻
最后,關于算法的門檻,戴文淵表示, 未來的AI,不應該依賴科學家來調參,而是讓算法做到不需要科學家,讓機器去學習。這也是破解AI落地算法門檻的關鍵。
讓機器自動建模、自動調參,這在機器學習領域稱為AutoML。要做到這一點,就要把機器學習或深度學習過程中高度專業化的參數設計環節自動化,而這過去往往都是頂級數據科學家的看家本領。我們AI這個領域,過去過多強調了科學家的調參能力,不利于AI的普及。第四范式從3年前開始發展不需要調參的AutoML,目的就是真正讓企業也掌握自有AI能力。為此,“第四范式先知”平臺將AutoML技術封裝,能夠讓用戶在沒有機器學習研究背景的情況下開發機器學習模型、或是縮短數據科學家用來創建模型的時間和精力投入。
AutoML是AI賦能的重要方式之一,第四范式作為世界上最早開始研究AutoML的團隊,也是世界領先的團隊,過去的三年取得了多個階段性突破。在醫療領域,第四范式和瑞金醫院聯合發布了糖尿病前期診斷的模型,運用AutoML技術,結合醫院的數據總結出了50萬條診斷規則,比醫生普遍診斷水平提升200-300%。第四范式某一客戶,利用AutoML算法,在去年的一個世界反欺詐比賽中,戰勝了諸多專業反欺詐公司,獲得了亞軍。今年,第四范式也在與諸多國際巨頭的競爭中,取得了國際最具影響力的神經網絡會議NIPS中的AutoML大賽的承辦權,成為國際AutoML的領導者。
一個好的AI算法可能需要耗費工程師們1年的時間,而解決AI落地的問題可能需要花費一個團隊10年時間——第四范式就是這樣一個團隊。秉持“AIForEveryone”的企業愿景,第四范式一直致力于降低AI應用門檻,希望AI能普惠大眾、賦能百業。在長期人工智能落地和企業服務實踐過程中,第四范式不斷在解決著阻擋企業AI落地的各種障礙。2015年,第四范式推出“先知“1.0,開始邁向技術賦能企業AI落地之路。三年多的時間,“第四范式先知”積累了大量人工智能落地和企業服務的實踐經驗和方法,包括數以千計的團隊掉進的陷進。從幫助企業從低門檻構建模型開始,到如今發展到為企業提供端到端AI覆蓋能力和量產屬性的AI核心系統,“第四范式先知”不僅解決了企業AI落地從0到1的各種問題,還賦予企業從1到N的強大能力。第四范式一直堅持探索AI落地解決之道,已經為銀行、保險、證券、醫療、政務等多個領域上千余家企業提供人工智能產品、服務和解決方案,特別在金融領域,第四范式服務的客戶總資產已經占到中國金融總資產的半數以上。“AIforEveryone”要求第四范式走的不是一條顛覆式創新的路,而是要幫助各行各業的合作伙伴、成為各自領域最好的AI公司,與大家共建AI時代。