如果把人工智能比作一輛轟鳴的戰車,那么算法和模型則扮演著“發動機”的角色。“發動機”的質量在一定程度上直接影響甚至決定了戰車最終的效力。從學術角度來看,算法和模型一直以來都是人工智能研究的重點,涌現的大量成果直接推動了人工智能技術的迭代發展。從產業角度來看,算法和模型是人工智能技術在生產實踐中真正落地、促進產業發展的重要保障。
人工智能算法和模型發展現狀
人工智能算法和模型經過長期積累已覆蓋多個研究子領域。以機器學習為例,較為核心的算法包括最小二乘法、K近鄰算法、K均值算法、PCA分析法、梯度下降法、進化算法等,較為核心的模型包括線性回歸、邏輯回歸、決策樹、聚類、支持向量機、前饋神經網絡等。由于具備較完備的理論基礎和長期的推廣應用,這些算法和模型已經成為相關問題的標準解決方案。當前,針對這些核心算法和模型的進一步研究與改進也在不斷向前推進。
人工智能在近些年的巨大突破,催生了一批“年輕的”算法和模型。以深度學習為例,新算法使得挖掘數據高層抽象特征成為可能,例如反向傳播算法等,而新模型則為解決復雜問題提供了可行路徑,例如深度神經網絡、玻爾茲曼機等。這些算法和模型極大地簡化了傳統機器學習處理信息的方式,成為計算機視覺、自然語言處理等領域的主流解決方案。可以預見,人工智能領域的新算法和新模型將會源源不斷地涌現,并持續改變和優化傳統領域的工作模式。
主流算法和模型庫對常見算法和模型進行了高效實現,成為人工智能生態中的重要一環。例如,Tensorflow框架集成了適配多種語言的機器學習和深度學習算法和模型,并且適用于強化學習和遷移學習等新領域,同時提供了模型管理組件,支持模型的持久化存儲、導入和導出。Caffe框架集成了卷積神經網絡相關算法和模型,擁有大量訓練好的經典模型以及近幾年提出的新模型(VGG、Inception、ResNet等),被廣泛應用于工業界和學術界。CNTK框架支持多種神經網絡模型,并集成了AdaGrad、RmsProp等多種優化算法,基于微軟在人工智能領域的研究成果,提供了細粒度的功能組件和可擴展的模型定制化能力。Keras框架專注于深度學習,不僅提供了可靈活搭配的模型模塊,還集成了Adam、批標準化、PReLU等多種優化算法,以高度的模塊化向用戶提供簡易的模型實現方式。MXNet集成了大量神經網絡模型,支持多語言封裝,并支持在移動設備上運行,目前已成為AWS的推薦深度學習框架。我國在算法和模型庫的建設上也嶄露頭角。百度推出的PaddlePaddle框架提供了針對計算機視覺和自然語言處理的模型庫,集成了MobileNet、SE-ResNeXt等最新模型。騰訊、阿里等企業也在人工智能算法和模型領域貢獻了大量成果。
算法和模型庫的重要性分析
夯實人工智能基礎,確保掌握關鍵核心技術。人工智能的原理與思想需要通過算法和模型予以展現,人工智能研究的發展必定要基于已有的算法和模型,也一定會帶來算法和模型的升級更新。一個完備的算法和模型庫既是對當前算法和模型研究的總結歸納,又是開拓下一個研究階段的起點,有益于夯實我國人工智能研究的基礎,是掌握人工智能關鍵核心技術不可或缺的一步。
推動人工智能各領域研究,催化人工智能技術全面健康發展。人工智能是一個復雜交叉的學科,覆蓋多個子領域,任何一個領域的研究短板都可能制約其他領域的進一步發展。算法和模型是這些領域間為數不多的交叉點之一,是各領域開展研究的共同必備要素。一個完備的算法和模型庫為各領域研究提供基礎支撐,在一定程度上消弭了領域間的隔閡,取長補短實現了領域知識的交叉共享,有利于推動人工智能技術的全面健康發展。
激發傳統學科研究取得突破,走出多學科交叉融合、共同發展的新路徑。人工智能提出了一套異于傳統學科的思維模式,利用機器學習、深度學習等技術解決傳統學科中的復雜性問題成為可能。向傳統學科引入人工智能方法,不斷將算法和模型應用到研究工作中,同時吸收多學科知識來豐富和完善人工智能算法和模型,相互反饋、互相融合、共同發展,激發傳統學科研究走出新路子,取得新突破。
助力人工智能技術的產業應用,促進產業發展升級。我國的產業發展具有海量數據和市場規模持續增長的特征,人工智能技術也因此擁有巨大的應用潛力和優勢。結合產業特點建設算法和模型庫,既保證了人工智能技術的有的放矢,也大幅降低了傳統產業融合人工智能技術的門檻,是推動人工智能在產業界持續廣泛深入應用的重要保障。
算法和模型庫建設的初步考慮
人工智能算法和模型庫的建設是一個以知識為核心、研發與管控相結合的系統工程,可以從以下幾點探索開展。
統一規范,建立標準。算法和模型庫是涉及多學科、多領域的知識體系,不同體系的算法和模型在描述、結構、實現等方面均存在差異,在一定程度上阻礙了算法和模型的整合。通過建立適當的標準體系,統一算法和模型的描述,合理約束算法和模型的實現,兼顧一致性和靈活性,從而能夠在包容開放的基礎上進一步為擴充和升級做出指導。
開展評測,去偽存真。人工智能的研究進展迅速,新算法新模型不斷涌現,以開放模式建設算法和模型庫,必然會面對如何評估算法和模型優劣的問題。通過研究制定面向算法和模型的評估方法,建立評估機制,跟蹤評測算法和模型質量,做到去粗取精、去偽存真,從而保證算法和模型的有效性、可靠性和安全性。
推廣應用,形成閉環。建設算法和模型庫的最終目的是要服務于實際,在實踐中對算法和模型進行充分的檢驗與驗證是推動算法和模型進一步發展的重要途徑。積極推進算法和模型庫在各領域各行業的應用,將實際效果反饋給算法和模型研究者,形成理論與實踐的反饋閉環,從而在深化人工智能技術應用的同時,不斷促進算法和模型的優化和創新。
人工智能是新一輪科技革命和產業革命的重要驅動力量,算法和模型是人工智能技術的知識輸出。建設完備的算法和模型庫是掌握關鍵核心技術、突破科技和產業發展瓶頸的重要一步,具有深遠意義和巨大價值。探索建立一個開放靈活、標準可控、安全優質的算法和模型庫,是進一步深入發展人工智能技術的必要環節,也必然會在科技和產業發展的各個方面大顯身手。