據英國科學新聞網站11月7日報道,在實驗中,研究小組用4分鐘和6.6分鐘分別訓練了兩個深度神經網絡AlexNet和ResNet-50。此前,AlexNet和ResNet-50的最快訓練時間分別為11分鐘和15分鐘。
報道稱,Alexnet和Resnet-50是建立在ImageNet(一個用于視覺對象識別軟件研究的大型可視化數據庫)基礎上的深度神經網絡。一旦接受訓練,系統就能夠識別并標記給定照片中的物體。這一結果顯著快于此前的記錄,而且超過了所有其他現有系統。
報道稱,機器學習是一套令計算機能夠從數據中學習而無需由人類編程的數學方法。生成的算法可以用于各種應用于人工智能的數據和視覺識別任務。
香港浸會大學團隊由計算機系教授禇曉文和博士生施少懷組成。禇曉文說:“我們提出了一種新的優化訓練方法,在不犧牲精確度的情況下大大提升最佳輸出。在人工智能訓練中,研究人員試圖更快地訓練自己的網絡,但這可能會導致精確度下降。因此,在保持精確度的同時高速訓練機器學習模型對科學家來說是一個至關重要的目標。”
禇曉文說,訓練人工智能機器所需的時間受計算時間和通信時間的影響。研究團隊在這兩方面都取得了突破,從而創造了這一破紀錄的成就。
他說,考慮到數據塊大小和傳輸模式的影響,團隊以“張量融合”方式,將大量小型數據塊集合成較大組件,成功提升訓練人工智能的效率。
報道稱,這種新技術可以用于大規模圖像分類,也可以用于其他人工智能應用,包括機器翻譯、自然語言處理、醫學影像分析以及在線多人游戲。