然而,“當前國內缺失人工智能芯片的相關評測標準。”在中國科協主辦的第二屆“風向標——中國創新創業先鋒論壇”上,人工智能芯片企業鯤雲科技創始人牛昕宇指出,這造成大家不知道自己研發的芯片在國際上處於什麼樣的水平。而獲知一款芯片性能如何,最直接的方法是進行評測。“這就需要一套公認的評測標準”。
人工智能芯片評測到底多重要、多緊迫?怎樣建立一套公認的評測標準?對此,科技日報記者採訪了相關業內專家。
全球范圍內尚無公認評測指標
牛昕宇向科技日報記者表示,國際上,缺乏統一的芯片評測標準也是一個比較大的問題,包括英偉達、英特爾等公司的芯片性能也主要依靠芯片廠商自家發布。“全球多個機構都在嘗試給出評測方案,然而現狀就是無公認基準測試方法和指標。”中國人工智能產業發展聯盟評估認証工作組組長曹峰說。
“從政府、用戶、系統集成廠商到算法開發者,全部無法準確評價所使用芯片的技術水平以及在國內外所處的地位,無法選取最適用於自己需求的底層芯片,芯片企業無法清晰確認自己的技術優勢及目標市場。”牛昕宇對此感慨頗深。
人工智能芯片與傳統計算芯片不同,它要求高效實現深度學習算法對海量數據高吞吐量等高並行化任務的處理。曹峰介紹,當前人工智能芯片主要分兩大體系,馮諾依曼體系和非馮諾依曼體系。
馮諾依曼體系以五大架構芯片為代表,分別是CPU、GPU、DSP、FPGA和ASIC,在深度學習訓練環節和終端推斷方面發揮重大作用。非馮諾依曼體系,以IBM TrueNorth芯片為代表,採用人腦神經元的結構來提升計算能力,但目前還處於實驗室階段。
中國信息通信研究院DNN Benchmark項目負責人張蔚敏指出,人工智能在不同算法、不同場景下,對芯片提出了不同的要求。硬件架構、延遲、帶寬、能耗、神經網絡模型、參數都是用戶方選擇人工智能芯片的重要參考。
人工智能芯片為何要評測?“當前,AI芯片的功能日益復雜化、多樣化,一方面,芯片廠商紛紛給出不同的衡量標準,聲稱其產品在計算性能、單位能耗算力等方面處於行業領先水平﹔另一方面,需求方卻關心如何能從廠商給出的信息中判斷出芯片是否能實際滿足其真實場景的計算需求。”曹峰強調,“針對這一現狀,一個與真實場景緊密相連的、同時跨產品可比的測試評估方案的出現,迫在眉睫。”
“統一的芯片標準會降低芯片廠商、人工智能算法廠商的溝通成本,建立一個有序的競爭環境。”牛昕宇表示,國外現在有一些人工智能算法競賽,在一定程度上起到了對於人工智能算法的評測作用。我國人工智能企業也在嘗試給出評測方案,比如阿裡的AI matrix,寒武紀的Benchip,以及百度的Deepbench等。
公司自行摸索增加開發成本
事實上,我國龐大的人工智能應用市場對底層芯片需求巨大,但本土人工智能芯片產業尚處於起步階段。“有一套衡量人工智能芯片性能的公認指標,我們才能知道自己前方的目標線在哪裡。”牛昕宇呼吁道。
當前,“應用領域的差異性和實現選擇的多樣性導致很多測評難題。”曹峰舉例,如何讓評測指標在不同級別的設備中橫向可比?面對雲端和終端的應用差異化現狀,如何構建相應的基準測試?如何為不同測試項目分配權重,以獲得一個相對公正客觀、有代表性的評分?
這種現狀讓人工智能整個行業倍感焦慮。“對人工智能行業的從業者來說,缺乏標準意味著缺乏統一的行業交流接口。”牛昕宇在接觸大量人工智能應用研發領域一線情況后發現,在制定人工智能整體方案時,如果無法對於底層芯片所能夠提供的性能和算力有一個準確的了解,難以在項目規劃初期就確定整體方案,需要在項目開發過程中不斷試錯來測試方案。“相當於每家公司要承擔部分芯片評測任務,大大提高了開發門檻。”
缺乏評測標準帶來諸多問題,人工智能芯片公司對此有更深刻的體會,牛昕宇直陳痛點,“無法通過公開統一的渠道來確定自家芯片技術在國際的地位,需要每家公司自行摸索,增加了芯片公司的成本。”
《報告》指出,長期以來,中國在CPU、GPU、DSP等處理器設計上一直處於追趕地位。然而,人工智能的興起,無疑為中國在處理器領域的發展提供絕佳機遇。傳統的計算架構無法支撐深度學習的大規模並行計算需求,人工智能芯片是人工智能時代的技術核心之一,決定了平臺的基礎架構和發展生態。
建議政府牽頭制定評測標準
當前國內外都將人工智能視為產業突圍的重大機遇。人工智能芯片作為底層技術,其應用領域也遍布金融、股票交易、商品推薦、安防以及無人駕駛等眾多領域。如何為蓬勃發展的人工智能芯片建立一套評測標準?
“確實需要國家牽頭來認証標準。”牛昕宇建議道,可以組織業內用戶企業形成需求標準,由落地應用牽引芯片評測標準。
當前,在國家發改委、科技部、工信部、網信辦指導下,由中國信息通信研究院等單位發起的中國人工智能產業發展聯盟,愈加重視芯片評估認証工作。目前已經聯合阿裡巴巴集團、百度、寒武紀科技等多家企業,推出了AIIA DNN benchmark——人工智能端側芯片基準測試評估方案。
張蔚敏表示,該方案為芯片企業提供第三方評測結果,同時為應用企業提供選型參考,幫助產品找到合適其應用場景的芯片。目標為客觀反映當前以提升深度學習處理能力的AI加速器現狀,所有指標旨在提供客觀比對維度。以“版本迭代、不斷豐富、不斷完善”的工作方式,為更多評測應用場景、評測指標等提供評估方案。
“這是解決缺失人工智能芯片評測標準問題的一個起步。”牛昕宇進一步建議,今后希望有第三方機構能夠公開評測標準和流程,由芯片公司、算法公司、系統集成廠商、最終用戶共同商議通過﹔每年定期發布國內芯片公司以及國際芯片巨頭的芯片評測結果﹔政府對於人工智能芯片行業的支持政策可以參考評測結果。