傳統芯片中,采用的是馮·諾伊曼架構,計算模塊和存儲單元是分開的,"內存墻"問題很嚴重。而AI依賴的算法是一個龐大和復雜的網絡,有很多參數要存儲,也需要完成大量的計算,需要巨大存儲容量,高帶寬、低延時的訪存能力。很多AI初創芯片公司,實際上都在努力解決這個問題。
而我們的思考是,不能采取通常的先有計算指令然后提供數據的方式,應該從存儲子系統的優化入手,讓數據在存儲之間的搬移過程之中完成計算。
這也可以叫做"基于memory的計算",而不是"基于計算的memory"。
當前芯片領域對于AI算法的關注還較多,針對AI的結構改進嘗試還比較少。之后,memory與computing結合的嘗試,我相信會是一個好的方向。
安防芯片同質化問題嚴重
對于AI安防芯片來說,"芯片+算法"的整合是最重要的。而對于具體一款芯片,最主要的指標應該是價格和穩定性。芯片是"硬"的,算法是"軟"的,如何能將兩者更好的結合起來,這就需要加強芯片對底層運算加速算法的適應性。現有芯片的問題,從技術角度來說,對前端的AI芯片算力的要求,對存儲問題的解決,都很重要,都需要靠算法和芯片架構一起來改善,比如說現在的算法就還比較耗帶寬。再具體應用上,AI安防芯片在安防攝像頭中作為協處理器,目前已經被主控芯片集成了,所以單純提供AI加速器并不占優勢。而開發編解碼能力、加密及AI能力三合一的芯片,為攝像頭提供安全加密則是重點所在。這也是安防相對于其他芯片廠商不同的一點。從行業角度來說,現有AI芯片在安防行業應用落地上的主要問題,其實是同質化。很多AI芯片廠商產出的芯片并沒有太大差別,一方面很多芯片達不到現有安防行業對前端AI芯片的要求,一方面又容易陷入芯片同質化競爭。現在的安防芯片格局下,其實已經存在壟斷的生態,有大的行業玩家存在,那么做AI安防芯片如何找到自己的價值點,并做到差異化還是最難的。
芯片成本問題有待突破
在智能安防監控領域,芯片是硬件設備中成本占比高的零組件之一,也是安防視頻監控設備的核心部件,通過前端攝像機內置人工智能芯片,可實時分析視頻內容,檢測對象,識別人、車屬性信息,并通過網絡傳遞到后端人工智能的中心數據庫進行存儲。
目前,安防視頻設備中所需要的處理器芯片主要包括網絡攝像機中的SoC芯片、后端DVR/NVR中的SoC芯片以及深度學習算法、加速器芯片以及前端模擬攝像機中的ISP芯片四種類型。目前,高性能的深度學習算法加速器芯片仍由國外芯片廠商提供,但其余三類處理器芯片已實現了較大程度的國產化替代。安防領域最主流的深度學習芯片方案是GPU,但GPU存在成本、效率、功耗等瓶頸。
當前在安防智能化進程中,算法層面已經接近成熟,而在芯片成本上還存在一些問題。為了實現智能化的功能(即運行深度學習算法),安防監控系統的前端和后端設備中需要加入英偉達或是英特爾等國際大廠所設計的GPU、FPGA或者ASIC加速芯片,與原有的承擔圖像處理和編解碼功能的主處理器芯片一起構成雙芯片方案,而采用這些芯片一般要為安防監控設備新增高額成本(2017年僅前端攝像機中采用的AI加速器芯片的成本就高達上百美元),因此導致智能化設備的成本普遍偏高,在很大程度上影響了智能化的大面積應用。
AI芯片的易用性有待提升
現在的安防市場上,已經出現了很多前端的AI加速器,但實際它們在應用上,還存在一些問題。
第一是價格太高。第二是可編程性不足。原先的通用芯片CPU很容易能實現編程,但AI加速模塊中并沒有指令集,無法編程,需要手工去調整。
在安防領域也是一樣,廠商普遍反映的,不是AI芯片的性能,而是無論AI初創企業,還是傳統大廠設計的加速器都很復雜,AI加速器很難被用起來。
一般來說,通用芯片難以負荷對計算的高要求,AI專用芯片則在可編程性、靈活性上有所欠缺。目前應用較多的集成度高的Soc,將不同計算架構芯片集成在一起,需要多套編程程序,運行就容易帶來問題。這也是安防芯片廠商們,尤其是在安防前端應用上面臨的難題。
而業內目前看好的一種方式,就是將不同的芯片架構結合在一起,這就是"異構計算"。
異構計算的長處在于,能實現比較好的適應性和靈活性,在通用性和專用性上達成一個折衷。既能高效的處理數據,又能相對保證算法的及時更新和迭代。這也是我們在探索的一個方向。
現在在安防、自動駕駛等這些邊緣端的市場,對芯片的綜合要求非常高。芯片需要處理的數據量很大,同時對于性能、性價比、性能功耗比要求也很高。