而根據百度在發布會上公開的信息,昆侖芯片最高算力可達到260 TOPS,已經是 NVIDIA 的最新算卡 V100 的兩倍以上,但是這個算力指標靠不靠譜?對百度云計算的規劃是否真能發揮作用?其實 DT 君抱以存疑的態度。
首先,算力的計算有很多層次,就以 TOPS 這種每秒整數操作次數,還可分為不同精度,以及稀疏計算模式的啟用與否,以寒武紀為例,其在 5 月發布的專業算卡架構在性能指標方面就可分為多種模式,且該架構不用 TOPS 作為性能指標,而是采用基于浮點計算的 TFLOPS,性能從倍精度、單精度到半精度,算力跨度從 16 TFLOPS 到 166 TFLOPS,昆侖僅提供單一數據,且只有公開最大整數計算能力,其實背后隱含著該架構可能在均衡性有所欠缺,只能少數狀況下擁有較高性能表現的可能。
另外,若以昆侖芯片的 TOPS 參數和 NVIDIA 的 V100 比較,表面數字上的確贏了不少,但是昆侖芯片并沒有公布芯片的規模,只有宣布其整合了數萬個小核心,那么從這些簡短信息來判讀,昆侖芯片采用的是一般乘加法器的大量疊加來增加其算力,但 NVIDIA 的 CUDA 單元或寒武紀等計算架構都具備可編程的彈性應用能力,NVIDIA 更是擁有業界最成熟的 CUDA 工具套件,可以讓硬件架構更好的發揮,而昆侖芯片在開發環境上能否讓昆侖芯片百分之百地發揮亦是令人存疑。
近幾年 AI 議題火熱,似乎只要各種行業沾上了 AI,無窮的“錢景”就會隨之而來。一向反應最快的中國市場,更帶領了一波芯片與產業服務的 AI 創新。
在產業、官方以及學術界的通力合作之下,中國 AI 技術的發展似乎已經領銜全球,我們可以看到各種先進的方案、算法,以及應用不斷冒出頭,與之搭配的各種芯片方案也紛紛被創造出來,不論從視覺識別,自然語言、終端、邊緣、云計算的 AI 方案也一應俱全,但其中的一個大問題是,各家廠商并沒有形成共通生態,而是走向各自為政。
雖然,從理論上講,光是現有產業的 AI 化就已經具備可以支撐整個產業的需求規模,即便芯片生態分散,仍應能找到自己的生存空間。但自有芯片對應用或者是云計算廠商是一種必要投資,還是“”自有“”這兩個字已經被過度強調之下的產物?或許值得我們再三思考。
就好比為了喝牛奶而養牛,我們要有專門環境,專人照顧,食料、疾病防治,加上擠牛奶的設備、牛奶的保存,這些不只要資金維持,也要很多的時間成本。AI 芯片亦不外如是。芯片設計出來除了芯片架構本身,開發環境、各種框架的整合,以及與現有架構的互換性,若沒有互換性,那又需要重頭設計整套生態,因此,看芯片不只是看芯片本身,更要看周邊生態的搭配,這些都是人和錢堆出來的產物。
當然,政府為了推動半導體產業發展,其實通過很多種補貼方式來鼓勵芯片設計行業開發自己的方案,就好比為了喝牛奶想養牛,政府就會真的補助一條牛,但怎么養,怎么生產牛奶就要自己想辦法。
很多企業因此在真正考慮營收獲利模式之前就先開個芯片再說,其出發點可能是為了配合政策,也可能是有了補貼不開白不開,但開了芯片之后能有什么作用?單純仿照其他人的作法做出架構類似的 AI 計算架構,又是否真能幫助自己的計算事業更上層樓?這會不會甚至模糊了自己的固有優勢?
除了開發芯片的成本低以外,還有另外一個原因,那就是要根據行業別不同而進行定制化的需求。
其實,不少企業開發芯片的理由,都是“找不到適合的芯片”,比如說語音芯片或者是視覺識別芯片可能需要不同前后端設計,通用方案可能無法完全滿足這些廠商的需求,這種設計可能就有其價值,但以昆侖這種通用 AI 芯片,似乎就沒有太大的必要。
前面也提到,由于現在推出“自有”AI 芯片的廠商已經多如牛毛,且因為各行其是,難以形成足夠強大的聚落,當然,目前業界其實也有像寒武紀或 Arm 這種可提供授權,具有一定生態基礎的架構可使用,但自古“文人相輕”,況且 AI 芯片基礎架構大同小異,差別只在算法軟件和平臺的配合,若能關起門來能自己賺那又何樂而不為?畢竟采用別人方案肯定會削薄利潤。
但事實真是如此嗎?
我們可以回頭看看過去 NVIDIA 在發展 AI 計算以及相關環境時,在芯片以外的東西投注了多少心力,光是 CUDA 這個開發環境,就已經花費了十年以上的心力,不僅是完善本身的架構,也積極與業界、學界合作,從底層穩扎穩打做起。
雖然現在的 AI 計算環境早就已經不是過去極度貧乏的狀況,各種開發環境都擺在那邊,框架也都幫你設計好,只要在程序中直接引用即可,但這種“自有”又是“”真的自有“”?
而廠商的各行其是,等于是各家廠商都花費了許多時間在做類似的工作,推出類似的方案,對全國研發資源而言,更可說是一種浪費,如果能夠集中這些資源,讓廠商不用重復發明輪子,而是集中精力,想辦法讓現有、已經夠好的輪子有更好的應用方向,那是否會對整個中國 AI 產業能有更正面影響和幫助?
DT 君認為是有這個可能的。只可惜國內廠商們在“自有”這條路上走的太遠,像昆侖這樣的通用 AI 芯片方案此起彼落,是真正對個別廠商,或對整體中國 AI 產業能產生幫助,還是造成研發資源的浪費,恐怕還需要時間證明。