自從去年大模型熱潮興起之后,國內市場對算力“卡脖子”的擔憂就與日俱增。英偉達面向中國市場特供的“閹割版”計算芯片A800價格水漲船高,一芯難求。
10月17日,芯片禁令再度升級。美國商務部工業和安全局(BIS)發布針對芯片的出口禁令新規,對涉華先進計算芯片和半導體行業的出口管制措施進一步升級,要求英偉達在內的美國半導體公司不得再向中國供應A800和H800等先進計算芯片、芯片制造設備和其他產品。
消息一出,國內市場嘩然,尋求大模型算力的第二選擇至關重要。算力是訓練AI大模型的基礎,唯有擁有自主可控的算力底座,國產大模型才能夠在這場變革未來的AI競爭中取得領先。
國內公司中,科大訊飛最難能可貴的是在美禁令下走出一條自主創新之路。在美芯片禁令升級后不久,科大訊飛在2023全球1024開發者節上發布了訊飛星火認知大模型V3.0,科大訊飛董事長劉慶峰稱,訊飛星火V3.0七大能力持續提升,整體超越ChatGPT,醫療領域超越GPT-4。
但這場發布會另一個重要看點,則是科大訊飛與華為聯合發布的“飛星一號”大模型算力平臺。劉慶峰在接受媒體采訪時表示,星火3.0是除了華為內部應用外,第一個真正在國產算力上訓練出來的大模型,且能夠對標ChatGPT。
今年3季度的財報電話會議上,科大訊飛副總裁江濤也對外明確表態,星火大模型完全架構在自主創新的軟硬件基礎上。
事實上,早在2019年科大訊飛就被美國列入實體清單。去年10月,美國對包括科大訊飛在內的28家中國人工智能、高性能芯片、超級計算機領域的頭部企業和機構再次加碼制裁。
劉慶峰在接受媒體采訪時對外透露,訊飛的國產化替代從三年前就開始進行,不是因為今天美國出了新政策才開始的,“(新的禁令)更加凸顯了我們早做準備的重要性。”
在訊飛星火大模型研發尚未啟動前,科大訊飛就與華為確定了合作,5月6日訊飛星火發布之后雙方合作進一步深入。劉慶峰說,訊飛和華為組建了“聯合特戰隊”,半年內實現了星火大模型訓練和推理效率均翻番。
2023全球1024開發者節上,華為公司副董事長輪值董事長徐直軍高度稱贊了科大訊飛的技術領先。他透露,華為與科大訊飛的合作不止局限于大模型領域,華為公司在全球所有使用的智能終端的語音技術都是來自于科大訊飛,且不僅僅是中文,而是涉及十幾種語言。
在技術迭代以天計算的大模型領域,自主創新并不容易。劉慶峰在接受媒體采訪時也坦言,所以假如他們現在不是用國產平臺,而是已經成型的英偉達的平臺,星火的效果可能會更好,“但這一步你非走不可。”
劉慶峰說,早期任何國產操作系統,都有一個從不好用到好用,最后到整個生態繁榮的過程。但這個過程是值得的,“如果誰都不往前走一步,而且沒有能夠堅定地提供底座的廠商,這個國家始終是沒有辦法獨立自強。”
科大訊飛選擇與華為共同做那個“趟路”的人。劉慶峰覺得,他們在國產算力平臺上的探索,將來都能為國內的其他科研單位和企業提供借鑒和參考。也是中國科技企業軟硬件一體化聯手,強強聯合的一個案例。
文淵智庫創始人王超在接受媒體采訪時認為,“飛星一號”大模型算力平臺對于國產AI大模型來說有非常大的意義。如果確實能夠在一定程度上達到或接近英偉達的水平,就說明中國的算力平臺已經達到一個成熟的地步,所謂芯片制裁和大模型圍剿基本上成了馬其諾防線,對中國的科技行業來說是一個非常大的利好。
從更廣泛的維度來看,“飛星一號”大模型算力平臺的推出,也是為全球科技行業提供了第二種選擇的可能。劉慶峰在發布會中表示,飛星一號不僅是中國企業相互聯合的產物,更是為世界提供了第二種選擇。
第二選擇的實現尤為不易,它承載著中國企業自主創新的艱辛,更是中國企業面向國際化的抓手。劉慶峰在接受媒體采訪時也提到,中國企業要走出去,前提之一就是必須要有實實在在的硬科技。
訊飛星火3.0實現了整體超越ChatGPT之后,劉慶峰宣布,基于“飛星一號”大模型計算平臺,將啟動對標GPT-4的更大參數規模的星火大模型訓練,預計明年上半年將實現對標GPT-4。
他同時強調要正視國產大模型與GPT-4的差距,在他看來,其中的差距主要體現在對復雜知識的推理、對小樣本快速在各個領域的學習、對更超常文本的處理以及跨模態的統一理解這4大方向。
OpenAI的先發優勢,決定了國產大模型必須要以持之以恒的決心的追趕。就如同劉慶峰所說,大模型賦能千行百業是一場硬仗,絕不是靠吹牛能做成的,只有實事求是的科學精神,才能真正實現超越。