大型語言模型因其多功能性、廣泛的領域知識和解決復雜多步驟問題的能力而廣受歡迎。相比之下,小型模型為企業提供了一種資源消耗更少的方式,能夠利用定制化的專業知識完成特定任務。
分析師告訴記者,雖然過去幾年大型語言模型在企業中更為普遍,但輕量級模型已逐漸受到關注,并且其商業應用預計今年將進一步增加。
“代理模型和推理模型將是主要話題……但小型語言模型是整體商業價值討論中的重要部分。”Gartner杰出副總裁分析師Arun Chandrasekaran表示。
對于小型AI模型的定義,眾說紛紜。一些人根據參數數量來定義小型語言模型,其參數數量通常在數千萬至數十億之間,而大型語言模型的參數數量則達到數百億或數千億。
“我認為,理想的參數范圍在10億至100億之間,”Chandrasekaran說。“在過去6到12個月里,至少50%的企業已經積極研究了參數范圍在10億至100億之間的模型,以用于其應用場景。”
其他人則更少地基于模型大小來定義小型模型,而更多地關注開發方法,如通過蒸餾法。Forrester預測,隨著擁有行業特定術語的企業尋求利用具有特定領域專業知識的模型,這種小型語言模型的集成今年將激增60%以上。
不同的定義可能會讓CIO和采購團隊感到困惑。
“小型語言模型并沒有任意的規模界限,這確實使得這個領域非常令人困惑。”Forrester高級分析師Rowan Curran表示。
小型AI模型的供應商選項眾多。谷歌的輕量級Gemma模型系列已推出近一年。微軟推出了一系列名為Phi的小型模型,其中最新的Phi-4于去年12月向客戶推出。OpenAI在1月底發布了o3-mini,此前該初創公司已于去年夏天推出了GPT-4o mini。
“構建大型模型的公司也在構建小型模型。”Chandrasekaran說。
企業的吸引力
小型AI模型與其大型同類模型一樣,既有優勢也有局限。
Curran表示,具有專業術語的行業和企業,如醫療保健或醫療器械零售商,是小型模型發展的理想領域。Forrester發現,約三分之一的技術決策者在購買時優先考慮特定領域的GenAI能力。
小型模型通常使用較少的計算能力,從而降低了資源緊張企業的成本。由于預算限制、技能差距和計算能力可用性,超過三分之一的公司已將AI項目推遲了三個月至半年。
小型模型在設備端、本地和云端都具有成本效益。例如,OpenAI表示,其GPT-4o mini的成本比GPT-3.5 Turbo低60%以上。在本地或私有云部署上運行的小型模型還可以緩解CIO對安全和隱私的擔憂。
聯合國教科文組織等組織已推廣小型模型作為更環保的計算替代方案。
盡管人們希望GenAI最終能推動企業更接近可持續發展目標,但企業在控制支持AI計劃所需資源方面一直面臨挑戰。根據谷歌的年度報告,隨著計算強度和技術基礎設施投資的增加,其溫室氣體排放量去年也有所上升,自2019年以來增長了48%。
Constellation Research的副總裁兼首席分析師Andy Thurai表示,雖然小型模型有其優勢,但它們并非所有用例的最佳選擇。
企業網D1net(hfnxjk.com):
國內主流的to B IT門戶,旗下運營國內最大的甲方CIO專家庫和智力輸出及社交平臺-信眾智(www.cioall.com)。旗下運營19個IT行業公眾號(微信搜索D1net即可關注)。
版權聲明:本文為企業網D1Net編譯,轉載需在文章開頭注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。