但這一切在2022年底隨著OpenAI推出ChatGPT而發生了改變,這一突破性工具不僅可以生成內容,還能執行各種任務,迅速吸引了全球數百萬人的關注。正如Gartner在2023年AI技術成熟度曲線中所指出的那樣,GenAI已經達到了“膨脹期的頂峰”,預計將在未來5到10年內進入“生產力平臺期”。
克服挑戰與局限性
根據Gartner的定義,達到生產力平臺期意味著AI將被廣泛采用,其優勢將得到明確定義,并有清晰的實施指南。要實現這一目標,我們首先必須解決當前AI技術的局限性,并探索如何通過智能體來克服這些挑戰。
盡管當今的大型語言模型(LLMs)在生成電子郵件、寫作文章和進行情感分析等任務上表現出色,但它們在處理復雜任務時仍然存在困難,例如復雜的數學計算或多步驟問題解決。此外,LLMs還存在其他顯著的局限性:
• 幻覺或誤導性輸出
• 技術限制,如有限的上下文長度和內存
• 輸出中的偏見
• 可能產生有害或不當言論
• 知識有限(例如,ChatGPT 3.5的知識截止日期為2021年9月)
有趣的是,這些挑戰與我們人類所面臨的問題并無太大不同。我們也容易犯錯誤、存在偏見、記憶有限,有時甚至會做出有害的回應。為了管理這些不足,我們通常會:
• 在線尋找信息,使用Excel和Word等工具。
• 多次修改我們的工作以糾正錯誤并提高質量。
• 尋求同事和導師的反饋,并吸收他們的見解。
• 團隊合作以取得更好的結果。
通過應用類似的策略,我們可以改進大型語言模型(LLM)的輸出,從而引出GenAI智能體的概念。
什么是GenAI智能體?
GenAI智能體旨在克服當前LLM的許多局限性,能夠執行單一模型無法處理的復雜任務。例如,如果你想從一個數據集中識別出按收入排名前三的公司,智能體將會:
• 獲取所有公司的收入數據。
• 按收入對公司進行排序。
• 返回排名前三的公司。
為了實現這一目標,智能體將LLM與關鍵組件結合起來,如規劃、記憶和工具:
• 規劃:智能體使用LLM制定并執行計劃。
• 記憶:智能體在執行多個步驟時保留信息,從而能夠處理復雜任務。
• 工具:智能體使用各種工具來執行特定任務,以下將對此進行更詳細的討論。
GenAI智能體的關鍵特性
GenAI智能體被設計為:
• 規劃和執行任務
• 反思結果
• 使用工具實現特定目標
• 在最少的人工干預下運行
此類智能體的例子包括網站建設工具、從Excel表格中提供見解的數據分析師,以及根據用戶輸入規劃旅行的旅游代理。
工具在GenAI智能體中的作用
工具對于智能體至關重要,使其能夠有效地執行任務。在GenAI的領域中,工具使LLM智能體能夠與外部環境和應用程序進行交互,例如進行互聯網搜索、代碼解釋器和數學引擎等,這些工具可以訪問數據庫、知識庫以及外部模型。
例如,一個旅行代理需要工具來搜索和預訂航班,還需要搜索互聯網的工具。其他工具可能包括:
• 實體提取:從非結構化文檔中提取特定信息。
• Chat DB:無需SQL知識即可從數據庫中檢索信息。
• 知識機器人:使用檢索增強生成(RAG)技術,根據自定義知識庫回答問題。
• 互聯網搜索:根據用戶查詢從搜索引擎獲取內容。
• 摘要生成:為大型文檔提供針對特定角色的摘要。
• 程序執行:執行Python代碼以解決特定問題。
• 維基百科搜索:根據用戶查詢從維基百科檢索內容。
• 比較:回答比較性問題,如性能指標或產品推薦。
智能體設計模式
為了執行復雜任務,智能體必須有效地協調這些工具。基于Andrew NG的講座,已經出現了幾種智能體設計模式:
• 反思:LLM評估自己的工作以改進輸出。
• 工具使用:LLM利用工具,如網絡搜索或代碼執行,來收集信息和處理數據。
• 規劃:LLM制定多步驟計劃以實現目標,然后執行該計劃。
• 多智能體協作:多個AI智能體協作,分配任務并討論想法,以尋找更好的解決方案。
盡管前兩種模式會產生可預測的結果,但后兩種仍處于實驗階段。
LLM智能體框架
基于對智能體、工具和設計模式的理解,規劃模式的一種變體逐漸形成。這個框架包括定義一個任務或目標,然后通過迭代的方式規劃并執行下一個動作,接著進入反饋循環。
一個LLM智能體由核心組件組成:
• 大腦/LLM:作為協調者。
• 記憶(向量數據庫):存儲中間步驟和結果。
短期記憶:在上下文窗口內保存上下文信息。
長期記憶:一個外部的向量存儲,提供相關的上下文信息。
• 工具/互聯網:使智能體能夠執行任務,如網絡搜索或程序執行。
• 政策:通過設計確保信任,防止處理有害輸入。
智能體的未來
GenAI的未來在于智能體與人類的協作。試想一個世界,醫生、設計師和客戶服務代表都由增強其能力的智能體支持。從科學發現到藝術創作,可能性是無窮的。
對于企業而言,將GenAI智能體融入運營中可以帶來戰略優勢,釋放出新的效率提升、個性化服務和問題解決能力,這些智能體不會取代人類的創造力,而是會增強它,推動一個充滿創新和進步的未來。
企業網D1net(hfnxjk.com):
國內主流的to B IT門戶,旗下運營國內最大的甲方CIO專家庫和智力輸出及社交平臺-信眾智(www.cioall.com)。旗下運營19個IT行業公眾號(微信搜索D1net即可關注)。
版權聲明:本文為企業網D1Net編譯,轉載需在文章開頭注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。