為什么智能體是GenAI的下一個前沿

責任編輯：cres 作者：Lareina Yee |來源：企業網D1Net 2024-08-12 10:49:16 原創文章企業網D1Net

通過從信息向行動的轉變，比如虛擬同事能夠完成復雜的工作流程，這項技術承諾帶來一波新的生產力和創新浪潮。

在過去的幾年里，全球對GenAI所展現的能力和可能性感到驚嘆。基礎模型，如大型語言模型（LLMs），能夠在多個媒介中執行令人印象深刻的工作，從文本、音頻到圖像和視頻，然而，GenAI的下一個階段可能會帶來更具變革性的影響。

我們正處于從基于知識的GenAI工具——比如回答問題和生成內容的聊天機器人——到啟用GenAI的“智能體”演變的開端。GenAI“智能體”利用基礎模型在數字世界中執行復雜的多步驟工作流程。簡而言之，這項技術正在從思考向行動轉變。

廣義上講，“智能體”系統是指能夠在動態世界中獨立互動的數字系統。雖然這種軟件系統的版本已經存在多年，但GenAI的自然語言能力揭示了新的可能性，使系統能夠規劃其行動，使用在線工具完成任務，與其他智能體和人類合作，并通過學習來改進其性能。GenAI智能體最終可以作為技能嫻熟的虛擬同事，與人類無縫且自然地合作。例如，一個虛擬助理可以計劃并預訂個性化的復雜旅行行程，處理多個旅行平臺上的物流。工程師可以使用日常語言向程序員智能體描述新的軟件功能，后者會編碼、測試、迭代并部署它幫助創建的工具。

傳統上，實現智能體系統一直很困難，需要費力的基于規則的編程或高度特定的機器學習模型訓練，GenAI改變了這一點，當智能體系統基于基礎模型構建（這些模型已在極大且多樣化的非結構化數據集上進行訓練）而不是預定義的規則時，它們就有能力適應不同的場景，就像大型語言模型能夠對未明確訓練過的提示做出智能回應一樣。此外，使用自然語言而不是編程代碼，人類用戶可以指揮啟用GenAI的智能體系統完成復雜的工作流程。一個多智能體系統隨后可以解釋和組織這個工作流程，將其分解為可操作的任務，分配工作給專門的智能體，使用數字生態系統中的工具執行這些精煉的任務，并與其他智能體和人類合作，不斷改進其行動的質量。

在本文中，我們探討了GenAI智能體所帶來的機會。盡管這項技術仍處于初期階段，且在準備投入商業部署之前還需要進一步的技術開發，但它正迅速吸引關注。在過去的一年里，Google、Microsoft、OpenAI等公司已經投資了支持智能體功能的軟件庫和框架。由LLM驅動的應用程序，如Microsoft Copilot、Amazon Q和Google即將推出的Project Astra，正在從基于知識的功能向更注重行動的功能轉變。Adept、crewAI和Imbue等公司和研究實驗室也在開發基于智能體的模型和多智能體系統。鑒于GenAI的發展速度，智能體可能會像今天的聊天機器人一樣普遍。

智能體能為企業帶來什么價值？

智能體所能釋放的價值來自其在自動化復雜用例方面的潛力，這些用例通常具有高度可變的輸入和輸出——這些用例在歷史上由于成本或時間效率的問題而難以解決。比如，商務旅行看似簡單，卻可能涉及多種可能的行程，包括不同的航空公司和航班，更不用說酒店獎勵計劃、餐廳預訂和非工作時間的活動了，而所有這些都必須在不同的在線平臺上處理。盡管有努力去自動化部分流程，但由于潛在輸入和輸出的廣泛變化，使得這一過程過于復雜、成本高昂或耗時，因此大部分工作仍需手動完成。

GenAI驅動的智能體可以通過以下三種重要方式簡化復雜和開放式用例的自動化：

1. 智能體能夠管理多樣性。許多業務用例和流程都具有線性工作流程，具有明確的起點和一系列步驟，最終導致特定的解決方案或結果，這種相對簡單性使它們易于在基于規則的系統中進行編碼和自動化，但基于規則的系統往往表現出“脆弱性”，即在面對設計者未考慮到的情況時會崩潰。例如，許多工作流程遠不如想象中那樣可預測，往往充滿了意外的轉折和多種可能的結果，這些工作流程需要特殊處理和細微的判斷，這使得基于規則的自動化變得具有挑戰性，然而，GenAI智能體系統因為基于基礎模型，具有處理給定用例中各種不太可能發生情況的潛力，能夠實時適應以執行完成過程所需的特殊任務。

2. 智能體系統可以通過自然語言進行指揮。目前，要自動化一個用例，必須首先將其分解為一系列可以編碼的規則和步驟，這些步驟通常被轉換為計算機代碼并集成到軟件系統中，這一過程通常需要大量成本和勞動，并且需要顯著的技術專長。由于智能體系統使用自然語言作為指令形式，即使是復雜的工作流程也可以更快速和輕松地編碼。更重要的是，這一過程可能由非技術員工完成，而非軟件工程師，這使得更容易整合主題專家的知識，擴大GenAI和AI工具的訪問范圍，并簡化技術和非技術團隊之間的協作。

3. 智能體可以與現有的軟件工具和平臺協同工作。除了分析和生成知識之外，智能體系統還可以使用工具并在更廣泛的數字生態系統中進行溝通。例如，智能體可以被指示與軟件應用程序（如繪圖和制圖工具）協同工作，搜索網絡以獲取信息，收集和整理人類反饋，甚至利用其他基礎模型。使用數字工具是智能體的一個定義特征（這是它們在世界上行動的一種方式），也是它們的GenAI能力得以發揮的獨特途徑。基礎模型可以學習如何通過自然語言或其他接口與工具進行交互。如果沒有基礎模型，這些功能將需要大量手工努力來集成系統（例如，使用提取、轉換和加載工具）或繁瑣的手工努力來整理不同軟件系統的輸出。

GenAI驅動的智能體如何工作

智能體可以支持跨行業和業務職能的高復雜性用例，特別是涉及耗時任務或需要各種專業定性和定量分析的工作流程。智能體通過遞歸分解復雜的工作流程并執行跨越專門指令和數據源的子任務來實現預期目標，這個過程通常包括以下四個步驟：

1. 用戶提供指令：用戶通過自然語言提示與AI系統互動，就像指示一個值得信賴的員工一樣。系統識別出預期的用例，并在需要時向用戶詢問進一步的澄清。

2. 智能體系統規劃、分配并執行任務：智能體系統將提示處理為工作流程，將其分解為任務和子任務，然后由管理子智能體分配給其他專門的子智能體，這些子智能體配備了必要的領域知識和工具，利用先前的“經驗”和編纂的領域專業知識，相互協調，并使用組織的數據和系統執行這些任務。

3. 智能體系統迭代改進輸出：在整個過程中，智能體可能會請求用戶提供額外輸入，以確保準確性和相關性。最終，智能體將向用戶提供最終輸出，并根據用戶的反饋進行迭代改進。

4. 智能體執行動作：智能體在現實世界中執行任何必要的操作，以完全完成用戶請求的任務。

可能的應用場景：三個潛在的用例

這些類型的系統對企業意味著什么？以下三個假設的用例提供了一個未來不遠可能實現的功能的概覽。

用例1：貸款審批

金融機構準備信用風險備忘錄，以評估向借款人提供信貸或貸款的風險，這個過程涉及編制、分析和審核與借款人、貸款類型和其他因素相關的各種信息。鑒于信用風險場景和分析的多樣性，這往往是一個耗時且高度協作的工作，通常需要客戶經理與借款人、利益相關者和信用分析師合作進行專業分析，然后提交給信用經理進行審查并提供額外的專業意見。

潛在的基于智能體的解決方案：一個智能體系統——由多個智能體組成，每個智能體承擔專門的任務角色——可以被設計用于處理廣泛的信用風險場景。人類用戶可以使用自然語言啟動流程，提供包含特定規則、標準和條件的任務的高級工作計劃，然后，這個智能體團隊將工作分解為可執行的子任務。

例如，一個智能體可以作為客戶經理，處理借款人與金融機構之間的溝通。一個執行智能體可以編制必要的文件，并將其轉發給財務分析智能體，后者會例如從現金流量表中審查債務并計算相關的財務比率，然后由批評智能體審核以識別差異和錯誤并提供反饋，這個分解、分析、改進和審查的過程將重復進行，直到最終的信用備忘錄完成。

與更簡單的GenAI架構不同，智能體可以生成高質量的內容，從而減少20%到60%的審核周期時間。智能體還能夠跨越多個系統，理解從多個來源提取的數據。最后，智能體可以展示他們的工作成果：信用分析師可以快速深入任何生成的文本或數字，訪問完整的任務鏈并使用數據源生成的洞察，這有助于快速驗證輸出結果。

用例2：代碼文檔化和現代化

大型企業的遺留軟件應用程序和系統通常存在安全風險，并可能減緩業務創新的速度，但使這些系統現代化可能是復雜、昂貴且耗時的，需要工程師審查和理解數百萬行舊代碼庫，并手動記錄業務邏輯，然后將這些邏輯翻譯成更新的代碼庫并與其他系統集成。

潛在的基于智能體的解決方案：AI智能體有潛力顯著簡化這一過程。可以部署一個專門的智能體作為遺留軟件專家，分析舊代碼并記錄和翻譯各種代碼段。同時，質量保證智能體可以對這些文檔進行審核并生成測試用例，幫助AI系統迭代優化其輸出，并確保其準確性和符合組織標準。由于這一過程的可重復性，還可以產生“飛輪效應”，即智能體框架的組件可以被重復用于組織內的其他軟件遷移，顯著提高生產力并降低整體軟件開發成本。

用例3：在線營銷活動創建

設計、啟動和運行在線營銷活動通常涉及一系列不同的軟件工具、應用程序和平臺，而且，在線營銷活動的工作流程非常復雜。商業目標和市場趨勢必須轉化為創意活動理念。書面和視覺材料必須根據不同的細分市場和地區進行定制。活動必須在各種平臺上與用戶群體進行測試。為了完成這些任務，營銷團隊通常使用不同形式的軟件，并且必須將輸出從一個工具移至另一個工具，這往往既繁瑣又耗時。

潛在的基于智能體的解決方案：智能體可以幫助連接這個數字營銷生態系統。例如，營銷人員可以用自然語言描述目標用戶、初步想法、預期渠道和其他參數。然后，智能體系統在營銷專業人士的協助下，將幫助開發、測試和迭代不同的活動理念。一個數字營銷策略智能體可以利用在線調查、客戶關系管理解決方案中的分析數據以及其他市場研究平臺收集的洞察，使用多模態基礎模型來制定策略。內容營銷、文案寫作和設計的智能體可以根據策略創建定制內容，然后由人工評估者審查品牌一致性，這些智能體將協同工作，迭代和優化輸出，確保活動在最大化影響力的同時，最小化品牌風險。

商業領導者應如何為智能體時代做準備？

盡管智能體技術仍處于初期階段，但對這些工具的不斷增加的投資可能會使智能體系統在未來幾年內取得顯著的里程碑，并實現規模化部署。因此，商業領導者現在就可以開始了解智能體技術，并考慮是否可以利用智能體系統和功能加速某些核心流程或業務需求，這種理解可以為未來的路線圖規劃或情景提供信息，并幫助領導者保持在創新準備的前沿。一旦確定了潛在的用例，組織就可以開始探索日益增長的智能體生態系統，利用API、工具包和庫（例如，Microsoft Autogen、Hugging Face和LangChain）來開始理解哪些內容與他們相關。

為了為智能體系統的到來做好準備，企業應考慮以下三個關鍵因素，這將是實現這些系統潛力的關鍵：

相關知識的編纂：實施復雜的用例可能需要組織將業務流程定義并編纂為標準化的工作流程，然后用這些流程來訓練智能體，同樣，企業還可以考慮如何捕捉專業知識，并用自然語言來指導智能體，從而簡化復雜的流程。

戰略技術規劃：企業需要整理其數據和IT系統，以確保智能體系統能夠有效地與現有基礎設施對接，這包括捕捉用戶互動以獲取持續反饋，并創造靈活性以整合未來技術，而不干擾現有運營。

人機協作的控制機制：隨著GenAI智能體開始與現實世界互動，控制機制對于平衡自主性和風險至關重要。人類必須驗證輸出的準確性、合規性和公平性，與專業知識專家合作以維護和擴展智能體系統，并創建一個持續改進的學習反饋機制。企業應開始考慮在何種條件下以及如何部署這種人機協作機制。

麥肯錫最新的“AI現狀”調查發現，超過72%的受訪公司正在部署AI解決方案，并對GenAI的興趣日益濃厚。在這種背景下，看到公司開始將前沿技術如智能體系統納入其規劃過程和未來AI路線圖也就不足為奇了。智能體驅動的自動化仍然是一種令人興奮的前景，具有徹底改變整個行業的潛力，為工作帶來前所未有的行動速度。

盡管如此，該技術仍處于早期階段，在實現其全部能力之前還有很多發展工作要做，這些系統的復雜性和自主性增加帶來了許多挑戰和風險，而如果將AI智能體的部署比作為團隊添加新成員，那么就像他們的人類團隊成員一樣，智能體在能夠獨立操作之前，需要經過大量的測試、培訓和指導，但即便在這些最初的日子里，人們也不難想象這一代虛擬同事可能釋放的廣闊機會。

企業網D1net(hfnxjk.com)：

國內主流的to B IT門戶，旗下運營國內最大的甲方CIO專家庫和智力輸出及社交平臺-信眾智(www.cioall.com)。旗下運營19個IT行業公眾號(微信搜索D1net即可關注)。

關鍵字：AI