日韩毛片免费观看,日本高清二区视频久二区,亚洲国产精品第一页

正確啟動(dòng)AI助手的策略與實(shí)踐

責(zé)任編輯：cres

作者：Taryn Plumb

2024-11-15 14:56:05

來源：企業(yè)網(wǎng)D1Net

原創(chuàng)

隨著AI技術(shù)的飛速發(fā)展，企業(yè)急于構(gòu)建和部署AI助手以跟上時(shí)代步伐，但往往面臨復(fù)雜的技術(shù)挑戰(zhàn)。

由于AI的快速發(fā)展以及對錯(cuò)失恐懼癥(FOMO)的擔(dān)憂，GenAI項(xiàng)目往往采用自上而下的推動(dòng)方式，企業(yè)領(lǐng)導(dǎo)者很容易對這項(xiàng)突破性技術(shù)產(chǎn)生過度興奮的情緒，然而，當(dāng)企業(yè)急于構(gòu)建和部署時(shí)，往往會(huì)遇到與其他技術(shù)實(shí)施中出現(xiàn)的所有典型問題。AI復(fù)雜且需要專業(yè)知識(shí)，這意味著一些企業(yè)很快就會(huì)陷入困境。

事實(shí)上，F(xiàn)orrester預(yù)測，嘗試內(nèi)部構(gòu)建AI助手的企業(yè)中，有近四分之三將會(huì)失敗。

Forrester分析師Jayesh Chaurasia和Sudha Maheshwari寫道：“挑戰(zhàn)在于這些架構(gòu)錯(cuò)綜復(fù)雜，需要多個(gè)模型、先進(jìn)的檢索增強(qiáng)生成(RAG)堆棧、高級數(shù)據(jù)架構(gòu)和專業(yè)知識(shí)。”

那么，企業(yè)該如何選擇何時(shí)采用第三方模型、開源工具或構(gòu)建定制化的、內(nèi)部微調(diào)的模型呢?專家對此進(jìn)行了權(quán)衡。

AI架構(gòu)遠(yuǎn)比企業(yè)想象的復(fù)雜

Forrester高級分析師Rowan Curran告訴記者，嘗試自主構(gòu)建代理的企業(yè)通常會(huì)在RAG和向量數(shù)據(jù)庫方面遇到困難。在預(yù)期的時(shí)間框架內(nèi)獲得準(zhǔn)確輸出可能是一項(xiàng)挑戰(zhàn)，而且企業(yè)并不總是理解重新排序的過程或其重要性，重新排序有助于確保模型使用最高質(zhì)量的數(shù)據(jù)。

Curran指出，例如，用戶可能會(huì)輸入10000份文檔，而模型可能會(huì)返回與當(dāng)前任務(wù)最相關(guān)的100份文檔，但是，較短的上下文窗口限制了可以輸入以進(jìn)行重新排序的內(nèi)容。因此，例如，人類用戶可能需要進(jìn)行判斷并選擇10份文檔，從而降低模型的準(zhǔn)確性。

Curran指出，RAG系統(tǒng)的構(gòu)建和優(yōu)化可能需要6到8周的時(shí)間。例如，在進(jìn)行任何調(diào)整之前，第一次迭代的準(zhǔn)確率可能為55%，第二次發(fā)布可能達(dá)到70%，而最終部署的準(zhǔn)確率理想情況下將接近100%。

開發(fā)人員需要了解數(shù)據(jù)的可用性(和質(zhì)量)以及如何對模型進(jìn)行重新排序、迭代、評估和落地(即將模型輸出與相關(guān)、可驗(yàn)證的來源進(jìn)行匹配)。此外，調(diào)高或調(diào)低“溫度”決定了模型的創(chuàng)造力——但一些企業(yè)在創(chuàng)造力方面“非常嚴(yán)格”，從而限制了發(fā)展，Curran表示。

“人們一直認(rèn)為這些東西有個(gè)簡單的按鈕，”他指出，“但實(shí)際上并沒有。”

Curran表示，構(gòu)建AI系統(tǒng)需要大量的人力，強(qiáng)調(diào)了測試、驗(yàn)證和持續(xù)支持的重要性。所有這些都需要專門的資源。

Databricks的AI副總裁、MosaicAI的創(chuàng)始人兼前首席執(zhí)行官Naveen Rao表示：“成功部署AI助手可能很復(fù)雜。”企業(yè)需要訪問各種大型語言模型(LLM)，并且有能力管理和監(jiān)控不僅代理和模型，還有底層數(shù)據(jù)和工具。“這不是一個(gè)簡單的問題，隨著時(shí)間的推移，AI系統(tǒng)訪問的數(shù)據(jù)及其訪問方式將受到越來越多的審查。”

探索AI助手時(shí)需要考慮的因素

專家建議，在考慮部署AI助手的選項(xiàng)(第三方、開源或定制)時(shí)，企業(yè)應(yīng)采取一種受控的、戰(zhàn)術(shù)性的方法。

咨詢公司Intelligence Briefing的創(chuàng)始人兼首席AI戰(zhàn)略師Andreas Welsch建議，首先要考慮幾個(gè)重要的問題和因素，其中包括：

• 你的團(tuán)隊(duì)大部分時(shí)間花在哪里?

• 在這個(gè)過程中，哪些任務(wù)或步驟最耗時(shí)?

• 這些任務(wù)的復(fù)雜性如何?是否涉及IT系統(tǒng)和可訪問的數(shù)據(jù)?

• 提高速度或降低成本將為你的企業(yè)帶來什么?你能否(以及如何)衡量基準(zhǔn)?

Welsch指出，考慮現(xiàn)有的許可證和訂閱也很重要。與軟件銷售代表交談，了解你的企業(yè)是否已經(jīng)可以使用代理功能，如果可以，使用它們需要什么條件(例如附加組件或更高級別的訂閱)。

從那里開始，尋找一個(gè)業(yè)務(wù)功能中的機(jī)會(huì)。例如：“你的團(tuán)隊(duì)在哪些無法用代碼描述的手動(dòng)步驟上花費(fèi)時(shí)間?”之后，在探索代理時(shí)，了解其潛力并“診斷”任何差距。

同時(shí)，一定要通過向團(tuán)隊(duì)展示代理如何幫助他們工作來賦能和教育團(tuán)隊(duì)。“也不要害怕提及代理的局限性，”Welsch說，“這將有助于你管理預(yù)期。”

制定策略，采用跨職能方法

Curran強(qiáng)調(diào)，在制定企業(yè)AI策略時(shí)，采用跨職能方法非常重要。成功的企業(yè)會(huì)讓多個(gè)部門參與這一過程，包括業(yè)務(wù)領(lǐng)導(dǎo)層、軟件開發(fā)和數(shù)據(jù)科學(xué)團(tuán)隊(duì)、用戶體驗(yàn)經(jīng)理等。

他建議，基于企業(yè)的核心原則和目標(biāo)制定路線圖。“我們作為一個(gè)企業(yè)的目標(biāo)是什么?AI將如何幫助我們實(shí)現(xiàn)這些目標(biāo)?”

Curran承認(rèn)，這無疑很困難，因?yàn)榧夹g(shù)發(fā)展得太快了。“沒有一套最佳實(shí)踐、框架，”他說。在AI助手方面，沒有多少開發(fā)人員有發(fā)布后集成和DevOps的經(jīng)驗(yàn)。“構(gòu)建這些東西的技能還沒有以廣泛的方式真正得到發(fā)展和量化。”

因此，企業(yè)難以啟動(dòng)各種AI項(xiàng)目(包括所有類型)，并且許多企業(yè)最終會(huì)轉(zhuǎn)向咨詢機(jī)構(gòu)或他們現(xiàn)有的技術(shù)供應(yīng)商之一，這些供應(yīng)商擁有在其技術(shù)堆棧上進(jìn)行構(gòu)建的資源和能力。最終，當(dāng)企業(yè)與合作伙伴緊密合作時(shí)，他們將最有可能取得成功。

“第三方提供商可能有足夠的資源來跟上最新的技術(shù)和架構(gòu)來構(gòu)建這一系統(tǒng)，”Curran說。

這并不是說不可能在內(nèi)部構(gòu)建定制代理;恰恰相反，他指出。例如，如果一個(gè)企業(yè)擁有強(qiáng)大的內(nèi)部開發(fā)團(tuán)隊(duì)以及RAG和機(jī)器學(xué)習(xí)(ML)架構(gòu)，他們可以利用這些來創(chuàng)建自己的代理AI。他還強(qiáng)調(diào)，如果“你的數(shù)據(jù)得到了良好的管理、記錄和標(biāo)記”，并且沒有“一團(tuán)糟”的API策略，同樣也可以這樣做。

無論哪種情況，企業(yè)都必須從一開始就將持續(xù)的、部署后的需求納入其AI策略中。

“部署后沒有免費(fèi)的午餐，”Curran說，“所有這些系統(tǒng)都需要某種形式的發(fā)布后維護(hù)和支持，以及持續(xù)的調(diào)整和優(yōu)化，以保持它們的準(zhǔn)確性，并隨著時(shí)間的推移使它們更加準(zhǔn)確。”

企業(yè)網(wǎng)D1net(hfnxjk.com)：

國內(nèi)主流的to B IT門戶，旗下運(yùn)營國內(nèi)最大的甲方CIO專家?guī)旌椭橇敵黾吧缃黄脚_(tái)-信眾智(www.cioall.com)。旗下運(yùn)營19個(gè)IT行業(yè)公眾號(hào)(微信搜索D1net即可關(guān)注)。

版權(quán)聲明：本文為企業(yè)網(wǎng)D1Net編譯，轉(zhuǎn)載需在文章開頭注明出處為：企業(yè)網(wǎng)D1Net，如果不注明出處，企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。

AI GenAI AI助手