OpenAI CEO Sam Altman對“空中的魔法智能”的宣言引發了硅谷開發者的狂熱,許多人相信我們即將實現跨所有領域的人類水平的機器智能,即所謂的AGI。
然而,隨著2024年的進展,一個更加微妙的敘事正在浮現。扎根于現實的企業在實際應用中實現AI的過程中采取了更為謹慎的態度。人們逐漸意識到,雖然像GPT-4這樣的大型語言模型(LLM)非常強大,但GenAI總體上并未達到硅谷的高期望。LLM的性能已經趨于平穩,面臨持久的事實準確性挑戰。法律和倫理問題層出不窮,基礎設施和商業用例比預期的更具挑戰性。顯然,我們并沒有走上實現AGI的直接路徑。甚至更為溫和的承諾,如自主AI代理,也面臨許多限制。旨在以真實數據和準確性“接地”AI的保守技術,如RAG(檢索增強生成),仍然存在巨大障礙。基本上,LLM仍然存在大量的幻覺現象。
相反,公司正專注于如何利用現有LLM的強大基本功能,這種從炒作到現實的轉變由六個影響AI格局的關鍵辯論所體現,這些辯論代表了熱衷于即將實現超級智能的狂熱信徒和倡導更務實的AI采用方法之間的分歧。對于企業領導者來說,理解這些辯論至關重要。對于那些希望利用這項強大技術的公司來說,盡管它不是一些最狂熱支持者所聲稱的那樣神奇,但仍有重大利益可圖。
不要誤解,大多數企業領導者仍然相信這項技術已經帶來了深遠的好處。在我們最近的AI影響力巡回演講中,與全國財富500強公司進行的會議和活動中,領導者們公開討論了他們擁抱AI承諾的努力。
現在,讓我們深入探討這六個辯論:
1. LLM競賽:是否已經見頂?
自從OpenAI的GPT-3問世以來,開發最先進LLM的競賽一直是AI領域的顯著特征,但隨著我們進入2024年下半年,一個重大問題浮出水面:LLM競賽是否結束?
答案似乎是肯定的,至少目前是這樣。
這很重要,因為領先的大型語言模型(LLM)之間的差異變得越來越難以察覺,這意味著企業公司現在可以根據價格、效率和特定用例的適合度來選擇,而不必追求“最好”的模型。
在2023年,我們目睹了一場激烈的競賽展開。OpenAI在3月發布了GPT-4,展示了推理能力、多模態功能和多語言能力的顯著改進。評論家們認為,隨著這些模型被輸入更多數據,性能將繼續提升。一段時間內,似乎他們是對的。
但是在2024年,這一速度顯著放緩。盡管Altman模糊地暗示未來會有更多驚喜,但該公司的COO Mira Murati在6月中旬承認,OpenAI實驗室中并沒有比已經公開的更多的內容。
現在,我們看到明顯的停滯跡象。OpenAI似乎遇到了瓶頸,而其競爭對手Anthropic趕上了,并發布了Claude 3.5 Sonnet,在許多方面超越了GPT-4。值得注意的是,Claude并沒有大幅領先,它只是略有改進。更有趣的是,Sonnet基于Anthropic的較小模型之一,而不是其更大的Opus模型——這表明大量的數據訓練并不一定會帶來改進,而是通過優化和微調較小模型才能取得關鍵進展。
普林斯頓計算機科學教授Arvind Narayanan上周寫道,認為模型擴展正在走向AGI的流行觀點“基于一系列的神話和誤解”,僅靠擴展模型幾乎不可能實現AGI。
對于企業領導者來說,這種停滯具有重要意義,這意味著他們應該利用最適合自己特定需求的個別LLM——現在有數百種這樣的LLM可供選擇。沒有哪一個“神奇的獨角獸”LLM可以統治一切。在考慮他們的LLM選擇時,企業應該考慮開放的LLM,如基于Meta的Llama或IBM的Granite的模型,這些模型提供了更多的控制權并且更容易針對特定用例進行微調。
2. AGI炒作周期:頂峰還是低谷?
隨著LLM突破速度的放緩,一個更大的問題出現了:我們是否已經達到了AGI炒作周期的高峰?
我們的答案是:是的。
這很重要,因為公司應該專注于利用現有的AI能力進行實際應用,而不是追求AGI的承諾。
ChatGPT的發布引發了關于AI可能性的巨大興奮,其人類般的互動,由大量訓練數據提供動力,給人以真正智能的錯覺,這一突破使Altman在科技界成為了導師級人物。
Altman接受了這個角色,做出了關于AI未來的宏大宣言。2023年11月,在發布GPT-4 Turbo時,他聲稱這與他們正在開發的東西相比將顯得“古雅”。他提到AGI在未來幾年內是可能的,這些聲明激起了我們可以稱之為硅谷狂熱信徒的巨大熱情。
然而,這種狂熱開始消退。Altman在2023年底被OpenAI董事會臨時驅逐是第一個裂痕。隨著我們進入2024年,他關于AGI臨近的聲明開始顯得不那么令人信服——他開始強調需要進一步的突破。今年2月,Altman表示AGI可能需要高達7萬億美元的投資。
競爭對手縮小了與OpenAI領先的大型語言模型(LLM)之間的差距,許多人預測的穩定改進未能實現。為這些模型提供更多數據的成本增加了,同時它們頻繁的邏輯錯誤和幻覺仍然存在,這導致Meta首席科學家Yann LeCun等專家認為LLM是一個巨大的干擾,并且是通往真正AGI的“旁路”。LeCun認為,雖然LLM在處理和生成類人文本方面令人印象深刻,但它們缺乏實現AGI所需的基本理解和推理能力。
這并不意味著炒作完全消失,在某些硅谷圈子里,AI熱潮仍在繼續,前OpenAI員工Leopold Aschenbrenner最近發表了一段熱情洋溢的四小時視頻,主張AGI可能在三年內到來。
但包括普林斯頓的Narayanan在內的許多經驗豐富的觀察者指出了這些論點中的嚴重缺陷。企業公司應采用這種更為穩健的觀點。
在與企業AI領導者(如Honeywell、Kaiser Permanente、Chevron和Verizon等公司)的對話中,我一致聽到AI實施的現實比炒作所暗示的要復雜和細微得多。
雖然領導者們仍對其潛力充滿熱情,但不要被AI正在如此迅速改進的想法所左右,以至于下一代技術將解決現有一代的問題。CapGemini的EVP Steve Jones表示,你必須現在就建立控制措施來很好地利用它:“無論未來五年中AI做出的決策是20%還是50%,這都不重要。”他在接受VentureBeat采訪時說。關鍵是你的職業成功取決于該算法的成功,他說,你的企業依賴于你了解它的工作原理,并確保它能很好地運行。
“關于AGI的所有胡說八道正在發生,”他提到繼續在硅谷開發者中流行的炒作,而這些人并未真正專注于企業部署,但AI“更多的是一種組織變革,而不是技術變革,”他說,補充道公司需要利用和控制LLM已經提供的真正基本進步。
大公司正在讓模型提供商承擔訓練的重任,而他們則專注于為自己的特定目的微調模型,我們追蹤的金融、健康和零售領域的領導者也在采用這種更務實的方法。
例如,在我與摩根大通、花旗銀行、富國銀行等銀行的交流中,重點是使用AI增強特定的銀行功能,帶來諸如欺詐檢測、風險管理和客戶服務的實際應用。
在醫療領域,紐約長老會醫院系統的AI運營醫學主任Ashley Beecy博士提供了另一個大愿景被實際AI應用所錨定的例子。雖然她設想了一個了解患者所有信息的AI,但她說醫院從更實際的應用開始,比如通過記錄和轉錄病人就診來減少醫生的行政負擔。
Beecy指出,更雄心勃勃的AI版本的大部分技術能力已經到位,但需要調整內部工作流程和流程才能實現這一點,或者她稱之為“變革管理”。她承認,這需要大量的工作和測試,并且還需要國家健康組織的意見共享,因為這將需要超越她自己醫院的更大結構性變革。
3. GPU瓶頸:基礎設施現實
是否存在GPU瓶頸影響GenAI的擴展?我們的答案是:是的,但比頭條新聞所暗示的更復雜。
為什么重要:企業公司需要戰略性地規劃其AI基礎設施投資,平衡眼前的需求與長期的可擴展性。
AI開發的激增導致對專用硬件,特別是運行AI應用程序的GPU(圖形處理單元)的需求前所未有地高漲。作為領先的GPU制造商,Nvidia的市場價值飆升至3萬億美元以上,成為全球最有價值的公司之一,這種需求創造了供應緊張,推高了成本并延長了這種關鍵AI基礎設施的等待時間。
然而,這種瓶頸并不在所有AI應用程序中均勻分布。雖然訓練大型模型需要巨大的計算能力,但許多企業用例主要集中在推理——運行預訓練模型以生成輸出。對于這些應用程序,硬件需求可能不會那么高。
Groq公司開發創新AI芯片的CEO Jonathan Ross認為,推理可以在非GPU硬件上高效運行。Groq的語言處理單元(LPUs)在某些AI任務上承諾顯著的性能提升,其他初創公司也正在進入這一領域,挑戰Nvidia的主導地位,有可能緩解GPU瓶頸。
盡管有這些發展,總體趨勢仍指向不斷增加的計算需求。正在訓練先進模型并希望保持領導地位的AI實驗室和超大規模云公司正在建設龐大的數據中心,其中一些加入了我稱之為“50萬GPU俱樂部”,這種軍備競賽激發了對量子計算、光子學,甚至用于數據存儲的合成DNA等替代技術的興趣,以支持AI的擴展。
然而,大多數企業公司并沒有受到GPU可用性限制的困擾。大多數公司將使用Azure、AWS和Google的GCP云,讓這些大玩家承擔GPU建設的成本。
以Intuit為例,這家公司是去年率先認真采用GenAI的公司之一,該公司的AI副總裁Nhung Ho上周告訴我,該公司不需要最新的GPU來進行工作。“有很多舊的GPU運行得很好,”Ho說,“我們使用的是六七年前的技術……它運行得非常出色。”這表明,對于許多企業應用來說,創造性的解決方案和高效的架構可以緩解硬件瓶頸。
4. 內容權利與LLM訓練:前方的法律地雷
網絡上的所有內容都可以免費用于訓練LLM嗎?
我們的答案是:不行,這帶來了重大法律和倫理挑戰。
為什么重要:企業公司需要意識到在部署AI模型時可能存在的版權和隱私問題,因為法律環境正在迅速變化。
用于訓練LLM的數據已成為一個有爭議的問題,對AI開發者和企業用戶都有重大影響。紐約時報和調查報道中心已對OpenAI提起訴訟,指控其未經授權使用內容進行訓練,這只是冰山一角。
這場法律戰突出了一個關鍵問題:AI公司是否有權在未經明確許可或補償的情況下抓取和使用在線內容進行訓練?答案尚不明確,法律專家建議,這個問題可能需要十年才能在法院中完全解決。
雖然許多AI公司為使用其服務的企業提供賠償,但這并不能完全保護企業免受潛在的法律風險。隨著AI驅動的搜索引擎和摘要工具的興起,這種情況變得更加復雜。例如,Perplexity AI因總結付費墻文章而受到批評,導致福布斯指控其侵犯版權。
作為VentureBeat的創始人,我在這個辯論中有一定的利益。我們的商業模式與許多出版商一樣,依賴頁面瀏覽量和廣告。如果AI模型能夠自由地總結我們的內容而不為我們的網站帶來流量,這將威脅到我們變現工作的能力,這不僅是媒體公司的擔憂,也是所有內容創作者的擔憂。
任何使用基于網絡數據訓練的AI模型的企業都有可能面臨法律挑戰。企業必須了解他們所部署的AI模型所使用數據的來源,這對于金融和銀行公司尤為重要,因為這些公司在隱私和個人信息使用方面面臨嚴格的監管。
一些公司正在采取積極步驟來應對這些問題。在訓練方面,OpenAI正爭先恐后地與出版商和其他公司達成協議。據報道,Apple已經與新聞出版商達成協議,使用他們的內容進行AI訓練。這可能為未來AI公司和內容創作者的合作方式設立了一個先例。
5. GenAI應用:變革邊緣,不是核心
GenAI應用是否在顛覆大多數企業公司的核心業務?
我們的答案是:還沒有。
為什么這很重要:雖然AI具有變革性,但它目前在增強現有流程方面的影響更為顯著,而不是徹底革新核心業務模式。
關于AI的敘述經常暗示即將發生全面的企業運營顛覆,然而,實際情況卻有所不同。大多數公司通過將AI應用于外圍功能而不是完全改革其核心業務來取得成功。
常見的應用包括:
• 客戶支持聊天機器人
• 為員工提供的知識庫助手
• 生成式營銷材料
• 代碼生成和調試工具
這些應用正在推動顯著的生產力提升和運營效率,然而,它們還沒有帶來一些人預測的大規模收入增長或商業模式轉變。
零售公司如Albertsons和AB InBev的高管告訴我,他們急切地尋找影響核心業務的方法,正在實驗“大型應用模型”來預測客戶的購買模式。在制藥行業,人們希望AI能夠加速藥物發現,盡管進展比許多人預期的要慢。
Intuit也是一個有趣的案例。其業務基于稅收和商業代碼及術語,這更接近于LLM提供的強大語言應用,這解釋了為什么Intuit迅速躍升,宣布了一年前推出的GenAI操作系統(GenOS),它將AI助手整合到TurboTax、QuickBooks和Mailchimp等產品中,然而,其AI使用仍然集中在客戶幫助上,與其他公司使用AI的方式類似。
Apple的觀點很有啟發性,他們目前將AI視為一種功能,而非一款產品,這種立場反映了當前AI在許多企業中的狀態:作為一種強大的增強工具,而不是獨立的革命性產品。
StateStreet這家總部位于波士頓的大型銀行的執行副總裁Caroline Arnold也持有這種觀點,她認為GenAI主要用于提高生產力,而不是核心收入驅動因素。在我們三月份的波士頓活動中,她強調了AI的潛力:“GenAI讓你能夠以非常自然的方式與大量數據進行實時互動,構建場景……以一種傳統方式需要更多時間才能完成。”
盡管該銀行的新LLM注入的聊天機器人迅速超越了現有的幫助臺,但也并非沒有挑戰。聊天機器人偶爾會提供“奇怪的答案”,需要進行調整。四個月后,State Street尚未公開發布其應用程序,這突顯了企業在邊緣采用GenAI的復雜性。
6. AI代理:下一個前沿還是過度炒作?
AI代理將成為AI的未來嗎?
我們的答案是:是的,但有條件。
為什么這很重要?AI代理代表了自動化和決策領域的潛在飛躍,但它們當前的能力往往被夸大了。
AI代理的概念——即可以在最少人為干預下執行任務或做出決策的自主系統——吸引了許多科技界人士的想象力。一些人,如前OpenAI員工Leopold Aschenbrenner,設想了一個不遠的未來,數以億計的AGI智能AI代理將運行我們世界的各個方面。這反過來會將十年的算法進步壓縮到一年甚至更短的時間內:“我們將迅速從人類水平發展到遠超人類的AI系統,”他辯稱。
然而,我與之交談的大多數人認為這是一個空想。事實上,當前AI代理的狀態比硅谷愛好者們一年前爆發興奮時假設的要溫和得多,當時圍繞Auto-GPT(一個據稱可以讓你做各種事情的代理框架,包括創辦自己的公司)的興奮情緒爆發。盡管在客戶服務和營銷自動化等領域有一些有前途的用例,但完全自主的AI代理仍處于初級階段,并面臨著保持工作軌道的許多挑戰。
其他新興的AI代理應用包括:
• 旅行計劃和預訂
• 電商產品搜索和購買
• 自動化編程助手
• 金融交易算法
這些代理通常使用一個主要的LLM來協調過程,子代理處理具體任務如網絡搜索或支付,然而,它們距離一些人設想的通用、完全自主系統還有很長的路要走。
Intuit 對 AI 代理的做法頗具啟發性。Nhung Ho 透露,盡管 Intuit 已經建立了支持代理框架的基礎設施,但已暫停在該領域的投資。Intuit 正在等待技術成熟,然后再將其全面集成到產品中。
這種謹慎的態度反映了更廣泛的行業情緒。雖然 AI 代理顯示出潛力,但它們還不夠可靠或多功能,無法在關鍵角色中廣泛采用。
結論:在 2024 年及以后的 AI 領域中航行
在我們探討塑造 2024 年企業戰略的六個關鍵 AI 爭論時,一個明確的主題浮現出來:從炒作轉向實際實施。企業領導者的關鍵要點如下:
1. LLM 競賽已經停滯:專注于根據具體用例、成本效益和集成的便利性來選擇模型,而不是追求“最佳”模型。
2. AGI 的炒作正在降溫,實用 AI 正在升溫:立即關注利用現有的 AI 能力,實現切實的業務成果。
3. 基礎設施挑戰需要創造性的解決方案:探索替代硬件解決方案,并優化 AI 工作流程,以最大限度地提高現有硬件的效率。
4. 法律和倫理考慮至關重要:仔細審查 AI 提供商,并了解其訓練數據的來源,以降低法律風險。
5. 關注增強核心功能,而不是取代它們:尋找將 AI 集成到客戶支持、員工援助和運營效率改進中的機會。
6. AI 代理顯示出潛力,但尚未成熟:建立支持代理框架的基礎設施,但要準備等待技術成熟后再全面實施。
真正的 AI 革命不是在追求 AGI 的研究實驗室中發生,而是在全球各地的辦公室中,AI 被集成到日常操作中。正如 Capgemini 的 Steve Jones 所說,“AI 更多的是一種組織變革,而不是技術變革。”
最有價值的 AI 實施可能不會成為頭條新聞,它可能是每天為你的客戶服務團隊節省幾個小時,或幫助你的開發人員更快地發現漏洞的問題。問題不再是“AI 會改變一切嗎?”而是“我們如何利用 AI 更好地完成我們的工作?”這將決定未來幾年 AI 領導者與落后者的區別。
企業網D1net(hfnxjk.com):
國內主流的to B IT門戶,旗下運營國內最大的甲方CIO專家庫和智力輸出及社交平臺-信眾智(www.cioall.com)。旗下運營19個IT行業公眾號(微信搜索D1net即可關注)。
版權聲明:本文為企業網D1Net編譯,轉載需在文章開頭注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。