谷歌于當(dāng)?shù)貢r間周三發(fā)布了其認(rèn)為最強(qiáng)大的AI模型,該公司面臨著越來越大的壓力,需要回答它將如何通過AI盈利。
大型語言模型Gemini將包括三種不同的套件:Gemini Ultra,其最大、功能最強(qiáng)大的類別,Gemini Pro,可擴(kuò)展到各種任務(wù),以及Gemini Nano,它將用于特定任務(wù)和移動設(shè)備。
目前,該公司計劃通過谷歌云將Gemini授權(quán)給客戶,讓他們在自己的應(yīng)用程序中使用。從12月13日開始,開發(fā)人員和企業(yè)客戶可以通過Google AI Studio或Google Cloud Vertex AI中的Gemini API訪問Gemini Pro。Android開發(fā)者也將能夠使用Gemini Nano進(jìn)行構(gòu)建。Gemini還將被用來支持谷歌的產(chǎn)品,如Bard聊天機(jī)器人和搜索生成體驗,它試圖用對話風(fēng)格的文本回答搜索查詢(SGE還沒有廣泛使用)。
企業(yè)可以使用它通過聊天機(jī)器人和產(chǎn)品推薦來進(jìn)行更高級的客戶服務(wù),并為希望為產(chǎn)品做廣告的公司識別趨勢。如果一家公司想要創(chuàng)建營銷活動或博客內(nèi)容,以及想要為開發(fā)人員總結(jié)會議或生成代碼的生產(chǎn)力應(yīng)用程序,Gemini也可以用于內(nèi)容創(chuàng)建。
該公司提供了一些例子,包括展示Gemini能夠截取圖表的屏幕截圖,并分析數(shù)百頁研究報告,然后更新圖表,另一個例子是分析一個人的數(shù)學(xué)作業(yè)的照片,找出正確的答案并指出錯誤的答案。
Gemini Ultra是第一個在大規(guī)模多任務(wù)語言理解(MMLU)上超越人類專家的模型,該公司周三在一篇博客文章中表示,MMLU使用數(shù)學(xué)、物理、歷史、法律、醫(yī)學(xué)和倫理學(xué)等57門學(xué)科的組合來測試世界知識和解決問題的能力。據(jù)推測,它可以理解復(fù)雜主題中的細(xì)微差別和推理。
周三,谷歌的首席執(zhí)行官桑達(dá)爾·皮查伊在一篇博文中寫道:“Gemini是整個谷歌團(tuán)隊大規(guī)模合作的結(jié)果,包括我們在谷歌研究院的同事。它從一開始就是多模式的,這意味著它可以概括并無縫地理解、操作和組合不同類型的信息,包括文本、代碼、音頻、圖像和視頻。”
從今天開始,谷歌的聊天機(jī)器人Bard將使用Gemini Pro幫助進(jìn)行高級推理、規(guī)劃、理解和其他功能。高管們周二在與記者的電話會議上表示,明年初,該公司將推出“Bard Advanced”,將使用Gemini Ultra。
此次更新是在搜索巨頭谷歌首次推出Bard八個月后,以及OpenAI在GPT-3.5上推出ChatGPT一年后發(fā)布的。今年3月,這家由奧特曼領(lǐng)導(dǎo)的初創(chuàng)公司推出了GPT-4。高管們周二表示,Gemini Pro的表現(xiàn)好于GPT-3.5,但回避了有關(guān)它如何與GPT-4抗衡的問題。
然而,根據(jù)谷歌周三發(fā)布的一份白皮書,Gemini的Ultra模型在幾個基準(zhǔn)測試中的表現(xiàn)優(yōu)于GPT-4。
當(dāng)被問及谷歌是否有計劃對訪問Bard Advanced收費(fèi)時,谷歌Bard總經(jīng)理Sissie Hsiao表示,谷歌專注于創(chuàng)造良好的體驗,目前還沒有任何盈利細(xì)節(jié)。
在新聞發(fā)布會上,當(dāng)被問及與當(dāng)前一代的LLM相比,Gemini是否具有任何新的能力時,谷歌DeepMind產(chǎn)品副總裁伊萊·柯林斯回答說:“我認(rèn)為是這樣的”,但該公司仍在努力了解Gemini Ultraa的新能力。
據(jù)報道,谷歌推遲了Gemini的發(fā)布,因為它還沒有準(zhǔn)備好,這讓人想起了該公司在今年年初艱難推出其AI工具的記憶。
多名記者詢問了延遲的原因,柯林斯回答說,測試更先進(jìn)的型號需要更長的時間。柯林斯說,Gemini是該公司構(gòu)建的經(jīng)過最嚴(yán)格測試的AI模型,并且它擁有谷歌所有模型中“最全面的安全評估”。
柯林斯表示,盡管是最大的模型,但Gemini Ultra的服務(wù)成本要低得多。“它不僅更有能力,而且更有效率,”他說,“我們?nèi)匀恍枰罅康挠嬎銠C(jī)來訓(xùn)練Gemini,但我們訓(xùn)練這些模型的能力正在變得更加高效。”
柯林斯表示,該公司將于周三發(fā)布一份技術(shù)白皮書,其中包含該型號的更多細(xì)節(jié),但表示不會公布周長計數(shù)。今年早些時候,記者發(fā)現(xiàn),谷歌當(dāng)時最新的AI模型——Palm 2大型語言模型,用于訓(xùn)練的文本數(shù)據(jù)量是其前身LLM的近五倍。
同樣在周三,谷歌推出了用于訓(xùn)練AI模型的下一代張量處理單元。谷歌表示,Salesforce和初創(chuàng)公司Lightricks已經(jīng)開始使用TPU v5p芯片,其性價比高于2021年宣布的TPU v4,但該公司沒有提供與市場領(lǐng)頭羊英偉達(dá)相比的業(yè)績信息。
在谷歌10月份的第三季度收益電話會議上,投資者向高管們詢問了更多關(guān)于它將如何將AI轉(zhuǎn)化為實(shí)際利潤的問題。
今年8月,谷歌推出了一項名為搜索生成性體驗(SGE)的早期實(shí)驗,讓用戶看到使用搜索引擎時GenAI體驗是什么樣子 - 搜索仍然是該公司的一個主要利潤中心,其結(jié)果是更具對話性,反映了聊天機(jī)器人的時代,然而,它仍被認(rèn)為是一項實(shí)驗,尚未向公眾推出。
今年5月,Gemini首次在其年度開發(fā)者大會Google I/O上宣布了這項實(shí)驗,自那以來,投資者一直在要求SGE的時間表,Gemini周三的聲明幾乎沒有提到SGE,高管們對其向公眾推出的計劃含糊其辭,稱Gemini將“在明年”并入SGE。
皮查伊在周三的博客文章中說:“這個模型的新時代代表著我們作為一家公司所做的最大的科學(xué)和工程努力之一。我真的為未來感到興奮,也為Gemini將為世界各地的人們帶來的機(jī)遇感到興奮。”
關(guān)于企業(yè)網(wǎng)D1net(hfnxjk.com):
國內(nèi)主流的to B IT門戶,同時在運(yùn)營國內(nèi)最大的甲方CIO專家?guī)旌椭橇敵黾吧缃黄脚_-信眾智(www.cioall.com)。同時運(yùn)營19個IT行業(yè)公眾號(微信搜索D1net即可關(guān)注)。
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需在文章開頭注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。