每個人都對AIGC算法的方式感到驚訝,它可以產生任何風格的令人驚嘆的藝術作品,然后立即用很棒的語法寫出長篇文章。每個CIO和CEO都有一張或三張幻燈片,準備討論AI將如何改變他們的業務。
這項技術仍處于初級階段,但其能力已經不可否認。下一波計算將涉及AIGC,可能會出現在工作流程的幾個地方,趨勢將是勢不可擋的。
有什么可能出錯?嗯,很多事情。末日預言者想象著經濟的徹底毀滅和人類的奴役。
即使最糟糕的情況永遠不會出現,也不意味著一切都會完美。AIGC算法仍然非常新,發展迅速,但仍有可能在基礎上看到缺陷。深入研究這些算法,你仍然會看到它們無法兌現的地方。
以下是AIGC算法的7個黑暗秘密,在計劃如何將該技術整合到你的企業工作流程中時,請記住這些秘密。
它們憑空制造出錯誤來
大型語言模型撰寫1000字的文章的方式幾乎是神奇的,這些文章涉及一些晦澀的主題,比如沙鶴的交配儀式,或者17世紀東歐建筑中隆起的重要性。但同樣的魔力也使他們能夠無中生有地創造錯誤。他們正在游蕩,用受過大學教育的英語專業學生的能力來搭配動詞和語法。許多事實是完全正確的。然后,瞧,他們只是編造了一些東西,就像一個四年級的學生試圖假裝它一樣。
大型語言模型的結構使這一點不可避免。他們使用概率來了解單詞是如何組合在一起的。偶爾,這些數字會選擇錯誤的詞。沒有真正的知識甚至本體論來指導他們。這只是機率,有時擲骰子會出問題。我們可能認為我們正在與一個新的上級生物融合在一起,但我們真的和拉斯維加斯的賭徒沒有什么不同,在賭場上,我們在擲骰子的序列中尋找信號。
它們是數據篩子
人類試圖創造一個復雜的知識層次結構,其中一些細節是內部人士知道的,一些是與每個人分享的。這種一廂情愿的等級制度在軍方的分類系統中最為明顯,但許多企業也有這種等級制度。對于IT部門和管理這些層次結構的CIO來說,維護這些層次結構通常是一件非常麻煩的事情。
大語言模型在這些分類方面做得不是很好。雖然計算機是終極規則的追隨者,它們可以保存幾乎無限復雜的目錄,但大語言模型的結構實際上不允許某些細節保密,一些細節可供共享。這一切都是馬爾可夫鏈上的概率和隨機游動的巨大集合。
甚至還有令人毛骨悚然的時刻,大語言模型會利用其概率將兩個事實粘合在一起,并推斷出一些名義上秘密的事實。考慮到同樣的細節,人類甚至可能會做同樣的事情。
也許有一天,大語言模型能夠保持強大的保密層,但就目前而言,這些系統最好是用非常公開的信息進行培訓,如果它泄露了,不會引起轟動。已經有幾個備受矚目的例子涉及公司數據泄露和大語言模型護欄被繞過。一些公司正試圖將AI變成一種阻止數據泄露的工具,但我們需要一段時間才能理解做到這一點的最佳方式。在此之前,CIO們可能會更好地對提供給他們的數據進行嚴格控制。
它們助長了懶惰
人類非常擅長信任機器,特別是在它們節省工作的情況下。當大語言模型在大多數情況下證明自己是正確的時,人類開始一直信任他們。
即使要求人類仔細檢查AI,效果也不是很好。在人類習慣了AI是正確的之后,他們開始迷失方向,相信機器會是正確的。
這種懶惰開始充斥整個企業。人類停止為自己思考,最終企業陷入低能量停滯,沒有人想要跳出框框思考。它可以放松和沒有壓力一段時間-直到競爭出現。
它們的真實成本是未知的
沒有人知道使用大語言模型的正確費用。哦,有許多API的價格標簽,詳細說明了每個令牌的成本,但有一些跡象表明,這一金額得到了風險資本的大量補貼。我們看到,像優步這樣的服務也發生了同樣的事情。價格一直很低,直到投資者的錢用完了,然后價格飆升。
有一些跡象表明,目前的價格并不是最終將主導市場的真實價格。租用一個好的GPU并保持它的運行可能要昂貴得多。在本地運行大語言模型S可以節省一點錢,方法是在機架上裝滿視頻卡,但這樣就失去了交鑰匙服務的所有優勢,比如只在你需要的時候才為機器付費。
它們是版權的噩夢
市場上已經有一些很好的大語言模型可以處理一般的家務,比如做高中作業或寫大學入學論文,強調學生的獨立性、干勁、寫作能力和品德--哦,還有他們獨立思考的能力。
但大多數企業沒有這些AI可以承擔的一般性家務。他們需要為他們的特定業務定制結果。基本的大語言模型可以提供一個基礎,但仍然需要大量的培訓和微調。
幾乎沒有人想出了收集這些訓練數據的最佳方法。一些企業很幸運,擁有他們控制的大數據集。然而,大多數人發現,他們并沒有解決所有關于版權的法律問題(這里、這里和這里)。一些作者提起訴訟,因為他們沒有得到關于使用他們的寫作來訓練AI的咨詢。一些藝術家覺得自己被抄襲了。隱私問題仍在解決中(這里和這里)。
你能根據客戶的數據訓練你的AI嗎?版權問題解決了嗎?你有合適的法律形式嗎?數據的格式是否正確?有如此多的問題阻礙了你創造一個偉大的、定制的AI,準備在你的企業中工作。
它們可能會被供應商鎖定
從理論上講,AI算法是一種泛化的工具,它已經抽象了用戶界面的所有復雜性。他們應該是獨立的,獨立的,能夠處理生活——或者他們所服務的白癡人類——拋給他們的方式。換句話說,作為一個API,它們不應該是僵化的。從理論上講,這意味著快速更換供應商應該很容易,因為AI機構只是會適應。不需要一些程序員團隊重寫粘合代碼,并在更換供應商時做所有會造成麻煩的事情。
然而,在現實中,仍然存在分歧。API可能很簡單,但它們仍然存在差異,比如調用的JSON結構,但真正的不同之處隱藏在深層,為AIGC撰寫提示是一種真正的藝術形式,AI并不容易讓它們發揮最好的性能,已經有一份工作描述是給那些了解這些特質的聰明人的,他們能寫出更好的提示,提供更好的答案,即使API的差異很小,提示結構中奇怪的差異也很難快速切換AI。
它們的智力仍然很淺
長期以來,對材料的隨意熟悉和深刻而明智的理解之間的差距一直是大學里的一個主題。亞歷山大·蒲柏曾寫道:“學識淺薄是一件危險的事;要么深飲,要么就不要品嘗皮埃爾的泉水。”那是在1709年。
其他聰明人也注意到了人類智力極限的類似問題。蘇格拉底的結論是,就他所知道的一切而言,他真的一無所知。莎士比亞認為聰明人知道自己是個傻瓜。
清單很長,這些對認識論的見解大多以這樣或那樣的形式應用于AIGC的魔力,而且往往在更大程度上適用。CIO和技術領導團隊面臨著一項艱巨的挑戰。他們需要充分利用生產性AI所能產生的最好效果,同時努力避免擱淺所有智力淺灘,這些淺灘長期以來一直是任何地方的智力的問題,無論是人類、外星人還是計算機。
關于企業網D1net(hfnxjk.com):
國內主流的to B IT門戶,同時在運營國內最大的甲方CIO專家庫和智力輸出及社交平臺-信眾智(www.cioall.com)。同時運營19個IT行業公眾號(微信搜索D1net即可關注)。
版權聲明:本文為企業網D1Net編譯,轉載需在文章開頭注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。