每個IT問題都有學習曲線和臨界點,以及頓悟時刻-即當解決方案出現時。在人工智能項目中,我也經歷過同樣的事情;例如我意識到AI與傳統軟件編程的邏輯有多么不同時。隨后我形成AI思維模式,讓我可以真正開始使用AI。
隨著AI成為各行各業的標準,你的企業也需要這樣做。
AI有時被稱為“軟件2.0”,因為它的編程方式完全不同。我們必須讓計算機自己學習,而不是告訴計算機做什么。為了使其“更加智能”,我們??必須為其提供更多更好的培訓數據。然后通過檢測數據集的模式,AI可以“編程自己”。
基于此,我們有時很難知道AI真正學到了什么。有些情況下,AI被訓練為檢測綿羊,而實際上學會了檢測草,或者AI被訓練為通過面部來檢測罪犯,而實際上只是微笑檢測器。當然,這些都是極端的例子,但是,那些不太容易出錯的情況其實更糟糕,因為它們將我們的種族或性別偏見帶入AI的決策算法,而這更難被發現。
因此,正確訓練人工智能非常重要。以下是有關如何開始使用AI的三條建議。
對于人工智能能為你的企業做什么以及不能做什么,設置合理的期望
在開啟AI之旅前,首先需要設置合理的期望,對于AI可以為你的企業做什么。
不幸的是,媒體和廠商圍繞人工智能的炒作使企業得很難設置合理的期望。例如,對于AI災難的警告,例如,AI比人類更加智能,會導致誤導的期望,而當未實現預期時,會導致整個項目失敗。
大多數項目都會根據人類在相同情況下的表現來衡量人工智能的準確性。例如,神經網絡檢測癌癥的準確率高達94%,超越人體放射科醫師。當然,醫療行業特別敏感并且需要超精確的人工智能,這種案例并不適用于很多其他行業。例如,視頻推薦引擎有80%的準確率已經很不錯,其他項目可能只需要準確率為30%至40%即可。
人工智能驅動的數字體驗平臺Bloomreach的首席技術官Xun Wang表示:“即使AI只提供2%的提升或只有30%的準確率,可能已經足夠好。這里問題不在于它是否足夠好;而是如何在更大的系統中利用AI技術或組件來實現某種增量提升。”
因此,衡量標準不是人工智能的準確率百分比,而是人工智能對你的業務有多大幫助。你不應該期望AI完全取代你的員工,真正的衡量標準應該是它如何增強他們的工作,使他們的工作更容易,提高他們的準確性并節省他們的時間。
發現企業數據中的價值
要開始使用AI,你需要數據–質量數據。在AI中對良好數據(以及大量良好數據)的需求似乎顯而易見,因為這是一種需要數據的技術。但令我驚訝的是,通常會遺漏數據收集步驟。
我認為這是因為IT專業人員還沒有AI思維模式。要培養AI思維模式, CIO需要研究他們的業務流程,發現他們收集(或需要收集)的數據,并找到相應地通過AI優化或改進業務的方法。
這些數據可能位于你的CRM、網站分析日志或支持服務單中。通過AI思維模式,你將開始以不同的方式思考這些數據。重要的不是數據的內容,而是你可以從中提取的模式和特性。
對于“數據”,我們并不僅僅意味著人口統計或上網行為。 AI非常愚蠢,因為它不知道它自己的作用,但它在檢測我們無法想到的模式方面卻又非常聰明。雖然AI缺乏人類理解,但它的計算速度可以彌補這一點。 例如,在自然語言理解領域,研究人員已經為AI提供了數十億字節的文本。他們的目的是讓AI找到單詞之間的相似性和關系 – 例如,“女人”和“男人”之間的關系,與“女王”和“國王“之間的關系結構相似。7月初,科學家利用這種機制研究了大量科學文摘,以發現以前被忽視的化合物。
當你開始使用AI,你會看到每個“數據湖”都可作為AI優化機會:你擁有構建塊數據;添加AI使你可以探索數據以挖掘其潛力。例如,我們可以開發支持系統,在客戶或用戶向運營商報告問題前,根據他們正在編寫的內容,而不僅僅是觸發器關鍵字,向客戶或用戶推薦解決方案。或者通過情緒分析,檢測客戶問題的嚴重性,并相應地將高級員工分配到更緊急的案例中。
當然,在某些情況下,你會發現需要AI,但你沒有必要的數據。在這些情況下,你可以開始在內部收集數據,也可以從第三方來源獲取或購買必要的數據,以便更快地開始使用。
從簡單算法開始并保持在正確的軌道
當你開始使用AI時,重要的是從小處著手。
市場情報提供商TeqAtlas公司聯合創始人兼總裁Ruslan Gavrilyuk表示:“從克服慣性方面障礙最少的流程以及允許跟蹤最佳結果的流程開始。從小處著手,一次自動化一個流程,并僅在出現可見結果后才繼續。”
從小處著手的原因之一是需要訓練AI。沒有什么比花費數小時訓練AI而最終結果不盡人意更令人沮喪。因此,更簡單的算法(訓練速度更快)可更好展示你是否處于正確的軌道。
Gavrilyuk繼續道:“請記住,獲得可見結果需要時間,更不用說投資回報率了。”第一次運行時不要嘗試啟動深度學習或卷積網絡。
同樣,你的AI團隊必須準備數據,這說起來容易做起來難。在BI領域中使用經常引用的格言:“無用輸入,無用輸出”。在抓取網頁時,很容易從側邊欄獲取廣告或注釋,這與主頁的內容完全無關。同樣,數據的質量很重要。當Open AI訓練其“怪異”的GPT-2模型時,它只依賴于Reddit上有高投票的文章。
即使在訓練期間,你的AI開發人員也應該了解AI模型如何理解數據。例如,垃圾郵件過濾引擎可以顯示最有可能被它視為垃圾郵件的內容-快速查看幕后情況可顯示AI是否在正確的軌道。
只有在數據干凈,并且AI模型和算法得到很好理解后,AI開發人員才應該嘗試優化它,通過轉向更高級的算法,例如卷積神經網絡或遞歸神經網絡。到那個時候,Gavrilyuk建議你“租用計算能力和存儲,而不是購買和維護它”。
現在是時候開始AI之旅
根據TeqAtlas的研究顯示,人們對AI應用缺乏了解。文化障礙阻礙著企業部署人工智能,因為很多企業領導要么將技術視為消除其工作的競爭對手,要么無法信任地將控制權移交給機器。
然而,人工智能是非常棒的技術,而且非常必要,特別是隨著競爭的加劇。如果你知道開啟AI之旅的要求是什么、你應該設置怎樣的合理期望以及如何實現這一目標,你就會知道如何利用這項新技術的力量,而屆時這種興奮將轉化為業務成果。