人工智能(AI)系統的交互過程更像人類,這讓一些人感到不舒服,但人工智能并不是要取代人類。實際上,它更多的是把機器人從人類身上移除。人工智能的價值很大一部分在于自動化人工過程和快速分析大量數據,這樣人類就可以自由地完成需要理性和判斷力的高階任務。然而,要達到這一點,人工智能系統必須能夠與用戶通信并分析自然形式的數據(又稱非結構化數據),所有無法以整潔的方式打包的自由流動的數據,如語音、圖像和文本。
非結構化數據對人工智能系統的發展至關重要。人工智能系統與用戶的溝通越好,就越能自主學習,因此,它的效率也就越高。這一點很重要,因為如果一個人工智能系統只要求用戶以結構化的格式進行交互,那么它的組件將受到極大的限制。為了讓人工智能成功,它必須理解雜亂的信息。
在這種情況下,需要深入了解非結構化數據是如何發揮作用的。
非結構化數據的挑戰
在人類的世界里,當人們進行對話時,如果不按禮儀說話??赡苋魏螙|西都會出現在我們的腦海中,以某種可能遵循或可能不遵循慣例的配置。人們可能使用俚語,諷刺和開玩笑。人們把日常語言和希望傳達的信息組織成整齊的列和行是不自然的。語言本身就是非結構化的。
如果人們曾經與亞馬遜公司的Alexa進行過互動,那么就會知道雖然Echo系統通常非常熟練地理解自由格式命令,但缺乏定義的協議有時會導致問題,或者至少在Alexa嘗試回答時會產生幽默的回應查詢不適合模具。亞馬遜公司已投入大量資源和數百萬美元用于創建和永久性地改進算法,使這種類似人類的語音能夠響應命令,但正如Echo熟練解讀自由流動語言一樣,Alexa仍然存在缺陷。
Alexa示例強調了一種非結構化數據的復雜性。人工智能系統處理和創建與文本等效的數字的能力也是一項很高的要求,特別是當企業考慮細微差別和場景的重要性時。想象一臺機器試圖“理解”家庭度假中那張照片中發生的事情,或者是一部關于印象派的藝術史教科書中的圖像。
與處理非結構化數據相關的復雜性可能是企業中人工智能的最大障礙。然而,它們并不是不可逾越的。
專業知識的重要性
非結構化數據本身就是噪聲。因此,它需要大量的專業知識來突破、梳理和檢測模式,然后開發識別這些模式的模型。數據科學家正在積極推動人工智能系統的改進,最大的成功表明人類的本能和經驗是必需的。這通常發生在團隊專注于非常狹窄的人工智能應用時。
以工作人員的賠償索賠程序為例,對聲明有深入了解的數據科學家團隊可以根據他們發現的關鍵指標創建預測模型。它們包含非結構化數據,如診斷、藥物信息、索賠記錄等。這樣做,人工智能系統評估早期指標,并確定某個索賠可能被拒絕。然后它可以向用戶提供警報。索賠代表可以找出如何干預和給予特定索賠更小心,以防止索賠人的律師參與(通常被拒絕的索賠最終涉及律師,這會變得非常昂貴,需要很長時間才能解決)。
在這種情況下,很容易看出人工智能系統是如何為用戶提供幫助的,而且當合并非結構化數據時,與單獨依賴結構化數據相比,還大大提高了準確性。在非結構化數據(例如,關于共病的信息)中,有一個信息和洞察力的金礦,它無法一致地找到進入結構化數據的方法。每增加一條信息,人工智能系統就會變得更智能,結果也會得到改善。這將提高效率并降低索賠成本。
這只是將非結構化數據合并到企業人工智能系統中的一個好處示例。破解代碼需要時間和努力,但回報正在獲得前所未有的洞察力——與幾天或幾周相比,只需幾分鐘或幾小時就可以獲得。
非結構化數據是關鍵
展望未來,很明顯每個人工智能系統都需要以自然的方式與用戶交互。各組織必須對此高度重視。事實上,如果非結構化數據分析不是路線圖的一部分,那么公司的產品存在巨大的差距。
盡管非結構化數據具有挑戰性,但亞馬遜、谷歌、蘋果和其他公司為人工智能應用提供了許多機會。人們可以利用這些進步,并將它們應用到企業應用程序中,在這些應用程序中它們具有巨大的業務影響。
通過花時間應用專業知識和聲音數據科學,人們可以取得重大突破。人們不僅要通過非結構化數據提高數據分析的準確性,還要在未來實現基本的新思維、溝通和利用信息的方式。