對于正在意識到圍繞其業務具有大量非結構化數據的企業高管來說,人工智能在文本分析方面不受語言限制的可能性是一個至關重要(但很容易被忽視)的問題。
畢竟,非結構化數據(UD)并不是以電子表格等格式結構化的數據,通常是在各種社交媒體、博客、網站評論、呼叫中心電話、私人聊天等的大量數據——而這些數據對于有興趣改善客戶體驗(CX)的企業來說意味著具有更多價值的大量資源。
大多數數據都是非結構化數據。根據麻省理工學院的估計,如今80%~90%的數據是非結構化數據,并且正在快速增長。而這一事實意味著,客戶的所有意見都可以供那些投資于技術和專業知識的企業進行整理和分析。
這是文本分析人工智能發揮的作用。這導致在任何平臺上對企業品牌發表評論的每一位客戶都可以前所未有地了解他們的想法、觀點和想法。它可以讓企業準確而快速地發現優先解決的客戶痛點,從而減少客戶流失。
鑒于這種普遍性,認識到語言不可知論的價值就顯得尤為重要。將分析和注釋僅限于英語的觀點(當其他觀點存在時)會破壞非結構化數據的規模和這種文本分析的普遍性。
因此,有必要了解多語言人工智能分析的工作原理,以及其收集客戶意見綜合概述的潛力。
自然語言處理的力量
人工智能驅動的文本分析的基礎是機器學習(ML)和自然語言處理(NLP)的結合。
機器學習是一種旨在模仿人類學習的人工智能方法。雖然傳統的編程需要執行人類創建的規則,但機器學習使用數據分析來學習可用于推斷的極其復雜的模式,這使得機器學習非常擅長解決問題和執行復雜的任務。
與此同時,自然語言處理(NLP)屬于處理語言。實際上,它可以理解為是機器學習支持的復雜任務之一。
在這種情況下,自然語言處理(NLP)的用途是多種多樣的。它可以用于更簡單的目標,例如計算給定的術語或單詞在文本中出現的頻率。或者可以承擔更艱巨的挑戰,即確定給定文本的情緒甚至情感。
顯然,這兩者對于希望詳細了解所有可用客戶意見的企業都有很大的用處。
自然語言處理(NLP)的這些用途使企業能夠評估大量數據,以發現他們的品牌在網上或線下被談論的頻率,以及了解是積極的還是消極的評論,還是與一系列更細微的情緒有關。
多語言的方法
至關重要的是,這種方法的好處在于其包含所有客戶意見的能力——文本分析適用于每種意見,而不是樣本或選擇。
然而,為了實現這一目標,不能限制表達給定意見的語言,而是需要人工智能完全與語言無關,特別是如果一家企業是跨國組織的話。
可以通過使用無監督和有監督的機器學習來實現這一點。監督機器學習意味著所涉及的算法由人類對訓練數據進行注釋“訓練”,在涉及大量數據(也稱為大數據)的任務時,人工智能可以比人類做得更好。
為了確保滿足所有語言的需求,研究人員利用了一個由大約300名以各種語言為母語的人員組成的團隊,他們對非結構化數據進行閱讀、理解和人工注釋。例如,確定某條推特是正面還是負面的,其主題是否存在諷刺意味,甚至是電子郵件或聊天消息的內容所暗示的客戶旅程。
一旦人工智能接受母語訓練(不需要翻譯成英語和使用英語的機器學習模型)以非常準確地實現其目標(無論是建立情緒還是識別主題),其結果可以很容易地使用英語可視化,以客戶可以理解的語言為客戶體驗(CX)專業人員、客戶保留經理等解鎖所有客戶的意見。
最重要的是,人工智能精度還可以不斷提高。例如,當一個人用某種情緒對一小部分推文進行注釋時,就可以衡量其準確性。可以看到80%~90%或更多內容與算法匹配,無論這些推文是用什么語言寫的。
考慮到表達情感的主觀性,這表明這些人工智能技術已經變得多么強大。
在非結構化數據中大海撈針
非結構化數據(UD)無處不在,它代表了一個了解所有客戶意見的機會,而不是像民意調查那樣,根據定義只能提供基于樣本的客戶意見。
然而,為了真正實現這種不受限制地獲取消費者意見的能力,跨國公司不僅需要聘請人工智能專家和技術人員,還需要確保他們的人工智能系統在所有相關語言的數據上都得到與英語相同的高精度訓練。
這樣一來,文本分析不僅與源無關,而且與語言無關。讓企業領導可以自信地斷言,他們對客戶的觀點、痛點和收獲點的理解是詳細、精確以及全面的。
版權聲明:本文為企業網D1Net編譯,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。