現在大數據技術這個話題火熱程度已經逐漸開始取代云計算了,好像現在我們平常的任何事不與大數據扯上關系就落伍了,我們先來大致普及一下,現在常說的大數據技術指的是無法在一定時間內用傳統數據庫軟件工具對其內容進行抓取、管理和處理的數據集合。
近些年,隨著數據產生的成本急劇下降,我們日常使用所產生的數據量也正在呈指數倍的增長,其中80%以上都是傳統數據庫無法處理的非結構化數據,根據IDC的權威監測數據顯示,全球已經從2010年就已經正式進入了ZB數據量的時代,并且預計到2020年開始,全球將總共擁有35ZB的數據量,如果把35ZB的數據全部刻錄到容量為9GB的光盤上,其疊加的高度相當于在地球與月球之間往返三次。
隨著近些年大數據在醫療服務、公共管理、政府關系以及交通、教育等等很多行業進行了廣泛的應用,讓我們已經能夠切身感受到數據的巨大能力,有業內專家曾經表示,大數據對于未來客戶服務行業來說將會帶來一場巨大變革,也將會給客戶帶來極大的想象空間和無限的發展前景,甚至將會讓客服部門從原來的成本中心轉換為利潤中心,這其中究竟如何轉換,究竟有哪些關鍵步驟,本期我們將詳細分析。
語音客服更智能化
目前,通信運營商在客服領域比較先進的企業已經實現了智能文字客服,通過文字識別技術和智能匹配算法對通過短信和網站文字客服提出的服務訴求進行智能匹配答案,不需人工判斷,要實現智能語音客服,也要通過識別和匹配這兩關。
早在Siri之前,就已經有很多語音識別工具問世,最早的基于電子計算機的語音識別系統是由AT&T貝爾實驗室開發的Audrey語音識別系統,它能夠識別10個英文數字,現在AT&T的語音系統Watson已經可以實現在線德語和英語的實時口譯。
算法是軟件的核心,目前的語音識別算法使用的語言模型仍是一種概率模型,還未發展成以語言學為基礎的文法模型,算法不突破,效果無法取得突飛猛進的進展。算法的優化不是一朝一夕的事情,需要慢慢不斷地進行,尤其語音這種非結構化數據,有了大數據,我們就可以對一些核心算法的特征進行提取和分析,并且通過一些搜索等技術對算法的結果進行更為強大的支撐。
由于方言、語氣、環境和音色等因素的影響,限制了語音識別算法的效果,這就需要語言識別系統具有一定的自適應性,不同口音、方言的識別都需要以一個龐大的語音數據庫為基礎,對這些非結構化數據的管理分析就更加指望大數據技術了。
隨著數據源越來越多,大數據技術的不斷進步,語音識別系統也在持續地完善之中,說到底,算法依然是核心,而數據則是基礎,對于這類非結構化數據,也許傳統的數據庫技術無法滿足,但大數據技術卻可以完全勝任。
語音轉換怎樣更準確?
對于任何企業的call center來說,對于工作人員的語音識別都是至關重要的,客服人員日常與客戶的電話溝通都是需要進行錄音的,這樣一來所產生的數據量是十分龐大的,僅以廣東移動為例,廣東移動客服中心每年就要新增約60TB的數據存儲,這個體量對于一般的企業來說已經是“大數據”了。
有人會質疑這些錄音是為了便于追溯留證的,不是原始的錄音記錄,客戶不認賬怎么辦?當然對于企業來說,也不是所有的錄音都需要被轉換成文本文件,對于客戶投訴或辦理業務的來電,仍然保留錄音記錄,一則便于企業對客服人員的服務態度進行監督,二來也是為了備份留存。
企業將大量的語音數據轉換成文本信息之后進行存儲,雖然減少了存儲的空間,但是這些文本數據還可用于后續的信息挖掘,用來改進服務或發現商機,畢竟文本的信息分析要比語音的容易得多。
擴展一步:用戶資源輕松挖掘
在當今的IT行業,數據成為了我們日常的核心資源,對于企業來說,利用數據來對用戶信息進行挖掘和分析已經變成了家常便飯,比如用戶的地域分布、購買能力、使用習慣等等,都是有助于提升企業利潤的有效途徑。
而客服部門作為企業前端的客戶直接接觸窗口,每天都可以從客戶身上獲取大量的信息,甚至可以在客戶比較滿意的時候,主動獲取一些愛好、職業等信息,積少成多,某些時候,這些數據將為企業創造巨大的價值。
對于用戶信息的挖掘現在也已經有很多企業開展這種服務,比如通過數據的挖掘,可以發現哪些用戶是高爾夫球愛好者,進行精準營銷,避免盲目營銷導致的客戶反感及投訴。以及像類似通過定位系統讓個人位置信息成為客戶服務領域待被開采的金礦等等。當然企業的這些數據收集和分析功能必須是要建立在保護和尊重用戶個人隱私前提之下的。
編輯的話
本期我們聊了大數據在客戶服務方面的大量應用,其實不單單是客服,對于企業來說,產品、技術、銷售等等很多環節現在都開始利用大數據技術進行更加精準高效的運營,數據在行業用戶當中的應用范圍也在飛速擴張,當然,對于我們這些個人用戶而言,大數據也同樣重要。