數字經濟時代,數據成為提高生產力、發展生產力的關鍵要素,蘊含著巨大的使用價值與潛能。因此,對當今企業而言,對數據的挖掘與利用均被放到了非常重要的戰略位置,與此同時,企業也紛紛采用BI商業智能系統作為實現數據價值的有力工具,用以整合企業內外部海量數據,提高數據分析質量與效率,為具體業務進行賦能,為企業決策提供支撐。而將自然語言處理(NLP)技術引入BI系統,帶來的不僅是人機交互方式的變革,更是數據分析質量與效率的躍升。
什么是NLP?
NLP全稱Nature Language Processing,即自然語言處理,它是與自然語言的計算機處理有關的技術統稱。為了便于理解,其實可以分開來看,“自然語言”是指人與人之間書面或口語交流的形式;“處理”則是指利用計算機對數據進行理解和分析。因此,自然語言處理實際上就是指讓計算機理解人類語言,并進行相應的分析;其目標是讓計算機/機器在理解語言上像人類一樣智能,進而彌補人類交流(自然語言)和計算機理解(機器語言)之間的差距。
NLP,是人工智能領域中的重要方向之一,被譽為人工智能皇冠上的“明珠”。雖然它聽起來似乎很高深,但實際上早已與我們的生活息息相關。比如,我們所熟知的蘋果Siri、微軟Cortana (中文名:微軟小娜)、谷歌Assistant、亞馬遜Alexa等智能語音助手,以及公共場所里對答如流的智能服務機器人等,就是自然語言處理的典型應用。正是有了自然處理技術的加持,它們不僅能夠理解我們所說的話,還能夠針對性地做出反饋。
不過,自然語言處理技術的應用場景卻絕非僅限于我們所熟知的語音識別領域,在信息檢索、數據整合等領域也同樣擁有廣泛的應用場景。比如,在信息檢索領域,自然語言處理能夠大大提高檢索的精準度,而且能夠促使檢索引擎更加精準地理解用戶的需求、更加智能化。比如,當你在搜索引擎中搜索 “今天冷嗎?”,百度、360等主流的中文搜索引擎不僅會在結果頁顯示與搜索關鍵詞相關的網頁信息,更會在顯要位置以圖表形式直觀地展示當前所處城市的實時及未來的天氣情況,而這背后實際上就有自然語言處理技術的身影,這也使得信息檢索與獲取變得更加方便快捷。在數據整合領域,自然語言處理技術則能提高數據處理的質量、優化輸出指令等;也正因如此,自然語言處理技術之于實現數據價值的有力工具——BI而言,也變得越來越重要。
為什么NLP技術對BI而言越來越重要?
在研究咨詢機構Gartner發布的2020年和2021年現代分析與商業智能平臺應具備的關鍵功能中,自然語言查詢(Natural Language Query,NLQ)和自然語言生成(Natural Language Generation,NLG)連續兩年被納入其中。自然語言查詢,即允許用戶在搜索框中鍵入或說出字詞來提問,查詢數據和分析內容。自然語言生成,即自動創建對數據中發現的見解的豐富語言描述;在分析上下文中,當用戶與數據交互時,描述會動態變化,以解釋關鍵發現、圖表、儀表盤的含義。這也意味著,在現代分析與商業智能平臺中,NLP技術被放在了很重要的位置。
2020年和2021年現代分析與BI平臺應具備的關鍵功能(來源:Gartner)
與此同時,一些市場主流的BI廠商也已經發現了NLP這項技術的好處,并將NLP技術與功能添加到其BI產品中,以改善用戶體驗。
那么,為什么NLP技術對BI而言越來越重要呢?在筆者看來,一方面在于自然語言處理技術所帶來的人機交互方式的變革,進而帶來更低的使用門檻;另一方面也在于自然語言處理技術所帶來的更加高效的數據分析。
在NLP技術應用于BI系統之前,在人機交互方式是“人適應機器/計算機”,也就是BI用戶需要通過編程、建模等方式,用機器懂的語言來進行數據的探索和分析,這就帶來了很高的使用門檻,也正是如此,BI常常被調侃為IT專業人員、數據分析師以及數據科學家的數據分析工具。雖然此后為了降低使用門檻,BI也朝著“低代碼”的方向發展,但低代碼并非無代碼,一旦涉及到編程仍需IT專業人員的協助,在交互方式上也依然是“人適應機器”。而在NLP技術應用于BI系統之后,在交互方式上則是“機器/計算機適應人”,大大降低了使用門檻,用戶無需學習機器的語言,只需使用自己所熟悉的語言即可進行數據的探索與分析,從而實現“數據民主化”,BI也由此轉變為“人人可用的數據分析工具”。
此外,將NLP技術與功能添加到BI產品之中,也相當于增加了一個智能私人數據助手,其實現的界面與我們所熟知的智能語音助手或服務型聊天機器人類似,能提高數據分析的效率與質量,使BI更具洞察力。它能驅動各種應用,結合商業智能分析滲入業務的方方面面,任意時刻都能提供數據驅動的處理,使得基于數據提出問題并得到答案,如求助萬能的朋友圈一樣簡單。
想象一下,你只需在BI系統中,與聊天機器人對話般向BI系統提出問題,如“XX產品近三個月的銷售額如何?”XX分公司過去一年的銷售目標達成率如何?”,無需多年的數據分析經驗,無需熟悉BI系統的操作方式,也無需擔心提出的問題機器是否能理解,BI系統即能根據所提出的問題自動創建和生成圖表,并添加豐富的自然語義描述,對數據的探索、分析與洞察將變得何其簡單!而實際上,正是有了自然語言處理技術與功能的加入,以上所描述的場景正在變成現實。
“觀哥”全中文NLP數據分析智能助手,自由探索數據價值
正是看到了自然語言處理技術在BI系統中的應用價值,上海亦策軟件在其新一代增強智能協同BI平臺——觀數臺中,已融入了自然語言處理技術與功能,并推出了觀數臺機器人“觀哥”。
觀數臺機器人——觀哥Data Buddy
觀數臺是亦策軟件擁有自主知識產權,專為中國企業量身定制的本土化、輕量級、可嵌入的商業智能(BI)平臺,具有數據自動化、增強智能和無處不在的嵌入式分析的特點,為用戶提供了相關的洞察分析和可視化,供用戶進一步考慮和探索。而觀數臺機器人——“觀哥”則是亦策軟件推出的全中文NLP數據分析智能助手,其作為觀數臺平臺的主要組件之一,可提供中文自然語言理解、意圖識別的人機交互應用場景,支持上下文關聯查詢,幫助用戶自由探索數據價值。有了“觀哥”的協助,數據可智能呈現,想到即看到;同時也不再提前固化用戶的數據關系和查詢思維,用戶可隨心所欲隨查隨看。觀數臺機器人“觀哥”具有以下特點與功能:
全面支持中文自然語言:“觀哥”可以接受中文命令提示,實現自由中文對話,并提供中文幫助文檔。在查詢過程中,“觀哥”的中文提示可幫助用戶更精確地分析數據。在自由對話的中文場景中,“觀哥”提供預測、上下文關聯和郵件推送等功能,用戶在與“觀哥”進行對話時,無需選擇應用,直接輸入對話,“觀哥”即可預測應用;完成對話后,“觀哥”也能預測用戶還想查看的數據;而且,“觀哥”也附帶記憶,可以記住用戶上下文所說的對話內容,同時“觀哥”也能將圖文報告通過郵件發送給指定用戶。中文幫助文檔則可幫助企業零成本培訓員工。
觀數臺“觀哥”界面示例
完善的后臺管理:在后臺管理界面中,管理員可進行一鍵數據訓練和一鍵NLP發布,應用數據級的安全配置,設置個性化維度及度量,添加常用交互反饋(如“方言化”交互),并可與社交通訊工具集成。
個性化助手:“觀哥”可提供預警提醒、可客制化即時報告模板、PDF報告分發以及其它開放API等。
開放性平臺:“觀哥”不僅支持企業內部應用系統(如BI/CRM/OA等)、企業APP(手機客戶端需支持API接口)、社交軟件(如微信/釘釘等)等豐富的API接口,而且支持Python/.Net Core源碼級別二次開發,從而可進行引擎優化、功能模塊開發(如加入語音識別功能模塊等) 、私有化SMS/內部消息開發等。
全平臺部署模式:“觀哥”既支持云端部署,也支持企業私有化部署。在云端部署方面,既支持基于AMS云安全模式;也支持與觀數臺數據分析集成,提供一站式體驗。在企業私有化部署方面,“觀哥”可運行在Windows Server、Cent OS、Fedora、Debian、Ubuntu、Linux Mint、OpenSUSE、SUSE Linux Enterprise Server(SLES)、Alpine Linux等多種操作系統環境中。
總的來說,依托于亦策軟件專業的開發團隊、大數據科學家團隊和AI科學家團隊,專業的數據分析與知識,深厚的數據分析項目經驗,以及龐大的客戶群體,觀數臺機器人“觀哥作為全中文NLP數據分析智能助手,具有中文理解準確,響應速度高;行業經驗充足,語料庫完善;推薦關注精準,自帶行業性;數據訓練技術成熟;能與主流數據分析產品深入集成等諸多優勢。
如今,觀數臺作為新一代增強智能協同BI平臺,已經在制造、零售、醫藥、教育、金融、航空與物流等眾多行業與領域得到廣泛應用,而觀數臺機器人“觀哥”作為觀數臺的主要組件之一,不僅大大改善了人機交互方式,降低了使用門檻,而且也顯著提高了數據分析效率與質量,進而賦能各行業客戶自由探索數據價值,為其帶去更加精準的分析建議與決策。