數據科學民主化:數據科學家過去往往要準備幾個月的東西,數據嗅覺明銳的業務用戶只要幾天的時間就可以整合在一起。
那些想履行諾言,將機器學習用于數據分析的公司正在求助一個看似愛莫能助的老朋友。它們正在用人工智能對商業智能系統(主要是分析過去績效的領域)進行改進,使其報告功能具備預測的功能。
Symphony Post Acute Network就是這樣一個組織。該醫療公司在伊利諾斯州、印第安納州和威斯康星州的28家醫療機構中擁有5000張床位,它希望每年都能利用人工智能和機器學習改善護理,以惠及8萬從膝蓋手術或透析治療中康復的患者。例如,如果人工智能深挖患者的病歷根源可能會發現患者因跌到而危及生命的風險特別高,因此需要額外的預防措施。
如果這些有可能是個人數據點或細微數據模式的指標得以發現的話,它們就是機器學習的理想用例。但是建模并非易事。
Symphony的數據科學兼分析主管Nathan Patrick Taylor說:“人們連珠炮似地問我關于預測的問題。即使我把所有的時間都用來建模,我也分身乏術。”
因此公司聘請了兩名數據科學家。Taylor說:“而且他們身價不菲,但是我們并沒有因為他們的加入而得償所愿,這真是費力又燒錢。”
所以兩年前,Symphony開始另辟蹊徑,去找那些已經擁有機器學習模型并萬事俱備的供應商。現在,該公司用采用了數據倉庫中已收集的數據,用供應商DataRobot的基于云計算的人工智能引擎來發送數據,結果則以每隔三小時的頻率反饋回公司的Microsoft PowerBI儀表板。Taylor說:“我立即就明白了,我的首席信息官也明白了,我們驚訝極了。這看起來很神奇。”
今天,240名醫生和護士在PowerBI儀表板中獲得了預測和建議,他們可以通過平板電腦和智能手機查看這些儀表板。因此,例如,容易摔倒的患者會自動標有樓梯圖標。很可能再次入院的患者則標有救護車圖標。
將人工智能注入商業智能
Taylor說,再入院率對Symphony來說非同小可。醫院和保險公司會考察再入院率,每次再入院都會花掉公司13,500美元。他說:“這不是一筆小錢”
為了確定DataRobot的預測是否有用,Symphony最初只將DataRobot的反饋推廣到一部分設施,并進行了為期6個月的研究,以了解再入院率是否有差異。他說:“如果你能做到1%的變動,那你干得真漂亮。”
Taylor說,比率確實得到了改善——從21%下降到18.8%。他說:“這是一個顯著的進步,這贏得了我們的首席執行官的支持。”
如今,該公司開始用同樣的方式來考察與保險公司簽署的合同。他說:“如果我們不能很好地為服務計費,就會錯過很多利潤。”
初始安裝大約需要20個小時的時間,包括連接數據饋送和建立學習模型。現在,如果有人想要新類型的預測,一個全新的學習模型大約需要六到八個小時的時間才能建立起來,他說,在三個工作日的不同時段完成。
此外,他說現有模型可以隨時得到再訓練。例如,法規可能會發生改變,或者醫務人員可能會開始使用新程序。另外,一個模型可能會隨著時間而發生改變。Taylor每隔兩個月就重新訓練模型,或者每當有重大的政策轉變時就這么做。如果發生重大變化,那么學習模式可能只需要在新政策生效后提供的數據上進行培訓。
他說,管理系統不再需要訓練有素的數據科學家,但它確實需要具有統計基礎知識的人員。 Symphony還使用R代碼來架設模型。
DataRobot開箱即支持Python。據DataRobot的產品營銷總監Colin Priest稱,使用其它語言的客戶還可以使用任何能理解Rest API的語言(包括Java,C#,SAS,JavaScript和Visual Basic)來調用DataRobot Rest API。
人工智能的下一步是自助式服務
Forrester Research的副總裁兼首席分析師Boris Evelson說:“人工智能已經民主化。直到不久前,它還需要一名數據科學家來編寫代碼,現在,有了這些商業智能系統,我點擊幾個數據點就能選擇我要預測的變量,比如客戶的購買傾向,而且這些預測模型會自動生成。”
他說,過去需要數據科學專家數月才能完成的東西,現在理解數據并使用Excel的人幾天就可以整合在一起。
他說:“營銷人員正在利用這一點來預測客戶行為并據此采取行動,業務管理者正在使用它來考察和預測風險,供應鏈人員正在利用它來查看和優化物流。”
Forrester最近對全球決策者的調查稱,改進數據、分析或洞察平臺在人工智能技術的用例中位列三甲。所有主要的商業智能供應商(包括IBM,甲骨文和微軟)都致力于此。
如果八小時的時間聽起來太長,無法建立一個新的機器學習模型,你還有更多的選擇可用。不久之后,用戶就能自動獲得最常見的預測類型,獲得推薦,并擁有內置圖像識別和自然語言處理功能,因為Gartner預言,自然語言生成和人工智能將成為一個標準功能,為未來兩年內90%的現代商業智能平臺所具備。
為文本和可視化分析配備商業智能
SpringBoard.ai的首席執行官Bruce Molloy說,用戶需要信息時可以直接用英語提問,自然語言處理使這成為現實。“我認為這是自然的演變。”
他說,領域越狹窄,可供平臺使用的數據的相關性越高,供應商就能更輕松地添加人工智能功能。會計平臺或Salesforce等客戶關系管理系統已經擁有了它們所需的數據,而且有些問題用戶很可能會提問。他說:“有了Salesforce,看看人們會做什么,這會很有趣,Salesforce已經受到了限制,而且工作已經完成了一部分,人們已經確定這些想法很重要,他們可以在這些想法上對人工智能功能進行分層。”
增強的處理能力、更智能的算法、云計算和標準接口推動了人工智能的應用。例如,DataRobot同時利用了云計算和標準Rest API,這使它除了能支持Trifacta、Alteryx和Domino Data Labs的商業智能系統外,還支持PowerBI、Tableau、Qlik、Exce、R Shiny和很多其它的儀表板。
由人工智驅動的商業智能儀表板也可以處理比以往更廣泛的數據種類。例如,Symphony不只是看病人記錄中的具體數據,還會看醫生和護士的病人病程記錄。
咨詢公司Publicis.Sapient的全球數據兼人工智能主管Josh Sutton說,有很多信息以非結構化格式保存,這些信息可能會產生有用的見解或預測。這不僅僅是文本那么簡單。
Sutton說:“作為商業智能來源的非結構化數據的最大來源之一是視覺圖像。例如,營銷部門可以根據他們在社交媒體上分享的照片分析他們的客戶如何與產品互動,從中受益。
超越描述性分析
但預測和洞察只是人工智能得以添加到商業智能儀表板的第一步,International Data公司的認知和人工智能系統研究總監David Schubmehl這樣說道。人工智能驅動的儀表板還可以提供建議,或為用戶下一步應該采取的具體措施提出建議——甚至向用戶提供能采取這些措施的建議。
他說:“如果微件(widget)的銷量下降,這可能會說明這對未來意味著什么,以及你現在應該怎么做。”
這使得商業智能更有價值。
他說:“我認為這就是這么多人采用這種工具的原因”。例如,Salesforce剛剛發布了一項重大聲明,稱其Einstein最近在預測性智能方面做出每天逾10億次的預測,這些預測性智能幫助人們做成新業務,發現新的業務線索并創建面向行動的功能。我認為這表明人們需要的不僅僅是描述性業務分析。”
他說,我們仍處于早期階段。“在接下來的兩三年內,我們可能會完全成熟,人們才剛開始理解人工智能和機器學習的潛力。”
埃森哲負責人工智能的資深負責人兼全球負責人Rumman Chowdhury說,特別是人工智能仍然不具備常識。
她說:“我們處在弱人工智能(narrow AI)的世界”。即使特定平臺內置了人工智能模型并可以隨時得到使用,用戶仍然要了解正在使用的數據及其與手頭問題的相關性。
她說:“你必須確保它適用于你所得到的輸出,我不知道我們是否會完全取代某些領域的人為判斷,我不知道我們是否能夠實現真正的決策自動化——即便我們必須知道。”
版權聲明:本文為企業網D1Net編譯,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。