精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

玩轉大數據 “沃森”向終極目標推進

責任編輯:editor004

2013-12-02 11:14:12

摘自:暢享網

“沃森”和“大數據”自然語言理解、找到證據、判斷,是沃森所具備的的三大能力,這種“認知計算”能力讓沃森在當前的大數據浪潮中大有用武之地。也許未來大數據應用就是那樣簡單,我們只需對著計算機、甚至是隨身的終端設備說出我們的需求,就能快速得到最準確的答案。

最近重溫了部電影,威爾史密斯主演的《I,Robot》。在故事中的時代,地球上每十五個人就擁有一臺人能智能機器人,從工作助理到家庭保姆,機器人滲透進人類生活的方方面面,它們不僅成為人類的得力工具,更成為人類家庭的一份子。

片中的機器人能夠與人類交流,理解人類意圖,甚至最終進化到能夠獨立思考,擁有人類的思想。這讓筆者想到了IBM的“沃森”人工智能計算機,雖然目前沃森和片中的智能機器人還有著不小的差距,但沃森和這些智能機器人有著相似的地方:能夠識別人類自然語言,運用人類思維特征來表達意思和作出決策——IBM將這種原則稱之為“認知計算”。

結合時下最為熱門的大數據趨勢,這種“認知計算”方式為大數據應用和分析提供了新的途徑,試想一下,當我們對著計算機說上幾句話,就能得出最想要的結果,比如“我們該在哪里開設下一家店?我去哪能買到最便宜的襯衫?這樣的癥狀應該如何診斷?…”看上去這像是科幻電影中的橋段,但事實上這是大數據及分析所追求的一種終極目標。

目標很遙遠,但沃森的問世讓我們看到了目標的雛形。近日,IBM又宣布將把“沃森”應用于云環境的開發平臺,開放API,讓企業能夠開發自家的“沃森”App,從而構建起“沃森”生態圈,將“沃森”應用到更廣泛的領域。此外,IBM還建立了一個“沃森”內容庫,供應商可以為沃森提供內容,包括通用和專用的信息,如醫療保健等。開放“沃森”API、建立生態系統,沃森又將大數據的終極目標向前推進了一大步。

沃森“是誰?它怎么工作?

將人工智能計算機以IBM創始人的名字來命名,足見IBM對“沃森”寄予厚望。沃森誕生于IBM在2006年啟動的一個有關“認知計算”的研發項目,期間,IBM并沒有透露太多的消息。2011年2月,沃森首次公開亮相,在美國電視節目《危險邊緣》中戰勝人類冠軍而名聲大噪。在節目中,沃森能夠分析和理解人類語言,能夠準確的得出答案,并展現出比人類更快的答題速度,這不禁讓人驚呼,機器代替人腦的時代要來臨了么?這并不是機器首次戰勝人類,早在1997年,IBM超級計算機“深藍”在國際象棋賽中戰勝了當時的世界冠軍卡斯帕羅夫,成為第一臺戰勝人類的智能電腦。

盡管都是人工智能的產物,但“沃森”和“深藍”有著巨大的不同:“深藍”存儲著數量有限的國際象棋走法,通過數據規則來預測象棋的走法,實際上“深藍”所處理的還是比較明確的機器語言,而“沃森”大有不同,它所處理的是人類的自然語言。和明確的機器語言相比,自然語言對一臺機器來說是非常不明確的,因為它有著無限種的表達方法。

IBM系統與科技部Power Systems全球實驗室服務總監Ian Jarman先生舉過這樣一個例子:我們知道,愛因斯坦出生在德國烏爾姆,計算機也能夠識別這種結構化的數據;但如果換成自然語言,比如“有一天,Otto從烏爾姆的諸多城市景致圖畫之中,選擇了一幅水彩畫寄給愛因斯坦,作為對他出生地的紀念”,計算機就難以回答愛因斯坦到底出生在哪里。沃森在《危險邊緣》中所表現出來的,是超強的對自然語言的理解能力,當然,要得出準確的結果,僅僅有對自然語言的理解還是不夠的,還需要從大量的結果中篩選出最為合適的。

Ian Jarman先生曾解釋過沃森的工作原理:分析問題和主題——從答案來源中生成假設——從證據來源中給假設和證據評分——合并和排名置信度計算——得出具有置信水準的答案。通俗來說,沃森得出正確結果的關鍵是提出以證據為基礎的假設,如果你提一個問題的話,計算機理解了會產生很多的答案,沃森會收集一些證據來支持這些答案,然后根據對不同答案的評分作出最好的選擇。另外沃森還具備適應和學習的能力,沃森可以進行人機對話,它會吸收人們給予它的新信息,對它所作的決定或者答復加以修改和改進。

“沃森”和“大數據”

自然語言理解、找到證據、判斷,是沃森所具備的的三大能力,這種“認知計算”能力讓沃森在當前的大數據浪潮中大有用武之地。大數據已經被公認為是一座“金礦”,但如果從中無法提取“黃金”,大數據也毫無價值可言。大數據有著數量大、速度快、多樣性、不確定性等特點,故而數據的采集、存儲、管理和分析并不簡單,如何將紛繁數據化繁為簡,實現類似人腦的認知與判斷,發現新的關聯和模式,從而做出正確的決策,才是大數據分析的核心價值。沃森的工作過程實際上是一個完整的大數據分析過程:識別理解自然語言是處理非結構化數據的過程,找到證據就是從不同來源的大數據中檢索的過程,判斷就是給證據評分,作出最佳決策的過程。

好比我們在谷歌進行搜索,輸入關鍵字中可能會出現數十萬條結果,哪條結果是最合適自己的,需要自己來判斷;沃森所做的就是充分理解我們的意圖,幫助我們從海量的結果中挑出最合適的,它代替了人類進行分析決策的過程。具備這些能力,沃森在大數據領域會有非常光明的前景,因為大量的行業的數據資料都是以自然語言編寫的,比如醫療行業的醫療記錄、文本、雜志和研究資料,這些都是計算機難以理解語言;在零售、旅游、金融、電信、服務等行業,同樣存在著大量以自然語言存儲和編寫的資料,如果存在一套能夠這些自然語言資料中快速找出準確答案的系統,將為行業帶來巨大的改變。據Ian Jarman先生介紹,沃森不再是電視節目中的明星,如今已經進入醫療、金融、呼叫中心行業提供支持服務。比如在醫療領域,沃森從不同的信息來源采集數據并且提煉,給醫院,或者是醫師、醫生提供醫療采購方面的建議和咨詢意見。在美國德克薩斯大學MD Anderson癌癥中心,沃森已經在其中對醫生提供建議,以助于治療復雜的疾病和癌癥。

沃森商用要過幾道關

IBM將沃森作為面向大數據市場的重要工具,為了讓沃森進入更多的行業,IBM近日宣布建立沃森生態系統,向合作伙伴提供技術、工具和API編程接口,希望借助云服務和訪問工具,利用沃森幫助合作伙伴開發他們的認知計算軟件及系統。首批合作伙伴包括零售業的Fluid、醫療保健領域的MD Buyline以及健康管理領域的Welltok。另外,IBM還建立了一個沃森內容庫,供應商可以為沃森提供內容,包括通用和專用的信息,如醫療保健數據資料等。

尋找合作伙伴是IBM的習慣做法,也起到了很好的效果,例如在IBM Power Systems在中國實施的“天工計劃”和“天合計劃”,大大提升了Power服務器的市場覆蓋面。獨木不成林,沃森要拓寬應用領域,也需要建立自己的生態圈。IBM更擅長的是硬件和大數據分析工具,想要將沃森應用于那些具有專業性的行業,例如醫療,就需要借助那些具有較深行業背景的合作伙伴的力量。同時,沃森能夠得出正確答案的關鍵在于以豐富的證據來支持結果,這就需要廣泛的信息來源,沃森內容庫的建立更需要IBM和合作伙伴以及客戶的通力合作。那么,是不是意味著沃森的合作伙伴越多、生態環境越大,沃森越容易找到需要的結果和支持的證據?是不是IBM應當將沃森內容庫向所有人開放,就像谷歌,讓所有人都能夠貢獻數據資源?筆者認為這不是一個理想的狀態,雖然沃森需要廣泛的信息來源,但前提是這些信息應當是可信的,因為沃森要從中尋找證據來支持結果,所以信息來源的可信度是關鍵,一旦根據大量錯誤的證據得出錯誤的答案,后果是非常嚴重的。這正是沃森和谷歌所不同的地方,谷歌雖然有大量的信息來源,但其中有可信的,也不乏大量的不可信信息,大量信息的檢索也會增加系統的負載。筆者認為這也是目前IBM謹慎的選擇沃森伙伴的原因。未來,沃森也許不會向公眾公開信息來源的渠道,因為信息的甄選并不是件容易的事情。但是,用沃森來提供公共云服務是個不錯的做法,公眾可以更加快速準確的獲得專業的建議和搜索結果,免去了自己篩選和判斷的麻煩。

另外一個問題,沃森目前還僅限于理解英語語言,還沒有多語言版本,也就是說,在繁雜的語言環境中沃森的自然語言理解優勢也就不復存在了。例如在中國有著大量的方言和表述方法,即使對于一名中國人來說,很多語境理解起來也頗具困難。想想看,讓一臺機器去理解“倒鴨子”,仿佛是件匪夷所思的事情。不過支撐沃森的一些底層技術,如Power服務器、Symphony、InfoSphere等大數據分析平臺和技術在中國都已經上市,假以時日,未來也許能理解“倒鴨子”的方言版沃森也會橫空出世。最后總結一下,沃森所代表的認知計算,為大數據的未來描繪了一幅美麗的圖景,也將人工智能大大推進了一步。也許未來大數據應用就是那樣簡單,我們只需對著計算機、甚至是隨身的終端設備說出我們的需求,就能快速得到最準確的答案。

鏈接已復制,快去分享吧

企業網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 通山县| 泽库县| 固原市| 若羌县| 宾阳县| 静海县| 罗源县| 克什克腾旗| 德保县| 翁牛特旗| 彰化县| 瑞昌市| 报价| 株洲县| 聂荣县| 肃北| 建阳市| 麦盖提县| 岱山县| 彭泽县| 新乡市| 普陀区| 进贤县| 河津市| 乌鲁木齐县| 阿勒泰市| 白玉县| 荆州市| 新平| 蒲江县| 抚州市| 和田县| 德保县| 阳城县| 石阡县| 图木舒克市| 安图县| 南投县| 贡觉县| 桂阳县| 东台市|