摘要:“大數據”是近兩年來各界最熱議的話題之一,和“大數據”相關的實踐幾乎成為所有行業在技術和商業兩個方面最具創新意義的行動。
“大數據”是近兩年來各界最熱議的話題之一,和“大數據”相關的實踐幾乎成為所有行業在技術和商業兩個方面最具創新意義的行動。
“大數據”是近兩年來各界最熱議的話題之一,和“大數據”相關的實踐幾乎成為所有行業在技術和商業兩個方面最具創新意義的行動。在越來越多企業重視“大數據”價值的同時,新型數據的挑戰也隨之而來。
據IBM商業價值研究院和牛津大學賽德商學院共同發布的《分析:大數據在現實世界中的應用》顯示,全球僅四分之一的受訪者表示自己具備了分析高度非結構化數據的能力,而對大部分組織而言,掌握先進的非結構化數據分析能力仍是從“大數據”中獲得價值的重大挑戰。究竟 “非結構化數據” 與 “大數據”有何關聯?哪些創新技術能夠應對新型數據的挑戰?
企業內容管理:突圍非結構化數據
針對非結構化數據所呈現的新趨勢,IBM近年來不斷加深在企業內容管理(ECM)領域的實踐,充分發揮信息全文檢索、自然語言處理、和行業深入理解三大突出能力,為越來越多的企業找到了非結構化數據管理和分析之道。
BJC Healthcare推進醫療研究:和大部分醫療服務提供商一樣,BJC Healthcare面臨大數據時代的挑戰。現有的醫療信息資源與實際操作嚴重脫節,分散在非結構化的臨床記錄和診斷報告中的歷史數據幾乎閑置,只有少部分研究人員偶爾查閱,其隱藏的研究信息因此無法得以充分利用。通過使用IBM 企業內容管理解決方案,BJC和大學研究人員得以分析非結構化的歷史存檔來回答以前無法解決的關鍵問題。
赫茲國際汽車租賃公司是全球最大并廣受歡迎的租車品牌,準確識別客戶關于產品、服務和員工的滿意度是赫茲的關鍵業務。通過使用IBM 企業內容管理解決方案,赫茲能夠通過分析客戶的調查記錄更好地識別汽車和設備租賃業績水平,確定客戶的滿意水平并進行必要的調整,從而進一步改善流程。
在智慧城市(Smarter City)中,非結構化大數據分析成為政府、公安、消防、民政等多個部門的協同運營奠定基礎;在智慧商務(Smarter Commerce)中,非結構化數據分析為產品信息管理、銷售合同管理、服務管理、市場推廣行動管理提供支持;在社交商務(Social Business)中,非結構化數據分析成為網絡協同,信息挖掘的前提。
非結構化數據:新價值和新挑戰
什么是“非結構化數據”?相較于記錄了生產、業務、交易和客戶信息等的結構化數據,非結構化的信息涵蓋了更為廣泛的內容,包括了如合約、發票、書信與采購記錄等營運內容;如文書處理、電子表格、簡報檔案與電子郵件等部門內容;如HTML與XML等格式信息的Web內容;以及如聲音、影片、圖形等媒體內容。
目前,非結構化數據的內容占據了當前數據海洋的80%,并將在2020年之前以44倍的速度迅猛增長。同時,因為非結構化數據的信息量和信息的重要程度很難被界定,分析成為了難點。如果說結構化數據用詳實的方式記錄了企業的生產交易活動,那么非結構化數據則是掌握企業命脈的關鍵內容,所反映的信息蘊含著諸多企業效益提高的機會。