根據Deloitte集團的一份新報告,非結構化數據和其他所謂的黑暗數據類型的分析可以提供重要的業務價值。
(Deloitte中文譯名為Deloitte,是世界四大會計師事務所之一。)
Deloitte的新報告《黑暗分析》這樣寫道:“隱藏在非結構化數據中的機會并不能說明全球范圍內充滿戲劇性的斗爭,但仍然暗示了對于一些公司仍然是黑暗藝術分析實踐的實質性收益者。”
數據類型如自由文本、圖像、音頻和視頻文件,以及在非索引網絡服務器上托管的研究論文具有實質性的智慧。2017年技術趨勢報告報告顯示,傳統企業對這些黑暗數據類型的了解非常有限。
報告作者之一Paul Roma是Deloitte分析咨詢公司的負責人,他指出,即使企業不再處于領先地位,也不會很快淪為普通企業。
是時候讓黑暗數據“重見光明”Roma說:“這種非結構化數據的概念和讓黑暗數據“重見光明”的能力應該發揮作用。將這種能力用于決策逐漸成為主流,比如桌上賭博。”
并不是所有的黑暗數據類型都適用于今天的企業。Roma說,文本文件是最容易分析的。像Microsoft,IBM和Google這樣的公司,可以對文本文件進行高級分析,而不缺少API服務。音頻文件也比較容易,因為轉錄軟件可以輕松地呈現文本文件進行分析。
Roma說,分析圖片和視頻還有很長的路要走。圖像識別算法實現人類成果的速度已經很快。
現在就是要找到這種非結構化數據分析的業務案例。 Roma說:“使用這些技術的費用和時間遠遠超過兩三年前。”
API服務有助于獲得收益
API服務有助于獲得收益的部分原因是API服務的可用性,讓用戶將數據移交給受過充分培訓的認知系統。這意味著企業不必有專業的人員就可以獲取實踐的好處。
此外,越來越多的企業可能正在使用深度學習和AI。許多軟件公司正在其產品中構建這些功能,以增強聊天或搜索功能。 這些都不能保證黑暗分析對企業而言沒有風險。Roma指出,深度學習算法常常會返回大量的誤報和似是而非的相關性。這樣需要很多的業務知識,確保算法提供的信息是正確的。
此外,他看到一些公司采取廣泛的企業范圍的項目,投入大量的預算后,卻不會帶來任何投資回報。他說,一般來說,具有針對性的非結構化數據分析項目表現更好。
但總的來說,企業需要了解這種分析趨勢,并評估如何幫助他們的業務。