如今,在企業界,大數據已不再是新奇的事物。縱觀整個商業市場,大數據早已成為董事會會議的經常性議程項目,越來越多的C級高管們希望成為以洞察力驅動的組織掌舵人——利用數據分析和信息處理,了解市場及經營業務。
市場研究機構IDC日前發布報告預測,全球大數據技術與服務市場至2019年的復合年均增長率將達到23.1%。
目前,利用大數據技術了解客戶需求和各項技術信息,從而使其經營和管理日益高效和智能化已成為一種新常態。
然而,現存的商業環境中還存在一種對大數據概念的誤解——很多人認為數據分析僅可通過精準的數據收集來實現。事實恰恰相反,“大數據”是指以多元形式,自許多來源搜集而來的龐大數據組,往往具有實時性。在企業對企業銷售的情況下,這些數據可能得自社交網絡、電子商務網站、顧客來訪紀錄,還有許多其他來源。這些數據并非公司顧客關系管理數據庫的常態數據組,而是從海量數據中提取和獲得。大數據(big data,mega data)一般需要新處理模式才能具有更強的決策力、洞察力和流程優化能力,以便取得海量、高增長率和多樣化的信息資產。因此,大數據并非來源于各項精準的數據信息,而是對海量數據的中有效信息的提取和分析。簡言之,從各種各樣類型的數據中,快速獲得有價值信息的能力,就是大數據技術。
有時,最全面的見解可能是通過分析大量不同來源的的異構數據而創建。當今大數據世界,想要確定一種產品或行業的發展趨勢,或證明一個假設的成立與否,完全可以通過“重數量而非質量”的方式來實現。
操作過程需精準
隨著數據集的不斷增長和開放,信息源日益增多,企業不得不以各種各樣的方式應對各類信息。這些數據表面看去可能原始、簡單、非結構化,但很多冗雜繁瑣的信息中可能隱藏著巨大商機和行業潛在發展趨勢,企業需培養其較強的洞察力用以接受和處理“數以億計”的數據集,大數據技術則是從這些“雜亂不堪”的數據中提取可用信息,并進一步使其“智能化”。
換句話說,大數據的核心在于為客戶挖掘數據中蘊藏的價值,而非軟硬件的堆砌。因此,針對不同領域的大數據應用模式、商業模式研究將是大數據產業健康發展的關鍵。微軟公司公共政策事務負責人兼首席法律顧問Smith先生稱,“數據資源對各行各業都非常重要,給我提供一些數據,我就能做一些改變。如果給我提供所有數據,我就能拯救世界。”
負責數據處理工作的統計學家和分析師們可能會對凌亂的數據集感到頭痛,他們需要從不同方式呈現的信息中提取可用信息,該過程要求及時準確,因為操作失誤和異常信息將導致整個分析結果產生偏差。
成功評價結論的不確定性和定量方法的有效性是合理利用大數據的一個關鍵技能,輸入數據不完善時,需及時洞察并進一步實施確認操作。
允許錯誤和不完美(缺陷)的存在
大數據就是互聯網發展到現今階段的一種表象,沒有必要對其神話或保持敬畏之心,在以云計算為代表的技術創新大幕襯托下,這些原本很難收集和使用的數據開始容易被利用起來,通過各行各業的不斷創新,大數據會逐步為人類創造更多價值。從技術上看,大數據與云計算的關系就像一枚硬幣的正反面。大數據無法用單臺計算機進行處理,必須采用分布式計算架構,其特色在于對海量數據的挖掘,但必須依托云計算的分布式處理、分布式數據庫、云存儲和/或虛擬化技術。
從根本上說,你處理數據的方式決定了該數據所具有的價值,因此,數據處理和分析的前提就是接受錯誤和不完美的存在,我們必須承認缺陷也是該數據集的一個組成部分,并相信相較于如此龐大的信息集,幾個簡單的錯誤數字不足以導致該分析結果產生明顯偏差。
另一方面,大數據的不精確和相對不完美在某種程度上可以幫助專業人士進行更切合實際的產品和行業預測,對于某些特定行業,數據的不精準更可能促使較為完備的準備工作。實際上,接受凌亂的數據集還可減輕對有關數據輸入問題的偏見,對團隊合作也具有一定的積極意義。
如何撥亂反正?
如今的各種數據集可能會比以往任何時候都混亂復雜,認知分析將為大數據和實際決策參考數值之間的差距提供一種較為有效的彌補方式。
通過認知分析和深入研究,分析師研發出了從冗雜的數據中提取有效信息的各種算法,經過分析、推導和演練,將熟練操縱高級抽象信息成為可能。
企業則可通過利用上述研究成果,分析和處理包括圖像、語言和視頻文件在內的各類復雜數據模型。面對大數據帶來的空間機遇,越來越多的企業將目光轉向該市場。當前,如何挖掘大數據金礦,實現數據變現,正成為企業實現轉型發展的新機遇,各大網絡運營商也面臨著突破自身約束,應對外部競爭的重大挑戰。如今,數據已經成為寶貴生產力,誰掌握了數據誰就可能擁有未來。
譯自:2015年11月30日英國www.computerweekly.com
編譯:工業和信息化部國際經濟技術合作中心 李肖