行業專家稱,“藏在大量數據中的知識就是可以改變世界。”
人們目前生活在一個后現代世界,在這個時代,技術、數據和信息統治著世界。因此,人們很容易相信大數據概念是一個獨特的現象,從2012年開始,當時的美國總統奧巴馬政府宣布了大數據研究和開發計劃。
然而,自1991年互聯網得到迅速發展以來,大量的數據一直存在。當時與現在的根本區別是,人們解析這些數據量的能力已經發展到現在可以將這些數據作為人們的業務決策過程的一部分。
大數據和數據挖掘:收集正確的數據
當焦點首先從數據存儲轉移到大數據的價值時,很容易收集和存儲盡可能多的數據,以便盡可能在將來某個時候使用該業務。
然而,這一焦點現在已經從簡單的數據收集轉移到相關數據的收集;為業務增加價值的數據。只有收集大量的數據是不夠的。大規模地收集數據會給人們帶來大量數據;因此,有大量的數據;但這并不一定意味著擁有有價值的數據。
有用的數據不僅需要大數據,還需要高質量,實用的信息。換句話說,企業需要收集關于每個主題的數據,這些數據足夠詳細,以便分析工具和模型可以根據需要深入細節。
這是數據挖掘的地方。本質上,數據挖掘是用于對大型數據集進行排序以識別模式和關系的方法。然后將這些模式和關系用于解決問題并預測未來趨勢。
一旦原始數據被提取,轉換和加載到數據倉庫中,才執行數據挖掘方法。
數據挖掘和機器學習:構建預測模型
WhatIs.com的Margaret Rouse將機器學習定義為“人工智能(AI)”,允許軟件應用程序在未明確編程的情況下更準確地預測結果。
其主要宗旨是基于可以查看輸入數據并使用統計分析來根據輸入數據預測趨勢和值的算法。機器學習模型是關于邏輯和我們做事情的方式。
推薦引擎
最簡單的機器學習模型之一是推薦引擎。然而,在我們看看推薦引擎的工作原理及其作為業務預測模型一部分的有效性之前,我們來看看什么是機器學習。
如上所述,推薦引擎是一種簡單的預測軟件模型,其嘗試預測用戶將給予項目的評級。推薦引擎最知名和最實用的用途之一是將其并入電子商務購物平臺。
例如,如果戶外裝備網站的訪問者點擊一條徒步旅行褲,推薦引擎將推薦可以與所選擇的徒步旅行褲一起佩戴的其他裝備和服裝。
推薦引擎如何知道要選擇什么?嗯,可以查看客人所看的褲子的款式,預測網站用戶會購買的衣服的樣式,并顯示一個徒步旅行褲相匹配。
提出的問題是,推薦引擎如何知道提供額外的服裝?答案是既簡單又復雜。從本質上講,預測模型是合乎邏輯的;因此,它使用統計分析來建立用戶角色模型,包括每個訪問者對網站的服裝風格和顏色的喜好。
結語
大數據(及其相關的方法)目前正在并將繼續發揮作用,在預測和預測趨勢方面發揮越來越重要的作用。因此,企業利用其決策權在消費者購買浪潮的最前沿獲得最佳機會。