通過了解最低級別的數據的全部價值,可以讓公司在以后更加充分地利用數據。
大數據挖掘通常從高水平的數據抽象開始,然后隨著公司從中獲得更多信息,逐漸加大挖掘數據的深度。
這種方法行之有效,在許多不同類型的應用程序中都可以操作。
例如,地理信息系統和制圖系統使用數據讓一幅大地圖可視化,然后集中在一個特定的點或位置。當數據分析人員深入研究到這個位置時,他們可以查看其他可能附在該位置的相關數據,例如居住在該地點的人口統計數據,或該地點的交通事故數量。
然而,還有另一種方法,它能夠解開大數據的隱藏價值。這種方法實際上是從數據的最底層開始,然后再向更復雜的數據結構開展工作,以提供對管理人員和工作人員有幫助的數據洞察力。
以下是一個例子:建筑,工程和地理空間解決方案提供商Woolpert公司研究與開發總監,副總裁Layton Hobbs表示:“顯示器可以顯示一個點的可見顏色,也可以顯示可用于測量營養健康的紅外值。”
Hobbs闡述了農業和林業公司超越基本的地理空間數據的潛力,他們收集和解開隱藏在地理空間數據(如地形,土壤,地面覆蓋,植物健康和樹冠數據)中隱藏的寶藏。
“多數地理空間數據是為一個特定的原因或需要而創建的,但是在地理空間數據中還有更多的信息未得到充分利用或未被承認。”Woolpert公司地理空間學科帶頭人JoeCantz補充說。“特別是使用較新的技術,數據豐富的信息呈指數級增長,但在這一點上我們只使用了一小部分。”
據Woolpert公司的技術人員介紹,地理空間數據像素能夠存儲比傳統256位8位圖像更廣泛的數值。Hobbs說:“這些現代系統通常以高達12位的數據(紅色,綠色,藍色和紅外線)存儲四個頻帶,每個頻帶約有4000個數值。“結合這四個圖像波段,可以在一個空間位置創建256萬億種可能的組合!這絕對秒殺大多數應用程序的能力,但顯示了圖像大數據應用的潛力。
為什么這對公司大數據項目很重要?
物聯網數據,如傳感器捕獲和發射的數據馬上就會出現。
使用物聯網,您可以從自己的自頂向下的大數據計劃和分析開始,利用從無人機上的傳感器發送的數據和圖像。但是如果查看無人機發送的數據的每個像素,發現有額外的數據值被捕獲,可以回答現在不會令人感興趣的問題,但可能在未來進行解答。
以下是如何優化當前和將來使用的數據:
分析從給定的數據單位(例如像素)可以提取的內容,即使可能不在乎現在的所有這些信息。
這可以很容易地完成。參考LaytonHobbs的例子,也許人們目前并不關心森林的健康狀況,但是如果有一天想在收獲后恢復這片森林,那么了解一些有關森林健康的信息將會有所幫助。在這一點上,知道從管理中的大數據中可以獲得的一切都是重要的。
在大數據的最低單位列出可能的信息捕獲
如果正在處理一個像素,并且知道森林健康和地形可以從這些數據進行分析,并記錄下來,如果當您需要的時候,記住數據的信息潛力并激活它要容易得多。
不要迷失在細節中
雖然重要的是在最低級別的數據中將大數據的信息潛力進行編目,但重要的是不要迷失在細節中。如果目前的工作是簡單的一個森林地圖,簡單確定森林砍伐的情況,需要找出收獲木材的立場,堅持下去。不要進行與手頭任務無關的其他類型的數據探索。
預期的教訓
當一家銀行營銷部門通過根據年齡組識別某些地區的人員,然后將檢測產品與客戶所在的各個生命周期階段相關聯,將人口統計信息用于其一個檢查活動。之后,為了改善效果,可以增加了針對檢查活動中人員的職業和年齡。
這是公司常見的情況。他們想回到數據,看看他們是否能添加更多的信息,以便他們能改進結果。
通過對數據的最底層的潛在信息收益進行評估和編目,數據分析師可以準備開放數據以進行更全面的分析,從而提供公司下一步要提出的問題的答案。