大數據和商業決策之間究竟有何關聯?這個問題相信困擾著很多企業。的確,企業管理層在下達任何一個決策或指令時,都會經過深思熟慮,然而深思熟慮的背后是基于一個怎樣的考慮和根據?所下的決策又會給企業帶來怎樣的影響?
回首過去的IT模式,用戶往往都是帶著所遇到的問題到數據當中去尋求答案,以及可以解決問題的方法。然而隨著大數據的不斷發展,到今天這種模式已經顛倒過來了,數據已經能夠幫我們預測很多事情,從而能幫助用戶在下每一個決定之前能夠信心百倍。數據對于用戶決策的這種改變背后究竟是什么?本期我們就來說說。
數據的“干凈”與否
曾經有一家美國的初創型公司,公司專注于和地理位置相關的很多數據收集、整理和查詢等工作,它將地理位置的相關指標,按照酒店和旅館等屬性劃分為不同細類,對外提供基于位置信息的實時查詢,對于所收集來的數據會提供一個數據質量評分,以反映數據的可信度和質量水平。它會對這些數據的源頭以及對處理數據階段所用的算法進行評分。也就是說,這家公司在提煉數據的每一個階段都進行了數據化管理。
通過這家美國企業的服務模式我們不難看出,服務商其實并不是百分之百相信所收集來的數據是“干凈的”,因此當企業把數據收集來之后,就會像污水處理廠處理廢水一樣,對海量數據進行過濾和檢測,確保將這些數據變成我們所謂的真實可用的“干凈數據”。
事實上,我們今天在處理的大數據,依然只是冰山一角,而更大的數據都隱藏在我們的語言中,比如我們說的話和寫的字。所以,將來我們要準確地從互動中抓取數據,也一定要依賴對自然語言的處理,因為基于自然語言所收集來的數據才是真正貼近用戶需求的,真正可用的。
淡化數據是必經之路
數據其實是具有優先級的,對于數據的標準化方面,在當今的大數據時代是一個需要我們深聊的一個問題。此外,我們如何進行大數據的交換和對接,怎樣在交換的同時保證數據的穩定性,也是十分重要的。
此外還有諸如像數據存儲方面,對于大數據的存儲是現在很多企業所關心的,如何在保障大容量數據存儲安全的同時,還能夠對數據進行實時管理和監測,從而保障數據的時效性是現在我們面臨的大數據困擾之一。
美國專家曾經提出過一個理念叫數據淡化,也就是說我們現在所收集、分析、存儲的海量數據都會慢慢淡化,正是因為數據是有優先級的,在數據中有些是特別核心的,有些即使缺失了也沒有多大問題,所以讓海量數據形成一個有層次的優先級管理模式是未來的一個重要趨勢。
數據的屬性標簽是人類經驗判斷的數據,是數據后的數據。例如,當你要為一件物品打上標簽時,其實就已經動用了你的經驗數據分析,并進行了歸納總結,結合當下的環境給出了判斷。
在數據屬性的管理上,對于用戶來說,每個人身上貼的標簽都是多種多樣的,但是對于企業來說,如何將這些標簽歸一,如何用一個點去將之串聯,又如何把這些點連起來去描述這個用戶,這才是核心問題。
標簽在觀察之后加進平臺和直接加進去是不一樣的。在電商平臺中,就有一些標簽是在觀察后加進去的,如果由賣家自由地加標簽進去,必然會造成混亂。所以,標簽的屬性管理,在運營數據中非常重要。
標簽化管理,是一個非常重要的趨勢。電商企業今天面對的一些問題在美國的電商企業中同樣存在,屬性管理的層級化十分有必要,但是在使用數據前,必須要了解數據的場景、數據是如何放進去的和數據的場景是什么。
編輯的話
有很多業內專家表示,未來是“人機合一”的時代,對于大數據的收集和管理,在模式上已經和以前有了很大區別。對于企業來說,在確保能夠收集海量數據的同時,將數據的時效性大大提升,才是真正能滿足用戶需求的有效途徑。