《經濟時報》最近的一份報告提到,寶馬利用AWS開發了一個數據中心以提高效率。該報告說:“將培訓約5000名BMW員工使用AWS技術來更好地利用數據。”技術的出現在經商過程中帶來了明顯的變化。大數據和預測分析對行業產生了巨大影響。
Gartner公司對于大數據的定義是,大數據是高容量,高速度以及種類繁多的信息資產,即3V。這些大量復雜數據無法用傳統方式處理。大數據用于獲取見解,檢測威脅,預測趨勢以實現最佳生產。
人腦從來沒有過無錯誤的特權。這不是為什么我們更偏向于技術-一個提供完美結果的平臺。好吧,事實不同。一切都有自己的風險。大數據也是如此。為了清楚起見,以下看與大數據相關的問題。
準確性
許多人認為,數據越多,準確性越好。這不是真的。大量數據來自各種不完善的來源。這可能導致無組織,不準確的數據或見解。當這些值僅僅是近似值時,我們將失去精度。所有公司都沒有能力實時處理大量數據。因此,他們使用采樣來分析數據。此過程使用來自云的少量數據樣本,并嘗試獲取見解。這導致不正確的結論和決定。
數據是否一致?
數據必須一致才能獲得正確的見解。數據永遠不會是靜態的;它一直在變化。由于數據收集來自多個來源,因此保持一致性并不容易。如果數據不一致,用戶可能會誤會。對于同一查詢獲得不同的答案可能會導致這種不一致。
數據算法中的偏見
由于這些數據塊來自多個來源,因此并不總是可信的。這些數據離偏差不遠。由于人的大腦參與其中,因此這些不是客觀價值或信息。某些數據可能包含從其源繼承的偏差和錯誤值。
使用算法進行數據處理也會導致偏差。數據算法中的這些偏見不是一本公開的書。它們仍然被認為是黑匣子,這使我們無法了解其根源和目的。這可能會導致誤解。例如,人們可以用各種方式來解釋社交媒體語言。如果算法被設計為以性別歧視或種族主義的方式理解它,則會導致錯誤的見解。這肯定會影響用戶,在其他情況下也會影響您的業務成功。
如何使事情變得更好?
所有這些偏見不能使大數據消失。大數據將仍然是有效業務管理的重要方面。因此,它需要設置正確。
•應該改善數據質量和組織。為確保這一點,公司應了解其數據要求并定義相關數據。這些數據應該以易于管理的方式進行分類和存儲,以獲得有效的結果。
•一切都需要偶爾清潔。應該清除數據以清除臟數據,這些臟數據離完整性很遠。這將使我們能夠創建一個完整且相關的數據湖。
•更好的治理可以輕松解決數據流和安全問題。例如,SAPDataHub可確保最大程度地集成和管理數據庫,以產生有效的業務策略。
•為了增加對技術的信任,必須確保對用戶的最大透明度。更好地理解所涉及的來源,偏見和錯誤將對客戶產生積極影響。更少的操縱和更多的統計證據可以幫助贏得信任。