由大數據觸發的數據驅動的做法是一種最好的理解。如今,各個組織正在各種數據結構,格式和分布式地理數據源位置等方面進行競爭,并在時間框架和數量上超過了現有系統的能力。
以往人們關注了社交,移動和云平臺的應用與發展。同樣重要的是,在大數據時代之后涌現出的幾種輔助技術得到了蓬勃發展,由此產生的基礎架構,架構,以及IT挑戰表明,整個數據環境發生了模式轉變,這種變化是由改變業務進行方式的力量的開始決定的。
由于這種轉變的迅速性和其需求的即時性,許多組織希望在市場上尋找最好的解決方案,并有大量的點解決方案來解決數據景觀的大規模系統變化,而這些零碎的方法在短期內提供有限的價值,但是由于供應商的鎖定和業務的需求不斷變化,長期來說其最終成本更高。
此外,即時的反應需要不同的工具來管理大數據的每個方面復雜的架構,同時耗費大量的時間。這種方法的根本缺陷是,這樣的工具不是明確設計用于大數據,這限制了其在大數據革命后的價值。
大數據的涌入指出了一系列跨行業因素產生創新的方式,從最初的采納到分析。這些普遍存在的市場力量對于為數據管理過程的每個方面需要針對大數據技術設計的全面方法是有幫助的。
大量的數據使得需要一個集中的平臺,應對當今和未來的數據驅動實踐的每一個方面,最好以終端用戶管理的自助服務智能數據湖的形式實現。
無處不在的市場力量
了解負責重塑數據環境的市場力量的性質,需要在技術和非技術方面對其進行分析。在前者中,對SMAC(社交,移動,分析和云計算)的依賴代表了訪問大數據手段的最大決定因素。這些技術深深地影響了大數據對企業的獲取形式和形式。它們最顯著的效果可能是它們所使用外部數據創造的前所未有的價值,這反過來又有助于強調這種數據與內部數據的集成。同樣,他們負責多元結構數據的突出和其固有價值的企業的復雜性。
這種復雜數據格式所帶來的新穎的復雜性通過單一集中的語義平臺的流線型架構而被均勻地緩解。具體來說,通過在RDF圖上鏈接在一起的演進的語義模型來無縫地合并數據源和類型的多樣性的多結構化格式。在該框架內,所有數據元素以標準化方式彼此并排表示,代替了對傳統方法所要求的各種結構化數據管理不同數據庫,數據模型和模式的需要。在這樣的獨特平臺中,其架構和底層基礎設施被明顯簡化,相應地降低了成本。
非技術力量的典型代表是加速的業務步伐,并在這些縮短的時間框架內解析的數據量。企業進行的速度會受到互聯網的普遍性以及它在工作流中根深蒂固的實時響應的巨大影響。這種權宜之計是大數據的其他規定,例如當前流行的傳感器數據,移動通信的快速性,以及這些因素能夠產生的機會的增加。在這些力量的影響的關鍵考慮是它們的臨時性質。組織可以獲得更多的機會,但他們也稍縱即逝,需要對時間敏感的方法來利用數據。
綜合平臺解決了這些加速的時間問題,使終端用戶在決策和基于分析的行動階段比零碎的方法更快。對單個節點的語義圖表示適當的加速調整模式和重新調整了模型與其他方法的奇異性。加速了整個數據準備過程,這可以壟斷最好的數據科學家的時間,或者最基本的以數據為中心的需求過分依賴IT。用戶能夠投入更多的時間用于數據發現和分析,分享現代企業制定的速度。
解決常規問題
上述力量已經塑造了數據環境,由于日益分層的數據管理過程的必要性,導致集中的語義平臺廣泛的問題。來自SMAC技術的多結構化數據以快速交付的大量數據可能對數據格局的常規領域造成嚴重破壞,包括:信息治理,數據準備,數據集成,搜索和發現,商業智能和文本分析。
當考慮采用點解決方法的孤島方式處理數據的這些方面時,容易成為供應商鎖定或昂貴的更新的犧牲品,從而產生大量的停機時間。這種方法最大的問題是,當業務需求或流程改變時,會缺乏靈活性,任務組織重新啟動手段實現,這六個重要功能之一。因此,當他們的系統不能產生價值,同時被迫采用更多的系統維護時,組織會花費更多的時間。
集中式方法的核心價值主張是實現數據使用的所有必要條件的整體方式。通過向現有系統提供必要的覆蓋,該方法能夠在短期和長期中實現收益。立即獲益包括更大程度的企業治理監督,部分通過標準化建模促進,在大多數情況下,包括所有企業數據。隨后,數據來源和數據建模更容易解釋,并且更易于追蹤,這加速了集成嘗試。其結果是更快地洞察在組織范圍內的治理協議與高度可見的數據,增加對數據資產的信任。
隨后的收益與這種洞察的性質有關,遠遠超過從點解決方案中收集的收益。語義圖的鏈接數據方法集中于節點之間的關系洞察,這有助于其他技術無與倫比的看似無關的數據元素的背景文化。用戶能夠有更多的數據,以識別他們之間的關系,以及他們的使用情況,否則是無法發現的。
此外,這種鏈接數據方法使數據發現過程在很大程度上實現了自動化,同時提供了探索性分析,用戶可以在其中詢問和回答盡可能多的問題。分析的結果是全面明確,并且包羅萬象。采取零碎的方法,實現這些目標是困難的。。
預期未來的發展
培養對集中化需求的最緊迫的營銷力量是大數據本身日益擴大的影響。對未來幾年生產的數據量的預測表明,其擴張并不會停止和停滯。當考慮連接的設備的數量全部無限地在物聯網中產生數據,以及增強現實和虛擬現實的進步,并考慮這樣的數據的人工智能選項的可用性時,顯而易見的是大數據的規模,速度,結構將在不久的將來大量增加。
集中的圖形感知環境為這些即將到來的技術進步做好準備。使用它作為Hadoop或其他數據湖設置的基礎,使其具有在這種工作負載密集型數據驅動部署中持續提供價值所需的規模和性能一致性。更重要的是,它是一個單一的手段簡化每個組件的短期解決方案,點解決方案不是為大數據的需求而創建的。這種方法對于目前來說是不夠的,并且對于未來大數據應用的更嚴格的負擔當然不可行。這樣的實現僅僅支持這樣的觀念:集中的,關系精明的語義圖解表示用于以管理數據為中心的需求的工業力量的融合。
必要的集中
從大數據的變革性可以看出,無論何處部署數據都可以提高業務價值。它的增長可以歸因于業務加速,支持技術的新生態系統,以及企業中數據類型的多樣性的快速發展。它只有單純的市場力量,需要一個整體的手段來管理每個謹慎的組件轉換數據到洞察行動。這些力量的影響是消除對現有基礎設施簡單地附加一些附加工具的需要。
相反,它強制要求簡化企業架構,實施成本效益好的基礎設施,用于包圍企業的大量數據類型和技術,并且監督長期重用數據所需的組織范圍治理和來源。如今的市場力量促成了對這種整體數據管理的需求同,而未來是強制性的。