物聯網(IoT)是技術市場上增長比較快的市場之一。合并和分析設備數據的能力既是福也是禍。數據格式以迭代速度變化,并且數據量在不斷增長,而且看不到盡頭。
物聯網數據只有一個地方可以管理和控制:流。數據流通過將物聯網領域的高級中間件與高級機器學習和人工智能相結合來處理數據傳輸。
但是,并非所有的流技術都是一樣的。流從一開始就被設計用來實現快速有效的數據移動,支持從醫療警報到遠程維護和智能家居的各種用例。為了完成這些多樣化的用例,流必須支持多種數據類型,并準備支持現有和新興的行業標準。
如今,隨著這個市場的成熟并發現流數據的更廣泛的應用和接受,業務和技術要求正在不斷擴大。數據流至少必須:
· 提供實時分析。
· 包括集成的數據管理,包括數據沿襲。
· 根據數據提供實時操作。
· 執行實時異常檢測。
· 支持所有類型的數據,包括有序和無序數據集。
· 隨流數據一起攜帶重要的標記信息。
· 支持獨立的數據區域設置。
· 嵌入數據安全性。
· 提供附加功能。
· 需要速度和吞吐量。
上面的要求是流技術的基礎。除了這些明顯的要求之外,我還建議了三個技巧來幫助您采用流技術:
1.為決策而構建。傳統上,分析是一種后處理功能,但在流技術領域卻并非如此。流將分析范圍擴展到在關鍵時刻提供關鍵數據。相反,流的分析模型依賴于問題確定和行動。這意味著流分析可以觸發警報,協調呼叫并將實時數據提供給舊版應用程序以立即改善業務。
為了使所有這些工作正常進行,流必須支持從GPU到CPU的最新計算模型,尤其是考慮到越來越需要在物理上更接近執行工作的地方進行工作。最后,隨著計算和存儲變得更加專業化,將需要流技術來支持專注于查詢或推理的參考體系結構,該體系結構由用于高級分析的API和過程組成。
2.了解您的業務案例。傳統上,我們將數據帶回中央數據倉庫或一系列數據湖,然后在其中進行分析。創建了許多技術來支持這種結構,包括Hadoop,數據多維數據集解決方案和多維數據庫。物聯網和流媒體解決方案的出現徹底改變了這種范例。如今,邊緣應用程序是圍繞推理模型構建的,從而允許邏輯工作更靠近生成數據的位置進行。不再需要將數據回傳到中央存儲庫或云。可以實時掃描IoT數據以確定異常或提供數據趨勢。噪聲數據可以本地存儲,也可以在源頭刪除,這代表著網絡,計算和存儲量的大幅減少。
正確的流技術可以通過內置邏輯,快速準確的問題確定和根本原因分析來識別數據中的異常。無需指責即可確定準確的問題區域,可幫助工程師在創紀錄的時間內解決問題,降低成本并提高客戶滿意度。流解決方案還應該具有靈活的能力來建立單獨的流,為機器學習或AI訓練模型提供這些異常的預定格式以供攝取-自動分析高度復雜和具有挑戰性的問題區域。
3.對現實世界的支持。流技術必須支持簡化編程的配置,并且必須高度適應多種環境。如今,支持無序數據處理的能力已成為常態。但是,對支持流中的有序數據的要求日益嚴格。對于機器學習和AI模型,這至關重要。流平臺中必須有順序處理流。知道并支持有序流可以提高建模的準確性,并且可以大大改善問題確定性,并可以對可預測的數據排序進行有力的控制。
最重要的是,數據流代表了跨云、混合云和邊緣計算等復雜環境的數據融合中的下一個重大飛躍。數據流今天就在這里,隨著物聯網的出現,它們是未來的浪潮。