在今天的信息時代,數據是成功的關鍵因素。然而,獲得正確的數據并能夠對其進行分析以獲得關鍵和準確的見解是至關重要的。正如愛因斯坦曾經說過的那樣:“并非能考慮到的事物都重要,而所有重要的事物并非都在我們的考慮之內。”
不要將數據與信息混淆。需要對數據——原始的測量集合——進行過濾和評估,以便將其納入被認為是信息的學習中。舊的陳詞濫調“信息超載”確實是錯誤的——您可以使數據過載,但信息始終是有價值的。數據本身不一定是可用的。如果沒有被過濾或評估得當,可能會導致錯誤的假設,就像我們最近看到的那些假消息一樣。
在過去的十年左右,數據量已經增長了數量級。《紐約時報》報道,2005年整個數字宇宙的規模是1300億千兆字節。今天的企業環境常常處理PB級的數據。隨著每天數據源數量的增加,處理會越來越快。要了解有事情如何發生變化,請查看下面的圖片,在1956年加載到飛機上的IBM硬盤驅動器。根據@HistoricalPics的推文,這是一個5 MB的硬盤驅動器,稱重超過2000磅!與今天的智能手機比一下。
隨著我們開始測量移動用戶活動和傳感器數據,各種數據類型也在增加。需要記住的是,所有這些數據都不意味著什么,除非你把它變成智力,而且將智力轉化為行動。
物聯網的力量在于其能夠實時捕獲數據并能夠快速合成的能力。當架構正確時,物聯網可以幫助將數據轉換為確定接下來應采取的行動所需的有用信息。
如《哈佛商業評論》中Kristian J. Hammond所說:“在大多數情況下,我們知道我們想要的數據。我們知道需要運行什么分析,需要找到哪些相關性,需要做什么比較。通過將我們所知道的并將其置于自動化系統的手中,可以進行所有這些操作,然后以人為本或自然語言將其解釋給我們,我們可以從始終保持的數據實現洞察力的有效性和規模它的承諾,但到目前為止還沒有交付。通過擁抱機器的力量,我們可以自動從數據中生成故事,彌補數字和知識之間的差距。”
我們如何將傳感變得有意義?在物聯網出現之前,分析各種設備提供的數據的種類和數量是非常困難的。物聯網技術提供了將機器數據拉入數據池進行分析的自動化機制,目的是在數據和應用程序管理中采取下一個邏輯步驟。物聯網不僅收集和分析數據,而且還自動改進流程。
在介紹過程中的步驟之前,我應該花點時間來定義在談論物聯網環境中數據傳輸時經常使用的幾個術語。北行和南行。北行數據是指從設備,通過網關到云端的數據。它通常是遙測數據,但它可以是命令和控制請求。南行數據從云到網關,或從云,通過網關到設備。南向數據往往也可以是命令和控制信息,如軟件更新和請求或更改配置參數。
以下是使用北行和南行通信渠道從傳感到意義的方式:
步驟1:傳感器提供北行遙測數據。根據架構,該數據可以被預處理并發送到位于傳感器附近的現場的數據存儲器;例如網關。步驟2:在網關上的這個臨時點對數據進行一定量的分析。在這里,您可以處理數據,例如,總結或轉換數據,以準備在數據中心或云中進行更深入的分析。然后,在戰術分析中將在網關上處理的信息與先前識別的模式進行比較。這基本上與歷史信息的相關性相匹配。根據您發現的模式,可以采取某些措施。但是你也會尋找你不知道的東西,試圖發現其他的相關性和推論。例如,您可能不知道當天氣低于10度以下,流感藥物處方增加了30%時,雞湯和面巾紙的銷售在未來10天內上漲。你可能以前沒有注意到?,F在,這是一個新的結論,可用于做出業務決策。步驟3:使用提供的新見解,創建一個可執行的規則。例如,當傳感器表示溫度已經降到10度以下時,您就可以將倉庫里的雞湯和盒子的紙巾移到靠近貨運碼頭的地方。通過這種方式,您將一個推理變為一個行為——可以被監控、管理和執行的業務規則。步驟4:在最后一步中,您將該規則編入準則并將其部署到該領域中。在下面顯示的信息生命周期圖中,您可以看到這是一個迭代過程。開源如何輔助
開源軟件項目提供標準化的工具包,讓您可以處理數據并依此實施行動,如Camel和Drools。 Apache Camel是基于Java規則的路由和中介引擎,具有可用于處理數據的企業集成模式。它通過開箱即用的消息中介、路由和數據轉換來協助開發者的物聯網解決方案。在我看來,在物聯網環境中使用Apache Camel的最好方法是通過Eclipse物聯網工作組項目,例如Eclipse Kapua和Kura。
來自JBoss社區的Drools,是一個業務規則管理系統,它已經建立了規則模板,允許您定義在某些情況發生時需要采取的行動。Drools對于具有明確定義的DSL(域專用語言)的物聯網實現需要定義規則和優化規則引擎所需的可擴展性。它還配有一個名為Workbench的GUI,可以讓開發人員輕松創建和編輯規則。
能夠將數據轉換成可以為您效勞的信息,這是任何物聯網工作的核心。而且,正如我之前的博客中指出的那樣,通過開源軟件可以做到這一點,這將有助于加速物聯網的采用和物聯網實施的成功。