當人們提到物聯網(Internet of Things)的時候,通常會想到像是Hadoop這樣的大數據科技,這種大數據科技可以存儲PB大小的數據集,并且可以分析已知或是未知的圖形。許多人不知道的是,很多時候使用物聯網只需要很小的數據集。你可能會問,什么是小數據?小數據是一種包含了非常特殊屬性的的數據集。小數據通常被用來確定當前狀態條件,通過分析更大的數據集來生成。當我們談論到被部署在風力渦輪機,小包裝,閥門,管道或是被連接到無人駕駛機的智能設備的時候,我們其實就是在討論收集小數據集。小數據可以告訴我們關于位置,天氣,濕度,氣壓,振動甚至是一個項目開展與否這樣的信息。傳感器則給予我們實時的小型數據集,使我們能夠吸收提供了歷史角度的大數據集。
那么,為什么小數據如此重要?小數據可以根據現在所發生的事來觸發事件,而這些事件還可以被合并,和一些大數據集的機器學習算法中的行為或趨勢信息。這里還有一些例子:
小數據和大數據的例子
在風力渦輪機上安裝著各種傳感器,通過他們可以確定風向,流速,溫度,振動和其他有關屬性,人們可以通過編程將渦輪機的葉片調整為自動調節,以便于根據小數據即時提供的信息改變風力條件。這些小數據也會匯入一個較大的數據湖,在哪里機器學習算法也開始能夠理解圖形。這些圖形可以根據他們的歷史維護記錄揭示出某些機制的表現,像是風和氣候條件是怎樣對不同組件的磨損造成影響的,以及什么是平均壽命的特殊部分。
另一個例子是在藥品瓶子上智能標簽的使用。小數據能用來確定該種藥品是在哪里生產的,它剩余的保質期,如果瓶子的密封性被破壞,為了防止藥品被破壞需要怎樣的氣溫條件。隨著時間的推移,大數據可以被用來查看這些信息,研究分析藥品到期或被破壞的根本原因。是由于某些貨運公司或是某個零售商?是否有重復出現的案例來幫助我們明確指出供應鏈中的問題,以便于最大限度的減少這些事件的發生。
你需要大數據或是小數據么?
盡管一些人認為,不是所有物聯網案例都需要使用大數據,在許多情況下,知道少數屬性的當前狀態是要觸發所期望事件所需要的全部工作。病人的血糖是否過高?冷藏車中容器的最佳溫度是多少?土壤養分中是否含有正確的混合物?閥門是否泄露?
通過相關小數據進行分析來優化這些業務流程,可以為公司節約數百萬美元的資金。小數據知道跟蹤對象在做什么,如果你想要知道為什么該跟蹤對象在做那些事,你就需要用到大數據了。所以,當下一次有人告訴你他們正在著手一個物聯網倡議的時候,不要再認為這跟大數據有什么關系了。