日前,百度開(kāi)放云天工智能物聯(lián)網(wǎng)平臺(tái)再添一款重量級(jí)產(chǎn)品——分布式時(shí)序數(shù)據(jù)庫(kù),距今年7月13日百度CEO李彥宏在百度云計(jì)算戰(zhàn)略發(fā)布會(huì)上宣布推出天工平臺(tái)不到3周時(shí)間。百度開(kāi)放云也成為國(guó)內(nèi)首家發(fā)布物聯(lián)網(wǎng)云數(shù)據(jù)庫(kù)的公有云廠(chǎng)商。
根據(jù)相關(guān)研究機(jī)構(gòu)預(yù)測(cè),到2020年,將有125億帶有傳感器的設(shè)備被使用、監(jiān)控以及自動(dòng)化部署,屆時(shí)全球數(shù)據(jù)總量將超過(guò)40ZB(相當(dāng)于4萬(wàn)億GB),這一數(shù)據(jù)量將是2012年的22倍,年復(fù)合增長(zhǎng)率48%。物聯(lián)網(wǎng)發(fā)展已經(jīng)成為驅(qū)動(dòng)中國(guó)實(shí)現(xiàn)自動(dòng)化生產(chǎn)的關(guān)鍵目標(biāo),而物聯(lián)網(wǎng)大數(shù)據(jù)將是其中的重要課題。
大數(shù)據(jù)的存儲(chǔ)模型經(jīng)歷了多個(gè)發(fā)展階段,其中,關(guān)系型數(shù)據(jù)庫(kù)在計(jì)算機(jī)數(shù)據(jù)管理的發(fā)展史上是一個(gè)重要的里程碑。數(shù)據(jù)結(jié)構(gòu)化、最低冗余度、較高的程序與數(shù)據(jù)獨(dú)立性、易于擴(kuò)充、易于編制應(yīng)用程序等優(yōu)點(diǎn),使其一直長(zhǎng)期被廣泛應(yīng)用于數(shù)據(jù)的存儲(chǔ)、處理及分析,但隨著網(wǎng)絡(luò)技術(shù)和軟件技術(shù)的飛速發(fā)展,人們發(fā)現(xiàn)關(guān)系型數(shù)據(jù)庫(kù)系統(tǒng)雖然技術(shù)很成熟,但其局限性也是顯而易見(jiàn):它能很好地處理所謂的“表格型數(shù)據(jù)”,卻對(duì)越來(lái)越多復(fù)雜類(lèi)型的數(shù)據(jù)無(wú)能為力。
隨著云計(jì)算時(shí)代的到來(lái),云端的拓展也成了物聯(lián)網(wǎng)的重要趨勢(shì)之一。百度開(kāi)放云天工平臺(tái)此次發(fā)布的分布式時(shí)序數(shù)據(jù)庫(kù),不僅在原本關(guān)系型數(shù)據(jù)庫(kù)的優(yōu)勢(shì)上給予優(yōu)化,其非結(jié)構(gòu)化的數(shù)據(jù)處理方式,也更好的迎合了信息時(shí)代下的數(shù)據(jù)多樣化趨勢(shì)。
時(shí)間序列數(shù)據(jù)——是在不同時(shí)間點(diǎn)上收集的數(shù)據(jù),反映事物隨時(shí)間變化而變化的過(guò)程。某個(gè)鍋爐過(guò)去24小時(shí)內(nèi)每分鐘的溫度就是典型的時(shí)間序列數(shù)據(jù),它的特點(diǎn)是每一個(gè)時(shí)間戳對(duì)應(yīng)一個(gè)數(shù)值(在上面的例子里,這個(gè)數(shù)值就是溫度)。在不同的應(yīng)用場(chǎng)景中,這個(gè)數(shù)值可以是電流、電壓、轉(zhuǎn)速、濃度、分貝、頻率,無(wú)論是哪種度量,每一個(gè)數(shù)值都對(duì)應(yīng)一個(gè)具體的采集時(shí)間戳。
天工平臺(tái)的時(shí)序數(shù)據(jù)庫(kù)(TSDB)是一種非關(guān)系型數(shù)據(jù)庫(kù)。區(qū)別于傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù),TSDB針對(duì)時(shí)間序列數(shù)據(jù)的存儲(chǔ)、查詢(xún)和展現(xiàn)進(jìn)行了專(zhuān)門(mén)的優(yōu)化,從而獲得極高的數(shù)據(jù)壓縮能力、極優(yōu)的查詢(xún)性能,特別契合需要處理海量時(shí)間序列數(shù)據(jù)的物聯(lián)網(wǎng)應(yīng)用場(chǎng)景,在工業(yè)制造、環(huán)境、能源、水務(wù)、物流等領(lǐng)域有著巨大的需求。
具體來(lái)說(shuō),基于云端去中心化架構(gòu)的TSDB,能夠?qū)崿F(xiàn)數(shù)據(jù)的海量存儲(chǔ);與傳統(tǒng)數(shù)據(jù)庫(kù)相比存儲(chǔ)效率提升數(shù)十到數(shù)百倍,極大節(jié)約存儲(chǔ)空間;高速的檢索使數(shù)百萬(wàn)條數(shù)據(jù)的查詢(xún)得以秒級(jí)響應(yīng);不僅支持十幾種聚合操作,強(qiáng)大的Open API還能使企業(yè)得以方便的對(duì)接各種第三方物聯(lián)網(wǎng)應(yīng)用;此外,基于分布式架構(gòu)的TSDB采用多副本存儲(chǔ)策略,在確保服務(wù)更加穩(wěn)定的同時(shí),更為用戶(hù)提供快速?gòu)椥詳U(kuò)展能力,用戶(hù)不用再擔(dān)心丟數(shù)據(jù)或者無(wú)法處理不斷增長(zhǎng)的海量數(shù)據(jù)。
此外,TSDB更好的延續(xù)了工業(yè)用戶(hù)使用實(shí)時(shí)歷史數(shù)據(jù)庫(kù)的習(xí)慣,所采用的分布式區(qū)中心架構(gòu)打破了傳統(tǒng)架構(gòu)在性能和容量上的瓶頸,能更好地滿(mǎn)足工業(yè)等領(lǐng)域處理海量時(shí)序數(shù)據(jù)的需求,方便工業(yè)物聯(lián)網(wǎng)應(yīng)用更加便捷地搭建在云端,實(shí)現(xiàn)海量數(shù)據(jù)上云,進(jìn)而與開(kāi)放云大數(shù)據(jù)產(chǎn)品與服務(wù)快速對(duì)接,實(shí)現(xiàn)更加高效的數(shù)據(jù)分析,洞察數(shù)據(jù)價(jià)值。
通過(guò)持續(xù)技術(shù)創(chuàng)新和不斷積累行業(yè)經(jīng)驗(yàn),天工平臺(tái)日益成為更懂行業(yè)的智能物聯(lián)網(wǎng)平臺(tái),在工業(yè)制造、能源、零售O2O、車(chē)聯(lián)網(wǎng)、物流等行業(yè)提供完整的解決方案。至此,天工智能物聯(lián)網(wǎng)平臺(tái)已經(jīng)發(fā)布包括時(shí)序數(shù)據(jù)庫(kù)在內(nèi)的物接入、物解析、物管理等一系列產(chǎn)品,據(jù)悉后續(xù)還會(huì)有規(guī)則引擎、流式處理等重量級(jí)產(chǎn)品推出。隨著天工平臺(tái)的完善和發(fā)展,百度開(kāi)放云將成為爭(zhēng)奪物聯(lián)網(wǎng)市場(chǎng)的重要玩家。