“互聯網+”引出了大數據問題,針對數據來說,它和水、電資源一樣,不神秘但卻威力巨大。一百年前能夠用上電能的企業是非常了不起的,但今天,沒有人會以能夠用上電能而引以為傲,因為電——無所不在。同理,數據——伴你左右。
由于互聯網的大肆蔓延,隨著產生出成千上萬、成萬上億且各式各樣數據,且這個數據的生產模式還在不斷運行、不斷改變。我們剛體會出互聯網的便利,就被互聯網帶來的數據巨量化驚到了!大數據是利還是弊?有人說它無所不能,也有人說它只是一場泡沫演出。
如果大數據是泡沫一觸就破,但如果不是呢?
為什么說大數據會是泡沫呢?現實有一種說法:大數據可以讓你獲得所需要的一切,這些對于大數據過多的炒作,到底是真實的還是虛構的?如果你認為這些話是鼓吹大數據的做法,是不能實現的虛假宣傳,那么大數據會是一場泡沫演出,一觸就破。但如果你相信大數據將會主導未來,并非一場泡沫的話,請你不要停留在大數據的泡沫問題上,落實與變革才是數據分析中的高級之處。
說到泡沫——IT泡沫,我們真正意義上經歷過互聯網泡沫,大家熟知從1999年到2000年,當時出現了大規模的互聯網泡沫。其泡沫破裂之后,眾多企業經濟受損。然而當時的說法是,互聯網本身并非缺少價值,而是我們認為這種價值的獲得太過容易、太過迅速,這樣才造成了當時的互聯網泡沫。也就是說,在當時,普遍認同互聯網泡沫的危害是極大的。然而看一看現如今,互聯網已經深入到方方面面,以至于對工作、生活都帶來了非常深遠的影響和改變。這樣天地之差的感官與受益,當初的一場泡沫難道沒有意義嗎?
Gartner公司研究,大數據高級分析已經成為企業當下必須優先考慮的要務。
目前大數據也處于上述這種情況,幾年之后,只要大數據一旦可以帶來非常好的影響。現在這種泡沫的說法,自然也就一觸就破。
在過去,很多企業設立了單獨的大數據部門,或者將其分布于不同的分公司中。然而這些數據卻分散在企業各個不同的系統里面,并且還由不同的人員加以管理。這與大數據分析廠商Teradata公司所提出的企業級數據倉庫存在差異,所謂企業級數據倉庫是將數據源整合在一起,深入挖掘企業內部的數據價值。
這里要特別強調的是,我們是否應該避免過去傳統數據管理的問題,即要把數據統一集中在一起?在思考這個問題時,我們應該先對大數據的變化做到了如指掌。
數據分析的變革——Teradata天睿公司首席分析官Bill Franks
如今,我們面臨數據分析的變革,這非常類似于傳統的工業革命。在過去,產品的生產和購買方式都是手工作坊式的。思考過去,一方面因為它是手工制作的,所以不可能得到量產,也不可能得到擴展。另一方面,手工制作下的每一件產品也不可能做到完全一致。而工業革命的到來,徹頭徹尾地改變了它,即實現了產品的大規模生產。然而這并不是說手工作坊不重要,手工作坊價值在于定制化的價值,大規模生產中恰恰舍掉了這一部分。
同比大數據分析模式,手工作坊的方式是數據分析的所在,即通過“手工定制”的辦法,來針對企業具體的問題,做一些有關大數據的分析。其中,大數據分析廠商通過自己的技術特點為企業提供一些定制的解決方案。
Teradata天睿公司首席分析官Bill Franks
但面對千變萬化的市場變革下,針對大數據高級分析,Teradata天睿公司首席分析官Bill Franks提出了企業首要面對的問題:數據的高價值與低價值,對于存在高價值的大數據源,我們需要定制化的或者深層的分析能力。但是對于低價值的大數據資源,我們可不可以通過部署在具體的業務流程中、對大數據進行快速、低成本的分析解決方案?對此,Teradata公司在大數據高級分析中提出了非常落地的解決方案,即可以根據企業所需,在技術里、業務流程里嵌入數據分析,實現自動化地數據分析處理,這樣一來,我們不再需要太多的人工參與就可以進行數據分析。在衡量成本與支出的大數據天平上,采用業務驅動的大數據高級分析,可謂是一場數據分析的“工業革命”。
大數據廠商的意義何在?
我們怎么能夠利用這些大數據,讓其能夠帶來更多的價值,并利用它做更多的事情呢?針對大數據的挖掘工作來說,從大數據分析廠商中找到相關的工具、技術,以及專業服務應該是我們著重關注的地方。
為此,Teradata公司提出了“三個能夠”,可以作為我們衡量的標尺:
大數據分析廠商應該能夠挖掘企業業務的問題所在,幫助企業找到具體方法,并提供具體的工具和技術,更大地發揮大數據的作用;
能夠幫助企業發現問題,助力企業部署大數據。從業務的部署來說,幫助企業通過在業務當中實現大數據價值;
能夠在前端幫助企業發現數據的價值,同時在后臺可以進行跟蹤,給它進行量化,發現數據價值所在。
既然標尺已經確立,市場需要的大數據分析廠商應該是既能了解企業自身的行業知識,同時又具有專業的大數據分析能力。
在日益變化的市場環境下,Teradata提出的大數據高級分析中,還特別針對新的數據源,包括傳感器數據源、關系型數據、文本型數據等,提出了更高的要求,能夠作出預測性的維護工作和尋找到新的數據源。有且僅有這樣的高級分析,才是我們應該選擇的大數據高級分析。
Forrester公司在最新的內存分析數據庫平臺評估報告中指出,Teradata的優勢在于為分析負載提供高性能以及擴展性、硬件平臺整合、高可用度、災難恢復,以及對各種工具和編程語言的廣泛整合。Teradata的路線圖包括對內存處理的強化,以及對智能內存的優化。