在這即將過去的2012年,我們看到隨著技術(shù)的不斷進(jìn)步、互聯(lián)網(wǎng)的發(fā)展,整個(gè)IT界發(fā)生著巨大的變化。我們的數(shù)據(jù)量正在呈幾何倍數(shù)增加,對(duì)于我們每個(gè)人甚至每個(gè)企業(yè)來講都將擁有大量的數(shù)據(jù),而這些數(shù)據(jù)或者信息已經(jīng)開始涉及到我們的方方面面。
大數(shù)據(jù)來勢(shì)洶涌
據(jù)相關(guān)統(tǒng)計(jì)機(jī)構(gòu)指出,截止2011年底,全球的數(shù)據(jù)產(chǎn)生量達(dá)到了1.8萬億GB,未來十年還將增長(zhǎng)50倍,迅速積累的海量數(shù)據(jù)蘊(yùn)含著重大的商業(yè)價(jià)值和社會(huì)價(jià)值——通過挖掘海量數(shù)據(jù),在未來2-5年中,45%的企業(yè)將投資于大數(shù)據(jù),以確保在競(jìng)爭(zhēng)日漸激烈的商業(yè)環(huán)境中獲得生存。大數(shù)據(jù)成為全球IT產(chǎn)業(yè)增長(zhǎng)最快的領(lǐng)域之一,作為大數(shù)據(jù)產(chǎn)業(yè)的重要組成,未來中國(guó)大數(shù)據(jù)潛在市場(chǎng)規(guī)模有望近2萬億元,而全球市場(chǎng)則更高。
正是看到這一市場(chǎng)良好,我們看到越來越多的服務(wù)商開始關(guān)注并且進(jìn)軍大數(shù)據(jù)市場(chǎng)。國(guó)內(nèi)外的軟硬件巨頭強(qiáng)強(qiáng)聯(lián)手,針對(duì)分食大數(shù)據(jù)這塊“蛋糕”。在2012年針對(duì)于大數(shù)據(jù)市場(chǎng),我們看到國(guó)內(nèi)外巨頭們紛紛推出了針對(duì)大數(shù)據(jù)處理的解決方案或者產(chǎn)品來滿足大數(shù)據(jù)的需求,在這些解決方案或者產(chǎn)品中,備受關(guān)注的當(dāng)屬一體機(jī),一體機(jī)同時(shí)也將成為2012大數(shù)據(jù)領(lǐng)域的亮點(diǎn)。讓我們來了解一下大數(shù)據(jù)領(lǐng)域國(guó)內(nèi)外服務(wù)商一體機(jī)的現(xiàn)狀以及特性。
國(guó)外一體機(jī)呈現(xiàn)“三國(guó)鼎立”
1、Oracle Exadata 一體機(jī)
背景介紹:2012年10月,甲骨文公司首席執(zhí)行官Larry Ellison在2012甲骨文全球大會(huì)宣布推出OracleExadataX3DatabaseIn-MemoryMachine。該產(chǎn)品是OracleExadata數(shù)據(jù)庫云服務(wù)器(OracleExadataDatabaseMachines)的最新升級(jí)產(chǎn)品。Larry表示,ExadataX3將與ExadataX2賣一樣的價(jià)錢,。Exadata3完全突破了Exadata2的限制,現(xiàn)在可以把數(shù)據(jù)庫全部跑在內(nèi)存里。
Exadata3數(shù)據(jù)庫軟硬件整合一體化設(shè)備同時(shí)采用了多項(xiàng)技術(shù),如智能高速緩存(Exadata Smart Flash Cache)、混合列式壓縮(Exadata Hybrid Columnar Compression)等。智能高速緩存技術(shù)會(huì)自動(dòng)將讀寫活躍的數(shù)據(jù)存放在性能更好的閃存中,提升數(shù)據(jù)查詢速度及吞吐量,甲骨文表示,數(shù)據(jù)庫的寫入能力(Capacity for Writes)增加了20倍,而當(dāng)數(shù)據(jù)庫執(zhí)行SQL語法時(shí)讀取數(shù)據(jù)時(shí)的速度每秒可達(dá)到100GB。
Exadata3系統(tǒng)提供全機(jī)架、半機(jī)架、1/4機(jī)架和新的低成本1/8機(jī)架配置,以滿足最為廣泛的應(yīng)用需求。Oracle Exadata X3-8 Database In-Memory Machine采用全機(jī)架配置。兩種X3系統(tǒng)均能提供多機(jī)架配置,提供了幾乎無限的可擴(kuò)展性。
Oracle Exadata X3-2和X3-8 Database In-Memory Machine與前幾代Exadata完全兼容,而且現(xiàn)有系統(tǒng)還可用Oracle Exadata X3-2服務(wù)器進(jìn)行升級(jí)。此外,在價(jià)格方面,新的Exadata X3將保持和Exadata X2一樣的價(jià)格,
點(diǎn)評(píng):在大數(shù)據(jù)一體機(jī)領(lǐng)域,Oracle堪稱為鼻祖,從底層硬件到數(shù)據(jù)庫到應(yīng)用軟件,Oracle提供了全面的產(chǎn)品線,從Oracle的一系列的收購(gòu)戰(zhàn)略中我們就可以看到,Oracle對(duì)于未來一體機(jī)的戰(zhàn)略宏圖,對(duì)于一體機(jī)的銷售市場(chǎng),據(jù)了解,Exadata是甲骨文歷史上成長(zhǎng)最快的產(chǎn)品,這也難怪Oracle會(huì)認(rèn)為,Exadata是Oracle 30年最重要的產(chǎn)品之一。
在性能方面, Exadata推出了最新產(chǎn)品Exadata X3,其性能非常卓越,對(duì)于大數(shù)據(jù)處理方面具有非常快的速度,但美中不足的是,目前對(duì)于Exadata更加適合大型企業(yè)。
2、SAP HANA 一體機(jī)
背景介紹:在2006年SAP最初開發(fā)HANA的時(shí)候,它就是可以作為單一的數(shù)據(jù)源來進(jìn)行交易和分析系統(tǒng)的處理。
而SAP的HANA首次正式面市是大約是在2011年,它是作為SAP進(jìn)軍數(shù)據(jù)分析市場(chǎng)的一次嘗試,對(duì)于之前一直專注在ERP等應(yīng)用軟件領(lǐng)域的SAP而言這是一次大膽嘗試。HANA大膽地采用了內(nèi)存計(jì)算技術(shù)和列式存儲(chǔ)等技術(shù),以“實(shí)時(shí)的數(shù)據(jù)分析能力”作為其最大的賣點(diǎn)之一,這在同類產(chǎn)品中并不多見,從而引發(fā)了業(yè)界對(duì)此廣泛關(guān)注。
“SAP HANA 這一突破性的創(chuàng)新技術(shù)能夠幫助用戶以快10萬倍的高速訪問和發(fā)布信息。同時(shí),它還幫助用戶以一種全新方式駕馭大數(shù)據(jù),助力企業(yè)運(yùn)營(yíng)。”SAP 全球執(zhí)行副總裁、數(shù)據(jù)庫及技術(shù)部總經(jīng)理 Steve Lucas 表示, “SAP 的實(shí)時(shí)數(shù)據(jù)平臺(tái)構(gòu)建出一條信息價(jià)值鏈,能夠適時(shí)找出并利用正確信息,使其在 SAP HANA、SAP Sybase IQ 服務(wù)器和 Hadoop 文件系統(tǒng)之間傳輸。”
點(diǎn)評(píng):SAP HANA被推向市場(chǎng)后,客戶對(duì)于HANA認(rèn)可程度非常高,相關(guān)數(shù)據(jù)顯示,僅僅一年,就有600家客戶,在亞太區(qū)就有100家客戶,這對(duì)普通軟件商來說是不可想象的。除了大數(shù)據(jù)以外,在云計(jì)算方面,SAP HANA也表現(xiàn)出了強(qiáng)大的能力,SAP組建出了250TB內(nèi)存的龐大HANA云,有不同的服務(wù)器組成的Cluster,HANA能夠處理大數(shù)據(jù)運(yùn)行速度每秒達(dá)77萬條。
3、IBM Netezza 一體機(jī)
背景介紹:IBM在2010年收購(gòu)Netezza后,同時(shí)融合了IBM在硬件、企業(yè)中間件和咨詢服務(wù)領(lǐng)域的傳統(tǒng)優(yōu)勢(shì)以及在數(shù)據(jù)管理、業(yè)務(wù)分析優(yōu)化、云計(jì)算等方面的實(shí)力,更好地解決客戶需求,同時(shí)推出了IBM Netezza 一體機(jī)。
據(jù)了解,IBM Netezza數(shù)據(jù)分析一體機(jī)是以IBM BladeCenter技術(shù)為基礎(chǔ)的優(yōu)化系統(tǒng)。與市面上其他的一體機(jī)產(chǎn)品不同,Netezza只需幾分鐘便可運(yùn)行使用,而無需耗費(fèi)數(shù)日乃至數(shù)周之久。它能以超越競(jìng)爭(zhēng)產(chǎn)品百倍的速度分析拍字節(jié)數(shù)據(jù),且總擁有成本也遠(yuǎn)遠(yuǎn)低于競(jìng)爭(zhēng)產(chǎn)品。借助這款新工具,零售企業(yè)還可以利用SPSS預(yù)測(cè)分析軟件和IBM全球企業(yè)咨詢服務(wù)來更深入地劃分客戶群體并開展業(yè)務(wù)分析,從而拓展自身的預(yù)測(cè)分析能力。
點(diǎn)評(píng):據(jù)IBM相關(guān)人員透露,一系列一體機(jī)的推出,將會(huì)影響原有一部分IBM合作伙伴的生意,因?yàn)橛脩羲媾R的挑戰(zhàn)在變、需求在變,以IBM為代表的廠商也必須進(jìn)行改變,合作伙伴也必須進(jìn)行更多的轉(zhuǎn)型。在新的一體機(jī)平臺(tái)上,那些能夠創(chuàng)造更多附加值的合作伙伴將擁有更多的商業(yè)機(jī)會(huì)。除一體機(jī)以外,針對(duì)大數(shù)據(jù),IBM還在在中國(guó)發(fā)布針對(duì)大數(shù)據(jù)處理專家系統(tǒng)PureData,PureData能夠?qū)⑾到y(tǒng)安裝和配置時(shí)間從數(shù)天減至數(shù)小時(shí),將復(fù)雜的分析操作時(shí)長(zhǎng)從數(shù)小時(shí)降至數(shù)分鐘,并且能夠?qū)崿F(xiàn)在單個(gè)系統(tǒng)上管理超過100個(gè)數(shù)據(jù)庫。據(jù)相關(guān)資料顯示,通過PureData,企業(yè)得以在傳統(tǒng)IT環(huán)境或云環(huán)境中為業(yè)務(wù)用戶提供高性能的數(shù)據(jù)服務(wù),能夠在不到10天的時(shí)間里完成Web應(yīng)用的部署。
4、微軟計(jì)劃發(fā)布2013年推并行數(shù)據(jù)庫一體機(jī)
背景介紹:微軟計(jì)劃于2013年上半年發(fā)布基于SQL Server 2012的并行數(shù)據(jù)庫一體機(jī)(SQL Server 2012 Parallel Data Warehouse Appliance)以下簡(jiǎn)稱PDW,用以布局未來大數(shù)據(jù)市場(chǎng)。
基于SQL Server的微軟并行數(shù)據(jù)倉(cāng)庫一體機(jī)是現(xiàn)代的數(shù)據(jù)管理平臺(tái),可實(shí)現(xiàn)對(duì)于任何大小數(shù)據(jù)、隨時(shí)隨地的處理,簡(jiǎn)單而且更加容易部署。微軟并行數(shù)據(jù)倉(cāng)庫一體機(jī)是針對(duì)企業(yè)數(shù)據(jù)倉(cāng)庫、高度可擴(kuò)展的設(shè)備,使用Microsoft SQL Server中的“并行數(shù)據(jù)倉(cāng)庫”及其“大規(guī)模并行處理”體系結(jié)構(gòu),獲得可伸縮的性能和靈活性。
點(diǎn)評(píng):大數(shù)據(jù)的應(yīng)用涉及到方方面面,微軟提供了一系列的產(chǎn)品來支持大數(shù)據(jù)的落地,來滿足客戶對(duì)于大數(shù)據(jù)的支持,據(jù)了解為了幫助客戶快速部署大數(shù)據(jù),微軟并行數(shù)據(jù)倉(cāng)庫一體機(jī)兼容當(dāng)前最為流行的非結(jié)構(gòu)化數(shù)據(jù)體系Hadoop。對(duì)于大數(shù)據(jù)的投資,微軟未來可是要下了“血本”。
國(guó)內(nèi)一體機(jī)后起之秀
背景介紹:我們看到國(guó)外的服務(wù)商通過一體機(jī)發(fā)力大數(shù)據(jù)領(lǐng)域,國(guó)內(nèi)服務(wù)商也在加大對(duì)于大數(shù)據(jù)一體機(jī)的步伐,據(jù)了解,為了推動(dòng)國(guó)內(nèi)大數(shù)據(jù)的發(fā)展,浪潮也推出大數(shù)據(jù)一體機(jī)。大數(shù)據(jù)一體機(jī)采用的是新型的技術(shù)體系架構(gòu),涵蓋數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理、數(shù)據(jù)展現(xiàn)等全環(huán)節(jié)并提供一體化的數(shù)據(jù)處理的產(chǎn)品方案。據(jù)相關(guān)資料顯示,它具備以下特點(diǎn):
新型技術(shù)體系架構(gòu):采用全分布式大數(shù)據(jù)處理架構(gòu),平臺(tái)能夠隨著客戶數(shù)據(jù)的增長(zhǎng)和業(yè)務(wù)的擴(kuò)張而不斷增長(zhǎng),并且能夠保持極高的線性度,解決了傳統(tǒng)架構(gòu)的擴(kuò)展瓶頸,系統(tǒng)在擴(kuò)展至120000核心時(shí)依舊保持0.8左右的擴(kuò)展效率。
軟硬一體化的系統(tǒng):集成計(jì)算單元、存儲(chǔ)單元、通訊單元、管理單元、等核心模塊,是對(duì)數(shù)據(jù)存儲(chǔ)、處理、展現(xiàn)的全環(huán)節(jié)的解決方案,由浪潮統(tǒng)一開發(fā),能夠統(tǒng)一交付,集中管理,用戶可以輕松完成。
全局優(yōu)化的系統(tǒng):浪潮進(jìn)行全局優(yōu)化性能等技術(shù)指標(biāo)大幅提升,在性能、可用性方面有了重大提升。通過優(yōu)化系統(tǒng)任務(wù)調(diào)度策略,動(dòng)態(tài)調(diào)整任務(wù)執(zhí)行資源,減少慢任務(wù)數(shù)量,任務(wù)執(zhí)行時(shí)間平均縮短16%以上;引入Reed-Solomon算法,優(yōu)化分布式散列數(shù)據(jù)布局,滿足文件高并發(fā)和高帶寬雙重需求同時(shí)平衡數(shù)據(jù)冗余度,浪潮采用兩副本加編碼的方式相對(duì)三副本最大可實(shí)現(xiàn)30%空間節(jié)省;采用多級(jí)高速緩存,固化特定算法到FPGA,實(shí)現(xiàn)硬件加速。經(jīng)測(cè)試,1TB數(shù)據(jù)排序測(cè)試整體訪問性能提高50%。
點(diǎn)評(píng):對(duì)于大數(shù)據(jù)一體機(jī)我們可以看到浪潮或許是國(guó)內(nèi)第一款大數(shù)據(jù)一體機(jī),從長(zhǎng)遠(yuǎn)來看,雖然面對(duì)著國(guó)外巨頭以及技術(shù)的壓力,但我們看到至少在大數(shù)據(jù)領(lǐng)域國(guó)內(nèi)企業(yè)還是邁出了堅(jiān)實(shí)的一步,相信未來加大對(duì)于產(chǎn)品的研發(fā)、技術(shù)的研發(fā),必然能夠縮短差距,讓更多的企業(yè)受益于大數(shù)據(jù),才能更好的提升競(jìng)爭(zhēng)力。
小結(jié)
我們看到在2012年針對(duì)大數(shù)據(jù)領(lǐng)域,各大服務(wù)商都是主推的一體機(jī),這正如某行業(yè)記者所認(rèn)為的“軟硬件垂直整合正在成為IT產(chǎn)業(yè)一種新趨勢(shì),甲骨文、IBM等都紛紛推出了各自的軟硬一體機(jī)系列產(chǎn)品,而正是這幾家企業(yè)的變化將深刻地影響全球企業(yè)級(jí)IT產(chǎn)業(yè)生態(tài)體系的構(gòu)建。”
從大的環(huán)境來看,目前全球大數(shù)據(jù)技術(shù)的發(fā)展還處于起步階段,針對(duì)大數(shù)據(jù)無論是軟件技術(shù)還是硬件技術(shù)或是軟硬一體的技術(shù),國(guó)外企業(yè)的投入和重視都遠(yuǎn)比國(guó)內(nèi)企業(yè)要多得多。因此,“國(guó)內(nèi)IT企業(yè)要想在新一代信息技術(shù)的發(fā)展中搶到更多的話語權(quán),未來則必須高度重視和投資大數(shù)據(jù)技術(shù)和應(yīng)用。”