數據庫巨人甲骨文試圖通過商業化以及將大批專利軟件和開源軟件整合到預配置的x86服務器上的做法來拯救NoSQL和類似的數據存儲設備以及象Hadoop那樣的大數據設備。甲骨文沒有透露這些設備的銷售業績如何,但它升級了這些設備的底板和核心軟件中的NoSQL Database,那表明甲骨文認為Big Data Appliance是值得繼續投資的。
Big Data Appliance最早在2011年10月舉行的OpenWorld大會上就進行過預覽,今年1月開始銷售。它是對甲骨文Exadata數據庫群集、Exalogic應用服務器群集和Exalytics內存內設備的補充。 這些設備就是所謂的引擎系統,指的是那些用來運行非常具體的工作負載的系統。
甲骨文所有的設備都預設定了一個統一的硬件價格。這些系統或許預裝了特定軟件,但是基本價格并不包括軟件的價格,更重要的是,那些軟件的價格通常是基礎服務器、存儲設備和交換機的價格的2到3倍。 但是對于Big Data Appliance來說,其中預裝的軟件的價格已經被包含到了產品的價格之中。
Big Data Appliance群集實際上就是一種Hadoop Big Data設備,它在Cloudera提供的CDH 3 Hadoop配置下采用了甲骨文自己的Berkeley DB NoSQL數據庫。服務器結點運行著甲骨文自己改造的紅帽企業版Linux系統,還配置了數據加載和整合工具,來管理甲骨文11g R2數據庫的數據讀寫。 甲骨文還整合了開源R統計編程語言和運行時間,這樣群集中的每一個結點都可以運行R和MapReduce數據讀取常規任務。
第一代Big Data Appliance在機架上安裝了18個雙插槽Xeon 5600服務器,總共達到216個核心、864GB的主存儲容量和648TB的磁盤容量。每一個結點都有兩個時鐘頻率為3.06GHz的Xeon X5675處理器,內存為48GB和12個3TB的7.2k RPM的3.5寸SAS硬盤。 群集的各個結點之間通過一臺36接口的QDR(40GB/s)InfiniBand交換機相連,還有兩臺配備了8個10Gigabit Ethernet接口和32個InfiniBand QDR接口的交換機用來將機架內的系統與外界的其他系統相連。
隨著Hadoop和NoSQL群集的擴容,你可以利用備用的InfiniBand交換機容量將多個機架連接在一起,Oracle NoSQL數據存儲和Cloudera Hadoop軟件也會隨著結點的增加進行擴容。甲骨文已經選定的交換機允許在一個平面、非模塊式InfiniBand結構中最多將18個機架或324個結點連接在一起。 如果你想配置規模更大的系統,那么你就必須使用數量更多、容量更大的交換機。
Big Data Appliance預配置了免費的NoSQL社區共享版軟件,但是如果你想使用更多的功能,那么你還可以使用NoSQL企業版軟件。你還可以在群集上運行Hadoop分布式文件系統,以便儲存各種非結構化數據。HDFS與甲骨文NoSQL并不是相互排斥的。
第一代Big Data Appliance的售價為每機架45萬美元,其中包括Cloudera的CDH 3 Hadoop的一個終身OEM許可證,整個系統的高級支持服務合同的價格為每年5.4萬美元。算下來,每個節點的成本大約為2.8萬美元,如果你可以讓客戶來埋單的話,那也不是一筆小數目。
周一宣布的Big Data Appliance X3-2包括了硬件和軟件,但是價格穩定在每機架45萬美元。
甲骨文將采用基于英特爾最新Xeon E5處理器的服務器結點。甲骨文的雙插槽結點現在配置的是Xeon E5-2660處理器,它的時鐘頻率為2.2GHz。 甲骨文在聲明中稱,這可以提供比以前的產品多33%的處理能力,但是這一數據并不嚴謹。
是的,從6核升級到8核處理器可以給你提供比以前多33%的核心,但是那些核心的時鐘速度比以前的產品慢了28%。如果你看看利用X5675和E5-2660處理器的不同設備在SPECint 2006 CPU測試中的結果,你就會發現后者的性能要高出10%。 很難說這將如何轉化為更多的NoSQL或者Hadoop負載,但是一般而言,更大的超高速緩存和主內存以及更多的線程有助于增加系統的負載處理能力。
甲骨文將把機架上的主存儲容量提高33%,達到1.1TB,每個結點64GB,這樣有助于提升性能?;赬eon E5的設備的能源和冷卻成本比基于Xeon 5600的設備少30%,因此你還可以從這些新設備中獲得更多的好處。 硬盤的數量和容量仍然是每機架648TB。
在軟件方面,Big Data Appliance X3-2 Appliance包括了最新的Oracle Enterprise Linux 5.8和它自己升級的用來運行Java的Hotspot Java虛擬機。(Hadoop是用Java語言編寫的,因此這很重要。) 甲骨文還將采用Cloudera在6月份發布的最新CDH 4 Hadoop。
甲骨文還推出了2.0版NoSQL數據庫,該產品配備了C語言編程所需的API,支持JSON,還有管理以NoSQL形式儲存的更大對象所需的另一個API。軟件中還有一個外接表格連接,以便運行在甲骨文11g的關系數據庫中的SQL查詢可以從11g內部檢閱和查詢NoSQL數據庫中的記錄。 開源R distro已經升級,而且甲骨文Oracle Enterprise Manager還增加了一個新插件,可以控制Big Data Appliance。