從數據庫一體機到大數據一體機,軟硬垂直整合不僅是IT廠商的產品趨勢,也成為企業用戶未來的主流選擇。之所以成為主流,關鍵詞就在于性能—軟硬優化后的一體機性能更為優異。于是,自甲骨文、IBM等具有自有軟硬件品牌的大型IT企業推出一體機后,市場上也出現了形形色色的軟硬廠商聯合優化捆綁的一體機產品。
尤其對于大數據一體機來說,由于Hadoop的開放架構,使得不少具有軟件開發能力的IT企業都得以有機會開發自己的Hadoop商業版本,從而進入大數據領域。而有著硬件技術優勢的浪潮,自去年發布云海大數據一體機之后,也一直圍繞大數據一體機的核心—系統軟件緊鑼密鼓地進行技術積累。
近日,浪潮終于發布了其大數據一體機系統軟件—浪潮云谷Cloud Canyon V1.0。作為大數據系統軟件,云谷對于浪潮的大數據戰略可謂四兩撥千斤。它不僅在技術戰略上讓浪潮云海大數據一體機有了核心引擎,還進一步聚焦了浪潮的大數據行業市場戰略,而其向ISV、SI開放總線開發平臺的做法,則奠定了浪潮布局平臺化軟硬件整體解決方案,以開放推動“大數據生態鏈”發展全新產品的戰略,開啟了浪潮“產品+服務”的端到端交付大數據整體戰略。
聚焦行業大數據
正如當初進入云計算領域時,面對國際廠商在私有云領域的優勢,浪潮選擇行業云作為主攻方向一樣,在大數據領域,浪潮智慧地選擇了行業大數據為主攻方向。浪潮集團大數據產品部總經理王峰明確表示,金融、通信、公安、交通是浪潮重點發力的四大行業。
為什么選擇這四大行業?就浪潮的定位來看,金融和通信的行業大數據應用重點在于歷史數據的管理解決方案,主要為海量結構化數據的應用與分析;公安和交通的行業大數據應用重點則在于智能治安卡口支持系統解決方案,主要為圖片、視頻等非結構化數據的處理與應用。
在浪潮看來,金融和通信兩大行業的歷史數據含金量最高,它們就如同兩張并行的網絡,描繪出每個人的資金交易和生活圈。“但是,基于傳統交易型數據庫的成本原因,這些結構化數據被作為存儲備份檔案的方式存儲,從熱數據變成了長尾數據,又從長尾數據變成了死數據,最后被銷毀。”王峰表示,“這些海量的歷史數據沒有被好好利用和分析,它們可以被用于提升客戶體驗,甚至可以構成一套準確的信用體系。”
而在公安和交通行業,每天攝像頭都會產生大量視頻信息,身份證、指紋識別等圖片也是重要的非結構化數據。以交通行業為例,北京有超過50萬個卡口攝像頭,每天會記錄過億條數據,產生幾十TB的數據量。卡口系統的數據既有結構化的車輛信息數據,又有非結構化的圖片、視頻數據。如果可以迅速處理某張車輛照片對應的車主,就可以提高公安系統追蹤違法車輛的效率,及時發現駕駛員異常或車輛異常,提前報警,還可以降低交通事故的發生率。 據悉,浪潮與某省交通行業合作的以云海一體機為基礎的機動車套牌系統不久即將上線。
軟件定義一切
在軟件定義一切的今天,大數據的核心競爭力依然是軟件的競爭。浪潮去年發布的云海一體機奠定了其在大數據領域硬件自主研發的技術基礎,而云谷則使得大數據可以運行在浪潮自有的平臺軟件之上。
盡管這只是云谷1.0版本,但它在底層架構上已經具備了一個商業版Hadoop在關鍵領域應用的雛形,并已可以應對金融、電信、公安、交通四大行業的結構化歷史大數據與卡口系統非結構化大數據的特定大數據應用。王峰表示,與互聯網公司擁有強大的技術背景不同的是,行業用戶和傳統企業往往缺乏基于開源Hadoop構建大數據應用的相關能力和經驗,而集成大數據系統軟件并針對行業應用場景調優的平臺化整體解決方案,才是行之有效的應對之道。
云谷1.0版本是浪潮自主研發的面向行業海量數據整合、分析、挖掘的大數據平臺,具備電信級可靠性、數據驅動的彈性擴展能力、與現有系統的無縫集成、自適應的智能管理等特性。通過包括HDFS、MapReduce、HBase、HIVE等多個維度的創新算法、規模化改進和優化,云谷1.0版本在性能方面實現了突破。據王峰透露,相關測試數據表明,在數據排序、聯合查詢等應用場景中,云谷1.0版本可讓傳統系統的性能提升10倍以上。同時,用戶可獲得可視化的管理界面,有效管理和調配資源,節省物理服務器資源,提高資源利用率,保障業務可靠運行與數據安全。
“蘋果”模式
一體機雖然提升了性能,但軟硬一體化的后果往往就是將行業用戶與一家IT廠商牢牢捆綁在一起,從而削弱了用戶的議價權。浪潮則期望在大數據領域構建“蘋果”模式。
在浪潮看來,大數據應用的難題在于如何有效貫穿企業的業務流程。從用戶的應用環境到底層的基礎架構平臺,產業鏈的參與者缺乏完整的端到端的能力和經驗。具體到不同行業的應用場景,大數據的特征和需求也不盡相同。例如,金融行業更加關注系統的可擴展性,在此基礎上才能進一步解決數據挖掘及數據業務價值的問題。在公安、交通等行業,在海量的非結構化和半結構化數據存儲之上,如何有效地關聯與分析資料代表了未來的應用前景。
“針對不同的行業大數據應用需求,浪潮的產品策略是以平臺化的產品思路和專屬化的系統優勢切入市場,為行業大數據應用搭建通道。”王峰認為,“從數據的積累、流轉、處理到價值"變現",大數據是一條尚待完善的,需要系統廠商與SI、ISV等合作伙伴攜手共榮的生態鏈。”
為此,浪潮的云谷平臺支持開發總線應用,不僅提供基于業界標準接口各種接口,還提供了便捷的開發工具與完善的SDK(開發包)。另外,浪潮還將成立大數據ISV的行業聯盟,并展開ISV遷移資助計劃。目前,已有多家合作伙伴測試并部署了云谷1.0版本,以及浪潮大數據一體機平臺,并推出了商業銀行歷史數據管理、智能治安卡口支持系統等解決方案。
應該說,在云計算的推動下,“從數據到服務”的趨勢正將云計算的商業和服務模式引向行業大數據的發展階段。王峰表示,浪潮的大數據戰略就是端到端的業務策略,為了實現“產品+服務”的端到端交付。這無疑超出了一個傳統系統提供商的交付范疇,浪潮正通過大數據推動“從數據到業務、從數據到服務”的產業鏈縱向整合。