在筆者看來,很多硬件廠商所謂的大數據解決方案,不過是x86服務器+Hadoop發行版的簡單疊加產物。這種方法是通過軟硬件集成,一定程度上簡化用戶的工作。但盡管如此,這樣的解決方案距離實際的大數據應用還有很長一段距離,還有很多工作要做。而聯想大數據解決方案與之相比要更加靈活實用。先解決數據來源問題大數據應用首先要面對的是數據源問題。很多時候,企業只是著眼傳統的企業數據,被視之為核心數據,不肯與外界分享。實際上,這還不是真正意義上的大數據,除了傳統企業數據之外,還要把機器大數據、社交媒體數據,所謂價值密度低的非結構化數據全部納入進來,這才構成真正意義的大數據應用。
聯想集團副總裁、聯想研究院云計算與智能計算實驗室主任黃瑩博士表示,社交數據才能夠真正體現企業最終用戶價值,建立與用戶的真正連接,從而企業的業務決策提供有價值的依據。傳統的企業數據,實際上是數據倉庫、BI應用的翻版,不能夠體現大數據應用的價值。為了幫助傳統行業/企業獲取廣義大數據,在聯想大數據解決方案中提供了“爬蟲”這樣的工具,實現了分布式爬蟲調度與管理、可以實現多賬戶和多IP輪換,借助自然語言分析技術,可以實現數據的清洗和篩選。
以廣義大數據為依托,業務部門很容易了解用戶評價,并判斷和細分產品評論的對象;通過輿情分析,可以對于事件和新聞進行信息分類和情感分析;也可以實現內部文檔自動的歸類和分析。
通過對于機器大數據的深度分析和學習,用戶就可以賬務分析應用的實時流量,洞察故障隱患,并給出網絡優化的建議。幫助自身 成就客戶聯想大數據解決方案實際上是源于自身實踐應用,是經驗的積累和結晶。據聯想集團研究院大數據總監郭煒先生介紹,聯想微機和智能手機事業部率先應用了大數據解決方案。其業務都是構建在大數據平臺基礎上。“可以說在兩年之前,在推廣大數據時,還需要跟業務部門介紹大數據是干什么用的。但從去年開始,業務部門開始嘗試,試水性的應用,但到今年,對大數據已經沒有懷疑,已經成為了不可或缺的工具。” 大數據和實際業務結合的非常快。以往是前沿技術創新推動應用發展,如今是業務對于技術提出不斷的需求,促進技術的發展和提高。以實時技術分析為例,在應用需求的拉動下,取得快速發展和進步。黃瑩博士表示,如果說大數據以前是陽春白雪,現在因為業務推動,現有的技術手段已經不夠滿足需求發展了,需要不斷創新來追趕業務發展的節奏,這也是大數據發展比較健康的標志。聯想是一家技術底蘊深厚的公司,能夠把握Hadoop底層源碼,通過與服務器、微機、可穿戴設備等硬件設備迭代融合,可以為用戶提供完整成熟的大數據解決方案。聯想也希望將自己的企業實踐和經驗與更多的行業/企業用戶分享。大數據平臺的方向在聯想看來,80%的大數據處理是不需要編寫大數據程序實現的。用戶可以自建大數據集群,也可以使用云端的大數據處理和分析能力。大數據應用就像使用自來水一樣的方便。
目前聯想業務部門所使用的大數據平臺的節點數量已經超過了1000臺的水平,所積累的數據量已經超過了PB級,為業務提供了大量數據基礎,成為了業務部門不可或缺的工具。可以說,大數據分析已經成為業務不可分割的組成部分,而這不是單純ROI可以概括和評估的。很多人熟悉聯想的硬件,實際上,聯想也是OpenStack、Hadoop等開源社區的成員,充分利用社區力量,保證推陳出新,這已經成為聯想企業級戰略的重要內容。“充分利用開源,提供行業/企業級應用所需要的服務保障。這是我們的優勢。” 黃瑩說。小結實實在在,扎扎實實,這是聯想的文化,也是企業的宗旨。體現在大數據上,就是從實際需要出發,解決用戶的實際問題。聯想不僅是大數據方案的推動者,更是大數據應用的實踐者,所謂神農嘗百草,這樣功德,是用戶的福音,也是聯想企業級業務應用的基礎和未來。