在本周的“Hadoop與大數(shù)據(jù)技術(shù)大會”上,英特爾亞太研發(fā)集團(tuán)總經(jīng)理何京翔透露,在大數(shù)據(jù)方面,除了對英特爾Hadoop發(fā)行版的不斷優(yōu)化,英特爾還在開源社區(qū)的合作、QLengine的支持方面,對Hadoop進(jìn)行了強(qiáng)化。
從2010年開始,英特爾對自身的定位已不再是一家硬件公司,而是致力于通過計算技術(shù)來連接改善人們的生活,從而使世界變得更美好。以此定位出發(fā),如何為用戶提供更好的服務(wù),如何對采集的大數(shù)據(jù)進(jìn)行更好的分析,恰恰成為英特爾近年來最為關(guān)心的問題。
“Hadoop可以跨不同形態(tài)大數(shù)據(jù),可以將很多企業(yè)級應(yīng)用很有效結(jié)合起來。其可用來做統(tǒng)計模型分析等各種不同的數(shù)據(jù)分析”,何京翔認(rèn)為,可將Hadoop擴(kuò)展起來,用在實(shí)時數(shù)據(jù)分析上,將其做成下一代數(shù)據(jù)分析平臺,來為用戶提供更好服務(wù)”何京翔說。
基于此,英特爾今年7月在中國首發(fā)了“英特爾Hadoop發(fā)行版”。在此發(fā)行版上,英特爾做了四方面的優(yōu)化及調(diào)整。其中包括穩(wěn)定性/易用性、平臺的相關(guān)優(yōu)化,以及算法和結(jié)構(gòu)的相應(yīng)調(diào)整,即對即時性的優(yōu)化,使其能做到即時的數(shù)據(jù)處理。此外,英特爾在與中國用戶的合作方面,對行業(yè)應(yīng)用進(jìn)行了特殊調(diào)整和優(yōu)化。如電信系統(tǒng)的賬單服務(wù)與分析、智能城市的圖象處理與視頻分析。
何京翔特別談到了曾為中國聯(lián)通研究院所做的用戶賬單分析。使用Hadoop發(fā)行版之后對180個節(jié)點(diǎn)進(jìn)行了優(yōu)化。過去需要24小時整理出的數(shù)據(jù)現(xiàn)在只需30分鐘不到甚至不到10分鐘就可整理出來。“英特爾Hadoop發(fā)行版,比傳統(tǒng)的大數(shù)據(jù)處理速度的效率更高,而且數(shù)據(jù)容量也更高。”
據(jù)何京翔透露,此發(fā)行版的研究工大部分是由英特爾中國團(tuán)隊完成。“中國市場的大數(shù)據(jù)應(yīng)用與美國市場是齊頭并進(jìn)的,在此方面中國有機(jī)會領(lǐng)先,而英特爾中國的大數(shù)據(jù)研發(fā)團(tuán)隊也比美國做得好。”
而在研究項(xiàng)目上,英特爾不僅僅是停留在現(xiàn)在已有的發(fā)行上,在研究項(xiàng)目上,也注重與開源社區(qū)的合作,更在SQLengine的支持以及編程Document store方面,進(jìn)行了Hadoop的加強(qiáng)。除此之外,硬件的優(yōu)化也是英特爾未來的研究方向之一。