小伙伴們開(kāi)工大吉,這是大數(shù)據(jù)2月14日一周綜述,看看你們錯(cuò)過(guò)了什么?
首先是Gartner完全改寫(xiě)商業(yè)智能(BI)魔力象限,Hortonworks最新財(cái)報(bào)顯示,實(shí)現(xiàn)了業(yè)績(jī)大跳躍,因支持Spark而使收入飛漲。當(dāng)然還有你更感興趣的,情人節(jié)關(guān)鍵字搜索數(shù)據(jù)中,為什么“暗戀”(crush)頻次比“巧克力”更多?
Gartner本月終于發(fā)布了2016年商業(yè)智能和分析平臺(tái)魔力象限。 值得注意的是,只有三個(gè)廠(chǎng)商在領(lǐng)導(dǎo)象限中。
商業(yè)智能(BI)市場(chǎng)已經(jīng)達(dá)到了一個(gè)轉(zhuǎn)折點(diǎn),并且是一個(gè)根本性的轉(zhuǎn)變,從過(guò)去集中的IT組織自上而下的BI平臺(tái),轉(zhuǎn)向由商界領(lǐng)袖主導(dǎo)的敏捷工作流程和自助分析方式。
因今年的重大變化,Gartner也同時(shí)改變了評(píng)估廠(chǎng)商的標(biāo)準(zhǔn),從本質(zhì)上講,今年的版本重新定義了商業(yè)智能和分析平臺(tái)應(yīng)該是什么樣子的。這個(gè)時(shí)代定義的業(yè)務(wù),需要快速移動(dòng)的無(wú)約束的情報(bào)中心服務(wù)。在這個(gè)場(chǎng)景中,商業(yè)智能和分析平臺(tái)成為支撐整個(gè)基礎(chǔ)設(shè)施的工具,很容易被用戶(hù)拿來(lái)訪(fǎng)問(wèn)他們需要的情報(bào),而不是一個(gè)個(gè)離散的工具。這個(gè)重大轉(zhuǎn)變近年來(lái)急劇加速,終于達(dá)到了臨界點(diǎn),需要一個(gè)新的視角對(duì)商業(yè)智能和分析平臺(tái)魔力象限和底層BI平臺(tái)定義。
Gartner表示,這種變化符合雙模式IT的想法,模式1代表傳統(tǒng)IT交付,模式2代表敏捷交付。
事實(shí)上,這種變化是歷史性的一刻,在今年領(lǐng)導(dǎo)者象限中的廠(chǎng)商已經(jīng)縮小到3個(gè),相比之下,去年是9個(gè)。目前,在這個(gè)世界上, 微軟 、Qlik、Tableau Software是大贏家,而甲骨文則完全跌落,Gartner認(rèn)為,“因?yàn)樗恢狈磻?yīng)遲鈍,在市場(chǎng)動(dòng)態(tài)轉(zhuǎn)變中沒(méi)有產(chǎn)品和足夠的市場(chǎng)動(dòng)力,來(lái)滿(mǎn)足現(xiàn)代平臺(tái)標(biāo)準(zhǔn)的建立。”
Gartner今年的報(bào)告基于三個(gè)戰(zhàn)略規(guī)劃假設(shè)預(yù)期到2018年:
大多數(shù)商業(yè)用戶(hù)會(huì)訪(fǎng)問(wèn)自助服務(wù)工具準(zhǔn)備數(shù)據(jù)進(jìn)行分析。
大多數(shù)獨(dú)立自助數(shù)據(jù)準(zhǔn)備工具擴(kuò)展到端到端分析平臺(tái),或已作為功能集成到現(xiàn)有的分析平臺(tái)。
智能化、管理性、基于Hadoop、基于搜索和基于可視化的數(shù)據(jù),將會(huì)打包在下一代數(shù)據(jù)挖掘平臺(tái)中,同時(shí)包括自助服務(wù)數(shù)據(jù)準(zhǔn)備工具和自然語(yǔ)言生成工具。
上周,剝離自雅虎的Hadoop領(lǐng)域的3大知名初創(chuàng)公司之一——Hadoop Hortonworks 報(bào)告了季度和年度收益 ,超過(guò)了分析師的預(yù)期。其第四季度營(yíng)收從去年同期的1270萬(wàn)美元攀升至3740萬(wàn)美元,但該公司的成本費(fèi)用仍然超過(guò)銷(xiāo)售額。第四季度凈虧損5020萬(wàn)美元。
這個(gè)說(shuō)法近期越來(lái)越火。技術(shù)實(shí)時(shí)分析在本周也繼續(xù)獲得發(fā)展動(dòng)力,有更多的廠(chǎng)商宣布對(duì)Spark和其他大數(shù)據(jù)技術(shù)的支持。
大數(shù)據(jù)平臺(tái)公司BlueData,使用容器技術(shù)實(shí)現(xiàn)big-data-as-a-service(大數(shù)據(jù)即服務(wù))。它在上周宣布,可以提供了一個(gè)新的解決方案,與Spark Streaming, Kafka, and Cassandra構(gòu)建實(shí)時(shí)數(shù)據(jù)。他們表示,將會(huì)提供專(zhuān)為“快速數(shù)據(jù)”需求的,或需要實(shí)時(shí)或接近實(shí)時(shí)的應(yīng)用程序信息服務(wù)。
上周動(dòng)力技術(shù)也宣布,StreamAnalytix 2.0除了現(xiàn)有支持Apache Storm,還新增支持越來(lái)越受行業(yè)內(nèi)歡迎Apach Spark Streaming。
假日結(jié)束,是不是對(duì)如何利用大數(shù)據(jù)分析2015年假日購(gòu)物季感興趣?比如在線(xiàn)拍賣(mài)和市場(chǎng)巨頭如何評(píng)估最暢銷(xiāo)的物品的?eBay的數(shù)據(jù)科學(xué)家們已經(jīng)做了很多工作,利用這些信息來(lái)提醒供應(yīng)商,來(lái)提高他們的供應(yīng)鏈管理水平。他們已經(jīng)對(duì)Apache軟件基金會(huì)做了很多代碼貢獻(xiàn)。這是因?yàn)楫?dāng)eBay需要獲得更多大量的Hadoop數(shù)據(jù)的價(jià)值時(shí),他們創(chuàng)建了自己的一個(gè)名為麒麟(Kylin )的開(kāi)源工具,麒麟同時(shí)也是一個(gè)Apache基金會(huì)項(xiàng)目。
麒麟利用Hadoop的能力擴(kuò)展到數(shù)千個(gè)節(jié)點(diǎn)的服務(wù)器集群,利用分布式處理啟用MapReduce。與此同時(shí),它可以從數(shù)據(jù)可視化領(lǐng)域的SQL查詢(xún)系統(tǒng)表和ansi標(biāo)準(zhǔn)結(jié)果返回。
OLAP(聯(lián)機(jī)分析處理)技術(shù)并不新鮮。 構(gòu)建數(shù)據(jù)立方體,可以從不同的角度觀察,這也是Hadoop發(fā)明出的一個(gè)行之有效的做法。但麒麟可以大規(guī)模啟用cube-building。在獲得視圖前,也可以索引到Hadoop上的數(shù)千億行信息。其建立的“智能索引”的能力和規(guī)模是非常強(qiáng)悍的的一件事。
關(guān)注Python語(yǔ)言的要注意了,除了關(guān)注引力波是如何由強(qiáng)大的Python進(jìn)行數(shù)據(jù)分析的處理這個(gè)事,還要看看這個(gè)Python開(kāi)放源碼的分析平臺(tái)Anaconda 2.5已經(jīng)發(fā)布了,新版本加上了英特爾數(shù)學(xué)優(yōu)化內(nèi)核庫(kù)。該公司表示,將推動(dòng)全球數(shù)據(jù)科學(xué)團(tuán)隊(duì)分析研究。此外,該公司還介紹,Anaconda 的R-Essentials包與Microsoft R Open(MRO)是捆綁的。
最后,為了紀(jì)念2月14日情人節(jié),我們來(lái)看看哪些詞會(huì)迫使人們打開(kāi)你的郵件 ,有助于你提高郵件營(yíng)銷(xiāo)效率。今年主題關(guān)鍵字包括“暗戀”(crush),點(diǎn)擊率增加205%,“約會(huì)”,點(diǎn)擊增加166%;而“浪漫”,點(diǎn)擊增加155%。遺憾的是,“巧克力”的點(diǎn)擊率只增加了110%。90后的世界你不懂了吧。