本文來自星河融快,作者星河研究院吳極
上周我們與星河研究院為大家帶來了海外大數據企業中,大數據分析、可視化及BI三個領域公司的詳細介紹,本周我們將繼續對海外的大數據市場進行盤點,關注的重點為企業大數據檢索、產品大數據分析、大數據咨詢預測、大數據平臺和機器學習這五個領域。
-
企業大數據檢索能夠充分挖掘并釋放企業數據的潛力;
-
產品的大數據分析使用戶行為成為了產品設計與運營環節的重要參考因素;
-
大數據技術與咨詢業務的結合則對咨詢行業形成了很大的影響,數據技術導向的咨詢業務將極有可能成為未來行業的主流選擇;
-
大數據服務支撐平臺類企業則為大數據技術的普及和實用化做了很大的貢獻,是大數據技術生態中不可或缺的一環;
-
最后是機器學習,作為大數據分析的底層技術方法也逐漸開始得到廣泛應用。
以下,供你參考。
首先我們將企業大數據檢索、產品大數據分析、大數據咨詢預測、大數據平臺和機器學習這五個領域的典型企業列舉如下,接下來我們將分版塊為你進行詳細介紹。
企業大數據檢索
移動互聯網的普及與SaaS服務的興起令企業沉淀的數據量呈指數級上升,但目前對企業數據價值的挖掘僅僅停留在較淺層面,真正的大數據分析能力還尚未應用。因此如何做好企業內部數據信息價值的發掘成為了關鍵的第一步。
提升企業數據挖掘檢索能力,并將檢索的技術門檻降低的典型企業有Algolia,目前其產品具備關鍵字輸入智能容錯功能,并提供搜索排名配置,能夠讓普通員工也能按需要找到自己所需的數據信息。同時Algolia還為移動設備提供了離線搜索引擎,其C++ SDK可以嵌入到應用服務器端,這樣即便沒有網絡連接應用也能提供搜索功能,適用范圍很廣。
而在SaaS化服務興起的同時,企業采用多種軟件導致內部數據不聯通而形成了數據孤島。根據互聯網女皇Mary Meeker的分析,不同行業的公司平均使用SaaS服務的數量從25個至91個,需要跨平臺數據檢索分析服務。Maana開發的數據搜索和發現平臺Maana Knowledge Graph,其長處便是收集來自多個系統或者"孤島"的數據,并將其轉換為運營建議,可廣泛應用于多個行業。
產品大數據分析
產品大數據分析相對其他應用來說關注度稍低,但其能夠發揮的功能并不少。通過收集用戶的瀏覽、點擊、購買等行為,不單從宏觀上能夠察覺用戶群體的喜好變化提前應對,微觀上還能夠構建用戶畫像,從而做到定制產品的推薦與營銷,能夠有效的提升用戶的消費水平與滿意程度。
Mixpanel便是一家提供類似產品的公司,其讓企業用戶跟蹤用戶的使用習慣提供實時分析,其產品有用戶動態分析(Trends)、行為漏斗模型(Funnels)、用戶活躍度(Cohorts)及單用戶行為分析(People)等幾個模塊,全面的覆蓋了可能發生的用戶行為與場景。
大數據咨詢預測
如今大數據技術的發展為事件分析和預測提供了可能,并且準確度和處理速度已經具備了很大競爭力,傳統咨詢公司的處境類似于現在面對AI威脅的華爾街分析師,或許不久之后會被替代。因此隨著逐漸出現大數據咨詢公司的同時,傳統咨詢企業也紛紛與大數據技術公司合作,甚至成立了自己的數據業務部門。
Opera Solutions便是一家依托大數據分析的咨詢公司,其創始人是咨詢行業資深人士,曾創辦了商業咨詢公司Mitchell Madison和Zeborg。
目前Opera致力于金融領域的數據分析類咨詢,通過建模、定量分析給客戶提供建議,解決客戶的商業問題。例如其計算機系統可以一次性采集數十億條數據,包含從房產和汽車價格到經紀賬戶和供應鏈的實時數據等,通過分析獲得有關消費者、市場和整個經濟體系將如何行動的信號或見解。其客戶包含了咨詢機構及花旗銀行等公司,最近還為摩根士丹利提供了幫助經紀人團隊給其客戶提供投資建議的業務。
新技術、機器學習與咨詢預測行業的結合,相比于僅使用大數據分析技術能夠獲得更好的效果,也成為了行業內的一個小熱點。例如基于社會物理學原理的Endor能夠依托少量數據生成統一的人類行為數據集,并比傳統海量數據分析方式更早的做出模式識別與判斷。在甄別facebook上受ISIS控制的賬號的實驗中,根據已知少量ISIS賬號特性,Endor高效分辨出了新的ISIS疑似賬號并且準確度令人滿意。
大數據服務支撐平臺
目前圍繞著大數據技術與大數據產業生態鏈發展的,還有許多是平臺服務型的公司,這類公司具備一定的技術水平,但主要通過服務大數據技術公司及科研人員而存在,是技術生態中不可或缺的一環。
Dataiku創建了一個云平臺,旨在使數據科學家和普通員工更容易獲得公司收集的大數據,并通過機器學習庫縮短了專家以及數據分析師所需要的時間。
Algorithmia的平臺上提供包括機器學習、語義分析、文本分析等通用性算法,一旦用戶找到想用的算法,只需添加幾行簡單的算法查詢代碼到應用中,Algorithmia的服務器就會與應用連接,避免了開發者的重復勞動。
目前部分向開發者社區業務發展過渡的平臺型企業,因其資源已經得到行業巨頭的青睞,被Google收購的Kaggle便是一例,通過舉辦數據科學周邊的線上競賽,Kaggle吸引了大量數據科學家、機器學習開發者的參與,為各類現實中的商業難題尋找基于數據的算法解決方案。同時Kaggle為其社區提供了一整套服務,包括知名的招聘服務以及代碼分享工具Kernels。
機器學習
機器學習,是模式識別、統計學習、數據挖掘的技術手段,也是計算機視覺、語音識別、自然語言處理等領域的底層技術,在附件的介紹中大家可以看到,微軟Azure、Google云平臺及AWS都推出了自己的機器學習產品,而眾多的機器學習創業公司則通過提供有特色的技術或服務進行差異化競爭。
已累計獲得了7900萬美元融資的Attivio專注于利用機器學習技術通過文本進行情緒分析,提供有監督的機器學習與無監督機器學習兩種技術,幫助企業通過識別企業語料庫中的文檔進行情緒建模與分析。思科通過Attivio的智能系統令銷售人員能夠在與客戶合作時依據對方的情緒、消費能力等數據推薦合適產品,從而節省了數百萬的銷售運營費用,同時節約了銷售團隊15-25%的時間。
DataRobot的業務是搜索了數百萬種可能的算法組合,并進行預處理、特征計算、轉換和調整參數,為用戶的數據集和預測目標提供最佳模型,使用戶無需數據科學專業背景也能在幾分鐘內構建優秀模型,例如銀行利用Datarobot能夠自動構建非常準確的預測模型,識別欺詐性金融交易從而避免損失。
以上內容都是圍繞大數據技術在各行各業的通用應用來介紹的,這些企業很好的將大數據技術廣泛的面向產業進行了普及,令許多行業煥發了生機。但具備行業深度的大數據技術產品需求強烈,目前多數依然處于產品摸索階段,畢竟同時聚攏大數據人才與行業資深人士所需要的資源門檻較高。
本文來自星河融快,作者星河研究院吳極
上周我們與星河研究院為大家帶來了海外大數據企業中,大數據分析、可視化及BI三個領域公司的詳細介紹,本周我們將繼續對海外的大數據市場進行盤點,關注的重點為企業大數據檢索、產品大數據分析、大數據咨詢預測、大數據平臺和機器學習這五個領域。
企業大數據檢索能夠充分挖掘并釋放企業數據的潛力;
產品的大數據分析使用戶行為成為了產品設計與運營環節的重要參考因素;
大數據技術與咨詢業務的結合則對咨詢行業形成了很大的影響,數據技術導向的咨詢業務將極有可能成為未來行業的主流選擇;
大數據服務支撐平臺類企業則為大數據技術的普及和實用化做了很大的貢獻,是大數據技術生態中不可或缺的一環;
最后是機器學習,作為大數據分析的底層技術方法也逐漸開始得到廣泛應用。
以下,供你參考。
首先我們將企業大數據檢索、產品大數據分析、大數據咨詢預測、大數據平臺和機器學習這五個領域的典型企業列舉如下,接下來我們將分版塊為你進行詳細介紹。
企業大數據檢索
移動互聯網的普及與SaaS服務的興起令企業沉淀的數據量呈指數級上升,但目前對企業數據價值的挖掘僅僅停留在較淺層面,真正的大數據分析能力還尚未應用。因此如何做好企業內部數據信息價值的發掘成為了關鍵的第一步。
提升企業數據挖掘檢索能力,并將檢索的技術門檻降低的典型企業有Algolia,目前其產品具備關鍵字輸入智能容錯功能,并提供搜索排名配置,能夠讓普通員工也能按需要找到自己所需的數據信息。同時Algolia還為移動設備提供了離線搜索引擎,其C++ SDK可以嵌入到應用服務器端,這樣即便沒有網絡連接應用也能提供搜索功能,適用范圍很廣。
而在SaaS化服務興起的同時,企業采用多種軟件導致內部數據不聯通而形成了數據孤島。根據互聯網女皇Mary Meeker的分析,不同行業的公司平均使用SaaS服務的數量從25個至91個,需要跨平臺數據檢索分析服務。Maana開發的數據搜索和發現平臺Maana Knowledge Graph,其長處便是收集來自多個系統或者"孤島"的數據,并將其轉換為運營建議,可廣泛應用于多個行業。
產品大數據分析
產品大數據分析相對其他應用來說關注度稍低,但其能夠發揮的功能并不少。通過收集用戶的瀏覽、點擊、購買等行為,不單從宏觀上能夠察覺用戶群體的喜好變化提前應對,微觀上還能夠構建用戶畫像,從而做到定制產品的推薦與營銷,能夠有效的提升用戶的消費水平與滿意程度。
Mixpanel便是一家提供類似產品的公司,其讓企業用戶跟蹤用戶的使用習慣提供實時分析,其產品有用戶動態分析(Trends)、行為漏斗模型(Funnels)、用戶活躍度(Cohorts)及單用戶行為分析(People)等幾個模塊,全面的覆蓋了可能發生的用戶行為與場景。
大數據咨詢預測
如今大數據技術的發展為事件分析和預測提供了可能,并且準確度和處理速度已經具備了很大競爭力,傳統咨詢公司的處境類似于現在面對AI威脅的華爾街分析師,或許不久之后會被替代。因此隨著逐漸出現大數據咨詢公司的同時,傳統咨詢企業也紛紛與大數據技術公司合作,甚至成立了自己的數據業務部門。
Opera Solutions便是一家依托大數據分析的咨詢公司,其創始人是咨詢行業資深人士,曾創辦了商業咨詢公司Mitchell Madison和Zeborg。
目前Opera致力于金融領域的數據分析類咨詢,通過建模、定量分析給客戶提供建議,解決客戶的商業問題。例如其計算機系統可以一次性采集數十億條數據,包含從房產和汽車價格到經紀賬戶和供應鏈的實時數據等,通過分析獲得有關消費者、市場和整個經濟體系將如何行動的信號或見解。其客戶包含了咨詢機構及花旗銀行等公司,最近還為摩根士丹利提供了幫助經紀人團隊給其客戶提供投資建議的業務。
新技術、機器學習與咨詢預測行業的結合,相比于僅使用大數據分析技術能夠獲得更好的效果,也成為了行業內的一個小熱點。例如基于社會物理學原理的Endor能夠依托少量數據生成統一的人類行為數據集,并比傳統海量數據分析方式更早的做出模式識別與判斷。在甄別facebook上受ISIS控制的賬號的實驗中,根據已知少量ISIS賬號特性,Endor高效分辨出了新的ISIS疑似賬號并且準確度令人滿意。
大數據服務支撐平臺
目前圍繞著大數據技術與大數據產業生態鏈發展的,還有許多是平臺服務型的公司,這類公司具備一定的技術水平,但主要通過服務大數據技術公司及科研人員而存在,是技術生態中不可或缺的一環。
Dataiku創建了一個云平臺,旨在使數據科學家和普通員工更容易獲得公司收集的大數據,并通過機器學習庫縮短了專家以及數據分析師所需要的時間。
Algorithmia的平臺上提供包括機器學習、語義分析、文本分析等通用性算法,一旦用戶找到想用的算法,只需添加幾行簡單的算法查詢代碼到應用中,Algorithmia的服務器就會與應用連接,避免了開發者的重復勞動。
目前部分向開發者社區業務發展過渡的平臺型企業,因其資源已經得到行業巨頭的青睞,被Google收購的Kaggle便是一例,通過舉辦數據科學周邊的線上競賽,Kaggle吸引了大量數據科學家、機器學習開發者的參與,為各類現實中的商業難題尋找基于數據的算法解決方案。同時Kaggle為其社區提供了一整套服務,包括知名的招聘服務以及代碼分享工具Kernels。
機器學習
機器學習,是模式識別、統計學習、數據挖掘的技術手段,也是計算機視覺、語音識別、自然語言處理等領域的底層技術,在附件的介紹中大家可以看到,微軟Azure、Google云平臺及AWS都推出了自己的機器學習產品,而眾多的機器學習創業公司則通過提供有特色的技術或服務進行差異化競爭。
已累計獲得了7900萬美元融資的Attivio專注于利用機器學習技術通過文本進行情緒分析,提供有監督的機器學習與無監督機器學習兩種技術,幫助企業通過識別企業語料庫中的文檔進行情緒建模與分析。思科通過Attivio的智能系統令銷售人員能夠在與客戶合作時依據對方的情緒、消費能力等數據推薦合適產品,從而節省了數百萬的銷售運營費用,同時節約了銷售團隊15-25%的時間。
DataRobot的業務是搜索了數百萬種可能的算法組合,并進行預處理、特征計算、轉換和調整參數,為用戶的數據集和預測目標提供最佳模型,使用戶無需數據科學專業背景也能在幾分鐘內構建優秀模型,例如銀行利用Datarobot能夠自動構建非常準確的預測模型,識別欺詐性金融交易從而避免損失。
以上內容都是圍繞大數據技術在各行各業的通用應用來介紹的,這些企業很好的將大數據技術廣泛的面向產業進行了普及,令許多行業煥發了生機。但具備行業深度的大數據技術產品需求強烈,目前多數依然處于產品摸索階段,畢竟同時聚攏大數據人才與行業資深人士所需要的資源門檻較高。