數據作為企業的一項重要資產越來越被重視,而在對數據進行分析之前,需要做大量的數據抽取、處理、整合工作。這個準備工作是個臟活累活,卻非常關鍵。
上規模的企業往往有上百個業務系統、數據庫,以及成千上萬份表單,數據環境十分復雜。不同IT廠商的數據技術、設計思路不同,導致每個數據集獨立存在,無法互通。以前,企業關注的主要是業務,只要系統穩定不宕機就行了。而大數據時代,數據只有流通、碰撞才能產生價值。企業如果想進行數據關聯性分析,需要業務人員和IT人員一起,根據需求對數據進行對應、分類,并編寫腳本進行提取和關聯。如果溝通不暢導致提取的數據不準確,還得重新開發。Gartner曾指出,這項工作往往要花費企業80%的時間。
36氪近日接觸的Datablau,主要針對這個問題,為企業提供用戶數據管理方案,通過技術手段將數據的IT屬性和業務屬性相融合,節省企業人工開發、整合、溝通的時間。公司今年2月宣布完成數百萬元天使輪融資,投資方是跨境投資機構美國中經合集團。
企業存量數據的總量代表大數據,但此前其各個業務的數據集彼此獨立。如果企業想了解不同系統間的數據整合在一起能產生什么價值,必須將按照業務邏輯重新拉通。
Datablau充當的就是數據科學家的角色,既有IT知識,又了解企業業務。Datablau會先了解企業有哪些存量數據,再從不同數據庫,將不同結構的客戶、內部流程、運營等數據進行抽取并脫敏,通過預定義標簽以及企業的自有概念,將數據按標簽梳理歸類,產生數據資產目錄和面向業務數據虛擬集。
Datablau主要針對大型客戶做私有云部署。企業安裝部署Datablau后(一般3~5小時),IT人員將各數據源與平臺對接,自動獲取或手動設置存量/增量數據模型后,系統就能自動進行數據梳理工作,按照業務概念將數據分類歸檔。
與Datablau類似的,國外有Trifacta、Paxata、Tamr等。不過,數據準備在美國已比較成熟,中國市場接受程度普遍還不高。原因是,盡管數據準備是大數據分析的必經之路,但短期并不能給企業帶來直觀的效果。據王錚估計,目前國內有足夠能力用好這套技術的不超過1000家企業。他也在探索適合中國市場的商業模式,同時不放棄國際市場。國內一些數據分析公司,如GrowingIO、神策數據、諸葛IO等,主要是針對用戶行為數據,Datablau主要是按照業務邏輯拉通企業的存量大數據,更偏后端。
Datablau于2016年投入研發,目前1.0版本已經發布,試用客戶包括eBay、國家電網、北大智慧城市等。
團隊方面,目前共10人,主要是技術和銷售。創始人王錚2005年北京大學畢業,曾任ERwin全球研發負責人、CA技術開發部主任,在數據建模領域有10年經驗;CTO朱金寶是前ERwin總架構師,10年ERwin研發經驗;首席咨詢顧問劉晨擁有IT行業12年以上、數據治理領域8年以上從業經驗;首席科學家丁貴廣是清華大學軟件學院副教授、清華大學軟件學院副院長、博士。
數據作為企業的一項重要資產越來越被重視,而在對數據進行分析之前,需要做大量的數據抽取、處理、整合工作。這個準備工作是個臟活累活,卻非常關鍵。
上規模的企業往往有上百個業務系統、數據庫,以及成千上萬份表單,數據環境十分復雜。不同IT廠商的數據技術、設計思路不同,導致每個數據集獨立存在,無法互通。以前,企業關注的主要是業務,只要系統穩定不宕機就行了。而大數據時代,數據只有流通、碰撞才能產生價值。企業如果想進行數據關聯性分析,需要業務人員和IT人員一起,根據需求對數據進行對應、分類,并編寫腳本進行提取和關聯。如果溝通不暢導致提取的數據不準確,還得重新開發。Gartner曾指出,這項工作往往要花費企業80%的時間。
36氪近日接觸的Datablau,主要針對這個問題,為企業提供用戶數據管理方案,通過技術手段將數據的IT屬性和業務屬性相融合,節省企業人工開發、整合、溝通的時間。公司今年2月宣布完成數百萬元天使輪融資,投資方是跨境投資機構美國中經合集團。
企業存量數據的總量代表大數據,但此前其各個業務的數據集彼此獨立。如果企業想了解不同系統間的數據整合在一起能產生什么價值,必須將按照業務邏輯重新拉通。
Datablau充當的就是數據科學家的角色,既有IT知識,又了解企業業務。Datablau會先了解企業有哪些存量數據,再從不同數據庫,將不同結構的客戶、內部流程、運營等數據進行抽取并脫敏,通過預定義標簽以及企業的自有概念,將數據按標簽梳理歸類,產生數據資產目錄和面向業務數據虛擬集。
Datablau主要針對大型客戶做私有云部署。企業安裝部署Datablau后(一般3~5小時),IT人員將各數據源與平臺對接,自動獲取或手動設置存量/增量數據模型后,系統就能自動進行數據梳理工作,按照業務概念將數據分類歸檔。
與Datablau類似的,國外有Trifacta、Paxata、Tamr等。不過,數據準備在美國已比較成熟,中國市場接受程度普遍還不高。原因是,盡管數據準備是大數據分析的必經之路,但短期并不能給企業帶來直觀的效果。據王錚估計,目前國內有足夠能力用好這套技術的不超過1000家企業。他也在探索適合中國市場的商業模式,同時不放棄國際市場。國內一些數據分析公司,如GrowingIO、神策數據、諸葛IO等,主要是針對用戶行為數據,Datablau主要是按照業務邏輯拉通企業的存量大數據,更偏后端。
Datablau于2016年投入研發,目前1.0版本已經發布,試用客戶包括eBay、國家電網、北大智慧城市等。
團隊方面,目前共10人,主要是技術和銷售。創始人王錚2005年北京大學畢業,曾任ERwin全球研發負責人、CA技術開發部主任,在數據建模領域有10年經驗;CTO朱金寶是前ERwin總架構師,10年ERwin研發經驗;首席咨詢顧問劉晨擁有IT行業12年以上、數據治理領域8年以上從業經驗;首席科學家丁貴廣是清華大學軟件學院副教授、清華大學軟件學院副院長、博士。