去年采訪大數據創業公司星圖數據時,創始人谷熠曾提到數據開放的想法。時隔半年多,想法落地,變成現實,星圖數據在這個月發布了大數據開放平臺“蜂巢”(DataComb)。
根據谷熠的介紹,“蜂巢”將開放星圖數據自有的大數據體系,并引入第三方數據源和數據開發者,面向各行業提供更豐富更優質的“大數據+”應用服務,實現多方共贏的大數據商業化生態圈。
谷熠說,Tinder 是美國目前火爆的社交應用,它的約會匹配正是基于 Facebook 開放出來的在社交關系數據基礎上進行的建模計算,“穩定的海量數據源和既有社交用戶的導入,讓 Tinder 剛上線不到五個月的時間內,牽線男女的數量就已突破 5000 萬對,同時積攢了45億個用戶評分,也以火箭般的速度加入了10億美元俱樂部。”
此外,在 Twitter 和 Google+ 的開放數據體系中也快速成長著大量咨詢智囊公司和新銳投資機構,其中不乏影響到美國大選結果和股市漲跌的優秀團隊,這些新銳力量無不受益于海量數據開放,并帶動了不同產業的升級躍遷。
這其實也反映出了大數據在國外的發展是公開透明的開放機制。然而,大數據在國內的發展卻是表面開放,實則封閉。谷熠說,缺乏足夠的數據開放,極大地制約了大數據行業的快速發展,使得大量的創業創意和數據技術難以落地實踐,難以進行商業化變現。對于眾多的傳統行業來說,面臨著想要轉型升級,卻缺乏足夠的數據依托來驅動的窘境。因此,星圖數據決定推出“蜂巢”,希望可以從實質上推動大數據市場的開放和發展,進而有效提升大數據本身和大數據團隊的商業化能力,最終能夠真正意義上通過“大數據+”促進各個產業的轉型升級。
作為一家大數據服務公司,星圖數據基于自主研發的 iNebula(數據星云)分布式大數據監測和采集系統,每天監測互聯網上近 5 億的網絡頁面,獲取超過 5TB 的原始數據,并通過 WarpEngine(曲速引擎)數據處理引擎完成高效的數據挖掘、建模計算和機器自學習分析,生成了海量極具價值的商業數據。
谷熠說,星圖數據已經在此套大數據供應鏈體系上自主開發了多款針對電子商務、制造業、零售業、咨詢、媒體和廣告的DaaS數據應用服務,在一年左右的時間里幫助了上百家的知名企業向“互聯網+”轉型。
“蜂巢”大數據開放平臺將面向創業團隊、科研院所、高校以及個人開發者提供開放的數據集市,提供海量的高質量數據資源,以促進大數據產品和行業數據應用的生產與研發;并在平臺上打造數據應用商店,引入大數據產品和行業應用服務,共同為各行業企業提供一站式的全面的“大數據+”解決方案。
數據方面,“蜂巢”的數據接口集市包括自產數據接口服務和合作數據接口服務兩類。
自產數據接口服務中,最典型的是電商發展監測數據服務接口。這個服務接口是基于星圖數據自主研發、并擁有自主知識產權的整套大數據供應鏈系統,對國內 50 余家的主流電商綜合類和垂直類 B2C 平臺進行監測,并通過每分鐘 6000 萬條以上的數據吞吐能力,每天對超過 5TB 的數據進行處理、清洗、挖掘、建模計算和自學習分析,所形成的高頻的、海量的、有延續性的、高價值的商業數據。
通過這項數據接口服務,使用者可以獲取周度更新的,細化到行業、平臺、品牌甚至單品級別的電商銷售表現數據,目前覆蓋的品類包含:家用電器、3C數碼、個護化妝、母嬰用品、運動健康和食品飲料等6大超類,近百個品類。今后,品類還將進一步豐富,直至覆蓋所有線上在售的實體商品。
而合作數據接口服務中,首批開放的就包括網絡視頻內容的數據服務接口。通過這個服務接口,使用者可以自由調用視頻詳細信息、用戶偏好、直播信息等網絡視頻數據。并且,此數據服務接口一體化涵蓋PC端和手機端數據,從而全面反映網絡視頻行業的詳細情況。
此外,“蜂巢”目前已經上線的功能還包括針對大數據+高校&科研院所的應用“數據搜索引擎”、大數據+廣告&咨詢的應用“數據象限”、大數據+電商企業的應用“數據矩陣”、大數據+渠道&零售的應用“天鏡”、大數據+制造業的應用“原子力”、大數據+媒體的應用“圖播鼠”,等。
谷熠說,繼“互聯網+”之后,又一個嶄新的時代——“大數據+”時代已經到來。大數據開放平臺“蜂巢”希望能夠在未來給更多的制造業、零售業、開發者、高校和科研院所、媒體、廣告和咨詢等各個產業的企業與個人提供服務和幫助。為他們提供一站式的全面的“大數據+”服務。
星圖數據在去年 8 月份已經完成了數百萬美元的 A 輪融資,目前正在進行 B 輪融資。