精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當前位置:大數據業界動態 → 正文

搜索難用、個性推薦不準?達觀數據以此切入大數據服務

責任編輯:editor007 作者:暮雨 |來源:企業網D1Net  2016-01-18 21:25:36 本文摘自:36kr

搜索難用、個性推薦不準?達觀數據以此切入大數據服務

幾乎每見一個創業者,我都會聽到一次 “…,然后我們用大數據做用戶精準畫像 / 智能推薦 / 金融征信…”,其中有多少人舉著大數據的旗、干著基礎數理統計的事,大家心知肚明。

大數據背后的技術算法是核心,創業公司搭一個基礎大數據的 “臺子” 至少要請 4 個工程師,即使程序員的月薪降到 12k,也意味著每年至少 50 萬元的成本。在創業初期,產品、商業模式都需要不斷打磨、改善的情況下,分出精力和財力去做這件事,不一定劃算。

所以這種服務交由第三方企業來做是趨勢,但由于價格高、服務不容易產品化、標準化,導致不容易區分服務的水平。另外,一家第三方服務商在不同應用場景上也有不同的表現,做得好壞主要還是看應用場景以及是否能結合客戶業務來提升其業績。

最近剛剛拿到來自真格、眾米資本和掌門科技集團1000 萬元天使投資的 “達觀數據(官網)”,主要的應用有三:數據挖掘分析、搜索性能優化、通過用戶畫像做精準推薦。同樣以智能推薦為核心,較為成熟的國外公司是Taboola

在數據采集方面,大數據公司通常會用爬蟲抓取網絡信息,并打通第三方應用 SDK、Java Script 接口來獲取一些淺層數據,比如日活、月活、用戶留存率等等。而除此之外,達觀還要求其客戶向其打通更深層的 js 數據,比如用戶點擊行為、收藏記錄、付費記錄等等。

在此之后達觀為客戶提供最基礎的服務是數據分析,比如用戶在應用搜索欄和個性推薦欄中的轉化率分別是多少。該公司也推出了一個免費的 APP “達觀公眾號”,為微信公眾號運營人員提供數據分析工具,希望以此積累數據和用戶口碑。

而達觀核心的應用場景則是搜索優化和智能推薦,前者如關鍵字補全、自動糾錯、相關搜索、中英文自動串聯識別,這些體驗我們能在 Google、百度等搜索引擎中感知到,中小企業很難做好卻又非常需要,這就是為何知乎要引入搜狗來提供搜素技術(知乎的搜索體驗一直飽受詬病)。

智能推薦的應用也不難理解,早期以 Amazon 為典型的商品推薦算法用戶早已司空見慣,比如用戶在某電商買了輛自行車,隨即便推薦坐墊、頭盔等相關產品,常見的算法原理有 “與你類似的人喜歡什么” 以及 “從你喜歡的東西推測出你還會喜歡什么”。許多創業公司都是通過為產品打 tag 的方式強行關聯相似產品,體驗不一定好。

達觀在引擎架構研發中使用到了點擊模型,通過與用戶的隱性交互如點擊反饋,可以對結果進行調優:將符合用戶偏好但位置靠后的 item 提取至前,或者將不符合用戶意圖的 item 降權減分。

以電商推薦系統為例,這里引用該公司技術人員江永青在其微信公號發布文章中的論述:

協同過濾算法中,如果沒有顯性的評分機制,就需要收集點擊的行為來作為正向的評分。不同類型的點擊(如查看、加購物車、加關注等)可以生成不同維度的二維相似度矩陣,最后推薦的結果由這些矩陣計算生成的中間結果加權得到。

不過江永青也表示點擊模型存在一些挑戰和難點,包括位置偏向、冷啟動數據不足、感知相關性與數據無關、無法覆蓋長尾點擊數據、故意點擊作弊、Session 手機難。

大數據服務的量化標準是為客戶帶來多少業績提升,達觀數據 COO 馮佳妮向 36 氪列舉了一些案例,其中比較突出的是文學網站 “瀟湘書院”,該公司根據用戶瀏覽、點擊、購買等記錄做出一套新的推薦系統,較之前提升了 300%的下單購買率、85%的點擊率,年費大概為幾十萬元。

達觀數據自 2015年5月 創建、10月 上線達觀公眾號產品,至今已累計服務 8000 個自媒體用戶。

而其面向大 B 客戶的服務則按照 SaaS 的形式收取年費,每筆從 20 萬元至 200 萬元不等。馮佳妮表示,已經在和一些電商企業洽談數據打通事宜,比如某國內女性經期管理應用、同仁堂旗下的保健品電商品臺,還有一家 FA 機構。該公司也將于今年上半年和復旦大學計算機學院合作組建 “大數據實驗室”,與科研機構聯合做政企服務,相關政府單位已經提出文化場所選址規劃、管轄范圍內企業運營情況分析等需求。

做企業深度服務的訂單周期較慢是正常現象,但達觀面臨的主要問題還是如何獲得更多客戶,不得不解決的問題有兩個:

需要提供統一接口,滿足普通企業的基礎需求,客戶提出個性化需求后只需做簡單的改動而不用重頭再來。馮佳妮表示未來希望做成類似云服務的產品,讓客戶按需選擇服務。

目前達觀團隊有 20 余名,因人手不夠的問題只好將一些找上門來的客戶暫時擱置,即使該團隊有不少技術大牛,但人才稀缺是不得不考慮的問題。

達觀數據成立時間只有 7 個月,核心的三位聯合創始人全部出自盛大:

CEO 陳運文為復旦大學計算機博士,曾擔任盛大文學首席數據官,騰訊文學高級總監、數據中心負責人,百度核心技術研發工程師,國際計算機學會(ACM)會員,中國計算機學會(CCF)高級會員,在國際頂級學術期刊和會議上發表多篇 SCI 論文,多次參加 ACM 國際數據挖掘競賽并獲得冠軍榮譽;

CTO 紀達麒為原騰訊文學數據中心高級研究員、盛大文學技術總監等職務; 原搜狗廣告技術部和百度技術部高級工程師;擁有北京郵電大學計算機碩士學位;

COO 馮佳妮為原盛大云計算公司運營總監、安普丹華國際咨詢公司高級咨詢師,多次獲安普丹華公司 Top-Sales 榮 譽;擁有山西財經大學工商管理和商務英語雙學士學位。

關鍵字:搜索性能數據挖掘

本文摘自:36kr

x 搜索難用、個性推薦不準?達觀數據以此切入大數據服務 掃一掃
分享本文到朋友圈
當前位置:大數據業界動態 → 正文

搜索難用、個性推薦不準?達觀數據以此切入大數據服務

責任編輯:editor007 作者:暮雨 |來源:企業網D1Net  2016-01-18 21:25:36 本文摘自:36kr

搜索難用、個性推薦不準?達觀數據以此切入大數據服務

幾乎每見一個創業者,我都會聽到一次 “…,然后我們用大數據做用戶精準畫像 / 智能推薦 / 金融征信…”,其中有多少人舉著大數據的旗、干著基礎數理統計的事,大家心知肚明。

大數據背后的技術算法是核心,創業公司搭一個基礎大數據的 “臺子” 至少要請 4 個工程師,即使程序員的月薪降到 12k,也意味著每年至少 50 萬元的成本。在創業初期,產品、商業模式都需要不斷打磨、改善的情況下,分出精力和財力去做這件事,不一定劃算。

所以這種服務交由第三方企業來做是趨勢,但由于價格高、服務不容易產品化、標準化,導致不容易區分服務的水平。另外,一家第三方服務商在不同應用場景上也有不同的表現,做得好壞主要還是看應用場景以及是否能結合客戶業務來提升其業績。

最近剛剛拿到來自真格、眾米資本和掌門科技集團1000 萬元天使投資的 “達觀數據(官網)”,主要的應用有三:數據挖掘分析、搜索性能優化、通過用戶畫像做精準推薦。同樣以智能推薦為核心,較為成熟的國外公司是Taboola

在數據采集方面,大數據公司通常會用爬蟲抓取網絡信息,并打通第三方應用 SDK、Java Script 接口來獲取一些淺層數據,比如日活、月活、用戶留存率等等。而除此之外,達觀還要求其客戶向其打通更深層的 js 數據,比如用戶點擊行為、收藏記錄、付費記錄等等。

在此之后達觀為客戶提供最基礎的服務是數據分析,比如用戶在應用搜索欄和個性推薦欄中的轉化率分別是多少。該公司也推出了一個免費的 APP “達觀公眾號”,為微信公眾號運營人員提供數據分析工具,希望以此積累數據和用戶口碑。

而達觀核心的應用場景則是搜索優化和智能推薦,前者如關鍵字補全、自動糾錯、相關搜索、中英文自動串聯識別,這些體驗我們能在 Google、百度等搜索引擎中感知到,中小企業很難做好卻又非常需要,這就是為何知乎要引入搜狗來提供搜素技術(知乎的搜索體驗一直飽受詬病)。

智能推薦的應用也不難理解,早期以 Amazon 為典型的商品推薦算法用戶早已司空見慣,比如用戶在某電商買了輛自行車,隨即便推薦坐墊、頭盔等相關產品,常見的算法原理有 “與你類似的人喜歡什么” 以及 “從你喜歡的東西推測出你還會喜歡什么”。許多創業公司都是通過為產品打 tag 的方式強行關聯相似產品,體驗不一定好。

達觀在引擎架構研發中使用到了點擊模型,通過與用戶的隱性交互如點擊反饋,可以對結果進行調優:將符合用戶偏好但位置靠后的 item 提取至前,或者將不符合用戶意圖的 item 降權減分。

以電商推薦系統為例,這里引用該公司技術人員江永青在其微信公號發布文章中的論述:

協同過濾算法中,如果沒有顯性的評分機制,就需要收集點擊的行為來作為正向的評分。不同類型的點擊(如查看、加購物車、加關注等)可以生成不同維度的二維相似度矩陣,最后推薦的結果由這些矩陣計算生成的中間結果加權得到。

不過江永青也表示點擊模型存在一些挑戰和難點,包括位置偏向、冷啟動數據不足、感知相關性與數據無關、無法覆蓋長尾點擊數據、故意點擊作弊、Session 手機難。

大數據服務的量化標準是為客戶帶來多少業績提升,達觀數據 COO 馮佳妮向 36 氪列舉了一些案例,其中比較突出的是文學網站 “瀟湘書院”,該公司根據用戶瀏覽、點擊、購買等記錄做出一套新的推薦系統,較之前提升了 300%的下單購買率、85%的點擊率,年費大概為幾十萬元。

達觀數據自 2015年5月 創建、10月 上線達觀公眾號產品,至今已累計服務 8000 個自媒體用戶。

而其面向大 B 客戶的服務則按照 SaaS 的形式收取年費,每筆從 20 萬元至 200 萬元不等。馮佳妮表示,已經在和一些電商企業洽談數據打通事宜,比如某國內女性經期管理應用、同仁堂旗下的保健品電商品臺,還有一家 FA 機構。該公司也將于今年上半年和復旦大學計算機學院合作組建 “大數據實驗室”,與科研機構聯合做政企服務,相關政府單位已經提出文化場所選址規劃、管轄范圍內企業運營情況分析等需求。

做企業深度服務的訂單周期較慢是正常現象,但達觀面臨的主要問題還是如何獲得更多客戶,不得不解決的問題有兩個:

需要提供統一接口,滿足普通企業的基礎需求,客戶提出個性化需求后只需做簡單的改動而不用重頭再來。馮佳妮表示未來希望做成類似云服務的產品,讓客戶按需選擇服務。

目前達觀團隊有 20 余名,因人手不夠的問題只好將一些找上門來的客戶暫時擱置,即使該團隊有不少技術大牛,但人才稀缺是不得不考慮的問題。

達觀數據成立時間只有 7 個月,核心的三位聯合創始人全部出自盛大:

CEO 陳運文為復旦大學計算機博士,曾擔任盛大文學首席數據官,騰訊文學高級總監、數據中心負責人,百度核心技術研發工程師,國際計算機學會(ACM)會員,中國計算機學會(CCF)高級會員,在國際頂級學術期刊和會議上發表多篇 SCI 論文,多次參加 ACM 國際數據挖掘競賽并獲得冠軍榮譽;

CTO 紀達麒為原騰訊文學數據中心高級研究員、盛大文學技術總監等職務; 原搜狗廣告技術部和百度技術部高級工程師;擁有北京郵電大學計算機碩士學位;

COO 馮佳妮為原盛大云計算公司運營總監、安普丹華國際咨詢公司高級咨詢師,多次獲安普丹華公司 Top-Sales 榮 譽;擁有山西財經大學工商管理和商務英語雙學士學位。

關鍵字:搜索性能數據挖掘

本文摘自:36kr

電子周刊
回到頂部

關于我們聯系我們版權聲明隱私條款廣告服務友情鏈接投稿中心招賢納士

企業網版權所有 ©2010-2024 京ICP備09108050號-6 京公網安備 11010502049343號

^
  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 南阳市| 阳曲县| 名山县| 嘉义市| 安图县| 朝阳县| 南郑县| 泗洪县| 牟定县| 滦平县| 高碑店市| 崇州市| 伊金霍洛旗| 府谷县| 华亭县| 仙居县| 包头市| 红河县| 长宁县| 屯昌县| 普陀区| 通州区| 西昌市| 进贤县| 大埔区| 渝北区| 新乐市| 洛浦县| 朝阳市| 大关县| 灌南县| 乐业县| 茂名市| 环江| 霍州市| 哈巴河县| 民乐县| 蒙自县| 新丰县| 宿迁市| 巴东县|