Kyligence 聯合創始人兼 CEO 韓卿在現場正式對外宣布了企業全新"智能數據云"戰略、Kyligence 最新產品以及一系列合作伙伴計劃。以下是韓卿在峰會現場的演講實錄,他從專業的視角分析了目前企業數據管理面臨的痛點,以及進一步詳細地闡述了"智能數據云"戰略,希望可以給您帶來一些啟發。
以下是演講正文:
大家早上好!
非常高興在今天舉辦 Kyligence 行業峰會。非常遺憾去年的疫情讓我們缺失了一屆,不過此刻的我們也非常幸運,“煙花”臺風剛剛過去,今天早上黃浦江畔晴空萬里。
Kyligence 已經成立五年了,五年來離不開大家的支持,在這里我僅代表中國和美國三百多位小伙伴向客戶、合作伙伴、投資人,以及各行各業關心 Kyligence 成長的關注者們表示衷心的感謝,感謝各位在過去對我們的支持、信任,尤其重要的是鞭策!過去五年,Kyligence 有非常多的總結和相應的業務實踐,所以今天非常榮幸能夠基于過去對中國、美國以及亞太市場的業務實踐和對未來技術趨勢的觀察和了解做一些探討,此外,接下來我也會向大家匯報一下 Kyligence 未來戰略的改變和產品的趨勢。
行業假設發生變化
大家知道從上世紀70年代 AC 尼爾森公司介紹了數據集市開始,數據倉庫這個技術成為一個必不可少的基礎架構。尤其是 Bill Inmon 、Ralph Kimball 兩位大拿奠定了數據倉庫的理論基礎,在這之后數據倉庫在 Bill 的自頂向下模式和 Kimball 的自底向上模式之間引起了很多爭論,大家相愛相殺了很多年。在當年構建數據倉庫的時候有一些假設,例如數據相對比較少,計算、存儲比較有限,網絡處于低速時期等。
那么問題來了,三四十年之后,在云的時代,數據倉庫的行業假設跟以前是不是一樣呢?做任何的技術架構,如果它的行業假設有一些變化,那隨之采取技術的選擇、架構一定是不一樣的。那我們今天認為,在云的時代這些行業的假設已經有了巨大的、根本性的改變。今天我非常榮幸可以跟大家分享一些我們在這方面的思考以及總結。
首先,過去數據倉庫的構建模式是集中式的,剛才舉例介紹到,因為以前人沒有非常集中,我們認為把數據集中起來就好了,所以解決了數據煙囪(信息孤島)問題。但今天數據是天然分布的,數據不僅在不同的系統里面,它們甚至在多個云上,更甚者在一個云、多個數據庫里面。
其次,數據量已經大到不可能集中起來,幾十個 PB 數據只是一個“起步價”。這么大的數據量,讓特別是在云環境下的數據傳輸變得不再現實。
再看,隨著 GDPR 數據隱私法案的來臨,企業不可能把所有數據都進行匯總。
所以整個數據倉庫構建模式從“Collect”——把所有數據收集起來,到“Connect”——所有數據有機地連接起來,這是第一個改變。
第二,使用數據的人發生了根本性改變。以前都是決策者、專家去使用這些數據,或者有一個專業化的團隊,包含項目經理、各種工程師等,經過三個月、六個月給出一個決策方案。而今天使用數據的人已經發生了根本性改變,他們是一線工作者,他們是非技術或者分析崗位的職場人。我們發現企業不可能為每一個業務人員配備一支龐大的分析團隊,而且整個數據 IT 構建模式也發生了巨大的變化,沒有那么多人去服務它,所以對企業來說,要么投入更多人力、物力賦能數據管理,要么就用技術去改變它。
第三,數據的消費方式發生了變化。以前是從已知問題找已知答案,現在需要從未知問題找未知的答案。早前有一個客戶來和我溝通,他說:“假設我是一個數據分析師,我想要分析…"。我說:“停,不對。”現在的業務人員無法了解這么詳細,他們希望的是你告訴我有什么,企業可以基于已知的一些數據、文化、能力,并沉淀之后自動推薦給需要的人。例如我們服務平安銀行的時候,當工作人員去看一些指標,對方怎么知道現在存款指標非常重要呢?這些應該是系統自動告知,而不是工作人員自己想出來的。同時,現在大家習慣用兩樣東西,一是手機,二是搜索。所以,市場必須降低整個數據使用的門檻,用技術迭代來幫助客戶推送更具價值的數據。
隨著數據越來越多,使用端越來越多,數據的搜集與管理變得難上加難;另一方面,企業又希望數據能夠多面化,顧及到、賦能到每一個業務人員,這就導致了兩者之間不可調和的矛盾愈加明顯,越來越混亂。現在的 CIO 已經相當焦慮,我們發現他們找數據的時間遠遠超過使用數據的時間。“用1個月時間找數據,分析一下只要2分鐘”。現狀是企業根本不知道有價值的數據在哪里,以前是沒有數據,所以企業希望 IT 把數據全部收集起來;而今天是數據太多、信息過載,企業已經不知道該要什么類型的數據。
所以,基于我們過去對業務的一些實踐以及與客戶的探討,我們將未來的戰略定義在以云技術為核心,以人工智能為推動來解決所有的技術和數據的問題。所以我們全新的戰略將變成“智能數據云”。
智能數據云應運而生
我們認為,未來使用數據應該像使用云計算一樣簡單和方便。今天你需要一個算力的時候,根本不需要知道這些算力是來自英特爾、戴爾,還是惠普,只需要向底層云廠商靈活申請內存、帶寬、使用時間即可。現在行業需要的是平臺向數據申請人直接給出客戶數據、訂單數據、實時部署數據等。平臺應該要幫企業解決這個問題,這就是一個新的理念或戰略——智能數據云,我們可以幫助企業解決這個問題。
Kyligence 在不斷增強分析能力之外,會向數據管理轉移,將人工智能逐步引入到平臺里來。我們會逐步去掉 Hadoop ,平臺也會更加智能化和自動化。雖然今天 Hadoop 依然是極具優勢的大數據平臺,但五年以后、十年以后,隨著下一代云技術的發展,數據服務與管理會有新的不一樣,我們也相信技術會往云這個方向進行轉移。
上面這張圖很好闡述了 Kyligence 智能數據云平臺——我們不希望這個平臺把客戶所有的數據匯總到這里來,我們要幫客戶 connect 所有的數據源,平臺能夠自動識別最有價值的數據,希望用最簡單的方式去讓業務人員使用我們的數據,去賦能數字化轉型。
我展開來講一下:
第一,我們會以一個受治理的數據集市的概念做這個事情,用統一的指標口徑,統一的語義標準,統一的數據服務進行管理;
第二,我們會專注做 AI 增強的數據管理,AI 增強讓數據分析與管理的效率大大提高,機器代替人可以做很多表格的工作,把人解放出來做更有價值的事情,比如數據的審計等等;
第三,我們會采用敏捷的云原生架構,支撐業務敏捷化,尤其疫情以后,整個平臺不能變成云平臺的話,在劇烈變化中是很難適應的。
Kyligence v4.5 新品發布
基于上述理念,我們也更新了自身的產品,Kyligence v4.5 將會更加滿足市場和客戶的需求,這個產品會以企業版以及公有云版本為主,接下來具體展開介紹一下相關特性:
這是我們整體的架構。中間是剛才介紹過的受治理的數據集市,企業不需要把所有數據都放到我這里來,我可以通過各種各樣的方式連接起來,甚至鋪裝到原始的數據當中去。這樣的好處是我的平臺可以變成你的統一的訪問入口,在這個過程中我知道你想要什么數據之后,就可以自動化地去幫你去管理數據集市了,這就是 AI 增強帶來的核心能力。同時看到底層,在最早基于 Apache Kylin 的能力上,我們引入了 Clickhouse,更好地支撐全場景 OLAP 。
今天來說,在整個消費端,我們已經從支撐大量的企業內部分析應用轉換到支撐的是應用本身,已經有美國和中國的客戶基于我們的技術在互聯網上提供這樣的能力,甚至提供數據產品重新賣給了客戶。未來所有的軟件公司都將成為一個 SaaS 公司,每個 SaaS 公司都會是一個數據公司,你的數據怎么去變現?你的數據怎么去做更好的服務?我們在服務了很多客戶之后有了一些經驗。
另外,我們在美國的客戶也有非常好的應用,它用 APP 做了一個市場風控模型,整個底層的服務平臺來自我們,部署在整個 Kyligence 的云平臺上,帶來非常大的效率和能力的提升,目前智能數據云平臺已經對接到了各大公有云平臺,后面我也會介紹私有云的目標。
總之,通過我們新的產品,用 AI 增強的數據服務和管理等能力,打造全場景的OLAP,可以更好幫助企業提升數據服務與管理的能力。下面,我想重點強調幾點:
01、ClickHouse 的整合
Clickhouse 過去一兩年在中國特別地火,這是一個很好的技術,不過它有它的優勢,也有劣勢。其實 Apache Kylin 一直在整個聚合查詢上做的不錯,我們的客戶說要不要把 Kylin 和 Clickhouse 一起合并嘗試一下?這個需求提出后,我們看到了一些可能。通過 Kyligence 智能分層存儲(Smart Tiered Storage™?)技術,將 ClickHouse 有機融合在 Kyligence 產品的基座中,在原有聚合分析的高性能之上,更有效提升了明細分析、Ad-Hoc 查詢等場景的性能和優勢。
02、正式支持批流一體能力
全場景的OLAP 還有一個很重要的方面就是正式支持批流一體能力,進一步擴寬了全場景 OLAP 的能力,僅通過一個數據模型、一個 SQL 語句,就能同時接入批數據和流數據,對數據應用提供統一的查詢接口,助力企業極簡化數據應用架構,使用同一個系統和架構來同時滿足不同需求,以更快地響應業務敏捷性。
03、持續對 AI 增強引擎的投入
另一方面,我們也會持續在 AI 增強引擎上不斷地投入和突破。基于 AI 增強引擎,Kyligence 能夠根據業務分析行為自動推薦數據模型,幫助企業從海量的分析負載中識別和沉淀數據資產,并根據業務變化智能更新模型,實現自動化構建和管理。
除此之外,AI 增強引擎還能夠自動清理低效存儲,不斷優化 TCO。大量的數據被分析,數據倉庫拼命地做項目,但是清理這件事情很少發生。有銀行的客戶跟我說有 10 萬張報表,平均每張訪問量非常低,訪問量低浪費了大量的計算資源、存儲資源,浪費了大量的人工去做這些工作。今天 Kyligence 可以告訴你不再被使用或者使用率很低的數據,可以挪到歷史存儲區。
結合前面說的,通過不同的數據源讓我們這個數據服務和管理平臺成為統一訪問數據入口之后,我們有能力告訴你最有價值的數據是什么,數據資產應該如何被管理、并驅動業務決策產生價值。
04、統一的語義層
此外,我們希望通過統一的業務語義來支撐不同的業務場景,例如 Kyligence 對電子表格的百億級業務支撐是全球獨步天下的,這點在中美兩國都有很多客戶實踐。當然這其中還有很多挑戰,例如電子表格連在后臺還是面臨一些壓力,但是可以告訴大家的是,我們的創新取得了新進展,通過專利技術的突破,可以直接賦能到一線的電子表格用戶。
通過不斷地服務客戶,我們發現一個令人驚訝的事實,某一個客戶全國大概有上萬家門店,只有八九個人的 IT 團隊,負責人需要每天下班之前導出數據讓他們第一時間拿到數據做分析,這是中國真正的現狀。這就帶來幾個問題:
1. 安全問題,數據滿天飛的時候,安全面臨著嚴峻的考驗;
2. 業務的定義其實永遠不在管控的范圍內,散落在各個地方;
3. 整個后臺沒有業務的積累,永遠只是在導出數據。
我們希望構建統一的業務語義,可以在不同 BI 之間使用,以及中央管控整個安全,其實會帶來非常好的價值。最重要的是,在這個過程中業務使用的痕跡被留了下來。往往我們業務跟 IT 的挑戰是,業務很難告訴你他想要什么或者如何分析的,他們沒有辦法用 IT 語言告訴后端。但是如果后臺轉化的時候就可以通過機器學習的方式推薦給需要的人。
05、提供企業級運維管理服務
產品新版本會提供企業級的運維管理能力,把所有的集群管理起來,甚至可以做到多租戶的管理,通過指標監控、告警等實現自動化生產運維,以滿足銀行、保險等行業嚴格的 IT 合規要求。我們有非常好的監控統計,甚至這些能力可以被開放出來,通過 API 接口組合到客戶自己的運維和管控系統里去。關于信息安全和合規,目前我們已經拿到了 SOC 2 Type 1、ISO27001 信息安全管理體系和 ISO9001 質量管理體系。
目前,Kyligence 產品已經支持多個公有云平臺,包括微軟 Azure 、亞馬遜 AWS ,今年六月份剛剛支持了華為云,這個合作也幫我們拿下了泰國的單子。后續還會登陸谷歌云、阿里云、騰訊云。我們將在整個公有云的平臺上不斷地投入,去支持更多的應用場景。未來我們也希望能保證我們的客戶在多個云的不同架構和平臺上,業務的使用方式、體驗和接口都是一致的,即使你遷移到一個云平臺,上層應用不用改變。在公有云上,我們完全沒有了 Hadoop 的依賴,只依賴了云的對象存儲和計算資源,可以做到自動縮容,自動監控。
不過,我們仍需考慮到還在使用私有云的客戶,他們該怎么辦?隨著企業對私有云架構的需求高漲,Kyligence 也正式推出玄武計劃,加速下一代基于 Kubernetes 及分布式對象存儲等架構的私有云產品落地的進程,Kyligence 將為大型企業級客戶提供私有云環境運行 AI 增強數據服務與管理的能力, 目前實驗室已經完成了對接和測試。
我很喜歡玄武計劃這張圖,這張圖是龜和蛇的合體。為什么選這個?第一這代表海,如果公有云在天上,那我們想找一個地上的海。第二叫穩,玄武帶來的穩定,對業務架構很重要。第三叫做長壽,我們希望技術架構或者平臺對市場的影響時間可以更加長久,我們也希望以此為機會,鼓勵我們的客戶、合作伙伴可以加入到我們的共創計劃中,用業界的能力一起去打造基于私有云的業務架構。
另外,我也很高興宣布今年我們升級了業務合作伙伴體系 Kyligence Partner Network,聯合全球的合作伙伴去構建數字生態能力,對于我們公司的定位來說,我們是專注在整個產品和技術的研發上,希望在這個點上做到更深、更強,跟更多的合作伙伴做更多的聯合。
數據越來越多,數據越來越重要。我們希望數據能夠更好地服務人類,而不是讓我們成為它的奴隸。所以今天非常高興跟大家宣布 Kyligence 未來的新愿景——改變人類使用數據的習慣。我們希望用更大的能力去賦能到從一線業務人員到高層決策者,能夠去改變整個數據的使用方式和方法。非常感謝大家對 Kyligence 的認可和支持,Kyligence 將繼續秉持專業的態度服務客戶,也感謝各位合作伙伴參與其中,一起創造數據服務與管理的新未來。
關于我們
Kyligence 由 Apache Kylin 創始團隊創建,致力于打造下一代智能數據云平臺,為企業實現自動化的數據服務和管理。基于機器學習和 AI 技術,Kyligence 從多云的數據存儲中識別和管理最有價值數據,并提供高性能、高并發的數據服務以支撐各種數據分析與應用,同時不斷降低 TCO。
Kyligence 已服務中國、美國及亞太的多個銀行、保險、制造、零售等客戶,包括建設銀行、浦發銀行、招商銀行、平安銀行、寧波銀行、太平洋保險、中國銀聯、上汽、一汽、安踏、YUM、Costa、UBS、Metlife、AppZen 等全球知名企業和行業領導者。公司已通過 ISO9001,ISO27001 及 SOC2 Type1 等各項認證及審計,并在全球范圍內擁有眾多生態合作伙伴。
Kyligence 獲得了來自紅點、思科、寬帶資本、順為資本、斯道資本(富達國際自有投資機構)、Coatue Management、浦銀國際、中金資本旗下基金、歌斐資產、國方資本、ASG、宏兆基金、浦信資本等投資機構的多輪投資。目前公司已經在上海、北京、深圳、廈門、武漢及美國的硅谷、紐約、西雅圖等開設辦事機構。