小編的話
“技術干貨”系列文章意在分享技術牛人的知識干貨,每期主題都不一樣喲!期待各位讀者在文后發表留言,來一場技術上的交流和思想上的碰撞!本期將由品高大數據平臺產品經理李偉文帶來“云和大數據時代的數據管理”的分享。
分享嘉賓
李偉文,目前就任品高大數據平臺——BingoInsightDIG平臺的產品經理,專注于大數據和數據分析領域,擁有多個數據分析領域項目經驗,14年開始轉向數據平臺方向的研究,主要負責產品規劃、設計和售前支持。
分享正文
大家好,非常榮幸能和大家一起學習和交流,品高有將近10年數據分析領域的實施經驗,數據分析產品化是必然結果,所以今天主要跟大家分享一下本人對企業構建大數據平臺的一些觀點和品高大數據平臺BingoInsight的產品設計理念,歡迎大家和我碰撞和切磋。
Hadoop和Spark只是框架并非產品,
Hadoop離企業大數據的期望還有一段距離。
企業使用Hadoop構建平臺會面臨諸多問題,技術體系龐大選型復雜、開源無服務支撐、集群部署復雜等,Hadoop只解決了數據存儲和計算問題,企業還需考慮數據采集、數據處理、數據建模、數據運維、數據開放、數據可視化等一系列的問題;好復雜,感覺不會再愛了。
因此,我們品高大數據平臺BingoInsight(以下簡稱BingoInsight)的定位就是一站式大數據解決方案,幫助企業快速交付數據價值。以下給大家介紹一下BingoInsight的產品特性和設計理念;
第一,存儲和計算集群環境:一鍵交付
企業可自助定義大數據平臺存儲架構技術及集群配置,Hadoop、Spark、Nosql、RDB數據庫、數據庫、全文檢索等集群均可一鍵交付,節省了軟件部署的諸多時間。
第二,數據采集:只需簡單配置即可從多種數據源快速集成數據
可支持的數據源包括Oracle、DB2、Mysql、Sqlserver等主流RDB以及Nosql、MPP、文本、FTP、網頁、Excel、Socket、Webservice,采集周期可以是分鐘、小時、日、周、月,非常靈活。
第三,數據存儲和計算:開放性設計,擁抱不同的存儲計算技術,滿足不同企業的需求
不限制企業是用hadoop,MPP、RDB作為存儲計算,企業可按實際的數據量和應用場景靈活選擇。以上BingoInsight支持調度;
第四,數據處理和開發:從場景出發,將常見的數據處理場景模板化,提升數據處理效率
數據進到數據平臺后怎樣進行處理呢? 我們把企業數據處理的場景做了詳細的梳理和抽象,包括報表數據處理、指標數據處理、文本分類、全文索引構建、數據挖掘、提數、數據探索等,我們將這些場景總結沉淀為一個個數據處理的模板庫,用戶做數據處理和開發時按需選取一個數據處理的模板,然后再通過設置數據處理的一些參數即可進行開發,相當于用戶在做數據處理的時候不需要開發或者是少量的開發就可以處理數據。規則設置好之后BingoInsight會自動調度。
第五,數據開放和共享:打破部門壁壘和邊界,統一開放數據
去年8月份國務院發布《促進大數據發展行動綱要》,對政府和企業明確提出數據共享和開放要求,BingoInsight通過數據共享開放平臺為政府和企業各部門實現內部橫向和垂直部門的數據交換和共享,并以數據服務總線將數據統一開放,保障數據訪問的安全和效率,提供數據應用市場,統一管理、分發、檢索數據應用
第六,數據分析和可視化:讓數據盡快應用于生產
通過儀表盤、報表、自助分析、數據地圖等分析工具快速連接業務部門和數據,一般情況下 ,業務部門無需再找IT部門提數,如工具無法滿足需求,BingoInsight亦提供基于Html5的數據可視化開發框架,提供100多個數據可視化分析組件,快速定制數據應用。
好的,今天就聊這么多,大家如有疑問,歡迎在右下方留言,一起交流!
歡迎大家一起來交流!
想提出問題的同學們,可以在右下方“寫留言”,分享嘉賓會熱情并且耐心地進行解答噢!
你想和更多志同道合的技術大咖一起交流嗎?!你想收聽每周的“品高微信群公開課”的直播嗎?!加入我們“漫步云端 微信群”吧!
掃描下面二維碼添加“品高云珍珠妹”為好友,輸入“我要入群!”的暗號,即可得到入群指引噢~