背景
當前大家都知道:
1. 數據交易市場的繁榮為時過早,數據加工和處理太過于分散化;
2. 數據金字塔頂部的數據成為重要的資產,然后擁有者并不知道如何釋放;
3. 互聯網數據聚合及釋放數據價值的經驗值得所有企業參考。
筆者團隊經歷對于DAAS的幾個階段,艱辛萬苦,若有所思,現在把研究成果分享出來,以求大家反饋,研究研究在改進
DAAS是什么
基本定義
• Users can access vendor provided databases
用戶可直接獲取由BD公司提供的數據庫
• Users can host their own databases on vendor managed systems.
用戶可在BD公司提供數據管理平臺上處理自己的數據庫
• Users have the option to access data (their own and/or other parties) on a usage sensitive basis.
用戶可以按照自身意愿對多源數據進行應用級別的分析處理
DAAS哪些公司在做
DAAS有哪些產品
Amazon EMRCore DaaS
• Amazon Elastic MapReduce (Amazon EMR) 是一種 Web 服務,它簡化了大數據的處理,提供托管Hadoop框架,可以讓用戶輕松、快速、經濟高效地在多個動態可擴展的 Amazon EC2 實例之間分發和處理大量數據。
• 用戶還可以運行其他常用的分發框架(例如 Amazon EMR 中的 Spark 和 Presto)與其他 AWS 數據存儲服務(例如 Amazon S3 和 Amazon DynamoDB)中的數據進行互動。
• Amazon EMR 能夠安全可靠地處理大數據使用案例,包括日志分析、Web 索引、數據倉庫、機器學習、財務分析、科學模擬和生物信息。
AltiscalePerformance DaaS
• Altiscale通過將Hadoop的全部服務轉向云端,并提供Hadoop即服務以減少Hadoop的復雜性;
• 將Hadoop服務推向云端,意味著更廣闊的受眾,而客戶在遭遇不可避免的問題時,完全可以依賴Altiscale的服務。由于Altiscale完全專注于Hadoop,因此解決問題的過程可以從幾天縮短到幾個小時。
• 有的時候,Altiscale會在處理階段自己發現問題,有的時候則是客戶主動上報問題,因此客戶并沒有被迫要自己去追蹤問題,然后留給Altiscale來解決。
• 該產品被業界認為具有規模生產效應。
Qubole Feature DaaS
• Qubole致力于解決基礎設施沖突的問題,一旦互聯網的政策到位,任何數量的數據分析都可以在Hive,spark、Presto等數據處理引擎的協助下實現一鍵訪問,也可連接其他服務的API來導入數據。
• Qubole簡化、加快和縮減了處理存儲在AWS、谷歌或者Azure云中的大數據分析的工作量,用戶無需了解Hadoop系統管理,大大簡化了大數據應用的復雜性,而且成本更低。
• Qubole是一個企業級別的解決方案,它的靈活性使得它脫穎而出,成為一款相當值得使用的軟件平臺。
DAAS有哪些案例
DaaS案例-云平臺
Amazon Elastic MapReduce 支持的功能包括:
1) 查看過此內容的人還查看過
2) 要點回顧
3) 鍵入搜索內容時自動完成詞語
4) 搜索拼寫建議
5) 熱門搜索
6) 廣告
Yelp 每天運行約 200 個 Amazon Elastic MapReduce 作業來處理 3 TB 的數據,并借助AWS來幫助他們進行 Hadoop 應用程序開發,幫助Yelp節省 55 000 USD 用于前期購置硬件的資金,并且從設置到運行只需幾天,而不是數月。
Yelp 使用 Amazon S3 來存儲每天的日志和照片,每天可生成約 100 GB 的日志。該公司還使用 Amazon EMR 支持近20個單獨的批處理腳本,它們當中的大部分都用于處理日志,開發人員可以集中精力應對其他挑戰。
1)DaaS案例-自建
Big data cloud service makes ad-hoc analysis easier in Hadoop.
2)DaaS案例-技術輸出到數據擁有者
IBM所提供的Twitter服務分析:IBM向企業提供訪問數據和分析的渠道,查看Twitter每日5億條推訊,還有2.8億月活躍用戶。此外,它還提供了一個叫做“firehose”的推訊分析工具與應用,將這些混亂的非結構化數據轉變為有意義的信息;它還培訓了4000名咨詢師,協助企業將計劃付諸行動以期獲益。
蘋果和IBM剛剛宣布,合作開設了一個大數據的健康平臺。蘋果手表的出現可能會使商用可穿戴設備成為主流,毫無疑問也會帶來新一波BDaaS的應用爆發。預測將有數百萬使用者進行各種操作,包括監控心率、安排社交日程、遙控家庭娛樂設備,從而造就大量的數據。然后蘋果再找出新辦法,將這些數據包裝起來重新賣給我們。
3)DaaS案例-自產自銷
農業機械生產商John Deere,他為所有拖拉機配備了傳感器,這些傳感器會收集機械、土壤以及莊稼狀況的信息,并將這些流數據傳到MyJohnDeere.com與Farmsight服務上;從何時該訂購備件,到哪里種植莊稼一應俱全,農場主可以付費訂閱這些分析情報。
DAAS可能存在的商業模式
在使用DaaS時,理論上來說所有煩人的“基礎細節”都不用再操心了(在組件和基礎設施上的大量投入),企業也就可以專心解決業務問題。DaaS提供商承擔合規和數據保護的成本,當數據存儲到他們的云服務器上后,一切工作將由他們負責。租用他們基于云的存儲與分析引擎,然后按使用時間或者處理的數據量來付費。向客戶提供分析服務(分析報告或者人工服務費)。直接賣加工后的數據。
行業DaaS平臺:服務行業巨頭
需要釋放數據價值獲取更多數據:
1. 行業數據的提供
2. 行業數據分析的結果
3. 對數據進行分析
4. 數據驅動產業變革
5. 數據門戶:服務小企業
需要DaaS新的云化有數據的環境
• 工具
• 數據
DAAS展望
通過利用BDAAS對所收集的大量個人數據進行分析,客戶能夠更加有效地發現和吸引潛在客戶。這類服務有數千家中小型企業級使用者,將目標對準了潛在消費者可能存在的相關利基市場。亞馬遜的AWS以及谷歌的AdSense和AdWords,Acxiom都可歸為這一類,屬于其中的佼佼者。隨著軟件即服務的流行,我們越來越習慣在虛擬環境中通過web界面來工作,將分析整合到這個過程中也就成了自然而然的下一步。我們已經能看到:很多之前認為大數據遙不可及的企業,現在都看到了大數據項目的可行性。
如何做DAAS
• 數據源:專注在IT能力比較弱,但是數據價值較高的行業客戶上;
• 數據云化:強調數據管理的云化;
• 數據產品SaaS化:為可以接受SaaS服務的客戶提供數據產品
DaaS(數據管理服務)的技術整體架構
(圖來源百分點科技)
管理的具體措施
(圖來源百分點科技)
數據的積累、挖掘、整理、利用,是現代企業所必需的基本素養,沒有它,你的企業將無力面對未來的競爭。數據在云端的管理開始變得更加重要,很多軟件企業開始思考數據在云端的交互,這樣對于數據流通有天然的氧吧。數據服務(DAAS)雖然今天看起來還很模糊,缺少法律支撐,缺少數據流通技術支持,缺少成功案例,缺少企業涉足,但我們堅信:
1) 數據流通必然需要很多專業的公司提供服務;
2) 數據的流通必然會節省整個社會的生產成本。