隨著微軟不斷增加其Azure大數(shù)據(jù)產(chǎn)品組合,用戶發(fā)現(xiàn)越發(fā)難以跟上這些更新。下面是組織采取大數(shù)據(jù)行動的必須知道的Azure術(shù)語的細(xì)目。
大數(shù)據(jù)正上增工,不僅是規(guī)模,知名度也在上升。每天企業(yè)都有比前一天更多的數(shù)據(jù)需要處理,無論是通過互聯(lián)網(wǎng)事務(wù),還是社交媒體。但許多企業(yè)都需要一種服務(wù),可以在短時間內(nèi)縮減信息量——這正是云訪問的路徑。
隨著企業(yè)重新把注意力放在構(gòu)建智能云平臺上,微軟Azure大數(shù)據(jù)服務(wù)越來越具吸引力。 Azure平臺提供的能力包括:信息管理、存儲、機(jī)器學(xué)習(xí)、分析和認(rèn)知服務(wù)。另外,企業(yè)還可以在 Azure市場中從大數(shù)據(jù)和高級分析合作伙伴中訪問應(yīng)用。
但是在開始之前,使用這些術(shù)語來了解微軟Azure大數(shù)據(jù)服務(wù):
Azure Data Lake Analytics:數(shù)據(jù)湖分析,是微軟公有云中用于大數(shù)據(jù)的一個查詢服務(wù)。該服務(wù)允許客戶分析數(shù)據(jù)數(shù)據(jù),并獲得洞察,自動擴(kuò)展資源。根據(jù)微軟據(jù)說,組織可以與其現(xiàn)有的工具一起使用Data Lake Analytics,用于識別、管理、安全和倉庫工作。Azure Active Directory 與該服務(wù)集成提供了更深入的用戶許可管理。Azure Data Lake Analytics有權(quán)訪問Azure SQL Data Warehouse、Power BI和 Data Factory,它是Cortana Analytics Suite的一部分。該服務(wù)使用U-SQL——微軟從SQL和 C#中分離出來的查詢語言。
Azure Data Lake Store:Data Lake Store給大數(shù)據(jù)提供了基于Apache Hadoop的 超大規(guī)模存儲。該系統(tǒng)可以以其原有的形式存儲結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)。該 服務(wù)設(shè)計減少延遲,歸置關(guān)于帳戶和文件規(guī)模的未修復(fù)的限制,據(jù)微軟說。該服務(wù)與其它的微軟Azure大數(shù)據(jù)服務(wù)集成,包括Azure Data Lake Analytics和Azure HDInsight。
Azure HDInsight:HDInsight是一個Hadoop即服務(wù)產(chǎn)品,用于管理Apache Hadoop、Spark和 R集群。它可以按需擴(kuò)展,存儲巨大量數(shù)據(jù),用戶可以通過Excel來分析和可視化數(shù)據(jù)。HDInsight還包括了其它功能,如 Apache HBase、 Apache Storm、Apache Spark和R server for Hadoop
Azure Stream Analytics:Stream Analytics服務(wù)允許用戶執(zhí)行實時分析。主要用于物聯(lián)網(wǎng),它可以執(zhí)行數(shù)據(jù)流,并從中獲得洞察,同時低延遲擴(kuò)展。它與Azure Event Hubs集成來比較多個數(shù)以流。該服務(wù)可發(fā)送定制化的警示,并在控制面板中實時顯示數(shù)據(jù)。
Azure Data Factory:Data Factory是一項編排服務(wù),它用于協(xié)調(diào)本地與云之間的數(shù)據(jù)行為,從而為消費做準(zhǔn)備。用戶可以監(jiān)視和自動化數(shù)據(jù)管道,而且它還可以創(chuàng)建、調(diào)度、管理和編排數(shù)據(jù)流。它還用于連接其它的微軟Azure大數(shù)據(jù)服務(wù),如HDInsight、Stream Analytics和機(jī)器學(xué)習(xí)。
Azure Data Catalog:Data Catalog是一個管理服務(wù),用于簡化數(shù)據(jù)的發(fā)現(xiàn)。該工具允許用戶注冊和發(fā)現(xiàn)數(shù)據(jù)源,以及分享見解。用戶可以將元數(shù)據(jù)組織到目錄中,并控制誰可以訪問哪些數(shù)據(jù)集。
Azure Power BI Embedded:Power BI Embedded服務(wù)讓用戶能夠創(chuàng)建交互式報告來可視化數(shù)據(jù)。組織可以將這些視覺內(nèi)容嵌入應(yīng)用程序中,而無需通過REST API和SDK更改應(yīng)用程序的設(shè)計。數(shù)據(jù)可在個來源中可視化,包括Azure SQL Database 和Azure SQL Data Warehouse 。它還提供了現(xiàn)成的數(shù)據(jù)可視化,以及創(chuàng)建自定義視覺效果的能力。