KNIME是KNIME.com AG開發并支持的一個開源數據分析、報告和集成平臺。通過使用圖形界面,KNIME能夠讓用戶創建數據流,可選擇性地運行一些或全部的的分析步驟,并研究結果、模型和可交互的視圖。
KNIME 由Java寫成,基于Eclipse ,通過插件的方式來提供更多的功能。現有的插件支持通過文本挖掘、圖片挖掘和時間序列分析進行數據集成。還可以集成到其它各種各樣的開源項目中,比如,Weka的機器學習算法、R語言和JFreeChart。它支持封裝調用其他代碼,并提供節點,這樣用戶就可以運行Java,Python和Perl和其它代碼片段。KNIME還利用Eclipse插件功能,這樣,可以不斷增加用于廣泛系統和平臺的連接器擴展節點。
KNIME除了是一個開源的數據分析平臺,還提供了以下商用產品:
KNIME Personal Productivity:提供一種有效創建并維護KNIME工作流的方式。工作流中的代碼段和元節點可以更容易地進行管理,重復使用和共享。
KNIME Partner Productivity:為咨詢機構提供加密和鎖定與客戶共享封裝元節點的能力,同時保護自己的知識產權。
KNIME Team Space:通過集中存儲數據流和分析工作流程的方式,讓多個團隊成員共享和工作,提高團隊協作。
KNIME Server Lite:提供先進的協作能力,如基本的用戶認證和用戶權限,遠程計劃執行,報表生成,共享的數據空間,工作流程庫,元節點和優先級的更新。
KNIME Server:這是Server Lite的擴展,增加了先進的功能,包括更先進的用戶認證和用戶權限,Web服務支持,工作流版本控制和商業支持。
KNIME Big Data Extension:為從KNIME內部訪問存儲在Hadoop分布式文件系統(HDFS)蜂房數據庫中的數據提供節點。
KNIME Cluster Execution:在KNIME和集群之間提供薄連接層,通過幫助優化與KNIME集群使用,提高性能。
KNIME 2.11版提供了增強的數據庫連接,包括改進GROUPBY節點聚合方法、數據庫特有的聚合方法和基于模式匹配的聚合列選擇。平臺還增加了額外的數據庫節點。以改進數據庫集成和處理;同時,還增加了一個新的連接器節點,用于連接到HP Vertica數據庫。
KNIME Big Data Extension(商業擴展版)的改進包括新的Impala連接器和加載器節點,以及用來能夠運行在HDFS、擴展文件處理節點功能的新節點。與知名數據庫和數據倉庫也有連接器,KNIME可以從這些來源中提取數據。
KNIME分析平臺的可執行版本可用于Microsoft Windows和Linux(32位和64位)以及Mac OS X。