Paxata是一家應用機器學習技術處理大數據難題的初創公司。公司致力于將數據科學家和業務分析師從數據準備工作中解放出來,使他們能夠專注于數據分析工作。
最新發布的Paxata平臺將能為后端工具準備更大規模的種類更多的數據。該軟件搭配無模型、內存管道處理器和基于Spark的分布式處理引擎HDFS使用。
為了提高數據準備工作的自動化能力,Paxata采用了機器學習和語義檢索能力。這能幫助數據科學家和業務分析師處理數據轉換等相關工作。
Paxata聯合創始人、副總裁Nenshad Bardoliwalla表示,軟件的任務是幫助人解決難題,對數據科學家而言,我們的軟件可以幫助實現前端數據準備和大數據集成。不過Bardoliwalla也指出希望在后端的虛擬化軟件有所作為,現在主要的供應商是Tableau,但產品要完善的地方還很多。
Bardoliwalla表示,Paxata的Spring 15平臺支持使用RESTAPI工具集的數據提取。“如果使用可視化工具之前還要花大量時間準備數據,那也太不友好了。”
Paxata還提供機器學習界面。Bardoliwalla表示:“數據分析最困難的部分就是錄入很多數據源。在這方面,Tableau采用了可視化的方式,而我們希望采用另一種新的方式進行數據準備。”