Apache Beam在官方博客上正式發布了Beam 2.0.0。這是Beam有史以來的第一個穩定版本,根據Beam社區的聲明,Beam意欲為未來版本發布保持API的穩定性,并讓Beam適用于企業的部署。
Beam的第一個穩定版本是Beam社區發布的第三個重要里程碑。Beam在2016年2月成為Apache孵化器項目,并在同年12月升級成為Apache基金會的頂級項目。經過從開始至今的15個月全神貫注的努力,從一個有點混亂的代碼庫開始,從各大組織合并代碼,成就了如今的這個數據處理框架,它是一個真正與引擎和環境無關的數據處理框架。Beam經過三個孵化器版本和三個后孵化器版本的演化和改進,最終迎來了它的第一個穩定版2.0.0。
在從升級為頂級項目至今的5個月時間里,Beam在采用率和社區貢獻兩個方面都取得了重大進展。Google Cloud、PayPal、Talend等公司都在使用Beam。
Beam 2.0.0改進了用戶體驗,專注于提升框架在各種執行環境中的無縫移植能力,這些執行環境包括執行引擎、操作系統、本地集群、云端,以及數據存儲系統。Beam的其他特性還包括如下幾點。
API穩定性和對未來版本的兼容性。 有狀態的數據處理范式,支持高效的依賴數據的計算。 支持用戶擴展的文件系統,內建支持Hadoop分布式發文件系統及其他。 提供了一個度量指標系統,可用于深入窺見管道的執行情況。很多貢獻者促成了這個穩定版本的發布,他們承擔了各種角色的任務:貢獻代碼、編寫文檔、測試候選版本、為用戶提供支持,等等。
Beam 2.0.0將會在這周于邁阿密舉行的“Apache:大數據”大會上首次亮相,會上將會有四個與Beam相關的主題。Beam也將會成為很多開發者見面會的主角,包括“圣何塞數據的未來”見面會、“倫敦斯特拉塔數據大會”、“柏林Buzzwords”,以及“圣何塞DataWorks峰會”。
開發者從今天開始就可以試用Beam,也可以考慮加入Beam社區,或者可以通過Beam的郵件組、問題跟蹤系統向社區提供反饋意見和問題。