一年之前,Gartner公司曾經將OpenStack定義為一個“科學項目”。然而在與國家計算基礎設施協會的Andrew Howard進行溝通時,他結合澳大利亞規模最大的OpenStack部署方案給出了不同觀點。
在這座占地面積900平方米的數據中心內承載著30PB數據,且利用AARnet作為組成部分接入NECTAR。Howard在采訪中表示,NCI以OpenStack為基礎的軟件定義網絡改變了研究人員們的固有思維方式。
十年之前,他指出,大多數研究人員都選擇使用一臺高端PC并希望其中提供充裕的磁盤空間來運行各類應用。如果將其中一部分參數集交由IT部門來打理,那么恐怕沒有任何一套技術支持體系能夠順利接管。
然而時至今日,Howard表示,“大家可以運行自己的計算任務并將數據存儲在國家級設施當中。如今可供支配的計算資源較本地環境更為豐富,我們也能夠把處理結果通過網絡傳回設施內部。”
“它改變了資源的消費方式,也讓研究人員擁有了超越部門甚至是高校級別的資源支配能力。由于項目本身是由聯邦政府贊助的,因此幾乎任何其它組織都無法在規模上與之比肩。”
作為澳大利亞早期互聯網規劃的參與者之一,Howard亦投身于OpenFlow早期開發并在NCI考慮使用OpenStack之后拿出三年半時間進行研究,因此他對于OpenStack如今的表現有著相當深入的理解。
相較于基于TCP/IP的路由機制——大家可以將其理解成世界上最原始的“SDN”——SDN的核心實質在于“對數據流進行進一步細分處理”,Howard解釋道。
這對于NCI當然是一件大事,因為其科學高性能計算體系專門面向規模龐大但周期相對較短的數據流、大量用戶以及遍布全國的基礎設施。
大科學,大網絡
在舊有模式當中,“遠程”機制是指用戶能夠以登錄方式通過網絡訪問與自身所在位置相距甚遠的集中資源。現在,需要對CERN數據(或者天文數據)進行處理的研究人員希望能夠從來源處獲取數據,將其移動至應用當中,運行該款應用,獲取結果并共享結果等等。
“為了實現網絡設備商用化,供應商需要提供低成本交換機,同時將其全部集成至單一SDN控制面板當中,從而實際成本節約,”他表示,但在NCI看來,SDN的重要性已經遠遠高于上述作法帶來的復雜難題。
“對于我們來說,真正的成本優勢在于能夠跨越多套國家級設施實現靈活性目標。”
SDN控制面板的存在,意味著NCI的用戶們不再需要以某種方式借助電信運營商的力量,他表示:“我們可以為研究人員建立復雜的內部網絡,其負責以透明方式跨AARnet實現數據傳輸,而無需觸及運營商控制面板。”
AARnet對SDN功能的支持能力非常重要,因為研究人員所使用的網絡容量將直接轉化為應用程序功能——這種關系與上世紀九十年代的方案非常相似:“十五年之前,那時候人們還在使用ISDN PRI或者ATM(即初級速率接口與異步傳輸模式)。大家可以撥號上網并直接使用資源。”
“事實證明,這確定是一種極具成本效益的軟件實現方式。”
如今的體系構建工作再次回歸十年前的思路,“大部分資源由云環境提供”,而OpenStack則在NCI用于承載工作負載的虛擬機體系的升級工作當中起到舉足輕重的作用。
軟件堆棧“仍需要時間以達到成熟”,Howard告訴我們,但OpenStack未來三年的定期升級規劃已經讓NCI方面有信心將其引入生產環境,而Rackspace等廠商也在配合推出相關方案——這一切都讓OpenStack已經不再僅僅屬于實驗室環境下的“科學項目”。
盡管如此,Howard指出:“這是一整套復雜的軟件集合,需要想辦法將其整合起來。”雖然大家“無法在車庫中實現集成并立即將其投入生產環境”,但先以小規模方式安裝并摸索無疑是了解OpenStack的最佳途徑,他建議稱。
而對于用戶來說,由技能積累帶來的收益也顯而易見。“無論具體使用哪種虛擬化平臺,這些技能都可以稍加調整即運用于VMware等各類平臺之上。”
相較于那些令人頭痛的高難度環境,Howard強調稱,NCI發現OpenStack一直在“致力于平衡可用功能、簡化功能優勢的具體實現方式以及有效培訓研究人員運用環境優勢”。
為了盡可能降低研究人員的上手難度,大量指標被納入儀表板以供他們隨時查看。
“最典型的實例就是虛擬基礎設施即服務平臺——這是一套標準的OpenStack平臺,用戶可以借此啟動虛擬機并在此基礎上構建應用程序。”
此外還有更多進階用例,例如跨越多套設施或機構創建虛擬實驗體系。在各虛擬實驗室中,OpenStack能夠實現多種彈性工作負載,例如在支持NCI高性能計算服務的同時運行后處理虛擬化機制。
“研究人員能夠登錄至門戶站點,將數據拖拽至/出其設施,點擊對話框并運行工作負載。我們則負責完成配置工作——我認為這絕對是種與眾不同的實現方式。”
“我們能夠支持大規模數據流:作為國家級科學樞紐,我們負責處理來自SKA、CERN、Copernicus以及地球傳感系統的數據——其數據總量無疑極為龐大。”
“因此,我們能否取得成功完全依靠網絡體系的表現。對于用戶來說,我們需要為其提供真正穩定且值得信賴的高性能資源。”