盡管基于云計算模式的計算平臺或服務已被廣泛接受并逐步走進應用,但云計算的研究總體上還處于起步階段,許多現有的問題還沒有被完全解決。本文提出了部分具有挑戰性的云計算關鍵技術和研究問題。
1 虛擬機遷移
云計算通過允許虛擬機遷移實現整個數據中心負載平衡。此外,虛擬機遷移提高數據中心的健壯性和高度響應。虛擬機遷移是由進程遷移演變而來的。虛擬機遷移的主要優勢是避免熱點,然而,這并不簡單。目前,檢測工作負載熱點和啟動一個遷移缺乏應對突然的工作負載變化的靈活性。此外,虛擬機遷移時內存中的狀態應當一致且高效地傳輸,同時還需綜合考慮應用程序和物理服務器的資源負載。
2 服務器整合
服務器整合可以最大化資源的利用率,同時最小化能耗的有效方法。虛擬機遷移常用來整合駐留在多個很少使用的服務器的虛擬機到一個服務器,這樣剩余的服務器可以設置為節能狀態。在數據中心優化整合服務器通常是一個NP難的變種裝箱優化問題。針對這個問題已經提出各種啟發式方法。
服務器整合不應該影響應用程序的性能。眾所周知,單個虛擬機資源的使用不停的在變化。對于虛擬機間共享的服務器資源(比如帶寬、內存緩存和磁盤I/O),最大限度地整合服務器可能導致擁堵。因此,觀察虛擬機負載的波動和使用這些信息有效的整合服務器是很重要的。最后,在資源擁塞發生時,系統必須能快速響應。
3 能耗管理
提高能源效率是云計算另一個主要問題。據估計,能耗成本占數據中心運營支出總額的53%。因此基礎設施提供商承受了巨大的壓力減少能源消耗。目標是不僅要減少數據中心的能源成本,還要達到政府法規和環境標準。
設計節能數據中心最近受到越來越多的重視。這個問題可以從多個方向解決。例如,節能的硬件架構、減慢CPU速度和關閉部分硬件組件已成為研究者的共識。有節能感知的作業調度和服務器整合兩種方式可以減少能源消耗。最近的研究也已開始研究節能的網絡協議和基礎設施。一個關鍵的挑戰是實現節省能源和應用程序的性能之間達到一個好的平衡。在這方面,一些研究人員最近已經開始在一個動態的云環境實現性能和能耗管理的協調解決方案。
4 流量管理和分析
分析數據流量對于今天的數據中心是重要的。例如,許多web應用程序依賴于分析數據流量來優化用戶體驗。網絡運營商還需要知道數據流量進行許多管理和規劃決策。然而,把互聯網服務提供商(ISP)現有的流量測量和分析方法擴展到云計算數據中心還存在一些挑戰性的問題。首先,數據中心鏈接的密度要比ISP高得多;其次,大多數現有的方法可以計算幾百臺主機的流量矩陣,但一個小型數據中心可能擁有幾千臺服務器;最后,現有的方法通常基于一些ISP的流量模式,但是部署在數據中心應用程序極大的改變了流量模式。此外,在云計算中應用程序的網絡使用、計算和存儲資源存在更緊密的耦合。
5 軟件框架
云計算提供了進行大規模數據密集型應用程序的平臺。通常這些應用程序利用MapReduce框架(如Hadoop可伸縮的和容錯數據處理)。研究表明MapReduce作業的性能和資源消耗的是高度依賴應用程序的類型。例如,Hadoop任務sort是I/O密集型,而grep則要求大量CPU資源。此外,分配在每個Hadoop節點的VM可能是異構的。例如,一個VM可用帶寬依賴于配置在同一個服務器的其他VM。因此,通過仔細選擇它的配置參數值和設計更高效的調度算法能優化MapReduce應用程序的性能和成本。通過緩解瓶頸資源,可以將應用程序的執行時間顯著提高。關鍵的挑戰包括Hadoop的性能建模(無論是在線還是離線)和動態條件下自適應調度。
另一個相關的方法認為讓MapReduce框架有節能感知。這種方法的基本思想是將完成工作且等待新任務的Hadoop節點進入睡眠狀態。這就要求Hadoop和HDFS必須由有節能感知。此外,通常會在性能和節能感知之間進行權衡。根據目標,找到一個理想的權衡點仍是一個沒有探索的研究課題。
6 存儲技術和數據管理
軟件框架MapReduce和它的不同實現(Hadoop和Dryad)針對分布式處理的數據密集的任務。這些框架通常運行在網際文件系統(比如GFS和HDFS)。這些文件系統的存儲結構、訪問模式和應用程序編程接口不同于傳統的分布式文件體系。特別是他們沒有實現標準POSIX接口,因此引入和傳統文件系統和應用程序的兼容性問題。目前的解決方法主要包括提支持MapReduce框架使用集群文件體系方法和基于新的API原語支持可伸縮和并發數據訪問等。