數據中心在經驗積累上的創新往往意味著風險。在我們看來,具有多個大型數據中心操盤手經歷的人,他的經驗更意味著是一種力量的存在。數據中心工作組顧問專家曲海峰就是這樣一位擁有著力量的人。
近日,布線聯盟網總編輯張旭軍和曲海峰先生就數據中心的規劃、技術創新、綠色節能以及布線方式等內容進行了深入探討,試圖將這一賦有經驗的力量傳遞給廣大用戶。
項目投資者應多了解國標
張旭軍:中國有句老話,“沒有規矩,不成方圓。”在綜合布線領域,我們國家有GB-50311、GB-50312國家標準,數據中心方面有GB-50174。您在進行項目規劃時,這些標準有怎樣的指導作用?
曲海峰:國家規范/標準中蘊含著大量智慧,包含了大量實踐經驗積累出來的精華,對用戶來講,具有廣泛指導意義。但是,問題是什么?當有了規范之后,用戶如何遵守規范?如何理解規范里定義的內容?
曲海峰:現在所謂的國家標準還沒有完全上升到強制性的層面。如何讓一個標準能夠起到它應該有的地位和作用,核心的還是應該對投資決策者進行深入的指導和影響。
曲海峰:國家規范/標準中蘊含著大量智慧,包含了大量實踐經驗積累出來的精華,對用戶來講,具有廣泛指導意義。但是,現在的問題是什么?當有了規范之后,用戶如何遵守規范?如何理解在制定規范里面定義的內容?在目前看,是存在一定差距的。除了設計規范之外,還要做實施、驗收規范,這也是輔助國標變成完整體系的過程。簡而言之,規范是有指導意義并有法律效力的,它對于保護用戶投資特別有價值。但是目前要想把這方面做的更充分,真正起到作用,用戶的理解、溝通、反饋、普及是重中之重的工作。
關于GB 50174和GB 50311,我建議在出新的修訂版本的時候,在物理布局(包括一些系統的兼容性、可升級換代等方面)有更多的溝通。在住建部的標準體系下,對于布線標準來講,在一個相對有限的領域里面,把這個工作做到了比較完善,或者接近于極致的水平,它的規范的發展速度,對行業的指導意義,絕對是領先的并引領了客戶的需求。
數據中心行業的發展起步晚,發展速度又非??欤愿鞣N規范還相對滯后于市場和用戶需求的發展。所以從這個角度來講,也期待著GB 50174新版本的誕生。
現在所謂的國家標準還沒有完全上升到一個指導性、或者是說強制性的層面。首先是投資決策人對這個事情的理解比較少,我們現在舉辦的很多行業上的會議,參加的人還是局限在技術工程或者項目管理人員,真正決策者參與的還比較少。如何讓一個標準能夠起到它應該有的地位和作用,核心的還是應該對投資決策者進行更多深入的指導和影響。什么能夠打動他們?能夠打動他們的只有一點,如果按照規范來做,可以規避項目風險,提高收益性價比。如果能讓用戶明白這一點,這個規范地位和層次會有進一步提升,而不是只停留在一些技術人員桌面上的參考文件。
張旭軍:綜合布線智能管理系統最近兩年越來越受到用戶關注。綜合布線工作組《2011年綜合布線市場調查報告》顯示,有61%的用戶非常有興趣,或積極考慮在新的布線系統中選擇使用智能管理系統。您是如何看待綜合布線智能管理系統的?您負責的項目中有沒有使用綜合布線智能管理系統?
曲海峰:我本人職業經歷都是做服務型數據中心(或者叫外包型數據中心)。以往的業務當中,我們的服務界面相對來說比較簡單,就是基礎設施層面。從網絡角度來講,幾乎90%以上面向的都是互聯網。從這個角度來講,我們的布線系統還是非常簡單的,對于智能管理布線系統應用案例比較少。我覺得對于具有信息化系統的企業用戶來說,他們的數據中心對智能管理的需求會很大,會有更多的經驗可以拿來分享。在我這邊可以看到的是比較簡單的,但是這種簡單實際上是源于應用場景,與需求相關。
有人提出,互聯網會越來越簡單,如果你真的建設云,你必須簡單。所謂簡單就是把模式變簡單,用簡單的方式實現智能化。如果說IDC或者互聯網數據中心,未來發展趨勢不會是采用一種復雜的管理系統解決這個問題,而是在系統架構設計的時候就弱化技術特征,然后從架構上變簡單。
雙管齊下解決高密度
張旭軍:高密度和綠色這兩個詞無處不在,在做數據中心規劃的時候,您一般是用哪些方法來解決用戶對高密度的需求?
曲海峰:高密度是可選的手段。但是一定要理解,高密度不見得是真正能夠滿足業務最優化的模型,要評估高密度帶來的成本。
曲海峰:用戶在做數據中心規劃的時候,首先要清楚自己對于性能和可靠性的要求,要平衡好這兩者之間的關系,有了這個原則之后,就可以依據這個選擇技術和實現方式了。
曲海峰:我覺得有兩個角度,第一個來自于高密度的需求是如何產生和如何理解的,這是第一個層面的問題。第二個,為了滿足高密度的需求,應該用什么樣的工程技術方案來實現。
我們先說需求是如何產生和如何理解這個需求的。就目前的現狀來看,真正有高密度需求的最典型應用是超算,比如勘探、氣象等。這是真正稱之為高密度系統,因為每個機柜密度都很高,而且系統平臺是統一的。在應用發達國家,現在對于高密度的定義,單機柜15千瓦以下都不叫高密度,認為15千瓦以上才叫高密度,甚至像30千瓦、60千瓦。 這是對需求的定義和理解。對于目前國內的高密度需求,我覺得是漸進的過程。為什么這么說呢?就是說,要看用戶花費了多少錢,提供了多少計算能力。所以從這個角度來講,高密度不見得是真正能夠滿足業務最優化的模型。
國內現在有這么多高密度方案的產生,主要有兩個原因。一方面是,廠商愿意推出解決高密度的專有設備,這是技術能力的表現,包括商業規劃的做法,也就是廠商在推高密度。另一方面,現在很多的高密度是在解決原有數據中心的改造項目當中,就是說用戶數據中心空間有限,物理空間受到局限,這個時候需要把密度提高,擁有更多的計算能力。這樣的項目其實操作難度是非常大的,風險很高。什么意思呢?就是說我們不是簡簡單單的看到一個機柜原來放十臺服務器,現在放了二十臺服務器就叫高密度了,這后面存在著一系列問題,必須是經過深思熟慮的過程。目前高密度最大的挑戰影響,一是受制于電力擴容,二是受制于物理場地環境,比如沒有辦法安裝更多的設備制冷單元,或者原來只有一千千伏安的電力裝在一百個機柜里,現在還是一千千伏安的電力,裝在了五十個機柜,對性能提高并沒有帶來價值,所以這種做法我認為性價比不高,得不償失,這是關于需求的產生跟需求的理解。
簡而言之,高密度是可選的手段,但是一定要理解,業務需求對于高密度是不是有絕對實施的必要,并且要評估高密度帶來的成本。
我們再來看一看關于實現高密度系統的技術和工程手段,這是現在討論最多的問題。假定用戶的高密度需求確定了,不管是新建項目也好,還是改造項目也好。其實實現高密度的方案和手段是多種多樣的,這個并不是很神秘。有幾種手段可以解決高密度,第一是靠產品化的模式解決的,比如說像我們知道最多的集成化、一體化制冷機柜。這種方案比較適合于企業用戶使用。就是說企業用戶選擇一個好的服務商,用一個標準的產品交付模式獲得高密度解決方案。但如果是服務型數據中心,可能更多會采用工程化的方法來做。簡單講,這類用戶不會僅僅考慮采用專有的設備,而會從工程化角度解決問題。
在機房設計的時候額外考慮了功能性的方法。舉個簡單的例子,有一家做互聯網游戲的公司,以前在運行某款游戲的時候,當時單機功率做到了26千瓦。當時研究了很長時間,最簡單的辦法就是獨立設計出來一個空調單元。就是把一個區域封閉起來,從地板下面到上面全部封閉起來,形成獨立的暖通環境。把機柜分開放了,其實也解決了連續運營的問題,非常穩定。從這個角度講,高密度在暖通設計上,只要暖通設計合理,用傳統工程化的方法也可以解決高密度,不一定要額外加一些冷水背板、高密度的制冷機柜。
但是這里要講一個問題,在我們現有的數據中心,傳統機房的做法,我們發現單機柜8個千瓦大概是一個臨界平衡點,就是機柜在8個千瓦以下的時候,可以靠簡單的(比如說暖風通道封閉、架高地板、調整氣流)方法解決問題。如果超過了8個千瓦之后,系統就要進行額外設計,而這種額外設計帶來的成本主要投資在對意外風險的防范上。什么意思呢?用這些方法做到一個機柜或者一個模塊,每個都超過8個千瓦,但是往往需要采用輔助設施,比如額外的制冷單元、額外的風扇、額外的冷凍水系統。
與以前數據中心的標準設計相比,高密度數據中心實際上只是在電力方面做了冗余的考慮,包括UPS、備機等方面。但是在暖通方面,沒有過多冗余設計,如果用戶面臨超過單機柜8個千瓦,或者達到高密度之后,在暖通這部分冗余系統會額外花很多錢,而且往往限制于場地條件,如是不是有地方安放室外機,是不是有地方架設管道設備,這時候帶來的風險控制挑戰是很大的。所以我們前邊提到一個話題,如果采用了高密度,系統冗余程度會增加,這是費用當中很高的一塊兒,這也是需要考慮的問題。
另一方面,在決定采用什么樣的工程和技術實現的時候,我建議采用成熟廠商的產品。如果用戶是服務商,可以用工程的角度解決這個高密度的問題,但是單機柜8個千瓦,我認為是臨界平衡點。我們每次在做數據中心設計的時候都會畫出這樣一個模型,也就是性能和可靠之間的平衡。T4標準的數據中心代表著最高的可靠性,實際上,真正T4需求的用戶非常少,可能只占整個數據中心百分之幾的份額。
大部分用戶愿意犧牲一部分系統的可靠性,而需要更高的性能。這種最典型的代表就是互聯網,比如我們講的.COM公司。還有一類是超算,千萬不要認為超算的可靠性很高,超算是可以停機的,這些應用是應用高密度很多的地方。另外一類用戶,盡可能要高可靠性,比如T3、T4水平,但是密度沒有那么高,比如政府、銀行、電信。所以,用戶在做數據中心規劃的時候,首先要清楚自己對于性能和可靠性的要求,有了這個原則之后,就可以依據這個選擇技術和實現方式了。
“上走線”的絕對支持者
張旭軍:關于數據中心的布線方式有“上走線”和“下走線”之分。對于這兩種走線方式,目前出現了一些爭論,我想聽聽您的觀點。
曲海峰:這個問題在我這兒比較簡單,我個人觀點很明確,就是應該“上走線”。
曲海峰:“下走線”占用的凈高會高于“上走線”。這個可能只是在十幾公分、二十幾公分的差別。但正式這種差別,對于數據中心很多投資來講,往往是決定成敗的。
曲海峰:這個問題在我這兒比較簡單,我個人觀點很明確,就是應該“上走線”。為什么這么說?因為從布線系統來看,主要考慮幾個問題。第一個是路由,第二個是串擾,第三個是密度或者是容量。弱電系統一般會考慮這些問題。數據中心項目是一個整體項目,做整個數據中心架構設計的人要通盤考慮這些問題。
我認為“下走線”沒有“上走線”合理,原因是基于幾個方面。第一個是目前國內數據中心項目建筑層高有限,很多都是四米以下的建筑,從這個角度來講,“下走線”占用的凈高會高于“上走線”。這個差別可能只是在十幾公分、二十幾公分的差別。但正式這種差別,對于數據中心很多投資來講,往往是決定成敗的,因為建筑的層高無法改變,用戶就是沒有那個層高。這也是很多用戶很難找到給數據中心用的建筑,有一些用戶在停車樓層做數據中心主要就是層高的問題。從這個角度來講,“下走線”和“上走線”節省出來的十幾公分,恰恰是決定項目成功與否的重要原因,所以應該是盡可能壓縮空間。
第二方面是暖通。在氣流組織方面,下走線明顯不利于靜壓箱形成。我們談了這么多綠色、節能環保,因為機電系統可改造的空間在架構上最小,所以暖通就非常重要了。對氣流的組織實際上決定了整個系統的能效,包括PUE的能效。從這個角度講,應該破除一系列不利因素,留給有利的方案。所以地板下面干干凈凈的,就應該是一個靜壓箱,“上走線”有利于暖通系統的設計。
第三方面是關于平面布局和未來可變化。我和一位國際上在數據中心建設方面非常權威的老先生討論過一個問題:“是不是未來數據中心可以不用地板”?他給了一個很有經驗的話:地板可以給你最大的靈活性。如果把布線也放在地板下面,調整成本會變的很大,這是一個平面布局的變化問題。所以我們做的是數據中心架構設計,要考慮各種各樣的因素。從這些方面來講,我相信,可以平衡掉或者說可以產生一個主導意見,采用“上走線”。當然,“上走線”也會有一些小的問題,比如說會有串擾、空間上會變的更局促等等。但是綜合利弊來講,意見是傾向性的,是壓倒性的。
張旭軍:“光進銅退”這個概念已經提出很久了,但整體看來,光是進了,銅是退了。但和“光進銅退”這個提法來講,演進的速度并不是那樣快?在數據中心領域,“光進銅退”會更加徹底一些?
曲海峰:其實很多事情的發展過程都是經濟利益驅使的過程,“光進銅退”在最開始的時候作為技術趨勢,是比較多被提及的,但是影響速度的原因還是在成本對比。在數據中心領域,普及光的有利條件和有利環境應該比銅更多一些。
所以從這個角度來講,至少從我個人經歷的數據中心項目基本上都傾向于把光銅比例定義到50%對50%。對于服務型數據中心來說,他們更樂于看到“光進”。
“第一個吃螃蟹的人”
張旭軍:我們知道,很多用戶對于新產品、新技術的選擇都比較謹慎,不愿意做“第一個吃螃蟹的人”,這是否也意味著是一種保守?
曲海峰:這種保守來自于決策機制,投資的決策機制決定了對使用新技術的態度。我愿意嘗試新的技術,但是這些新技術我們要充分了解,并且對風險和投資的性價比要做完整評估。
曲海峰:很多時候所謂的創新并不是真正的技術創新,用戶應該有一個非常清晰和有能力的人對技術路線發展有把握,他可以跨行業理解一些東西,并且具有整合能力。
曲海峰:這種保守來自于決策機制,投資的決策機制決定了對使用新技術的態度。我簡單說說我個人對“吃螃蟹”的理解。在我經歷的數據中心項目當中,我個人的風格和習慣是愿意嘗試新的技術,但是這些新技術我們要充分了解,并且對風險和投資的性價比要做完整的評估。在我所經歷的事情當中,創新給我們帶來的影響是利大于弊的,只要你能合理控制風險,創新帶來的價值都是利大于弊的。很多創新的東西失敗不是失敗在技術上,而是失敗在應用的環境上,說白了就是沒用好。為什么沒用好?一方面,在一開始調研的時候沒調研清楚,理解清楚;另一方面,在后續過程中,沒有一套有效的機制去保障它能夠持續進行,所以失敗的情況會比較多。但是一旦創新帶來成功的話,它給出來的回報遠遠要超過失敗承擔的風險。所以從這個角度來講,我們認為應該去創新,應該去嘗試“吃螃蟹”。但是評估機制是建立在一個充分平等且和實際相結合的基礎上,這是非常重要的。我們有很多決策機制不是建立在平等、充分且和實際相結合的基礎上,所以這種風險給創新帶來的失敗是比較大的,很多人畏懼這種東西,就完全不做。
張旭軍:但是對于用戶來說,建立評估體系,對新產品、新技術的應用情況進行評估,這是不是難度蠻大的?
曲海峰:我覺得其實難度不大。咱們現在國內各種各樣的項目,比如說對創新或對“吃螃蟹”的事情,傳統做法就是請專家進行評審,且不論請來的是什么背景的專家,就算他很專業,在這種公開的評審會上,總是有各種各樣的因素,不能真正達到各抒己見,所以我覺得這種評審會的方法是沒有價值的。
我個人贊同的是跟廠商建立更全的合作,比如建立聯合實驗室也好,測試項目也好,通過一種合作模式來解決。首先應該建立測試性或者示范性的項目,并且數據是由自己的實際工程技術人員拿到的第一手數據,這是我特別看中的。第二,可能用戶經常會采用看起來很好的技術,但是這個技術是專有的,這也是我盡量回避的。為什么呢?不論技術再可靠,只要技術一旦變的專有之后,就會變成商業上的大風險,后續的成本看不清了,或者是綁死在一條船上,盡量建立在自己測試的基礎上。很多時候所謂的創新并不是真正的技術創新,用戶應該有一個非常清晰和有能力的人對技術路線發展有把握,他可以跨行業理解一些東西,并且具有整合能力。
張旭軍:對于數據中心來講可創新的地方挺多的,從數據中心發展史來講,確實有很多新技術、新理念包括一些新的設計思想可以值得去嘗試,像Google剛剛引用海水做冷卻。
曲海峰:國內數據中心項目經常是幾萬平米,十幾萬平米,從這種角度,可能項目的需求還沒有給創新留出足夠的反映時間,這是現在一個很大的問題。
數據中心應該建立一套完整的評估體系
張旭軍:用戶存在的一個普遍的現象是,重建設、輕管理,包括日后的運維。您是否有好的經驗讓廣大的用戶更多的重視管理和運維?
曲海峰:我并不認為用戶沒有意識到管理很重要,而是用戶難以用現在自身已有的條件去做到完善管理,這跟我們的企業里面多年形成的機制是有關系的。
曲海峰:數據中心應該建立一套評估體系,評估體系應該是完整全面的:第一是設計,第二是實施,第三是運行,重點在于運行。
曲海峰:這個問題涉及到一些行業的根本東西,如果從小的層面來講,你可以給用戶提供很多好的建議,比如咨詢、服務、各種各樣的工具。但是從我個人的觀點來講,看行業變化應該是這個社會變的分工明晰。舉個例子,不可能讓老百姓知道如何去打假,因為老百姓不應該學會打假。國內現在很多大型數據中心建設,是花的起錢,但是用不起人,這個情況是很多的。所以從這個角度來講,我并不認為用戶沒有意識到管理很重要,而是用戶難以用現在自身已有的條件去做到完善管理,這跟我們的企業里面多年形成的機制或者是環境是有關系的。所以從這個角度來講,你要看到問題產生的層面和解決的層面。如果在具體層面,應該引進更多的評估體系,包括設計、實施和運行。一個好的系統,如果疏于管理的話,會達不到系統應有的品質,但是一個差的系統,管理好的話就會提升品質,雖然它在硬件上不可能達到那種效果,但是整體交付效果上,可以達到或者提升原有的品質。
數據中心應該建立一套評估體系,評估體系應該是完整全面的,第一是設計,第二是實施,第三是運行,重點在于運行。運行部分可以參考國外已經有的經驗,比如運營商或者企業內部形成的管理規范。在這些過程當中,我覺得更多的是把責權利條塊化、明晰化。我認為這只能做到一個層面,因為數據中心的管理運行問題太復雜了。我建議用戶盡可能的引入評估機制,盡可能引入一些專業的細分角色來做。真正問題的解決方向是用服務的方式解決問題。用戶不要想做很多不太可能或者不擅長的事情,有很多東西確實是人家該掙那份錢,這個是很核心的問題。