建立冷熱通道的3大方法:機房空調改造術

機房溫度持續升高,是許多企業持續面臨的嚴重問題,有些企業為了抑制系統過熱造成不穩定,甚至把空調溫度調低到10度以下,企圖以幾近於冰箱冷藏室的低溫來解決機房散熱問題,但這樣做不僅浪費大量能源,更要付出電費暴漲的代價。要如何改善機房空調的問題呢?就先從建立冷熱通道開始做起





用冷熱通道有效管理機房氣流
走進英特爾位於馬來西亞的資料中心的白色大門,迎面而來一股涼意,這是一座從2002年就開始啟用的老機房,下吹式空調系統的2座冰水主機位於機房中央,冷空氣從高架地板吹出,通過機櫃後釋出的熱空氣則從天花板的迴風口排入到天花板通道中,送至冰水機冷卻,就像是一般企業老舊機房的傳統設計一樣。

英特爾亞太地區和中國各地據點營運所需的各式應用服務,近半數在這座機房中運作,包括辦公室、企業應用以及最重要的處理器產品設計。所在,在這座機房中,除了一般效能的伺服器以外,還有大量供英特爾研發團隊與合作廠商設計產品的高運算伺服器HPC。

但是,這座老機房原先的冷卻設計,難以滿足HPC的散熱需求,所以,後來英特爾另外在這座機房內,又打造了一個小房間,採取不一樣的冷卻設計,來解決高密度運算的需求。

英特爾用來改善機房冷卻問題的解決之道,正是導入了冷熱通道的冷卻設計。在這個機房內的小房間中,英特爾採用了煙囪式機櫃,冷空氣同樣由高架地板吹出,進入HPC機櫃後,由機櫃上方的煙囪排入天花板的通道,同樣循著原有冷熱循環管路,進入冰水機冷卻後形成冷空氣,再繼續下一個熱流循環。

不只是英特爾,隨著伺服器運算效能越來越高,企業也越來越仰賴IT以後,應用系統需要的運算量也越來越大,再加上虛擬化技術越來越興盛,單一伺服器上往往要負載好幾套應用系統,高密度的刀鋒系統和高耗能的HPC高運算伺服器讓整座機櫃的功率越來越大。

例如一座機櫃可以安裝4箱刀鋒系統,若全數插滿刀鋒伺服器,每箱14刀,一刀若用電4百瓦,整座機櫃的用電量就超過了22千瓦,非常驚人,遠高於傳統機櫃不到10千瓦的用電,對很多傳統機房的冷卻設計來說,這是非常大的挑戰。

很多企業為了抑制伺服器過熱造成的不穩定,往往會將機房空調溫度調低,甚至達到10度C以下,企圖以接近冰箱冷藏室的低溫,來解決機房散熱問題。但是,這麼一來,也造成空調系統效率不彰,耗電量大增,形成另外一筆電費的負擔。

臺北科技大學能源與冷凍空調工程系助理教授李魁鵬表示,這種用整間機房來冷卻的作法過於浪費,其實,現在機房最迫切的問題是「機房局部熱點的問題,但企業為了解決少數地方的問題,而將空調溫度降低,設定的溫度越低,效率就越差,也越耗電。

李魁鵬是經濟部能源局補助臺灣綠色生產力基金會編印的《電信網路機房節能應用技術手冊》主筆(後簡稱機房節能手冊)。這是他訪查過臺灣多座IT機房後的結論。

若以常見的機房能源消耗指標PUE(Power Usage Effectiveness)來看,美國電信級機房在2003年時的平均PUE值是1.95,而在2005年時更是達到1.63,但李魁鵬在這本去年出版的機房節能手冊中提出,實測臺灣電信專業機房得到的結果是1.9。兩相比較,李魁鵬認為,臺灣電信機房還有30%的節能改善空間。電信業者提供的IDC級專業機房都如此,更何況是一般企業自行打造維運的機房,多數也有很大的改善空間。

造成臺灣企業機房冷卻效果不彰的常見問題,包括了高耗能的IT設備缺乏節能管理或沒有整併;迴風設計沒有使用風管而是直接回風,造成氣流短循環,氣流無法有效率地冷卻機櫃。迴風口和出風口太接近,造成氣流短循環,氣流無法有效冷卻機櫃。

還有像機房缺乏冷熱通道的設計以及短循環的迴風,造成機房溫度場混亂,甚至進一步造成空調設備的溫控感測點不易設置,空調箱和冰機的控制失序,經常要頻繁開啟或關閉切換,導致冷卻系統不穩定運轉且有容易故障的風險。其他與冷卻設計相關的問題像是配線系統雜亂阻礙氣流、冰水主機老舊或過大設計而低效率運轉、不當高架地板開口設計造成了氣流分配不均與氣流洩漏嚴重等。


十大機房改善建議,動態PUE監控和建立冷熱通道最優先
李魁鵬在手冊中也提出了10項改善建議,其中,第一步要開始動態測量PUE值,藉由量測能源消耗及PUE監測,而且要長期監控平均計算,例如將冬天和夏天時的機房PUE值平均計算。了解機房能源性能和效率之後,接著就是要建立冷熱通道來進行機房氣流管理。

其他更細緻的改善作法還有調高冷通道溫度、使用變頻空調系統、避免空調超量設計和主機臺數規畫、將未使用的機櫃封板減少氣流短循環、採用伺服器虛擬化和整併。

若企業能進一步施工則可採用水或空氣的自然冷卻方法,使用模組化與高效率的變壓器和UPS系統,或是改用冷煤冷卻系統來提高冷卻效率。

其中,了解機房情況以後,第一個要動手進行的工作是「要建立冷熱通道,對冷卻才有幫助,才能兼顧整間機房不同散熱情況和能源的消耗。」這是李魁鵬建議企業優先採用的機房改善良方。


缺乏冷熱通道設計造成了混風連鎖效應,大大影響散熱效率
因為傳統機房沒有考量冷熱通道的擺設問題,大多是面對背的排列方式,例如第一排機櫃的背面,正對著第二排機櫃的正面,而第二排機櫃的背面又對著第三排機櫃的正面,以此類推。

但是,當冷空氣從高架地板吹入第一排機櫃後,完成熱交換所排出的熱空氣,會和第二排機櫃前方高架地板吹出的冷空氣混合,導致吹入第二排機櫃的冷空氣溫度上升。這個溫度比原始氣流更高的冷空氣,進入第二排機櫃進行熱交換後,得到的熱空氣會比第一排機櫃排出的熱空氣更高,前排機櫃的熱氣會造成下一排的散熱效果更差,以此類推,越後排的機櫃,散熱效果越差。

為了避免最後一排機櫃的伺服器因過熱而當機,企業得將機房溫度越調越低,甚至像冰箱冷藏室一樣不到10度,才能在層層混風連鎖效應的遞減下,讓冷空氣到達最後一排機櫃時,仍有足夠的制冷力。

除了降低溫度,MIS也會採取增加高架地板出風口的方式,增加風量來提高制冷力,但這只是造成更嚴重的混風效應,讓機房內的氣流紊亂,更難將冷空氣送達要冷卻的設備。

混風也會對空調設備的效率產生影響,迴風和出風的溫差越小,代表壓縮機使用相同的電力時,產生的冷凍效果越小,等於是空調設備的運轉效率越差,電力浪費的情況越嚴重。


隔離冷熱通道讓冷熱空氣分流
若調整機櫃擺設方向,讓機櫃兩兩相對,面對面與背對背的擺設,例如第一排機櫃的正面,和第二排機櫃的正面相對,而第二排機櫃背面與第三排機櫃背面相對。如此一來,可以將冷空氣送入正面相對的兩個機櫃間通道,作為冷通道,而第二排機櫃排出的熱氣,進入第二和第三機櫃之間的背對背通道中形成熱通道,由天花板上方迴風口排出,不會影響到第三排機櫃從另一個冷通道取得的冷空氣。

這樣的作法就能避免冷空氣和熱空氣混風,能建立冷熱通道隔離的效果。理想上,每一個機櫃都能都得到溫度品質相當的冷空氣。當然,高架地板的出風口也要隨之調整,在冷通道設置出風口,而在熱通道封閉或移除出風口。李魁鵬表示,光是這樣的調整,其他設備不變,就能大大改善機房冷卻效率。

像勤益科技大學在2009年8月時完成的新機房,就採取了冷熱通道隔離的設計方式。在20多坪的機房中,調整3排機櫃的擺設方式,來區分出冷通道和熱通道。下吹式空調系統的冷空氣從高架地板的蜂巢板吹出,熱通道上方天花板則設置抽風口,將熱風排放到天花板中的通風管路中,再送至屋頂冷卻水塔中降溫。

除此之外,勤益還導入了IP KVM遠端監控機制,減少人員進出機房造成的冷空氣外洩,並設置獨立冷卻水塔,減少外氣交換的比率來節省壓縮機耗電。也採用結構化布線系統,避免網路線影響高架地板下的氣流等作法。透過冷熱通道隔離和這些作法的綜效,最後打造出PUE值1.7的省電機房,甚至未來當勤益新機房的機櫃使用率從現有的6、7成,提高到滿載時,還有可能挑戰PUE 1.4。


封閉冷通道或熱通道,更徹底隔絕冷熱空氣
不過,這種作法只是利用機櫃體積來隔離冷熱氣流,稍加控制冷熱循環的流動方向,但機房仍舊是一個可以充分對流的空間,熱空氣有各種空隙可以繞過機櫃,與冷空氣混合,仍舊會造成部分程度的混風,只是遠低於完全沒有冷熱通道時的情況。

所以,從冷熱通道隔離的觀念出發,更積極管理氣流的作法是封閉,將冷通道封閉或者是熱通道封閉,更徹底地防止熱空氣和冷空氣混風。

<圖表>3種冷熱通道案例比較
<Box>10種機房冷卻改善作法
<Box>氣象局導入水冷式冷卻背板解決高運算散熱挑戰

冷熱通道隔離實例:勤益科技大學

冷熱通道隔離搭配外氣交換控制,挑戰超省電機房
勤益科技大學採用冷熱通道隔離,搭配IP化遠端監控與獨立冷卻水塔來降低外氣交換的冷卻耗能,打造出PUE值1.7的綠色新機房,未來還要挑戰PUE值1.4的超省電機房

冷通道封閉實例:國家高速網路與計算中心

封閉冷通道以承載800瓩超級電腦
國家高速網路與計算中心採用冷通道封閉設計,搭配水平式和下吹式空調系統,來冷卻全球42強超級電腦「御風者」耗電800瓩所產生的熱氣,省電設計效果在全球超級電腦中排名25

熱通道封閉實例:力登電腦

小機房用煙囪式機櫃建立封閉熱通道
力登電腦在7月剛完成的新機房中,導入了7座煙囪式機櫃,即使是只能擺設單排機櫃的9坪大機房,也能打造出熱通道封閉的效果

《詳細內文請見iThome電腦報516期(www.ithome.com.tw),天瓏、誠品、何嘉仁、搜主義、敦煌、法雅客、Page one書店均有銷售》


516期其他精采內容:
.新聞:聯合信用卡中心打造500坪新機房,冬天可用外氣冷卻來散熱
.新聞:虛擬化效能監控工具Veloxum在臺上市
.CIO TALK:搏感情創造長久夥伴關係 台新金控CIO的管理藝術
.IT人甘苦談:不做MIS,IT人走進印刷設計業
.產品報導:儲存虛擬化系統:FalconStor NSS VS
.產品報導:資料庫管理系統:MySQL 5.5 Community Edition
.程式人:面對資料存取,跳脫思考的陷阱/王建興
.程式人:每天用15分鐘掌握開發團隊進度/邱郁惠、施奇宏