KIEAE Journal
[ Research Article ]
The International Journal of The Korea Institute of Ecological Architecture and Environment - Vol. 21, No. 3, pp.47-53
ISSN: 2288-968X (Print) 2288-9698 (Online)
Print publication date 30 Jun 2021
Received 03 May 2021 Revised 11 May 2021 Accepted 17 May 2021
DOI: https://doi.org/10.12813/kieae.2021.21.3.047

데이터센터 냉방 에너지 절약을 위한 최적 냉수 유량 예측·제어 알고리즘 개발

박보랑* ; 최영재** ; 현지연*** ; 태영란**** ; 문진우*****
Development of Optimal Chilled Water Mass Flow Rate Prediction and Control Algorithm for Data Center Cooling Energy Saving
Bo Rang Park* ; Young Jae Choi** ; Ji Yeon Hyun*** ; Yeong Ran Tae**** ; Jin Woo Moon*****
*Main author, Associate Research Engineer, School of Architecture and Building Science, Chung-Ang Univ., South Korea pbr_1123@naver.com
**Coauthor, Graduate Student, School of Architecture and Building Science, Chung-Ang Univ., South Korea chlyoungwo@gmail.com
***Coauthor, Graduate Student, School of Architecture and Building Science, Chung-Ang Univ., South Korea jiyuneco@gmail.com
****Coauthor, Professor, Dept. of Liberal Arts, Myongji college, South Korea yourtae@hanmail.net
*****Corresponding author, Professor, Dept. of Architecture and Building Science, Chung-Ang Univ., South Korea gilerbert73@gmail.com


ⓒ2021. KIEAE all rights reserved.

Abstract

Purpose:

This study aimed at developing an adaptive control algorithm using ANN based on chilled water mass flow control to provide the optimal indoor thermal environment of the data center and save cooling energy.

Method:

The predictive model inherent in the control algorithm uses the model developed in preliminary research. The control algorithm including the predictive model was developed using three techniques with relearning function. To verify the adaptability of the finally selected ANN prediction-based adaptive control algorithm, it is compared and evaluated through simulations with the existing widely applied ON-OFF and PID controllers.

Result:

Among the three relearning techniques, the RMSE of the control algorithm to which the sliding window was applied is 0.04 (℃), which has the highest prediction accuracy. Thus, was selected as the final control algorithm model. To verify the adaptability and scalability of the selected ANN control algorithm, the containment size and the set-temperature scenario were changed into two and compared and analyzed with ON-OFF, PID controller using simulation. As a result, the ANN controller showed the highest accuracy with RMSE 0.23℃ and 0.24℃, respectively, in both control scenarios. Also, It showed the best performance in terms of maximum temperature difference and energy consumption. That is, the adaptability and scalability of the ANN-based control algorithm to the new environment have been reasonably verified.

Keywords:

Data Center, Cooling Energy, Artificial Intelligent, Optimal Control Algorithm

키워드:

데이터센터, 냉방 에너지, 인공지능, 최적 제어알고리즘

1. 서론

1.1. 연구의 배경 및 목적

최근 IT산업의 급속한 발달로 이에 직접적 관련이 있는 데이터센터의 수요가 급증하고 있다[1]. 데이터센터는 대표적인 에너지 다소비 건축물로 2020년 기준 전 세계 전력 소비량의 3%를 차지하고 있어 에너지소비량 절감은 필수적이다[2]. 데이터센터의 에너지 소비 중 냉각 시스템에서 50%를 소비하고 있어 서버냉각을 위한 냉방 에너지를 줄이는 것이 전체 에너지 소비를 줄이는 최선의 방안이 될 수 있다[3].

데이터센터는 중대형 건축물로 대부분 전기를 주 에너지원으로 하는 중앙 집중식 냉각 시스템을 적용하고 있다. 냉방 에너지를 효율적으로 절감하기 위해서는 중앙 집중식 냉각 시스템의 최적 유량제어가 효과적일 수 있다[4].

고밀도, 고발열 차세대 IT 장비 등장으로 데이터센터는 기존 냉각방식에서 경험하지 못한 발열량, 발열 패턴 등의 다양한 상황을 발생시키고 있다. 이에 따라 시스템 용량 과설계, 비효율적 운영으로 인한 실제 필요한 냉각용량 예측 불가의 문제 해결을 위해 IT 서버 배치 유형 및 공조방식에 대해 다양하게 연구 중이며 그 중 기존 방식의 단점이 보완된 컨테인먼트 방식 사용이 증가하고 있다[5]. 그러나 데이터센터는 연간 365일 무중단 운영으로 리모델링 및 보수가 어렵고 설계 시 공간과 구조의 제약이 많아 기계 설비적 해결방안에는 한계가 존재한다.

데이터센터의 서버냉각을 효과적으로 해결하기 위해서는 경제적인 전략적 제어방안 마련이 시급하다. 이에 따라 기계 설비장비의 하드웨어적인 제어가 아닌 소프트웨어적 제어의 접근이 필요하다. 소프트웨어적 제어기술은 인공지능 기술적용이 활발하다. 인공지능 기술은 건축환경 설비, 실내환경, 에너지 수요 예측 및 제어, 열원 및 설비시스템 제어 등에 활용 가능한 수준에 도달하였다. 인공지능 기술 도입으로 데이터센터의 냉각 에너지 절감을 위해 즉각성, 자동성, 적응성이 더해진 제어기술을 개발하고 적용하는 것이 중요하다.

따라서, 본 연구에서는 중앙 냉수식 냉각방식으로 설계된 컨테인먼트형 데이터센터의 냉방 에너지 절감을 위하여 인공신경망 기술을 활용한 예측기반 냉수 유량 제어알고리즘을 개발하고, 제어알고리즘의 적응성을 검증하여 다양한 환경 및 데이터센터로의 적용 가능성을 확인하고자 한다.

1.2. 연구의 방법 및 범위

본 연구는 컨테인먼트형 데이터센터의 냉방 에너지 절감을 위한 냉수 유량 제어알고리즘 개발 및 적응성 검증을 목표로 한다.

제어알고리즘에 내재하는 예측모델은 선행연구[6]에서 개발한 모델을 활용한다. 예측모델은 ANN (Artificial Neural Network) 기반으로 냉수 유량에 따른 데이터센터 실내 열 환경을 예측하기 위해 개발되었다. 개발된 예측모델을 포함한 제어알고리즘은 재학습 기능을 가지는 적응형 제어알고리즘 세 가지 유형으로 개발된다. 최종 선정된 ANN 예측기반 적응형 제어알고리즘의 적응성 검증을 위해 기존에 널리 적용 중인 ON-OFF, PID 제어기와 비교·평가한다.


2. 대상 데이터센터 및 시스템 모델링

컨테인먼트형 데이터센터는 냉각효율을 높이기 위하여 도입된 방식으로 냉복도(Cold Aisle)와 열복도(Hot Aisle) 공간이 분리된 차폐 형태이다. 본 연구에서는 냉복도와 열복도가 모두 차폐되며 열복도를 공유하는 구조인 컨테인먼트형 데이터센터를 MATLAB 소프트웨어를 활용하여 모델링 하였다.

컨테인먼트 1개소를 기준으로 하며 총 14대의 Rack이 7대씩 Rack이 1Row 로 배치된다. Rack의 최대 부하는 6.6kW이며 전후면 온도차는 11℃로 설정한다. 냉각 시스템은 중앙 냉수식 시스템으로 냉각탑 1대, 냉동기 2대, 냉매분배기 2대, CRAH (Computer Room Air Handler) 6대로 구성되며 CRAH의 용량은 30kW로 설정하였다. 컨테인먼트 구조는 서버발열에 의한 뜨거운 공기가 토출되는 Rack의 후면과 CRAH로 순환되는 공기를 공유하는 열복도가 중심부에 위치하며 CRAH가 공급하는 차가운 공기와 이를 회수하는 Rack 전면이 컨테인먼트의 양 외측에 배치된 냉복도 측으로 배치된다. 상세 장비 구성 및 사양은 Table 1. Fig. 1.과 같다.

Setup of containment and cooling system

Fig. 1.

Structure of containment and cooling system


3. 제어알고리즘 개발

3.1. 예측기반 제어알고리즘 개발

예측모델은 선행연구 Choi and et al.(2020)[6]이 개발한 냉수 유량에 따른 실내 열환경 예측모델을 사용한다. MATLAB (MathWorks, Natick, MA, US) 소프트웨어를 사용하였으며 총 20,200개의 학습데이터가 활용되었다. 입력변수는 출력값인 데이터센터의 CRAH 공급 공기 온도(CRAH_Tsa)룰 결정하는 변수인 IT 부하(IT Load), CRAH의 회수 공기 온도(CRAH_Tra), 냉수유량(CH_Mw)으로 구성된다. 최적화를 통한 예측모델의 은닉층의 레이어와 뉴런 수는 각각 2, 14개로 결정되었다. 결정된 최종 모델의 예측 성능은 R2 0.99, Cv(RMSE) 0.94%로 산출되어 ASHRAE의 Cv(RMSE) 기준인 30%이하에 충분히 만족하는 것으로 나타났다. Min-Max 정규화를 실시한 20,200개의 입출력 변수 범위는 Table 2.에 나타난다.

Setup of input and output on predicted model

개발된 예측모델을 포함한 제어알고리즘을 Fig. 2.와 같이 개발하였다. 개발된 제어알고리즘은 예측 오차 보정 기능이 없는 비적응형 제어가 보완된 적응제어로 수행되도록 구성하였다. 본 연구에서의 적응제어는 예측 오차를 실시간으로 평가하고 줄여나가기 위해 재학습을 수행하는 온라인 학습방식으로 본 연구에서는 Sliding window, Vector augmentation, Vector adaptation의 세 가지 기법을 사용하여 적응제어를 시행하였다.

Fig. 2.

Diagram of Control algorithm

1) Sliding window 기법은 학습 과정에서 과거 데이터를 한 개씩 삭제하고 마지막 위치에 새로운 데이터를 입력하여 학습시키는 방식으로 기존 배열의 크기 및 추세를 유지하며 새로운 정답 데이터의 특성을 신경망에 반영하여 제어 단계가 늘어나도 일정한 학습 시간을 유지하는 특성을 갖는다.

2) Vector augmentation은 초기 학습 이후 각 제어 단계마다 도출되는 정답 데이터를 배열 형태로 늘려가며 학습시키는 방식으로 제어가 수행될수록 배열 크기가 증가하여 학습 시간이 증가한다는 한계가 있다.

3) 마지막으로 Vector adaptation은 초기 학습 이후 정답 데이터를 배열이 아닌 벡터로 학습시키는 방식으로 제어 단계에서 신속하게 적응 학습을 한다. 학습데이터의 크기가 벡터이므로 과거 데이터의 추세와 입출력 관계성이 제거될 수 있는 우려가 있다.

제어는 5분 단위로 수행되는 것으로 설정한다. 현재 사이클인 n번째의 IT 부하, CRAH 회수 공기 온도, CRAH 공급 공기 온도를 취득하여 과거 5분 전인 n-1번째 사이클에서 예측되었던 CRAH 공급 공기 온도와 현재의 CRAH 공급 공기 온도를 비교한다. 두 값이 일치하지 않으면 과거 IT 부하, CRAH 회수 공기 온도와 현재의 CRAH 공급 공기 온도, 최적 냉수 유량으로 예측모델을 재학습 시킨다. 두 값이 일치할 경우 IT 부하, CRAH 회수 공기 온도, 냉수 유량으로 구성된 입력변수를 예측모델에 대입하여 5분 후인 n+1번째 사이클의 CRAH 공급 공기 온도를 예측한다. 예측값과 설정 온도의 오차가 0.1℃ 미만일 때 냉수 유량을 최적 유량으로 선정한다. 해당 제어알고리즘의 과정을 통해 예측모델은 지속해서 수정 및 개선되며 새로운 환경에 적응해 나갈 수 있다.

3.2. 제어알고리즘 최적화 및 성능평가

개발된 제어알고리즘의 성능평가 및 적응성 검증을 위해 2장에서 모델링된 데이터센터 시뮬레이션 모델을 활용한다. 해당 시뮬레이션 모델의 타당성 및 신뢰성 검증 결과 실제 유사 데이터센터와 실내온도 및 냉방 에너지소비량은 각각 1℃, 3.52%로 나타나 실제 컨테인먼트형 데이터센터 환경을 잘 모사한 것으로 판단할 수 있다.

제어알고리즘 성능평가를 위한 IT 부하는 실제 데이터센터 부하 패턴이 반영된 약 50%의 부분 부하로 난수를 생성하여 적용하였다. 설정 온도는 최악의 경우를 대비하여 ASHRAE의 데이터센터 환경설계 기준 중 가장 강한 수치인 18℃로 고정하여 평가한다. 제어 정확도 평가 기준으로는 제어의 정밀도를 표현하는데 적합한 척도인 RMSE (Root Mean Square Error)를 채택하였다. 세 가지 재학습 기법으로 수행되는 알고리즘 각각에 대해 주요 최적화 함수를 선정하여 초매개변수 최적화를 진행하였다. 이를 통해 최종적으로 가장 R우수한 RMSE 성능을 가진 재학습 기법의 제어알고리즘을 최적 적응형 제어알고리즘으로 선정한다.

본 연구에서 활용한 LM (Levenberg-Marquardt) 알고리즘은 최적화를 위해 다양한 초매개변수의 가중치 및 편향을 자동 업데이트한다. 총 12개의 초매개변수 중 주요 항목으로 판단되는 최대 유효성 검사 실패 횟수(max_fail), 오차 크기에 따른 기울기 보정(mu), mu 감소 인자(mu_dec), mu 증가 인자(mu_inc) 네 가지를 선정하여 알고리즘 최적화에 사용하였다. 최적화 결과 각 재학습 기법이 적용된 제어알고리즘의 제어성능 및 선정된 초매개변수값은 Table 3.에 나타난다. Sliding window 기법을 적용한 제어알고리즘이 RMSE 0.04℃로 가장 제어성능이 우수한 것으로 나타났다.

Result of hyper parameter optimization

세 가지 제어알고리즘 최적화에 의한 설정 온도 대비 CRAH 공급 공기 온도 제어결과는 냉방부하, RMSE, 최대 제어 온도 차로 평가한다. 설정 온도 18℃, 5분 단위의 4시간 동안 제어를 수행한 결과 Table 4.와 같이 냉방부하는 Sliding window 6,066.73kwh, Vector augmentation 6,316.21kWh, Vector adaptation 6,330.18kWh로 Sliding window 기법이 에너지 절약 측면에서 가장 우수한 제어알고리즘으로 나타났다. RMSE와 Max error도 Sliding window 기법이 각각 0.04℃, 0.39℃로 나머지 두 가지 기법에 비해 높은 제어성능과 적은 온도 오차를 보였다. 또한, 제어의 안정도면에서도 Sliding window 모델이 전체 4시간의 제어 기간 설정 온도에 안정적으로 수렴하는 것으로 확인되었다. 타 기법의 경우 제어 시작 후 약 60분까지의 학습 과정 동안 설정 온도에 수렴하지 못하고 오버슈트(Overshoot)와 언더슈트(Undershoot)가 발생하는 과도응답 상태를 보였다. (Fig. 3.~Fig. 5.)

Result of adaptive control algorithm performance evaluation

Fig. 3.

Sliding window - CRAH supply air control temperature compared with to the set temperature (Time step 1 = 5 min)

Fig. 4.

Vector augmentation - CRAH supply air control temperature compared with to the set temperature (Time step 1 = 5 min)

Fig. 5.

Vector adaptation - CRAH supply air control temperature compared with to the set temperature (Time step 1 = 5 min)


4. 제어알고리즘 적응성 검증

제어의 에너지 절약성, 정확성, 안정성에서 모두 가장 우수한 성능을 보인 Sliding window 기법이 적용된 제어알고리즘을 활용하여 새로운 환경의 데이터센터에 대한 적응성 검증을 수행하였다. 제어알고리즘의 적응성 검증은 인공신경망 기반 예측·제어 모델의 성능을 입증하기 위하여 제어에서 일반적으로 적용되고 있는 ON-OFF, PID 제어기와 비교하고 분석하였다.

단순 ON-OFF 제어기는 제어 설정값에 ±오차범위(Deadband)를 주어 동작하는 방식으로 동작이 간단하고 저렴한 장점이 있으나 제어 목표 달성을 위해 조작량을 0%과 100% 사이를 왕래하는 사이클 방식으로 변화가 크고 지나치게 반복적으로 제어하는 단점이 있다. 이러한 제어는 기계장비와 에너지 소비 측면에서도 유리하지 않다.

ON-OFF 제어의 단점을 보완하고자 도입된 PID 제어기는 정밀제어가 가능하고 응답속도가 빠른 장점이 있다. 그러나 P, I, D 각각의 최적 제어 계수는 시스템 상태 및 제어 환경에 따라 변경되기 때문에 잦은 수동적 계수조정이 필요하다. 즉, 자동으로 제어 특성 및 시스템 영향이 반영되지 않기 때문에 성능이 일정하지 않고 외부로부터 받는 영향인 외란에 민감하여 예상치 못한 돌발상황에 취약하다는 단점이 있다. ON-OFF, PID 제어기는 MATLAB 기반 그래픽 프로그래밍 환경에서 모델링 하는 Simulink(Ver, R2020a)를 사용하여 구현하였다.

새로운 환경의 데이터센터 모델링을 위해 2장에서 다루었던 Table 1.의 데이터센터 모델에서 Rack이 4개 줄어든 Rack 10개로 컨테인먼트 규모를 변경하였고 냉각 시스템은 동일하게 설정하였다. 제어알고리즘은 두 가지 제어 Scenario에 따라 평가되며 제어의 정확성, 안정성, 에너지 절약성 분석을 바탕으로 최종 적응성 검증을 수행하였다.

Scenario 1은 IT 부하 변경, 설정 온도 23℃로 고정한다. 시나리오 1의 수행목적은 컨테인먼트 규모변경 시 예측기반 제어알고리즘이 새로운 환경에서의 적응성과 예측제어 성능을 확인하는 것이다. 규모변경에 대한 적응성 확인 후 Scenario 2를 통해 IT 부하 변경, 설정 온도를 4시간 단위로 제어 시나리오에 변경을 주었을 때의 지능적인 제어알고리즘의 적응성을 검증하고자 하였다.

현실성 있는 적응성 평가를 위해 IT 부하는 실제 데이터센터의 IT 부하 패턴을 고려하여 반영하였다[7]. 4시간 단위로 부분 부하율을 20%, 10%, 30%, 40%, 50%, 40%로 설정하였다. 설정한 부분 부하율은 발생할 수 있는 최대·최소의 다양한 상황에 대비하여 가상으로 설정된 범위로 최악의 시나리오까지 고려하였다. 시뮬레이션 기간은 1개월로 설정하였으며 5분 단위인 Time step 8, 640번 제어된다. 상세 시뮬레이션 개요는 Table 5.와 같다.

Simulation summary for control algorithm adaptability test

4.1 제어의 정확성 분석

제어알고리즘의 정확성은 RMSE를 기준으로 평가한다. 각 제어기의 성능은 ON-OFF 제어기를 표준모델로 설정하여 ANN, PID 제어기와 비교분석 한다.

Scenario 1의 평가 결과 RMSE가 ON-OFF 6.89℃, PID 1.88℃, ANN 0.23℃로 ANN 제어기의 정확도가 가장 높았다. Scenario 2 에서도 ANN 제어기가 0.24℃로 가장 우수하였고 PID 1.86℃, ON-OFF 6.92℃ 순으로 산출되었다. 제어의 정확도는 설정 온도에 만족하는 CRAH 공급 공기 온도를 정확하게 제어해내는 현상으로 평가된다. ANN 제어기는 더욱 정확한 CRAH 공급 공기 온도 제어성능을 확보하였으므로 컨테인먼트형 데이터센터의 열환경 제어를 우수하게 달성해낸다는 것을 확인하였다. 이러한 현상은 결과적으로 ANN 제어기가 냉방 에너지 절감에도 크게 기여할 것으로 사료된다.

4.2 제어의 안정성 분석

안정성 평가는 설정 온도와 제어기로부터 산출된 제어온도 간의 최대오차 및 구간별 오차로 분석될 수 있다. 최대오차인 Max error는 제어 전 과정에서 산출된 오차 온도 중 최대오차로 각 제어기의 안정성을 판단한다. Scenario 1의 경우 ANN, PID, ON-OFF 제어기가 각각 0.98℃, 2.22℃, 2.78℃의 최대오차로 확인되어 ANN 제어기가 가장 안정성이 우수한 제어를 수행하는 것으로 나타났다. Scenario 2에서도 역시 ANN이 1.02℃로 ON-OFF, PID의 2.59℃, 2.22℃보다 낮은 최대오차로 안정성이 가장 높은 것으로 나타났다. 1개월의 전체 제어 기간에 대한 최대오차뿐만 아니라 하루를 기준으로 설정 온도가 변경되는 전 구간에서도 ANN의 최대오차가 가장 낮은 것으로 나타나 안정적 제어기임을 확인할 수 있다. 특히, Scenario 2는 컨테인먼트 규모변경과 추가적인 설정 온도의 변경도 적용됨에 따라 분석된 결과는 적응성 검증을 위한 중요한 핵심이 된다.

ON-OFF 제어기는 Deadband를 ±1℃로 설정하였으나 설정값보다 높은 오차는 불규칙적으로 발생하는 과도응답에 의한 것으로 확인되었다. PID 제어기는 ON-OFF 제어기보다 대부분의 구간에서 설정 온도에 수렴하지만 새로운 환경에 대한 자동 매개변수 조절이 어려워 이에 따른 잦은 과도응답 발생으로 ANN 보다 제어의 최대온도 오차가 높게 나타난 것으로 판단된다.

4.3 제어의 에너지 절약성 분석

제어 현상에 따른 각 제어기가 냉방 에너지 절감형 제어기인지를 판단하기 위해 산출되는 냉방부하를 비교·분석하였다.

ON-OFF 제어기는 세 가지 제어기 중 가장 높은 냉방부하인 2,520,267.91kWh로 Scenario 1, 2에서 동일하게 계산되었다. ON-OFF 제어기는 초기 설정값에 의해 일어날 수 있는 모든 상황에 대응 가능해야 하므로 최대 IT 부하량에서 기준 온도 18~27℃의 모든 범위에서 제어할 수 있는 냉수 유량으로 값이 고정되도록 입력되어 ±1℃를 기준으로 ON, OFF 동작을 반복한다. 따라서, 제어 Scenario에 따른 최적 냉수 유량으로 제어하는 기능이 불가능하여 에너지 절약적 제어와는 거리가 멀다.

PID 제어기에 의한 냉방부하는 Scenario 1, 2 에서 각각 737,392.92kWh, 737,931.38kWh로 계산되어 ON-OFF 제어기의 냉방부하보다 70.74% 저감 되었다. PID 제어기는 초기 설계 시 제어 환경에 적합한 P, I, D의 최적 매개변수로 설정된다. 본 연구에서는 실제 데이터센터의 운영환경과 유사한 환경 모사를 위해 IT 부하와 CRAH 공급 공기 온도에 외란을 포함하였다. PID는 최적 매개변수 설정 시 존재하지 않았던 외란이 입력되는 순간마다 적정 냉수 유량을 찾지 못하여 과도응답이 발생하고 이에 따라 불필요한 냉방부하를 발생시키게 된다. 외란이 없거나 적은 제어 상황에서는 현재의 결과보다 우수한 제어 수행이 가능하나 변화하는 환경에 적용되었을 때 스스로 적응하는 기능은 없어 에너지 절약적 제어로 판단하기는 어렵다.

ANN 제어기는 알고리즘 수행 시 각 제어 환경에서의 설정 온도에 만족하는 CRAH 공급 공기 온도 산출을 위해 필요 냉수 유량의 적정 범위 내에서 최소 냉수 유량을 선정, 냉각 시스템을 가동한다. 그 결과 Scenario 1, 2 에서 각각 527,826.37kWh, 527,487.94kWh로 냉방부하가 도출되어 ON-OFF 제어기보다 약 79% 절감되었다. 이에 따라 에너지 측면에서 다양한 제어 환경에 적합한 제어를 수행하게 되어 불필요한 과냉방을 방지하기 때문에 ON-OFF, PID 제어기 대비 에너지 절약에 월등한 제어기라고 판단할 수 있다. ANN은 ON-OFF, PID보다 과도응답 발생이 현저히 낮으며 새로운 환경에 스스로 적응하여 제어되기에 최적 냉방부하 도출에 적합한 제어기이다. 즉, ANN 제어기는 ON-OFF, PID 제어기의 한계인 과한 조작량, 제어 환경에 따른 매개변수의 수동적 조절이 개선된 지능적 에너지 절약형 제어기라 판단된다.

4.4 제어 정확성, 안정성, 에너지 절약성 기반 적응성 검증

4.1~4.3에서 분석된 정확성, 안정성, 에너지 절약성 평가 결과의 요약은 Table 6., Fig. 6~11. (Fig. 6~7.: ON-OFF, Fig. 8~9.: PID, Fig. 10~11.: ANN by two scenario)과 같다. 이를 바탕으로 각 제어기의 적응성을 검증하였다. 본 연구에서의 적응성은 확장성 또는 범용성의 의미도 내포한다. 개발된 ANN 제어기는 제어 Scenario에 따라 대상 데이터센터의 규모변경과 각기 다른 제어 환경에서도 일반적으로 사용 중인 두 가지 제어기 ON-OFF, PID보다 정확도와 안정성에서 확연히 우수한 성능을 나타내었다. 특히, ANN 제어기에서 사용된 재학습 기법인 Sliding window에 의해 지능적으로 새로운 환경에 대한 적응성이 뛰어난 것으로 확인된다. 즉, 본 연구에서 개발한 ANN 제어기가 기존에 일반적으로 사용 중인 ON-OFF, PID 제어 방식보다 제어 정확도뿐만 아니라 에너지 측면에서 절약적 제어를 수행해내며 다양하고 새로운 상황에 대해 매우 우수한 적응성 및 확장성을 가진 것으로 검증되었다.

Comparative analysis of controller adaptability

Fig. 6.

CRAH supply air control temperature of ON-OFF Controller - Scenario 1 (Time step 1 = 5 min)

Fig. 7.

CRAH supply air control temperature of ON-OFF Controller - Scenario 2 (Time step 1 = 5 min)

Fig. 8.

CRAH supply air control temperature of PID Controller - Scenario 1 (Time step 1 = 5 min)

Fig. 9.

CRAH supply air control temperature of PID Controller - Scenario 2 (Time step 1 = 5 min)

Fig. 10.

CRAH supply air control temperature of ANN Controller - Scenario 1 (Time step 1 = 5 min)

Fig. 11.

CRAH supply air control temperature of ANN Controller - Scenario 2 (Time step 1 = 5 min)


5. 결론

본 연구는 컨테인먼트형 데이터센터의 실내 열환경 개선 및 냉방 에너지 절약을 위하여 예측기반 최적 제어알고리즘을 개발하고 제어 성능평가 및 적응성 검증을 수행하였다.

ANN 기술을 활용하여 제어알고리즘을 구축하였고 적응형 제어를 위해 재학습 기법을 포함하였다. 개발된 적응형 ANN 제어알고리즘은 시뮬레이션을 통해 수치적 근거를 기반으로 제어의 정확성, 안전성, 에너지 절약성을 평가하였다. 이를 바탕으로 다양하고 새로운 환경에서의 적응성 검증을 위하여 컨테인먼트 규모 및 설정 온도 조건에 따른 두 가지의 제어 Scenario를 적용하여 기존에 일반적으로 사용하고 있는 ON-OFF, PID 제어기와 비교·분석하였다.

그 결과, 재학습 기법을 포함한 ANN 제어알고리즘은 정확성, 안정성, 에너지 절약성에서 두 가지 Scenario 모두에서 전반적으로 ON-OFF, PID보다 월등히 우수한 것으로 확인되었다. 즉, ANN을 활용한 제어가 새로운 컨테인먼트형 데이터센터 환경에 대한 적응 및 확장성이 뛰어난 것으로 검증되었다. 즉, 기존에 적용 중인 일반적인 제어기와 대비하여 더욱 에너지 절약적으로 현장을 제어하며 안정적 제어로 인해 냉각 장비의 효율도 개선할 수 있을 것으로 사료된다.

따라서, 본 연구에서 개발한 ANN 기반 데이터센터의 최적 냉수 유량 제어알고리즘은 데이터센터의 효율적 냉각 시스템 운영을 가능하게 함에 따라 냉방 에너지 절감 및 CO2 배출 감소에 기여할 것으로 기대된다. 추후 시뮬레이션 한계 극복을 위해 실제 데이터센터에 적용하여 실측 데이터를 기반으로 한 제어성능 평가를 통한 성능개선 및 검증을 수행하고자 한다. 또한, 응용 연구로써 제어알고리즘의 활용성 증대를 위해 효율적 시스템 운영 등을 목적으로 단순 모니터링에 그치지 않고 CPS (Cyber-physical system)와 구동하여 현상 분석 및 대안 제시를 통해 관리자 의사결정에 도움을 줄 수 있는 고도화된 제어 솔루션으로 구축하고자 한다.

Acknowledgments

본 연구는 2021년 산업통상자원부(MOTIE)와 한국에너지기술평가원(KETEP)의 지원으로 이루어졌습니다. (NO.201820106000100)

References

  • 송준화, 송명호, 대한민국 데이터센터 시장 2020-2030, 한국데이터센터연합회, 2020.05.
    J.H. Song, M.H. Song, Korea Data Center Market 2020-2030, Korea Data Center Council, 2020.05.
  • Delta Electronics Inc., LEED 인증 친환경 데이터센터의 구축, 기술보고서, 2020.
    Delta Electronics Inc, Construction of LEED Certified Eco-friendly Data Center, Report, 2020.
  • Info-Tech research group, Top 10 Energy Saving Tip for Greener Data Center, Operate & Optimize Info-Tech Advisor Premium - operate, 2007.04.11.
  • J.W. Ha, S. Cho, H.Y. Kim, Y.H. Song, Annual Energy Consumption Cut-Off with Cooling System Design Parameter Changes in Large Office Buildings, Energies, 13(8), 2020.04, pp.1-16. [https://doi.org/10.3390/en13082034]
  • K. Dunlap, N. Rasmussen, Choosing Between Room, Row, and Rack-based Cooling for Data Centers, White paper #130, Schneider Electric’s Data Center Science Center. 2012.
  • 최영재 외 3인, 컨테인먼트형 데이터센터 최적 제어 알고리즘을 위한 열환경 예측모델 개발, 한국생태환경건축학회 논문집, 제20권 제5호, 2020. pp.159-164.
    Y.J. Choi et al., Development of Supply Air Temperature Prediction Model for Optimal Control Algorithm of Containment Data Center, KIEAE Journal, 20(5), 2020. pp.159-164. [ https://doi.org/10.12813/kieae.2020.20.5.159 ]
  • 조진균, 고밀도 데이터센터의 공조효율 및 에너지성능 개선을 위한 공조시스템 계획방법 연구, 연세대학교 대학원, 박사 학위 논문, 2010.02.
    J.K. Cho, Vilbility of HVAC & R system for cooling efficiency and energy conservation in high-density data centers, 2010.02.

Fig. 1.

Fig. 1.
Structure of containment and cooling system

Fig. 2.

Fig. 2.
Diagram of Control algorithm

Fig. 3.

Fig. 3.
Sliding window - CRAH supply air control temperature compared with to the set temperature (Time step 1 = 5 min)

Fig. 4.

Fig. 4.
Vector augmentation - CRAH supply air control temperature compared with to the set temperature (Time step 1 = 5 min)

Fig. 5.

Fig. 5.
Vector adaptation - CRAH supply air control temperature compared with to the set temperature (Time step 1 = 5 min)

Fig. 6.

Fig. 6.
CRAH supply air control temperature of ON-OFF Controller - Scenario 1 (Time step 1 = 5 min)

Fig. 7.

Fig. 7.
CRAH supply air control temperature of ON-OFF Controller - Scenario 2 (Time step 1 = 5 min)

Fig. 8.

Fig. 8.
CRAH supply air control temperature of PID Controller - Scenario 1 (Time step 1 = 5 min)

Fig. 9.

Fig. 9.
CRAH supply air control temperature of PID Controller - Scenario 2 (Time step 1 = 5 min)

Fig. 10.

Fig. 10.
CRAH supply air control temperature of ANN Controller - Scenario 1 (Time step 1 = 5 min)

Fig. 11.

Fig. 11.
CRAH supply air control temperature of ANN Controller - Scenario 2 (Time step 1 = 5 min)

Table 1.

Setup of containment and cooling system

Equipment No. Contents
Rack 14 ∘ Heat: 6.6kW
∘ Inlet and outlet air temperature difference: △11℃
CRAH 6 ∘ Capacity: 30kW
∘ Mass flow rate: equals to total rack supply air mass flow rate
Refrigerant distributor 2 ∘ Capacity: 100kW
Refrigerant 2 ∘ Capacity: 120kW
∘ Setpoint temperature: 7℃
∘ Temperature difference: △5℃
Cooling tower 1 ∘ Capacity: Enough RT to handle more refrigerators
∘ Setpoint temperature: 32℃
∘ Temperature difference: △5℃

Table 2.

Setup of input and output on predicted model

Item Variables Range
* Set to be operated with partial load
** Design sriteria for environmental conditions in data centers: 2011 ASHRAE Thermal Guidlines(I-P cersion in Appendix E)
Input IT Load [kW]* 5~100
CRAH_Tra [℃] 29~38
CH_Mw [kcal/hr] 0~40,000
Output CRAH_Tsa [℃] 18~27**

Table 3.

Result of hyper parameter optimization

Algorithm Hyper parameter RMSE [℃]
max_fail mu mu_dec mu_inc
Sliding window 304 0.005 0.466 4.829 0.04
Vector augmentation 116 0.001 0.076 5.294 0.09
Vector adaptation 252 0.010 0.803 13.653 0.54

Table 4.

Result of adaptive control algorithm performance evaluation

Algorithm Performance
Cooling load [kWh] RMSE [℃] Max error [℃]
Sliding window 6,066.73 0.04 0.39
Vector augmentation 6,316.21 0.09 5.63
Vector adaptation 6,330.18 0.54 5.65

Table 5.

Simulation summary for control algorithm adaptability test

Containment size Rack 10EA, CRAH 6EA, IT load 6.6kW/Rack
Simulation time 1 Month, 8,640 step
IT partial load (%) - Partial load ± 0.05 (Gaussian noise)
- Random setting by 5 minutes
Control Scenario 1 IT load change, set-point temperature fixed
- Set-point : 0~24 hours, 23℃
2 IT load and setting temperature change
- Set-point : 0~4 hours, 22℃
4~8 hours, 18℃
8~12 hours, 22℃
12~16 hours, 25℃
16~20 hours, 27℃
20~24 hours, 25℃

Table 6.

Comparative analysis of controller adaptability

Control Scenario Analysis items Controller
ON-OFF PID ANN
1 RMSE (℃) 6.89 1.88 0.23
Max error (℃) 2.78 2.22 0.98
Cooling load (kWh) 2,520,267.91 737,392.92 527,826.37
2 RMSE (℃) 6.92 1.86 0.24
Max error (℃) 2.59 2.22 1.02
Cooling load (kWh) 2,520,267.91 737,931.38 527,487.94