Home > Current Issue > Vol. 24, No. 1


[ Article ]
Journal of the Korea Institute of Ecological Architecture and Environment - Vol. 17, No. 5, pp. 77-86
Abbreviation: J. Korea Inst. Ecol. Archit. And Environ.
ISSN: 2288-968X (Print) 2288-9698 (Online)
Print publication date 31 Oct 2017
Received 29 Aug 2017 Revised 25 Sep 2017 Accepted 30 Sep 2017
DOI: https://doi.org/10.12813/kieae.2017.17.5.077

건물에너지 분석 방법론 비교 : Steady-state simulation에서부터 Data-driven 방법론의 비교 분석
조수연* ; 이승복**

Comparing Methodology of Building Energy Analysis : Comparative Analysis from steady-state simulation to data-driven Analysis
Cho, Sooyoun* ; Leigh, Seung-Bok**
*Dept. of Architectural Engineering, Yonsei University, South Korea (suyouncho@yonsei.ac.kr)
**Corresponding author, Dept. of Architectural Engineering, Yonsei University, South Korea (sbleigh@yonsei.ac.kr)

ⓒCopyright Korea Institute of Ecological Architecture and Environment
Funding Information ▼

Abstract
Purpose:

Because of the growing concern over fossil fuel use and increasing demand for greenhouse gas emission reduction since the 1990s, the building energy analysis field has produced various types of methods, which are being applied more often and broadly than ever. A lot of research products have been actively proposed in the area of the building energy simulation for over 50 years around the world. However, in the last 20 years, there have been only a few research cases where the trend of building energy analysis is examined, estimated or compared. This research aims to investigate a trend of the building energy analysis by focusing on methodology and characteristics of each method.

Method:

The research papers addressing the building energy analysis are classified into two types of method: engineering analysis and algorithm estimation. Especially, EPG(Energy Performance Gap), which is the limit both for the existing engineering method and the single algorithm-based estimation method, results from comparing data of two different levels- in other words, real time data and simulation data.

Result:

When one or more ensemble algorithms are used, more accurate estimations of energy consumption and performance are produced, and thereby improving the problem of energy performance gap.


Keywords: Static data, Engineering analysis, Data driven analysis
키워드: 정적 정보, 엔지니어링 분석법, 데이터 드리븐 분석법

1. 서론
1.1. 연구의 배경 및 목적

건물에너지 분석 방법론은 건물의 외부환경(외기온, 습도 등)변화에 따라 건물의 물리적인 조건(외피, 냉난방 환기 시스템 등)을 적용했을 때 사용되는 에너지 소비량을 예측하는데 활용되었다. 특히 화석연료 사용의 지양과 온실가스 절감의 시대적 요구가 커진 1990년대부터는 건물에너지 분석 방법론의 종류 및 적용분야도 다양해지고 그 빈도수도 많아졌다. 최근에는 건물운영에서 도출되는 많은 양의 데이터를 활용하여 에너지 소비량 외 설비 시스템의 성능을 예측하거나 오작동(결함)을 예측하는 데 사용되기도 한다. 이러한 데이터를 분석하기 위한 다양한 프로그램의 적용과 연구의 결과물은 건물에너지 관리 및 에너지 사용효율을 높이는 데 중요한 역할을 해왔다. (Crawley, 2008) 건물에너지 시뮬레이션 연구는 50년이 넘는 기간 국내외에서 활발한 연구 성과물이 도출되었으나 (특히 동적 시뮬레이션) 국내에는 지난 20년간 건물의 에너지 분석과 예측에 대한 동향 및 비교연구의 사례를 찾아보기 쉽지 않다. 본 연구를 통해 건물에너지 분석의 방법론 및 각 방법론의 특징을 중심으로 흐름을 살펴보고자 한다.

1.2. 연구의 방법 및 절차

건물에너지 분석은 흔히 동적 시뮬레이션이라고 말하는 “엔지니어링 분석”방법과 건물 운영으로부터 나오는 다양한 종류의 건물에너지 데이터를 기반으로 한 기계학습 분석법인“데이터 드리븐 분석”방법으로 나눌 수 있다. 본 연구는 국내외 학술논문 중심으로 건물에너지 분석의 동향파악 및 한계성과 확장성을 밝히고자 한다. 특히 문헌분석에서는 2001년부터 최근 2016년까지의 건물의 에너지 데이터 분석과 관련된 (에너지 사용, 설비 시스템 성능 향상)학술 논문 중에서 사용된 분석법의 특징을 분석하고 각 분석법의 한계점 및 극복되어야 하는 점을 서술하고자 한다. 건물에너지 분석에 관한 국내외 200여 편의 엔지니어링 분석법, 데이터 드리븐 방법론 중심으로, 분석 방법론별 달라지는 주제와 대상건물, 적용한 타임 스케일의 변화 등을 살펴보고자 한다. 본론에서는 건물에너지 분석의 두 가지, 즉 엔지니어링 분석법(정적, 동적 시뮬레이션)과 데이터 드리븐 방법론(단일, 앙상블 알고리즘)의 대표적인 프로그램의 특징과 한계점을 제시하고 이 두 방법론으로부터 진화된 앙상블 알고리즘 방법론의 특징을 살펴보고자 한다.


Fig. 1. 
Research flow


2. 문헌고찰
2.1. 선행연구 고찰

건물에너지 분석을 위한 방법론 개발은 50년 전부터 이어져 왔으며 각 방법론의 적합성, 정확성, 민감도 등의 목적에 따라 다른 결과를 가져오기 때문에(Crawley, 2008) 연구목적과 적용대상 및 환경에 맞는 적절한 방법론을 찾는 것이 중요하다. 최근 20년간의 국내 건물에너지 분석의 방법론은 정적(Steady-state)데이터 기반의 시뮬레이션과 동적 시뮬레이션 기반의 엔지니어링 분석 방법론을 주로 사용되었다. 최근까지도 국내 논문의 건물에너지 분석은 엔지니어링 분석방법론을 사용한 연구결과가 대부분이다. 엔지니어링 방법론은 건물의 환경적 조건, 건물의 물리적인 정보(외피-시스템), 열원 등을 이용하고 열역학적 방정식을 사용하여 에너지 사용량을 추정하는 방법론으로써 건물에서 소비되는 에너지 및 설비 시스템의 성능을 예측하는 방법이다. (Beak, 2002) BLAST, ESP, EnergyPlus, ESP-r, TRNSYS 등의 동적 시뮬레이션 프로그램이 보편적으로 사용되고 있으며 정확하고 목적과 용도에 제한 없이 사용할 수 있지만, 변수가 늘어나고 사용 방법이 복잡하다는 단점이 있다. 이와는 다르게 데이터 드리븐(기계학습 기반) 예측방법론은 건물 전반의 히스토리 데이터를 사용하여 구체적인 제약 조건에서 앞으로 사용될 에너지양을 예측하거나, 설비 시스템의 오작동이나 결함을 찾는 기법이다. (Yu, 2014) 이 방법론에 대표적으로 사용되는 알고리즘은 선형 회귀, 인공 신경망, 서포트 벡터 리그레션 등이 있다. 단일 알고리즘 예측 모형보다 정확성과 신뢰도를 높인 앙상블 알고리즘 예측 방법론을 통해서도 건물의 에너지 사용 및 시스템의 성능예측 분야에서 동일조건의 단일예측 모델링보다 예측 정확도가 향상된 연구결과들이 보고되었다. 본 연구의 문헌분석은 국내 발표 및 게재된 16년간 총 185개의 건물에너지 분석에 관한 연구 논문을 분석하였다. 2001년부터 2016년 동안 건물에너지 분석 논문 중 엔지니어링 논문과 데이터 드리븐 예측 논문으로 구분하여, 연도별 게재 현황 및 주제별 분류 현황을 살펴보고자 한다.

그림 2는 2001년부터 2016년 동안 주로 동적 시뮬레이션으로 분석한 148개의 엔지니어링 분석법의 논문게재 현황이다, 2009년 이후 연평균 약 16개의 건물에너지 분석 논문이 엔지니어링 분석법으로 연구되었다. 그림 2의 데이터 드리븐 결과는 같은 기간의 건물에너지 분석 논문 현황 중 알고리즘 기반의 예측 방법론으로 총 37개가 제출된 현황이다. 두 연구 방법론을 동일 기준으로 비교하는 데는 무리가 있으나, 시대별 분석 방법론 사용의 경향을 알 수 있는 결과라 할 수 있다. 데이터 드리븐(알고리즘)예측 분석방법은 2010년 이후 증가하는 경향이 보이지만, 여전히 동적 시뮬레이션을 사용하는 엔지니어링 분석법이 월등히 많은 양의 연구 결과물이 제출되는 것을 알 수 있다. 그림 3은 같은 기간(2001~2016년)의 185개 건물에너지 분석 연구를 주제별로 구분한 결과이다.


Fig. 2. 
Building energy analysis research submission status


Fig. 3. 
Classification of building energy analysis research

엔지니어링 분석법으로 연구한 논문들은 건물의 외피, 냉·난방·환기 등의 설비 시스템, 요소기술의 성능평가, 조명, 실내 쾌적, 차양 등 연구주제가 다양하게 분포되어 있다. 그중에서도 건물에너지 절감과 가장 밀접한 분야라고 할 수 있는 설비시스템(냉·난방·환기)과 건물의 외피에 관련된 연구주제가 기타를 제외한 주제보다 2배 가까운 양의 연구로 진행됨을 알 수 있다. 반면, 데이터 드리븐의 결과는 엔지니어링 분석과 같은 주제로 분류되지 않아 주제별 대응 비교하는 데 한계가 있지만, 냉동기, 공조기 등의 설비시스템의 운영제어를 최적화하는 주제 및 결과 데이터를 시각화(패턴화)하는 연구결과들이 대부분이었다. 그 외에도 문헌 분석한 논문의 적용 대상은 엔지니어링 분석법과 데이터 드리븐 분석법 모두 사무실, 학교 등의 비주거 시설이 대부분이며(49%, 60%) 실험기간도 두 방법론 모두 연간 및 월간(79%, 84%)을 측정한 결과를 보여주고 있다. 문헌고찰 대상의 연구논문은 특정한 에너지 분석법이 적용된 연구결과이며 적용한 대상건물의 용도 및 여러 변수를 고려했다는 가정에 따라 분석법-대상건물-목적과의 적정성을 판단하기 어렵다. 그러므로 본 연구를 통해 특정 분석법 즉, 엔지니어링 분석법과 데이터 드리븐 분석법이 분석대상 건물에 적합하게 적용되어 연구되고 있는지에 살펴볼 필요가 있다.


3. 엔지니어링 분석법

이 장에서는 국내외 발표된 연구논문을 기반으로 엔지니어링 분석방법론 특징, 엔지니어링 분석법의 한계점, 최근의 데이터 드리븐(알고리즘 기반) 분석법의 순서로 분석하고자 한다.

3.1. 정적-동적 시뮬레이션

건물에너지 분석의 엔지니어링 분석법은 1990년대 이후 건물의 외피(벽-창호-유리), 냉·난방 환기 시스템의 성능, 단열성능 등을 이용하여 열역학적 공식을 대입하여 성능 및 소비량 측정하는 방식으로서 최근까지도 학계 및 실무에서 두루 사용되는 방법론이다. 대표적인 엔지니어링 분석법의 프로그램으로는 ESPr, TRANSYS, EnergyPlus 등이 있다. 엔지니어링 방법론에 사용되는 건물에너지 계산방법에는 정적 계산 방법과 동적 계산 방법이 있는데 전자의 경우에서는 실내에서 일어나는 열의 이동 현상이 시간에 따라 변화하지 않는다는 가정에 따라 계산하는 방법이다. 정적 계산 방법을 다른 표현으로 steady-state approach라고도 하며 이 방법론은 동적 계산 방법론보다 상대적으로 적은 데이터로 합리적인 에너지 평가가 가능하기 때문에 시간과 비용을 크게 줄일 수 있는 장점이 있다. 정적 계산의 대표적인 방법론으로는 Degree-day1) 방법론과 Bin method2)가 있다. 먼저 Degree-day 방법론은 소위 Single measure 방법론이라고 불리며 가장 간단하고 과거 에너지 분석에서 많이 사용되는 방법론이다. Degree-day 방법론은 저층형 건물 또는 주거용 건물과 같은 Envelope-dominated(외피에 영향을 받는) 빌딩에 적합한 반면, 운영시스템이 복잡하고 공조시스템이 복잡한 상업건물에는 제한되는 방법론이다. (Kim, 2017) 또한, Bin method는 Bin temperature frequency를 적용해 냉방 및 난방 부하를 분석할 수 있게하는 방법론으로 Degree-day 방법론의 Single measure의 한계를 보완한 방법론이다.

산업계와 학계에서 보편적으로 사용되는 동적 계산 방법론은 실내에서 일어나는 열의 이동 현상이 시간에 따라 변화하며 실·내외 조건을 고려하여 열의 이동 현상을 취급하여 계산하는 방법으로 BLAST, EnergyPlus, ESP-r, TRNSYS 등이 대표적인 동적 계산 방법론에 해당된다. 계산이 비교적 정확하고 목적이나 용도에 제한 없이 사용할 수 있지만, 다뤄야 할 데이터와 변수가 늘어남에 따라 프로그램 사용이 복잡해졌으며 또한, 변수에 대한 사용자의 이해도에 따라 결과값의 차이가 크기 때문에 대중적으로 건물에너지 분석하기에는 한계가 있는 방법론이다. <표 1>은 엔지니어링 (정적-동적 계산법)의 대표적인 프로그램 8개에 대한 5가지 카테고리에 대한 적용을 구분해놓은 표이다. 건물에서 사용되는 에너지 즉 열의 이동, 열역학적 반영, 열전달과 관련된 건물의 외피, 침기, 환기, 열원이 공급되는 설비 시스템 등 총 5가지 항목으로 구분하였다. 국내에서 사용되는 대표적인 엔지니어링 프로그램 8개(BLAST, DOE 2.1, ECOTECT, EP, eQUEST, ESPr, TRACE, TRANSYS)의 특징을 구분하였으며 그 중 대표적인 3개의 프로그램(Energyplus, ESPr, TRANSYS)에 대한 설명은 아래와 같다.

Table 1. 
Classification of 8 engineering programs
1 2 3 4 5 6 7 8
Thermophysical State Temperature
Airflow Partly Expert
Surface heat coefficient from CFD Expert Expert
Dry bulb
Dew point temperature, Humidity
Thermal mass calculation
Building Envelope Outside surface convection algorithm
Radiation-to-air component from convection Partly
Solar heat gain and daylighting
Infiltration / Ventilation Infiltration single zone
Calculation of wind pressure coefficients Partly
Natural – Mechanical Ventilation Partly Partly
Control Window opening Partly
Displacement Ventilation of CFD domains Partly
HVAC Idealized HVAC system
User-Configured HVAC systems
Renewable Energy Renewable Energy System
● : feature or capability available Partly : Partly implemented Expert : Need Expert Knowledge
1. BLAST 2. DOE 2.1 3. ECOTECT 4. Energy Plus
5. e QUEST 6. ESPr 7. TRACE 8. TRANSYS

EnergyPlus는 총 8개 프로그램 중에서 5가지의 모든 카테고리의 특징을 균형적으로 포함하고 있는 프로그램으로서 BLAST 및 DOE-2.1E의 가장 보편적인 기능을 기반으로 모듈화시키고 구조화된 코드를 사용한다. Energy Plus는 입출력을 텍스트 파일로 구현하는 시뮬레이션 엔진이다. 사용자 지정 시간(기본값 15분)에서 계산된 부하는 동일한 시간에서의 전체 건물 시스템 시뮬레이션 모듈로 전달되는 프로세스를 갖는다. EnergyPlus는 건물의 설비 시스템의 냉난방 및 열원의 플랜트 부분과 전기 시스템 모두를 계산하고 결과값을 준다. 또한, 시스템 및 플랜트 용량에 따라 재실자의 쾌적도 계산에서도 정확한 실내온도 예측을 제공해준다. 또한, 사용자는 설비시스템 제어 및 건물의 외피, 설비장비 등의 건물의 주요 요소마다 복사, 가열, 냉각 시스템, 내부 공기 흐름 등을 평가할 수 있다.

ESPr는 개발된 지 34년 넘은 다목적, 다중 도메인 건물에너지 분석 프로그램이다. 건물내부의 열, 내부 공간 의 공기 흐름, HVAC 시스템 및 전력 흐름을 분석하는 시뮬레이션 프로그램이다. 사용자가 특정 프로젝트의 요구 사항에 맞게 건물의 형태, 실내 환경 제어도 가능하다. 이런 기능으로 공간의 구역별 균형 잡힌 에너지 공급을 예측할 수 있다.

TRNSYS는 컴포넌트 기반 모듈 구조의 시뮬레이션 프로그램이다. TRNSYS 컴포넌트 요소는 설비 배관의 파이프처럼 간단하게 연결 할 수도 있고 멀티존 건물 모델처럼 복잡하게 구성하는 것도 가능하다. TRNSYS는 고유의 인터페이스(Simulation Studio)를 사용하여 각 컴포넌트들을 개별 구성하였을 때의 결과값 도출도 가능하다. TRNSYS시뮬레이션의 HVAC 시스템 구성은 시간별 건물 외벽의 열 균형과 공기 흐름을 동시에 구현하는 장점이 있다. 또한, 신재생 에너지 시스템, 열병합 발전, 연료 전지 등을 위한 구성 요소가 포함되어 다른 엔지니어링 분석 프로그램보다 설비 시스템의 강점을 보유하고 있다고 할 수 있다. 다만 일부 열역학 부문에서는 전문가의 지식을 필요로 하는 수준의 단계가 있어 일반인들의 사용하는 데 있어 장애가 있다. <표 1>에서 분석한 8가지의 프로그램의 항목은 주로 에너지 사용과 밀접한 항목으로 구분하였으며, 그 외에도 엔지니어링 프로그램에서는 에너지사용과 직·간접적으로 연관되는 전기 장비, 환경배출물, 경제성분석, 검증 부분이 프로그램마다 추가적인 옵션으로 제공되고 있다. 일부 프로그램에 포함되어 지원하는 전기 장비항목은 전력 부하를 계산하는 데 이용되지만 이 부분은 단순히 입력된값(프로그램 기본값)을 사용함으로 특정 건물의 정확한 정보를 제공하는데 편차가 심하고 평가하는 항목으로 넣기 어려워 제외하였다. 경제성 부분에서는 지역별(혹은 나라별) 기준을 제공하는 것과 법률적 해석에 민감한 부분이 있으며 나라마다 해석이 달라지는 한계를 가지고 있다. 같은 맥락에서 환경 배출물 또한 국가별 지정 환경 배출물과 그에 대한 표준 지표량이 다르게 적용됨으로 프로그램의 평가 및 검증 범주로 포함하는 데에는 한계가 있어 제외하였다.

Table 2. 
Regarding to Energy Performance Gap Researches
YEAR AUTHORS BUILDING USE TARGET / ENERGY SOURCE EVALUATIONS
2011 Menezes et al Non Domestic Ventilation POE
2011 Choi et al Non Domestic Ventilation POE
2011 Yu et al Domestic Gas, Electricity Data Mining
2013 Hossein et al Non Domestic Electricity POE
2014 Wilde et al Domestic Gas, Electricity Monitoring
2014 Olivia et al Hospital, School Indoor Comfort POE, Monitoring
2015 Salehi et al Non Domestic Ventilation Dynamic Simulation
2016 Niu et al Domestic Ventilation POE
2016 Herrando et al Non Domestic Ventilation Dynamic Simulation
2016 Min et al Non Domestic Air Handling Unit Facility Management Review

3.2. 엔지니어링 분석법의 한계점

국내에서 발표된 논문과 보고서 대부분을 차지하는 엔지니어링 분석 방법론의 특징은 위에서 언급한 바와 마찬가지로 사용자에 따른 결과값의 변화 및 시간과 고비용이 요구되는 것이 단점이라고 할 수 있다. 국외 연구 자료에서만 언급된 엔지니어링 분석법의 또 다른 한계점은 친환경 건축물의 보급과 관계가 있다. 이러한 건물에 사용된 주요 요소기술의 성능 및 설계 초기 에너지 사용이 실제 건물로 지어진 이후 초기 시뮬레이션 결과와 다르게 나온 연구 결과물을 쉽게 찾아볼 수 있었다. 일부 연구에서 대두된 이러한 현상을 Energy Performance Gap이라고 칭한다. (Wilde. 2014) Energy Performance Gap(이하 EPG)의 연구는 대게 해외 논문에서만 연구결과를 확인할 수 있다. 연구의 주요 내용은 건물의 물리적 특성값으로 분석한 엔지니어링 분석법의 결과값과 건물의 완공된 이후 건물에서부터 나오는 실측 데이터값의 차이의 근본적인 원인을 밝히는 연구이다. 그중에서도 엔지니어링 분석법 중 일부 시뮬레이션 프로그램의 예측값과 실제 대상건물에서의 측정값과의 차이가 크게는 2배 이상 차이가 있는 연구(Menezes, 2011)들이 있으며 에너지 성능 차이를 결정짓는 근본적인 원인도 설계-시공- 운영방법에 따라 다르게 나타나는 것을 알 수 있다. (Olivia et al, 2015) 에너지 성능 차이(EPG)와 관련한 국외논문에서 건물의 용도는 크게 비주거-주거로 나눠서 연구되었다. 이 중에서도 재실자의 거주 여부에 따른 결과를 볼 수 있는 비주거(오피스, 병원, 학교)를 대상으로 한 연구들이 많았다. 대부분 에너지 성능 차이 연구에서의 평가 항목은 총 전력에너지 및 가스 에너지 사용이 평가되었으며 최근에는 실내 쾌적 및 실내 환기에 대한 시뮬레이션-실측값 비교 연구도 진행되었다. (Choi et al, 2012) 연구의 최종 평가 방법은 재실자를 대상으로 한 거주 후 평가방법(Post Occupancy Evaluation) 방법이 사용되거나 시뮬레이션 방법론도 적용되었다. 위 연구들을 토대로 한 엔지니어링 분석법에서 나타나는 에너지 성능 차이(EPG)의 근본 원인은 크게 세 가지로 정리된다. 첫 번째 원인은 설계단계의 엔지니어링 분석 때의 불확실한 가정치(assumption)과 시뮬레이션 프로그램에 기본적으로 입력된 기본값(Default data)의 사용으로 인한 신뢰할 수 없는 결과값을 도출되는 것이 설계단계의 가장 큰 문제점으로 지적되었고 이로 인한 EPG의 결과가 큰 것으로 나타났다. 그뿐만 아니라 엔지니어링 분석법으로 사용되는 에너지 모델링 프로그램 자체의 오류로 인한 결과로 실제값과의 차이가 나타나기도 한다. 두 번째 원인은 실측대상이 되는 실제 대상건물 시공의 질로 인한 원인이다. 친환경 건물에 대한 인식이 부족과 숙련공이 부재로 인해 건물에 사용되는 요소기술(외벽시공, 창호기밀, 환기시스템 등)의 특정 기술의 구현과 구축에 있어 상세한 이해도 없이 수행한 결과로서 에너지 성능차이가 발생되는 경우가 많다. 또한 건설과정에서 세부 성능검사를 제대로 수행하지 않거나 성능을 충분히 확보하지 못한 채 완공을 한 경우에서도 에너지 성능의 차는 발생된다. 마지막 원인은 건물 구축 후, 각 특정기술의 성능측정과 검증기술의 낙후로 인한 에너지 성능차이 때문에 발생되기도 한다.


4. 데이터 드리븐 분석법
4.1. 단일 알고리즘 예측분석

단일 알고리즘 예측분석은 주로 건물의 에너지 사용량 예측, 설비 시스템의 결함 예측에 사용된다. 단일 알고리즘 예측방법은 하나의 예측 알고리즘에 기반을 두며 학습 알고리즘을 계산하는 예측 시스템을 말한다. 본 논문에서는 단일 알고리즘 예측방법 중 대표적인 MLR(Multiple Linear Regression), ANN (Artificial Neural Network), SVR(Support Vector Regression) 주요 내용 및 건물에너지 분석에 적용사례를 보여준다. 위 세 개의 알고리즘(들)은 주로 건물에서 도출되는 실시간의 연속형 데이터를 다루며 에너지 사용량을 예측하거나 특정 설비 시스템의 성능 예측 및 결함, 오작동을 예측하는 데 사용한다. 현재 예측을 위한 알고리즘은 ANN, Decision Tree, SVR 등 90% 넘는 에너지 예측 연구가 단일 알고리즘 예측방법론을 사용한 연구이다. 건물의 물리적인 특성을 나타내는 데이터를 제외하여 계산하므로 결과물의 신뢰도는 떨어지나 기계학습에 대한 예측결과가 높다.

그림 4는 일반적인 단일 예측 알고리즘 분석법의 개념도이다. 건물에서 도출되는 모든 히스토리 데이터를 기반으로 전처리 과정에서 이상치를 제거, 훈련(6), 검증(2), 시험(2)으로 분류하고 반복적으로 계산하여 최종 결과물을 도출하는 과정을 보여준다.


Fig. 4. 
The concept diagram of single algorithm

4.1.1 MLR(Multiple Linear Regression 이하 MLR)

다중 회귀 분석은 종속 변수와 여러 독립 변수 간의 관계를 모델링 하는 방식이다. MLR은 사용하기 쉽기 때문에 건물에너지 부하를 예측하는 데 많이 사용되는 알고리즘 중의 하나이다. (Catalina et al, 2008) MLR 알고리즘은 주거용 건물의 난방 수요를 계산하는 데 많이 사용되고 효율적인 예측 도구로 평가받고 있다. MLR의 경우 데이터 전처리 과정에서 수정해야 할 매개변수가 없기 때문에 사용 편의성 면에서 좋은 평가를 받고 있지만, 비선형 문제를 처리 할 수 없다는 큰 제약이 있다. 또한, 과거 해외 연구에서 MLR이 장기간의 건물에너지 사용을 예측하는 효율적인 도구로 입증되었으나 건물에너지의 단기 예측에 적용할 수 있는지는 검증되지 않은 상태이다.


Fig. 5. 
Comparison of single algorithms

4.1.2 ANN(Artificial Neural Network 이하 ANN)

생물학적 신경 네트워크에서 영감을 얻은 비선형 통계적 학습 방법론이다. 일반적인 ANN은 입력 레이어, 히든레이어, 출력 레이어의 세 개의 레이어가 상호 연결되어 있다. 지난 20년 동안 ANN은 건물에너지 소비량, 냉난방 부하 및 전기 소비량과 같은 다양한 유형의 건물에너지 사용량을 예측하는 데 적용되었다. 이 중에서도 일반 회귀 신경망(General Regression Neural Network)을 적용하여 상업용 건물의 냉각 부하를 예측한 결과가 대표적인 ANN 사례라고 할 수 있다. (Nakhi et al 2004) 연구보고에 따르면, ANN는 입력과 출력 간의 복잡한 비선형 관계를 감지할 수 있다는 가장 큰 장점이며, 이러한 특징으로 ANN 방법론을 실시간 모니터링에 적용할 수 있다는 강점이 있다. 그러나 ANN은 건물의 물리적 특징과 건물에너지 사용에 상호 연결 관계를 설정하지 못할 경우 건물 물리적인 구성요소 또는 시스템을 변경할 때 제한적으로 상용되는 단점이 있다.

4.1.3 SVR (Support Vector Regression 이하 SVR)

SVR은 높은 차원의 공간에서 선형 회귀 함수를 계산하는 것으로 유래 되었다. (Basak D, 2007) 두 카테고리 중 어느 하나에 속한 데이터의 집합이 주어졌을 때, SVR 알고리즘은 주어진 데이터 집합을 바탕으로 하여 새로운 데이터가 어느 카테고리에 속할지 판단하는 비확률적 이진 선형 분류 모델을 만든다. SVR을 건물에너지 사용 및 설비 성능의 주요 파라미터를 적절히 선택하면 SVR을 통해 높은 수준의 예측 정확도를 얻을 수 있다. 위에 설명한 세 개의 단일 알고리즘 분석 모델은 순차적 또는 병렬적으로 조합하여 적용하였을 때 단일 분석방법의 고유한 한계를 극복하고 예측 성능을 향상시키기 위해 발전되어 온 것을 볼 수 있다. 이러한 단일 알고리즘 분석 방법은 다양한 AI 모델과의 완벽한 연계를 통해 데이터 분류(Kim, 2006) 질병 진단(Kang, 2015) 및 일기 예보(Parker, 2010)와 같은 여러 연구 영역에서 더 높은 정확성을 보여 왔다.

4.2. 앙상블 알고리즘 분석

앙상블 알고리즘 분석은 단일 알고리즘 분석보다 정확도 측면에서 향상된 예측방법이다. 단일 알고리즘의 예측 분석을 통합적으로 사용함으로써 예측의 정확도가 향상되었다. 앙상블 알고리즘 분석은 축적할 수 있는 모든 데이터를 활용함으로 알 수 없는 변수들이 많은 상황에서 분석자의 경험적 판단 없이 자동 알고리즘으로 변수를 결정할 수 있고, 알고리즘을 통해 만들어낸 또 다른 변수들을 계속 새롭게 추가하고 분류하면서 분석-예측하는 방법론이다. 앙상블 모델에 대한 데이터 수집 및 전처리는 단일 예측 모델과 유사하다. 그러나 이러한 두 가지 유형간의 가장 큰 차이점은 학습 알고리즘을 선택하고 교육하는 과정에 있다. 하나의 학습 모델만 포함하는 단일 예측 알고리즘 모델과는 달리 앙상블 알고리즘 모델은 여러 개의 기본 모델로 구성된다. 기본 모델은 학습 데이터(Supervised learning3) data) 및 학습 매개 변수의 무작위 샘플링을 (Random sampling)통해 계산 결과를 도출한다. 그림 6은 데이터 드리븐 분석법의 대표적 두 알고리즘 즉 단일 알고리즘과 앙상블 알고리즘 분석법의 순서도이다. 앙상블 알고리즘 분석법의 데이터 탐색과 데이터 전처리 과정은 단일 알고리즘 분석법의 절차와 유사하다. STEP 1은 데이터의 탐색 과정이다. 환경적 요인(기상 데이터), 건물의 특성 및 재실자 현황과 같은 건물에너지 소비에 영향을 미치는 요소가 포함되는지 탐색하는 과정이다. 계산의 단순성과 예측 정확도를 향상시키기 위해서는 건물에너지 소비에 중요한 요소만 고려해야 한다. STEP 2의 데이터 전처리 단계에서 다뤄야 할 매개 변수는 목적과 용도에 맞는 센서로 모니터링된 변수를 사용한다. 가령 외기 환경센서로 수집된 온·습도·일사 등의 환경데이터, 전기, 설비 유량, 가스 계측 센서로 모은 데이터, 실내 쾌적 센서로 계측된 재실데이터등이 여기에 해당된다. 수집된 데이터 중에는 일부 누락 된 데이터, 부정확한 데이터 및 통합되지 않은 변수들로 인해 결과값에 영향 줄 수 있으므로 이러한 이상치들은 데이터 전처리에서 삭제된다. 또한 이 과정을 통해 훈련 데이터(Training Data)가 형성된다. STEP 3은 학습 알고리즘(Learning Algorithm)을 선택하는 단계이다. 이 단계는 단일 알고리즘 모델과 앙상블 알고리즘 모델 간의 차이를 나타내는 단계이기도 하다. 하나의 학습 알고리즘만 사용하여 모델을 작성하는 단일 알고리즘 달리 앙상블 알고리즘은 기본 모델(Base learner)을 학습하는 데 여러 개의 학습 알고리즘을 사용한다. STEP 4는 기본 모델(Base learner)이 생성되는 단계이다. 그림 6의 앙상블 모델에서 두 개의 다른 학습 과정이 포함되는데 이는 동질(Homogeneous), 이종(Heterogeneous) 앙상블 모델이라고 한다. 동질 및 이종 앙상블 모델의 학습 과정은 데이터 샘플링 생성 과정부터 다르다. 동질 앙상블 모델의 경우, 한 개의 훈련 데이터를 공유한 후 복수의 세부훈련 데이터(Training Data Sub set)가 생성된다. 이것을 다시 한 개의 학습 알고리즘(Learning Algorithm)으로 반복 계산하게 된다. (그림 6의 가운데) 반면 이종 앙상블 모델은 한 개의 훈련 데이터를 공유하고 각각 다른 학습 알고리즘을 개별적으로 학습해서 결과값을 도출한다. (그림 6의 우측 중앙) 앙상블 알고리즘의 마지막 단계인 STEP 5는 모든 기본 모델을 통합하여 최종 예측 결과를 출력하는 단계이다. 앙상블 모델의 데이터 일반화 능력이 단일 알고리즘의 일반화 능력보다 강하다는 것을 연구를 통해 확인할 수 있었으며, (Lv et al, 2014) 오류발생에 있어서도 단일 알고리즘 보다 적게 나타난다는 연구가 보고되고 있다. (Fan et al, 2014) 특히 (i) 학습 데이터가 최상의 학습 알고리즘을 선택하기에 충분한 정보를 제공하지 못할 경우나 (ii) 학습 알고리즘이 우리가 제기 한 어려운 문제를 해결 못 할 경우에 대해서 앙상블 모델은 극복 방식을 제공하며, 단일 알고리즘 모델보다 예측 정확도의 향상으로 인해 최근 몇 년 동안 좋은 연구 주제 및 프로그램으로 사용되었다.


Fig. 6. 
Two data-driven algorithms: concept of single and ensemble algorithm


5. 대상건물로 두 방법론 검증

<표 3>의 상단은 2000년부터 최근까지의 건물에너지를 분석한 연구논문을 엔지니어링 분석법과 데이터 드리븐 방법론으로 구분하여 특징을 정리한 결과이다. 특히 기존의 엔지니어링 방법론의 한계점인 EPG는 두 가지의 다른 데이터의 레벨 즉, real time data와 simulation data를 비교함으로써 오는 결과라 할 수 있으며 이와 같은 에너지 성능의 차이(EPG)를 1개 이상의 앙상블 알고리즘을 적용하여 계산함으로써 사용량 및 성능예측 결과가 향상됨을 해외 문헌의 결과로 알 수 있었다. 표 3의 하단의 내용은 한 개의 대상건물을 가지고 두 개의 다른 방법론을 적용하여 비교한 결과이다. 대상건물은 강동구에 위치한 공공건물로서(업무시설) 연면적 5,635㎡, 지하 1층 지상 4층 규모의 건물이다. 대상건물을 두 가지 방법 즉 엔지니어링 분석법과 데이터 드리븐 방법론을 적용, 5단계로 분석과정을 정리하였다. 먼저 엔지니어링 방법론의 STEP 2~4의 과정은 시뮬레이션을 통해 부하별 절대값을 도출하고 이를 기반으로 세부 부하(냉, 난방, 환기)에 대한 절감 량을 예측하는 과정이다. 엔지니어링 STEP 4의 그림에선 냉·난방 시뮬레이션 베이스 모델값과 실내 재실자 쾌적을 고려한 최적의 에너지 절감 량을 예측할 수 있다. 반면 데이터 드리븐 방법론 STEP 2~4의 과정은 대상건물의 실제 에너지 총량을 가지고 사용하기 때문에 단계별-에너지별 절대값이 도출되지 않는 반면 각 에너지를 색깔로 구분하여 실제 소비패턴을 도출할 수 있었다. (난방 붉은색, 냉방 파랑색, 조명 주황색, 기저부하 갈색) 한 개의 대상건물을 두 방법론으로 적용한 결과는 엔지니어링 분석법에선 대상건물의 실측값을 사용하더라도 프로그램의 INPUT값(열관류율, 창 면적비등)이 적용된 절대값과 실제 사용된 총 에너지값과의 차이(input값이 적용된 절대값은 실측값과 항상 차이를 가지고 있다는 점)를 보정하고 극복하는데 것이 가장 큰 한계점인 반면, 데이터 드리븐 분석법은 대상건물의 실제 에너지 총사용량을 가지고 에너지별 분할을 한 것이므로 총 에너지 사용량을 절감하고 예측하는데 있어서 엔지니어링 방법론보다 실제적인 건물에너지 절감 량 도출이 가능하다고 할 수 있다.

Table 3. 
Comparison and Limitation of Engineering Analysis and Data-driven Analysis
TYPE ENGINEERING ANALYSIS PROBLEMS LIMITATION DATA DRIVEN ANALYSIS
STEADY STATE DYNAMIC SINGLE ENSEMBLE
KEY WORD Analysis Prediction Energy Performance Gap Improvement Reinforced,
Enhanced
DATA Static data
(Architectural feature,
Weather data)
Real-time data,
Simulation data
Real-time data,
Simulation data
Static data
Real-time data,
Simulation data
OBJECTIVE Energy Consumption /
Performance Analysis
Energy Consumption /
Performance Prediction
Energy Consumption /
Performance Prediction
Improved prediction result,
Selection of important variables without human biased.
ISSUES Use single vaiable Cost, time consumed Less cost and time Developed
Need expert knowledge No required expert knowledge Developed
Low accuracy, reliability Complexity of use Simplicity of use Developed
No correlation between variables Identify the correlation between variables
Mainly used for energy consumption Architectural elements & physical features can be modified   Missing architectural elements & physical features Developing
 
effective prediction in design stage for building energy and performance Gap between actual data and simulation results Enhanced prediction for building energy consumption and system performance Developing
 
Data Table STEP 1 Data Collect and Preprocessing
Base Modeling STEP 2 Training Data
Calibration STEP 3 Learning Algorithm
Analysis STEP 4 Base learner
Solution STEP 5 Prediction


6. 결론

엔지니어링 분석법과 향상된 예측결과를 보여주는 데이터 드리븐 방법론의 비교 결과는 아래와 같다.

(1) 데이터 드리븐 방법론은 기계학습의 데이터 탐색 및 전처리 과정을 반드시 거쳐야 하는데 이 과정에서 범주형 변수로 인식되는 건물의 물리적 특징을 나타내는 변수(창면젹비, 열관류율)들이 생략되는 경우가 많다. 이로 인해 사용량 예측 및 성능 예측에 관한 건물의 물리적특성 간의 상관관계를 파악하기에 어려움이 있다. (2) 데이터 드리븐 방법론 중 단일 알고리즘 예측방법론은 건물의 설계 또는 운영 모드가 변경되었을 경우, 모든 데이터를 다시 트레이닝 시키는 과정이 발생하기도 한다. 하지만, 데이터 수집과 프로세스, 사용자의 숙련도에 따른 결과의 변동이 적고 총 에너지 사용량을 기반으로 한 결과이므로 신뢰성이 향상됨과 동시에 엔지니어링 분석법에 소요되는 시간보다 현저하게 줄어든 결과를 얻었다.

건물의 에너지 소비에 대한 인식이 높아짐에 따라 그 방법론과 해결책도 다양해지고 있다. 하지만 모든 건물에 같은 에너지 분석방법론을 적용할 수 없고 건물의 규모와 데이터의 속성에 맞는 절감안과 해결책이 제시되어야 한다고 판단된다. 이를테면, 대상건물로부터 도출되는 많은 양의 데이터 중에서 데이터의 중요도를 구분하는 분석, 에너지 소비에 영향을 주는 주요변수를 선정하는 분석, 이들 간의 상관관계를 해석하는 것은 데이터 드리븐 분석법으로 적용했을 때 더 효과적이다. 본 연구와 관련하여 데이터 드리븐 방법론(앙상블 알고리즘)을 적용하여 건물에너지 소비에 영향을 주는 주요인자가 무엇인지를 밝히는 연구 및 유사한 인자로 건축적 특징을(Envelope-Dominated Building 혹은 Internal-Dominated Building) 분류할 수 있는 건물 유형화의 대한 후속 연구가 필요하다.


Notes
1) 건물의 온도를 올리거나 내리는 데 필요한 에너지를 계산한 값으로, 건물이 위치한 지역의 실외기온을 토대로 산출한다.
2) 특정 위치에 대한 과거 날씨 데이터를 활용한 분석법이다. 기상청의 모든 시간별 날씨의 기록을 통해 계산을 수행. 개별 빈의 변수 평균값을 기반을 두어 도출한다.
3) 훈련용 데이터로부터 하나의 함수를 유추해내기 위한 기계학습의 한 방법

Acknowledgments

This work was supported by “Human Resources Program in Energy Technology” of the Korea Institute of Energy Technology Evaluation and Planning (KETEP), granted financial resource from the Ministry of Trade, Industry & Energy, Republic of Korea. (No.20174010201320)


References
1. D. B. Crawley, J. W. Hand, Contrasting the capabilities of building energy performance simulation programs, Building and Environment, (2008), 43, p661-663.
2. W. Zeyu, R. S. Srinivasan, A review of artificial intelligence based building energy use prediction, Renewable and Sustainable Energy Reviews, (2016), 75, p796-808.
3. 백영렬, “건물의 열에너지 해석 프로그램”, 기계저널, 42권(11호).
Y. R. Beak, Thermal energy analysis program of building, Journal of Mechanical Science and Technology, (2002), 42, p20-21.
4. Y. Yuebin, W. Denchai, D. Yu, A Review of Fault Detection and Diagnosis Methodologies on Air­handling Units, Energy and Buildings, (2014), 82, p550-562.
5. 김현수, 최기원, 장지훈, 강경모, 이승복, “BEAT프로그램을 이용한 건물에너지 retrofit요소들 간의 에너지 절감 관계분석”, 대한건축학회, 구조계, 33(2), 2017, Feb, p97-105.
H.S. Kim, K.W. Choi, J.H. Jang, K.M. Kang, S.B. Leigh, Analyzing Energy Reduction Correlations among Factors of Building Energy Retrofit by using BEAT Program, Journal of the Architectural Institute of Korea Structure & Construction, (2017), 33, p97-105.
6. D. Basak, S. Pal, D.C. Patranabis, Support vector regression, Neural Information Process, (2007), 11, p23-24.
7. K.J. Kim, S.B. Cho, Ensemble classifiers based on correlation analysis for DNA microarray classification, Neurocomputing, (2006), 70, p187-99.
8. S. Kang, P. Kang, T. Ko, S. Cho, S.J. Rhee, K.S. Yu, An efficient and effective ensemble of support vector machines for anti-diabetic drug failure prediction, Expert Systems with Application, (2015), 42(9), p4265-73.
9. W.S. Parker, Predicting weather and climate: uncertainty, ensembles and probability, Studies in History and Philosophy of Science Part B, Studies in History and Philosophy of Modern Physics, (2010), 41(3), p263-72.
10. P.D. Wilde, The gap between predicted and measured energy performance of buildings, Automation in Construction, (2014), 41, p40-49.
11. A.C. Menezes, A. Cripps, D. Bouchlaghem, Predicted vs. actual energy performance of non domestic buildings using post occupancy evaluation data to reduce the performance gap, Applied Energy, (2014), 97, p335-364.
12. G.S. Olivia, T.A. Christopher, In-use monitoring of buildings: An overview and classification of evaluation methods, Energy and Building, (2015), 86, p179-189.
13. J.H. Choi, V. Loftness, A. Aziz, Post-occupancy evaluation of 20office building as basis for future IEQ stanadards and guidelines, Energy and Buildings, (2012), 46, p167-175.
14. Carbon trust, Closing the Gap: Lesson learned on realising the potential of low carbon building design, 2012
15. NHBC Carbon Foundation, Compliance for tomorrow’s new homes, A review of the modeling tool and assumption, Closing the gap between designed and built performance, (2010).
16. T. Catalina, J. Virgone, E. Blanco, Development and validation of regression models to predict monthly heating demand for residential buildings, Energy and Building, (2008), 40(10), p1825-1832.
17. 안기언, 김영진, 박철수, “설계단계에서 동적 건물에너지 성능분석의 쟁점들”, 대한건축학회 - 계획계, 28(12), (2012), 12p361-369.
K.U. Ahn, Y.J Kim, C.S. Park, Issues on Dynamic Building Energy Performance Assessment in Design Process, Journal of the Architectural Institute of Korea Planning & Design, (2012), 28(12), p361-369.
18. A.E. Ben-Nakhi, M.A. Mahmoud, Cooling load prediction for buildings using general regression neural networks, Energy Conversion and Management, (2004), 45, p2127-41.
19. X. Lv, T. Lu, C.J. Kibert, M. Viljanen, A novel dynamic modeling approach for predicting building, Applied Energy, (2014), 114, p91-103.
20. C. Fan, F. Xiao, S. Wang, Development of prediction models for next-day building energy consumption and peak power demand using data mining techniques, Applied Energy, (2014), 127, p1-10.