KIEAE Journal

Home > Current Issue > Vol. 24, No. 1


[ Research Article ]
The International Journal of The Korea Institute of Ecological Architecture and Environment - Vol. 21, No. 1, pp. 35-40
Abbreviation: J. Korea Inst. Ecol. Archit. And Environ.
ISSN: 2288-968X (Print) 2288-9698 (Online)
Print publication date 28 Feb 2021
Received 15 Jan 2021 Revised 08 Feb 2021 Accepted 15 Feb 2021
DOI: https://doi.org/10.12813/kieae.2021.21.1.035
학교시설 실내공기질 환경 개선을 위한 실내 미세먼지(PM_2.5) 예측모델 개발
최영재^* ; 최은지^ ; 조혜운^* ; 문진우^****




Development of an Indoor Particulate Matter (PM_2.5) Prediction Model for Improving School Indoor Air Quality Environment
Young Jae Choi^* ; Eun Ji Choi^ ; Hye Un Cho^* ; Jin Woo Moon^****
*Main author, Graduate Student, School of Architecture and Building Science, Chung-Ang Univ., South Korea (chlyoungwo@gmail.com)
**Coauthor, Graduate Student, School of Architecture and Building Science, Chung-Ang Univ., South Korea (ejjchl77@gmail.com)
***Coauthor, Graduate Student, School of Architecture and Building Science, Chung-Ang Univ., South Korea (choaustin63@gmail.com)
****Corresponding author, Professor, School of Architecture and Building Science, Chung-Ang Univ., South Korea (gilerbert73@cau.ac.kr)
ⓒ 2021 KIEAE all rights reserved.


Funding Information ▼ National Research Foundation of Korea 2019M3E7A1113090

Abstract

Purpose:

In this study, an indoor particulate matter (PM_2.5) prediction model was developed to improve air quality in the classrooms. Employing the artificial neural network, the developed model is able to conduct iterative self-training in real-time and adapt itself to the various class environments.

Method:

A school building, which was used for data acquisition and performance evaluation of predictive model, was modeled by coupling 3 simulation programs to consider various factors that influence the formation of indoor PM_2.5 concentration. The ANN prediction model was developed using the Bayseian Regularization learning algorithm following the performance optimization. The optimized prediction model was applied to different classroom in the same building for the adaptive performance evaluation.

Result:

As a result of the performance evaluation, Cv(RMSE) of the optimized prediction model was 5% and R² was 0.8757, indicating high accuracy and stability. According to the real-time training, the error gradually decreased after occurrence. Therefore, it was demonstrated that the developed ANN prediction model is able to be adapted to various environmental conditions and expected to be applied in the optimal control algorithm through future research.


Keywords: Indoor Air Quality, Artificial Neural Network, Prediction Model 키워드: 실내공기질, 인공신경망, 예측모델

1. 서론

1.1. 연구의 배경 및 목적

현대인의 하루 실내 거주 시간은 약 80~90% 이상으로 쾌적한 실내 환경 제공을 위하여 실내공기질 관리는 필수적이다[1]. 학교보건법은 이산화탄소, 미세먼지, 라돈, 폼알데하이드 등 17가지의 실내공기질 오염원을 정의하고 있으며 각 오염원에 대한 최소 농도 기준을 제시하고 있다[2]. 특히 미세먼지는 어린이, 노약자와 같이 저항력이 약한 계층에 더 치명적인 것으로 보고되고 있으며[3], 재실자 밀도가 높고 건물의 노후화, 학생 활동 등에 의해 미세먼지 발생률이 높은 학교시설이 실내공기질 오염원 발생에 취약한 실정이다.

일반적으로 PM_2.5는 입경이 2.5㎛ 이하인 미세먼지를 총칭하며 입경 2.5㎛ 이상인 미세먼지보다 인체에 해로운 것으로 알려져 있다. 교육부는 학교 고농도 미세먼지 대책으로서 신축학교의 기계환기설비 설치를 의무화하고 있으며 기존 학교의 경우 기계환기설비 설치를 권고하되 여건에 따라 공기청정기를 설치하도록 하고 있다[4]. 그러나 조사결과 99.2%의 관련 예산이 공기청정기 설치에 투입되었으며[5] 이는 대부분의 학교가 기계환기설비가 아닌 공기청정기를 설치하였음을 의미한다. 공기청정기만 가동했을 시 환기량이 감소하여 실내 이산화탄소 농도가 약 2,300ppm 까지 증가하는 부작용을 초래할 수 있어 환기와 공기정화의 통합제어가 필수적이다[6-7]. 환기와 공기정화량의 제어는 풍량을 조절함으로써 실행되며 단일 변수 제어를 통해 실내공기질을 개선하기 위해서는 오염원을 종합적으로 고려한 최적 제어가 실시되어야 한다. 최적 제어는 실시간으로 변화하는 오염원에 대한 예측을 기반으로 하며 예측모델은 다양한 상황에 대해 정확도와 안전성이 확보되어야 한다.

이에 국내외로 미세먼지 예측모델 개발에 대한 다양한 시도가 이루어지고 있다. 예측모델의 경우 농도 해석이론에 기초한 수학적 모델링과 인공지능을 활용한 예측모델이 개발되고 있으나 기상데이터를 활용한 실외 미세먼지 예측이 주를 이루고 있어 실내 미세먼지 예측모델에 관한 연구는 미비한 실정이다. Kim (2018)은 환기와 공기정화의 최적 제어를 위하여 실내 미세먼지 농도 형성 메커니즘을 수학적으로 모델링 하였다. 미세먼지의 유입, 유출, 제거, 발생을 종합하여 실내 미세먼지 농도를 해석하였으며 주요 영향인자 도출을 통해 실내 미세먼지 농도에 영향을 주는 변수들을 선별하였다. 해당 예측모델은 현장 측정 데이터와 비교하여 평균 오차 5%, 최대 오차 17%로 높은 정확도를 나타내었다[8]. Yeo (2019)는 수학적 실내 미세먼지 농도 및 발생 예측모델을 실제 어린이집에 적용하여 비교평가 하였다. 그 결과 R²가 약 0.8로 높은 상관관계를 나타내었다[9]. 이와 같이 농도 해석이론에 기반한 예측모델은 실내 미세먼지 농도 형성에 영향을 주는 요인들을 세부적으로 적용함으로써 적용 대상이 되는 공간에 대해서는 정확도가 높다. 그러나 침착계수와 침투계수 획득을 위한 별도의 실험이 선행되어야 하며 등교 시간 같이 급격히 미세먼지가 발생하는 상황에 대해서는 예측 정확도가 낮다는 단점이 있다.

반면 인공지능을 활용한 예측모델은 농도 형성에 영향을 미치는 다양한 변수들을 선택적으로 학습시킬 수 있으며 실시간 학습을 통해 동적 상태에 대한 적응이 가능하다. 선행연구 분석결과 시퀀스 데이터를 기반으로 학습된 예측모델이 주를 이루었으며 다양한 학습 알고리즘과 성능이 비교되었다. Lagesse (2020)은 회귀모델(Regression Model), 인공신경망(Artificial Neural Network, ANN), LSTM (Long Short Term Memory)을 활용하여 업무시설의 실내 PM_2.5 농도 예측모델을 개발하고 예측 정확도를 비교하였다. 그 결과 ANN과 LSTM 모델의 RMSE (Root Mean Square Error)가 각각 2.38, 1.73으로 회귀모델에 비해 우수한 성능을 나타냈으며 ANN의 경우 시계열 데이터가 반영된 ANN-Lag 모델의 RMSE가 2.63으로 일반 ANN 모델에 비해 낮은 예측 정확도를 나타냈다[10]. 그 외 LSTM을 활용하여 실내 미세먼지 예측모델을 개발하는 연구가 다수 실행되었으나 이를 활용하여 제어를 수행한 사례는 많지 않다[11-12]. LSTM은 추세를 반영하여 예측을 수행한다는 강점이 있으나 다양한 추세에 대한 학습데이터를 취득하기 어려우며 LSTM 자체를 제어로 활용하기 위해서는 별도의 제어 프로세스를 거쳐야 한다. 또한 학습된 추세에 포함되지 않은 데이터 포인트 발생 시 예측 정확도가 하락한다는 단점이 있다.

따라서 본 연구의 목적은 학교시설 실내공기질 개선을 위해 최적 제어가 용이하며 실시간 학습이 가능한 인공신경망 기반의 실내 미세먼지 예측모델을 개발하는 것이다. 개발된 예측모델은 최적화를 통해 추후 최적 제어알고리즘 개발을 위한 기반으로 활용될 예정이다.

1.2. 연구의 방법 및 범위

PM_2.5 및 입경 2.5 ㎛ 이상의 미세먼지는 PM_2.5 포집이 가능한 필터로 대부분 제거되기 때문에 본 연구에서는 PM_2.5를 예측 및 제거 대상으로 선정하였다. 예측모델 개발을 위해서는 다양한 시나리오의 학습데이터가 필요하기 때문에 데이터의 취득 및 성능평가를 위하여 학교시설의 시뮬레이션 모델링을 실시하였다. 연돌효과, 침기, 열환경 등에 대한 영향을 종합적으로 반영하기 위하여 시뮬레이션 프로그램 간의 상호연동을 실시하였으며 실측 데이터와 비교를 통해 모델의 타당성을 확보하였다. 시뮬레이션을 통해 다양한 학습 데이터세트를 구축하였으며 초기 모델 개발 후 최적화를 통해 정확도와 안정성을 확보하였다. 이후 동일 건물에 다른 공간을 선정하여 예측모델의 실시간 학습 성능평가를 실시하였다.

2. 시뮬레이션 모델링

2.1. 시뮬레이션 모델링 개요

실내 오염원 농도는 실내외 환경 변수, 발생원, 침기, 침착, 재부유 등 다양한 인자에 의해 영향을 받으며 주요 영향 인자들을 종합적으로 고려하기 위해서는 시뮬레이션 프로그램 간의 상호 연동이 필수적이다. 본 연구에서는 Fig. 1.과 같이 총 3가지 프로그램에 대한 상호 연동을 실시하였으며 상세 내용은 다음과 같다.

Fig. 1.
Scheme of Interworking Process

(1) CONTAM은 미세먼지 모델링, 침기, 침착, 부유, 연돌효과 등 농도 형성에 영향을 주는 다양한 인자를 반영하여 실내 미세먼지 농도를 산출한다. CONTAM에서 제공하는 침기 값은 TRNSYS로 전송되고 실내 미세먼지 농도는 Matlab으로 전송되어 예측모델의 입력 값으로 사용된다.

(2) TRNSYS는 건물의 열환경 데이터를 제공함과 동시에 3가지 프로그램을 통합시키는 플랫폼의 역할을 한다. 동적 실내 온도 데이터를 CONTAM과 Matlab으로 전송하며 CONTAM은 해당 온도 데이터를 바탕으로 기류 및 농도를 산출한다.

(3) Matlab은 TRNSYS와 CONTAM에서 제공 받는 데이터를 종합하여 실내 미세먼지 농도를 예측하며 추후 개발 예정인 제어알고리즘의 결과를 CONTAM에 반영한다.

CONTAM과 Matlab은 컴포넌트를 통해 TRNSYS에 포함되며 TRNSYS의 time step 내에서 연산이 이루어진다. 데이터는 한 time step 내 연산의 마지막 단계인 Matlab에서 종합되며 Matlab에서 출력되는 환기시스템의 가동모드 및 풍량은 다음 time step의 연산에 사용된다.

시뮬레이션 모델링 대상 학교시설은 서울시 동작구에 위치한 C 중학교 본관이다. 해당 건물은 1965년에 교사가 신축된 건축물로 연면적 5,091m²의 지하 2층, 지상 4층 건물이며 개별 교실 크기는 88m²이다. 총 27개 학급으로 구성되며 학급 당 약 24명의 학생이 배정되어있는 보편적인 중학교 규모를 가진다. 연돌효과에 의한 기류를 반영하기 위해 전 층에 대한 모델링을 실시하였으며 분석 대상은 2층 남측의 3학년 3반 교실이다. 재실자는 총 20명으로 스케줄은 수업 시간과 쉬는 시간으로 구분된다. 수업 시간 교실은 20명 정원이며 쉬는 시간에는 10명이 재실하는 것으로 설정하였다.

침기 값은 대상 교실에 Blow Door Test를 실시한 후 취득한 Effective Leakage Area at 10Pa 값인 879.5cm²를 입력하였다. 해당 값은 외측과 복도 측에 각각 439.75cm²을 입력하여 실내외 침기를 모두 반영할 수 있도록 하였다. 미세먼지 발생량 및 제거량의 경우 선행연구에 따라 교실당 PM_2.5 발생량 50㎍/min과 제거량 0.09/h를 입력하였으며[13] time step은 5분으로 설정하였다.

대상 교실에 설치된 환기청정기는 전열교환형 환기시스템에 필터가 장착된 형태로 환기와 공기정화 기능을 모두 제공한다. 외기도입, 바이패스, 내부순환 모드를 선택적으로 적용할 수 있으며 미세먼지 및 이산화탄소 농도에 따라 급기풍량이 제어된다. 급기풍량은 약(150 CMH), 중(250 CMH), 강(400 CMH) 3가지로 토출되며 HEPA (High Efficiency Particulate Air) 필터를 거쳐 약 99.97%의 미세먼지가 제거된다. 상세 시뮬레이션 개요는 Table 1.과 같다.

Table 1.
Parameters of Simulation Model

Contents	Information
Modeling Image
Building Information	Location	Seoul, South Korea
	Total Floor area	5,091m²
	Classroom area	88m²
	Number of Floors	4F
	Floor Heights	3m
Classroom	Size	11m x 8m x 3m (W x D x H)
	Floor	2F
	People	20
Occupancy Hours	Schedule (Class)	09:00 ~ 09:45 09:55 ~ 10:40 10:50 ~ 11:35 11:45 ~ 12:30 13:30 ~ 14:15 14:25 ~ 15:10 15:20 ~ 16:05
Occupancy Hours	Schedule (Break)	08:30 ~ 09:00 09:45 ~ 09:55 10:40 ~ 10:50 11:35 ~ 11:45 12:30 ~ 13:30 14:15 ~ 14:25 15:10 ~ 15:20 16:05 ~ 16:20
Infiltration	Effective Leakage Area at 10 Pa	879.5cm²
Contaminants (PM2.5)	Generation Rate	50㎍/min
Contaminants (PM2.5)	Deposition Rate	0.09/h
Ventilation System	Air Flow Rate	Low : 150CMH Medium : 250CMH High : 400CMH
Ventilation System	Filter Efficiency	99.97% (Simple Mode)
Simulation Settings	Calculation & Output Time Steps	5min

2.2. 시뮬레이션 모델 타당성 검증

시뮬레이션 모델의 정확도 검증을 위하여 비재실, 환기시스템 미가동, 자연환기가 없는 기간인 2020년 12월 01일~06일을 선정하여 실내 PM_2.5 농도의 실측값과 시뮬레이션 결과값을 기간 평균의 오차와 Cv(RMSE) (Coefficient of Variation of the Root Mean Square Error)를 통해 비교하였다. Cv(RMSE)는 RMSE (Root Mean Square Error)의 변동계수로 0%에 근접할수록 정확도가 높다. 검증 결과 실측 실내 PM_2.5 농도 평균은 13.85㎍/m³, 시뮬레이션 결과의 평균 농도는 14.79㎍/m³로 93.66%의 정확도를 나타냈으며 Cv(RMSE)는 24%로 ASHRAE에서 제시하는 허용범위인 30% 이하를 만족하였다. 실외 PM_2.5 농도에 대한 실측값과 결과값은 Fig. 2.와 같다.

Fig. 2.
PM_2.5 Concentration of Measured and Simulation Results

3. 실내 미세먼지 예측모델 개발

3.1. 인공신경망(Artificial Neural Network, ANN)

인공신경망은 머신러닝(Machine Learning)의 지도학습 알고리즘 중 하나로 뇌의 신경망을 모사한 시스템이다. 입력층(Input Layer), 은닉층(Hidden Layer), 출력층(Output Layer)으로 형성되며 각 층은 노드(Node)로 구성되어 있다. 노드는 퍼셉트론 구조를 기반으로 하며 가중치(Weight)와 편의 값(Bias)를 가진다. 다수의 노드로 구성된 다중 퍼셉트론은 역전파 알고리즘(Back Propagation)을 통해 오차를 최소화 하도록 지속적으로 가중치와 편의 값을 업데이트한다[14-15]. 본 연구에서는 회귀의 목적으로 인공신경망을 활용하여 실내 미세먼지 농도 형성에 기여하는 주요 인자를 입력 변수로, 실내 PM_2.5 농도를 출력 변수로 하는 예측모델을 개발한다. 예측된 미세먼지 농도는 추후 개발 예정인 제어알고리즘에 활용된다. 학습 과정 및 예측모델의 적용은 Fig. 3.과 같다.

Fig. 3.
Process of Applying ANN Model

3.2. 학습 데이터세트 구축

실내 미세먼지 예측모델 개발을 위해서는 출력 변수와 상관관계가 높은 입력 변수를 선정하여야 하며 다양한 시나리오의 데이터 학습이 필수적이다. 입력 변수는 실내 미세먼지 농도 형성에 영향을 미치는 것으로 조사된 여러 주요 인자들 중 센서 측정에 의해 취득이 용이한 실외 온도, 실내 온도, 실외 PM_2.5 농도, 실내 PM_2.5 농도, 게이지 압력, 환기시스템 가동모드, 급기풍량을 대상으로 한다[8]. 출력 변수는 미래 실내 PM_2.5 농도이며 본 연구에서는 5분 후의 PM_2.5 농도로 정의하였다.

시뮬레이션을 통한 데이터 세트 구축을 위하여 선행연구에서 생성된 2019년 기상파일(WTH)과 오염물질 파일(CTM)을 활용하였다[16]. 시뮬레이션 기간은 2019년 1월 1일부터 2019년 12월 31일이며 조절 변수는 Table 2.와 같이 실내 PM_2.5 발생량과 환기청정기 가동모드 및 급기풍량으로 설정하였다. 실내 PM_2.5 발생량은 0㎍/min에서 100㎍/min까지 25㎍/min 단위로 증가시켰으며 상대적으로 재실자의 활동량이 많은 쉬는 시간에 발생하도록 설정하였다. 환기청정기의 급기풍량은 0m³/h부터 400m³/h까지 100m³/h 단위로 증가시켰으며 가동모드의 경우 실내 PM_2.5 발생량과 급기풍량의 경우의 수에 따라 OFF, 외기도입모드, 내부순환모드로 설정하였다. 학습 속도 및 정확성을 고려하여 전체 데이터 중 80,000개의 데이터를 선별하여 학습데이터 세트를 구축하였으며 해당 데이터 세트는 Train data (60%), Validation data (20%), Test data (20%)로 분류하였다.

Table 2.
Adjustable Variables for Simulation

Variables	Variations
Indoor PM_2.5 Generation Rate	0, 25, 50, 75, 100 ㎍/min
Operation Mode	OFF, Outdoor Air Ventilation, Recirculation
Supply Air Flow Rate	0, 100, 200, 300, 400 m³/h
Dataset Distribution	Train (60%), Validation (20%), Test (20%)

3.3. 초기 예측모델 개발

예측모델 개발을 위해 구축된 학습데이터 세트의 전처리를 실시하였다. 데이터는 정규화(Normalization)와 표준화(Standardization)를 통해 가공되었으며 Bayesian Regularization 학습 알고리즘을 통해 예측모델 학습을 실시하였다. Bayesian Regularization은 기존 Levenberg-Marquardt 학습 알고리즘에 정규화 파라미터를 추가하여 오차에 페널티를 부과함으로써 과적합을 방지한다[17]. 이는 예측모델의 실시간 학습 시 정확도와 안정성을 향상시킨다.

예측모델의 초기 구조는 입력층 1개, 은닉층 1개, 출력층 1개로 구성되며 각 층은 입력 노드 7개, 은닉 노드 15개, 출력 노드 1개를 포함한다. 학습된 예측모델의 정확도는 Test data의 정답과 예측값을 비교함으로써 산출하였다. 두 값의 오차는 Cv(RMSE) 통해 평가되었다.

학습 결과 Table 3.과 같이 표준화 전처리 방식을 채택한 초기 모델의 Cv(RMSE)가 2.77%, 정규화가 2.99%로 표준화 모델의 성능이 우수하였으며 해당 모델을 초기 예측모델로 선정하였다.

Table 3.
Structure and Result of Initial ANN Prediction Model

Variables		Information
ANN Structure		Input Layer (Neurons) : 1 (7) Hidden Layer (Neurons) : 1 (15) Output Layer (Neurons) : 1 (1)
Pre-processing Methods	Normalization	Cv(RMSE) = 2.99%
Pre-processing Methods	Standardization	Cv(RMSE) = 2.77%

4. 예측모델 최적화 및 성능평가

4.1. 예측모델 최적화

초기 예측모델의 예측 정확도 향상을 위하여 은닉층과 은닉 노드의 수를 변경시켜 Table 4.와 같이 최적화를 실시하였다. 은닉층은 1~5개, 은닉 노드는 10~20개 범위에서 최적 구조 탐색을 실시하였으며 각 구조별 Cv(RMSE) 산출을 통해 최적 예측모델을 선정하였다. 그 결과 은닉층 3개, 은닉 노드 18개 모델의 Cv(RMSE)가 0.71%로 가장 높은 성능을 나타냈으며 이를 최적 예측모델로 채택하였다.

Table 4.
Optimization Results of ANN Model, Cv(RMSE) (%)

Layers	Neurons
Layers	10	11	12	13	14	15	16	17	18	19	20
1	2.76	2.67	2.75	2.73	2.93	2.77	2.46	2.91	2.66	2.63	2.55
2	2.89	2.66	3.31	2.65	3.80	3.49	3.90	2.88	2.21	3.46	3.92
3	2.89	1.96	1.77	2.74	0.92	3.70	3.83	2.07	0.71	2.63	2.96
4	1.32	2.48	2.64	2.70	1.97	2.79	3.11	2.02	1.11	5.17	2.55
5	2.89	2.66	3.31	2.65	3.80	3.49	3.90	2.88	2.21	3.46	3.92

예측 정확도 및 안정성 판단을 위하여 성능평가에 활용된 Test Data의 정답과 예측값에 대한 오차를 산출하고 Fig. 4.와 같이 오차 범위에 따른 발생 빈도를 분석하였다. 그 결과 –0.5~0.0 범위의 오차가 10,141개로 전체 발생 오차의 62.8%를 차지하였으며 0.0~0.5 범위의 오차는 5,015로 전체 발생 오차의 31.06%를 차지하였다. 오차의 93.86%가 -0.5~0.5 범위에 존재한다는 것은 예측모델의 정확도와 정밀도가 모두 높은 것을 의미한다. 오차 절대값의 평균은 0.14, 최대 오차는 1.94로 전반적인 예측모델의 안정성도 높은 것으로 분석되었다. 이때 최대 오차는 연속적으로 발생하는 것이 아닌 특정 데이터 포인트에서 발생한 것으로 파악되었다. 또한 낮은 빈도로 –1 이하, 1 이상의 오차가 발생하나 최대 오차의 절대값이 2 미만이고 실내 미세먼지 농도의 비선형성을 고려하면 최적 예측모델의 정확도와 안정성은 높은 것으로 판단된다.

Fig. 4.
Frequency of Error Occurrence according to Error Range

4.2. 최적 예측모델 성능평가

최적 예측모델은 실시간 학습 기능을 포함하며 이는 예측모델이 다른 환경 조건의 공간에 적용되어도 실시간 학습에 의해 최적화가 가능함을 의미한다. 실시간 학습의 상세 프로세스는 Fig. 5.와 같다. 먼저 Step A에서는 입력 데이터로 활용되는 7가지 변수의 현재 값(n)을 취득한다. Step B는 실시간 학습 단계로써 이전 사이클(n-1)에서 예측했던 n번째 실내 PM_2.5 농도와 현재 취득한 실내 PM_2.5 농도를 비교한다. 두 값이 같지 않다면 n-1에 입력변수로 사용된 데이터와 현재 취득한 실내 PM_2.5 농도를 데이터 세트로 구축하여 예측모델에 학습시킨다. 이는 n-1에 입력된 입력변수의 정답이 예측값이 아니라 현재 측정된 실내 PM_2.5 농도 임을 재학습 시키는 과정이다. Step C는 재학습을 거친 후 업데이트된 예측모델로 n+1의 실내 PM_2.5 농도를 예측하는 과정이며 Step D는 이 값을 활용하여 최적 시스템 가동을 실시하는 과정이다.

Fig. 5.
Real-time Training Process

해당 프로세스를 바탕으로 시뮬레이션을 통한 예측모델 성능평가를 실시하였다. 적용 대상은 동일 건축물의 4층 교실이며 학습되지 않은 2020년 12월 1일~6일의 기상 및 오염원 데이터를 사용하였다. 시뮬레이션 결과는 Fig. 6.와 같으며 산출값과 예측값의 Cv(RMSE)는 5%로 매우 높은 예측 정확도를 나타냈다. 오차 절대값의 평균은 0.74, 최대 오차는 3.37로 1,400번째 Time Step 이후 오차가 증가하는 양상을 보였다. 그러나 두 값의 상관관계 분석에 의하면 결정계수(R²) 값이 0.8757로 높은 연관성을 나타냈으며(Fig. 7.) 이는 상대적으로 큰 오차가 발생하더라도 추세를 유지하며 재학습에 의해 최적화가 이루어짐을 의미한다. 따라서 실내 미세먼지 예측모델은 다른 환경조건의 공간에도 적용이 가능하며 실시간 학습을 통해 정확도와 안정성을 확보할 수 있을 것으로 판단된다.

Fig. 6.
Calculated and Predicted PM_2.5 Concentration

Fig. 7.
Correlation Between Calculated and Predicted Results

5. 결론

본 연구에서는 학교시설 실내공기질 개선을 위해 인공신경망 기반의 실내 미세먼지 예측모델을 개발하고 최적화 및 성능평가를 통해 정확도와 안정성을 확보하였다. 상세 개발내용 및 분석결과는 다음과 같다.

(1) 실내 미세먼지 농도 형성에 영향을 주는 열환경, 기류, 침기, 침착 등을 종합적으로 반영하기 위해 3가지 시뮬레이션 프로그램을 연동하여 학교시설을 모델링하였다. 타당성 분석결과 Cv(RMSE)는 24%로 허용범위를 만족시켰으며 해당 모델은 학습 데이터 생성 및 예측모델의 성능평가를 위해 활용되었다.

(2) 시뮬레이션 모델을 통해 80,000개의 학습데이터 세트를 구축하였으며 전처리 후 초기 예측모델 학습에 사용되었다. 초기 예측모델은 은닉층 1개, 은닉 뉴런 15개로 구성되었으며 Bayesian Regularization 학습 알고리즘을 통해 개발되었다. 정확도 평가결과 표준화 전처리 모델의 Cv(RMSE)가 2.77%로 가장 성능이 우수하였다.

(3) 개발된 초기모델에 대해 은닉층과 은닉 뉴런의 수를 변경시키며 최적화를 실시하였다. 그 결과 은닉층 3개, 은닉 뉴런 18개 모델의 Cv(RMSE)가 0.71%로 가장 우수한 성능을 나타냈다. 또한 Test Data에 대한 정답과 예측값의 오차가 –0.5~0.5 범위에 93.86% 가 분포함으로써 정확도, 정밀도 및 안정성이 높은 것으로 분석되었다. 따라서 해당 예측모델을 최적 예측모델로 선정하였다.

(4) 최적 예측모델은 실시간 학습 기능을 포함하며 이는 예측모델이 상이한 환경에 적용된 경우에도 최적화를 가능하게 한다. 본 연구에서는 동일 건축물의 4층 교실에 최적 예측모델을 적용하여 성능평가를 실시하였다. 시뮬레이션 결과 Cv(RMSE)가 5%로 매우 높은 예측성능을 나타냈으며 평균 오차와 최대 오차가 각각 0.74, 3.37로 산출되었다. 최적화 과정과 비교하여 상대적으로 큰 최대 오차가 발생하였으나 시뮬레이션 결과값과 예측값의 R²는 0.8757로 상관관계가 높은 것으로 분석되었다. 또한 최대 오차 발생 이후 실시간 학습을 통해 오차가 점차 감소하는 추세를 나타냈다.

따라서 상기 분석내용을 종합한 결과 개발된 실내 미세먼지 예측모델은 높은 정확도와 안정성을 확보하였으며 실시간 학습을 통해 다양한 환경에 최적화가 가능함을 확인하였다. 이에 실제 시스템 적용 시 최적화를 위한 경제적 비용 절감과 최적 운용에 따른 에너지소비량 절감이 가능할 것으로 사료된다. 본 예측모델은 추후 연구를 통해 실측 데이터에 대한 추가 학습 및 보정을 실시할 예정이며 최적 제어알고리즘에 포함되어 실시간 학습 기반의 시스템 최적화 운영을 위한 기반 기술로 적용될 예정이다.

Acknowledgments

이 연구는 2020년도 한국연구재단 연구비 지원에 의한 결과의 일부임. 과제번호:2019M3E7A1113090

References


1.	환경부, 실내공기질 관리 기본계획[2015~2019], 2015.02. Ministry of Environment, Plan for Indoor Air Quality Management[2015~2019], 2015.02.
2.	교육부, 학교보건법 시행규칙(교육부령 제194호, 시행 2019.10.24.): [별표 4의2] 공기 질 등의 유지ㆍ관리기준. Enforcement Rules of the School Health (Ministry of Education Command No.194, Effective Date: 2019.10.24.): [Appendix 4-2] Maintenance and Management Standards for Air Quality, etc.
3.	정지원, 이희관, 초등학교 교실에서 학생활동에 따른 먼지 농도 구성의 변화, 한국대기환경학회 2004 춘계학술대회 논문집, 2004.05, pp.253-254. J.W. Jung, H.K. Lee, Dust Concentration is an Elementary Classroom due to Student Activity, Korean Society for Atmospheric Environment 2004 Spring Conference, 2004.05, pp.253-254.
4.	교육부, 학교 고농도 미세먼지 대책 발표, 2018.04.06. Ministry of Education, Announcement of Measures for Particulate Matter at School, 2018.04.06.
5.	여인규, 학교 공기정화예산 집행금 99% ‘공기청정기’, 냉난방공조 신재생 녹색건축 전문저널 칸, 2019.05.25. I.G. Yeo, 99% of school air quality budget used for air purifier, Korea heating Air-conditioning Refrigeration & renewable energy News, 2019.05.25.
6.	경기도교육청, 도교육청, 도내 모든 학교 교실에 공기정화장치 설치 끝내, 2020.03.11. Gyeonggido Office of Education, Gyeonggido Office of Education Completed to Install Air Cleaning Devices to all School Classes, 2020.03.11.
7.	최영재 외 4인, 학교시설 최적 실내공기질 제공을 위한 환기시스템 및 제어 방법 분석, 한국생태환경건축학회 논문집, 20(2), 2020.04, pp.131-137. Y.J. Choi et al., Analysis of Ventilation System and Control Methods for Optimal Indoor Air Quality in School Buildings, KIEAE Journal 20(2), 2020.04, pp.131-137.
8.	김지혜, 공동주택의 실내외 미세먼지 환경조건을 고려한 Ventilation과 Filtration 제어 전략, 서울대학교 박사학위 논문, 2018.02. J.H. Kim, Ventilation and Filtration Control Strategy considering Indoor and Outdoor Particle Environmental Conditions of Apartment Building, Seoul National University Doctoral Thesis, 2018.02.
9.	여명석, 김지혜, 어린이집 보육실의 실내 활동 분석을 통한 실내 미세먼지 발생률 예측, 설비저널, 48(12), 2019.12, pp.44-50. M.S. Y, J.H. Kim, Prediction of indoor fine dust incidence through analysis of indoor activities in day care center, Magazine of the SAREK 48(12), 2019.12, pp.44-50.
*10.*	B. Lagesse, et al., Predicting PM2.5 in Well-Mixed Indoor Air for a Large Office Building Using Regression and Artificial Neural Network Models, Environmental Science & Technology, 54, 23, 2020, pp.15320-15328.
*11.*	홍태훈 외 6인, LSTM을 이용한 실내 미세먼지 예측모델 개발, 한국에너지기후변화학회 학술대회, 2018.11, pp.185. T.H. Hong et al., Development of the Indoor fine dust density forecast model using Long Short Term Memory, Korea Society of Energy & Climate Change Conference, 2018.11, pp.185.
*12.*	김성훈, 한기태, 주방환경에서의 미세먼지 센서 데이터를 이용한 LSTM 모델 기반의 실내 공기 오염 예측 연구, 한국통신학회 동계종합학술발표회, 2020.02. pp.1127-1128. S.H. Kim, G.T. Han, A Study of Indoor Air Pollution Prediction based on LSTM Model using Fine Dust Sensor Data in Kitchen Environment, Proceedings of Symposium of the Korean Institute of communications and information Sciences, 2020.02, pp.1127-1128.
*13.*	최하늘 외 5인, 학교 교실의 초미세먼지 저감을 위한 급기 환기 전략 개발, 대한건축학회논문집, 제36권 제9호, 2020.09, pp.119-129. H.N. Choi et al., Development of Supply Ventilation Strategy to Reduce PM2.5 in Chool Classrooms, Journal of the Architectural Institute of Korea, 36(9), 2020.09, pp.119-129.
*14.*	E.J. Choi et al., Development of Occupant Pose Classification Model Using Deep Neural Network for Personalized Thermal Conditioning, Energies, 13(1), 2020.12, pp.45.
*15.*	최영재 외 3인, 컨테인먼트형 데이터센터 최적 제어 알고리즘을 위한 열환경 예측모델 개발, 한국생태환경건축학회 논문집, 제20권 제5호, 2020.10, pp.159-164. Y.J. Choi et al., Development of Supply Air Temperature Prediction Model for Optimal Control Algorithm of Containment Data Center, KIEAE Journal, 20(5), 2020.10, pp.159-164.
*16.*	가서사, 최하늘, 김태연, PM2.5 동적 해석을 위한 CONTAM용 기상 데이터 셋 구축, 한국생태환경건축학회 학술발표대회 논문집, 제20권 제1호, 2020.05, pp.108-109. R. Jia, H.N. Choi, T.Y. Kim, Development of CONTAM Weather Data for PM2.5 Transient Simulation, Korea Institute of Ecological Architecture and Environment, 20(1), 2020.05, pp.108-109.
*17.*	D. J. C. MacKay, Bayesian Interpolation, Neural Computation, 4(3), 1992, pp.415-447.