
유동인구 설명을 위한 분석단위 크기 효과 분석 : 종로구 서촌 일대를 중심으로
ⓒ 2025. KIEAE all rights reserved.
Abstract
This study aims to identify an appropriate spatial analysis unit for the analysis and impact assessment of pedestrian traffic. It tries to address the limitations of previous studies that arbitrarily selected spatial units, by systematically deriving a spatial analysis unit optimized for pedestrian traffic analysis.
The study established 50×50 meters as the minimum spatial analysis unit and, based on this, constructed pedestrian traffic datasets for various spatial scales, including 100×100m, 200×200m, 400×400m, and 500×500m. Using these datasets, histogram analysis, spatial autocorrelation analysis (Moran’s I), correlation analysis, and simple regression analysis were conducted to determine the optimal spatial unit. In addition, commercial floor area data were similarly constructed and analyzed through correlation and regression analyses with the pedestrian traffic data. The data preprocessing stage also examined the influence of including or excluding zero values.
The analysis revealed that both pedestrian traffic and commercial floor area data exhibited clear density differentiation starting from the 100×100m unit, also spatial autocorrelation, correlation, and regression analyses showed the most stable results from this spatial unit. In particular, the 100×100m unit was confirmed to be the most suitable for pedestrian traffic analysis, although the 200×200m unit could also be used with caution due to potential information loss caused by smoothing effects. This study provides a practical guideline for setting spatial units in pedestrian traffic analysis and suggests directions for further research.
Keywords:
Pedestrian Traffic, Commercial Floor Area, Spatial Unit, Spatial Autocorrelation키워드:
유동인구, 상업용도 연면적, 공간 분석단위, 공간자기상관분석1. 서론
1.1. 연구의 배경 및 목적
최근 유동인구의 중요성이 크게 부각되고 있다. 유동인구는 상업, 지역 경제, 안전, 교통 등 다양한 분야와 관련이 있다. 상업적 측면에서는 상권의 발달 및 시장 상권 활성화 등과 같은 부분에서 중요하게 여겨지고 있으며, 안전 측면에서는 CCTV의 최적 설치 위치를 도출하거나 안전 인프라를 구축하기 위한 위치를 선정하는데 기여할 수 있다. 또한, 대중교통의 노선이나 배차 간격을 결정하는 데에도 유동인구가 중요하게 고려된다. 이 외에도 다양한 분야에서 유동인구는 중요하게 고려되고 있다.
유동인구의 중요성이 부각됨에 따라, 국내외 모두 유동인구와 관련된 연구들도 증가하고 있다. 이와 같은 연구의 증가는 기본적으로 유동인구 자료의 가용성이 커졌기 때문이다. 특히, 통신사에서 제공하는 유동인구 자료와 센서를 이용한 측정이 주목된다[1~4]. 또한, 유동인구 증가의 원인, 밀집의 원인 파악도 중요한데, 이를 위해 유동인구에 영향을 주는 인자와의 상관분석, 회귀분석 등도 많이 수행되고 있다[5,6].
유동인구와 관련된 다양한 연구들의 분석에 있어 적절한 공간 분석단위의 기준은 매우 중요하다. 이는 기본적으로 규모효과(scale effect), 구역효과(zoning effect)로 대변되는 MAUP (수정가능한 공간단위의 문제)로도 연결되는 문제이다[7]. 즉, 적용된 공간 분석단위에 따라 국지적 특성이 부각될 수도 희석될 수도 있다. 이는 실무적으로도 매우 중요한 의미를 갖는다. 기본적으로 목적에 적합한 유동인구의 공간적 분포 특성을 파악할 수 있어야 하기 때문이다. 그러나 유동인구와 관련된 다양한 연구들의 분석에 적절한 공간 분석단위 기준에 대한 연구는 미흡한 실정이다. 기본적으로 제공되는 자료의 구조(공간 분석단위)를 그대로 수용하며 연구를 진행하거나 역세권, 보행권, 페리의 근린주구론 등과 같은 기준에 맞춰 연구를 진행하고 있다. 유동인구 및 관련 연구의 목적에 적합한 공간 분석단위 기준을 적용하여 연구를 진행하고 있다고 하기는 어렵다.
본 연구의 목적은 유동인구 분석에 사용될 적정 공간 분석단위를 파악하는 것이다. 이에 본 연구에서는 유동인구의 분석, 그 영향평가 및 조사에 적절한 공간 분석단위를 결정해 보고자 한다. 기본적으로 적절한 공간 분석단위란 유동인구의 많고 적음이 잘 구분되어 그 자체의 분석 및 타 인자와의 상관성 분석에 효과적으로 사용될 수 있는 수준을 의미한다.
1.2. 연구의 범위 및 방법
본 연구의 공간적 범위는 서울특별시 종로구 서촌 일대이다. 시간적 범위는 유동인구 자료의 경우 유동인구가 많은 2019년 6월로 설정하였으며, 상업용도 연면적 자료는 코로나 직후인 2024년 2월로 설정하였다.
본 연구의 방법은 다음과 같다. 먼저, 유동인구, MAUP, 공간 분석단위에 대한 선행연구를 고찰하였다. 다음으로는 유동인구 및 상업용도 연면적 자료를 50×50m, 100×100m, 200×200m, 400×400, 500×500m 총 5개의 공간 분석단위의 자료로 각각 구축하였다.
분석에는 히스토그램, 공간자기상관분석, 상관분석 등을 이용하였다. 먼저 자료에 대한 히스토그램 분석은 자료가 쌍봉(bi-modal)의 특성이 나타나는 지를 시각적으로 판단하는 과정이며, 공간자기상관분석은 자료가 가지는 공간적 군집특성을 파악하기 위한 과정이다. 상관분석 및 회귀분석도 분석단위에 따라 변하는 두 자료 사이의 유의성을 살펴보기 위한과정이다. 유의성의 판단은 대상 검정통계량에 해당하는 p값과 유의수준 5%를 비교하여 수행하였다. 이들 과정은 모두 통계소프트웨어인 STATA 18을 이용하여 수행하였다.
2. 이론적 고찰
2.1. 유동인구 관련 선행연구 분석
유동인구는 정주인구와 대비되는 개념이다. 정주인구는 주민등록상의 등록 인구를 기준으로 한다[8]. 반면, 유동인구는 “특정 지역 내에서 일정시간동안 이동한 총 보행량”으로 정의한다[9]. 이 정의는 현재 유동인구 관련 연구들에서 보편적으로 사용되고 있다.
유동인구와 관련된 연구는 Table 1.에서 살펴볼 수 있는 것처럼 크게 유동인구의 특성분석, 유동인구의 측정, 유동인구의 영향요인에 관한 연구로 구분할 수 있다. 먼저, 유동인구의 특성은 기본적으로 정주인구와의 차이점을 부각하는 데 있다[9~11].
둘째, 유동인구 측정과 관련된 연구는 최근 발전한 통신, 센서 등과 연결되어 있다. 국외의 사례를 보면, 센서스(census) 자료를 이용하거나 현장조사, 센서 등 다양한 방법으로 유동인구를 측정하여 연구들을 진행하고 있다[1,3,12,13]. 국내에서도 국외와 비슷하게 국가 또는 통신사에서 제공하는 유동인구 자료를 이용하거나 또는 현장조사, 센서 등 다양한 방법으로 유동인구를 측정하여 연구들을 진행하고 있다[6,9,14,15].
마지막으로 유동인구와 관련된 가장 많은 연구는 유동인구의 영향을 주는 다양한 요인들을 파악하는 것과 아울러 그 요인들의 변화에 따라 유동인구의 변화를 추정하는 경우들을 포함한다[3,5,12,16~19]. 예를 들어, Lee, Yoo, Seo (2020)는 다양한 토지이용을 고려하여 유동인구의 영향요인을 파악하였으며[14], Aziz (2018)는 거리디자인을 통해 유동인구의 영향요인을 파악하였다[18]. 지가와 유동인구를 상관분석한 연구도 있다[19].
2.2. MAUP (Modifiable Areal Unit Problem) 관련 선행연구 분석
MAUP는 ‘수정 가능한 공간 단위의 문제’로 해석되는 것으로, 격자, 행정경계 등 공간단위로 공간을 분석할 때 발생하는 통계적 편향 문제이다. 이 문제는 Gehlke, Biehl (1934)가 처음으로 제기하였다[20]. Openshaw (1984)는 MAUP가 규모 효과(Scale Effect)와 구역 효과(Zoning Effect)라는 2가지 문제로 이루어져 있음을 확인하였다[7].
Openshaw (1984)가 제기한 규모 효과와 구역 효과는 다음과 같은 특징을 갖는다[7]. 먼저, 규모 효과는 상이한 공간 단위를 적용하여 분석을 수행할 때 분석결과가 변화하는 것을 의미한다. 반면, 구역효과는 공간 단위는 같으나, 구획방식에 따라 속성값이 변화하고 분석결과가 달라지는 것을 나타낸다[21]. Nelson, Brewer (2017)은 MAUP의 특성을 이해하는 것이 집계 데이터의 분석에 있어 매우 중요하다고 언급한 바 있다[22]. Dong et al. (2017)도 격자 기반 인구 분포를 정도있게 파악하기 위해서는 적절한 격자 크기의 사용 즉, MAUP가 중요하다고 언급하였다[23].
본 연구의 목적인 적절한 공간 분석단위를 파악하는 것은 MAUP와도 밀접한 관련이 있다. 본 연구에서 적절한 공간 분석단위를 파악하는 데에 사용된 집계 데이터는 유동인구와 상업용도 연면적 데이터이다. 이 자료 모두 MAUP의 규모 효과 및 구역 효과와 관련이 있다. 본 연구에서는 이 중 규모 효과에 집중하고 있다.
2.3. 공간 분석단위 관련 선행연구 및 연구의 차별성
유동인구의 공간 분석단위 관련해서는 거리, 반경, 그리드, 격자망 등 다양한 어휘가 혼용되어 사용되고 있지만, 그 기준 역시 명확하지 않다. 본 연구에서는 공간 분석단위를 그리드 크기, 격자 크기 또는 반경 등의 용어를 대표하여 사용하고자 한다. 먼저 유동인구 관련 연구에서 그리드 크기, 격자 크기 또는 반경 등의 용어를 사용한 연구를 조사하였다(Table 2.). 예를 들어, 채한희, 이경환(2023)은 역세권에서 500m를 기준으로 유동인구와 보행량을 분석하였다[24]. Eom, Suzuki (2019), 하재현, 이수기(2017)도 500m를 기준으로 연구를 진행하였으며[25,26], 이건원(2016), 이정우, 김혜영, 전철민(2015), 윤정미, 최돈정(2015)은 페리(C.A. Perry)의 근린주구론에 따른 보행적정반경인 400m와 그에 준하는 500m를 기준으로 연구를 진행하였다[27~29]. 반면, Su, Chen, Cheng (2022), 김은정, 안동혁(2019), 최돈정, 박정환(2018), 윤나영, 최창규(2013)는 국가표준 격자 크기인 100m 기준과 통신사 자료에서 제공하는 50m를 기준으로 연구를 진행하였다[4,30~32]. Woo et al. (2021), Lee, Yoo, Seo (2018)도 50m를 기준으로 연구를 진행하였다[14,33].
각각의 연구들은 역세권(500m), 페리의 근린주구론(400m), 국가표준 그리드(100m)라는 기준으로 연구를 진행하였지만, 적용된 공간 분석단위가 유동인구와 관련된 해당 연구에 모두 적절한 것인지는 판단하기 어렵다. 이에 본 연구에서는 다양한 공간 분석단위를 적용하여 구축한 유동인구 및 상업지역 연면적 자료를 분석하여 해당 연구에 최적인 공간 분석단위를 선정해 보고자 한다. 본 연구에서는 특히, 기존에 다루어지지 않았던 200m의 공간 분석단위를 추가하여 총 5개(50m, 100m, 200m, 400m, 500m)의 공간 분석단위를 고려하였다.
3. 연구 방법
3.1. 분석 대상지
본 연구의 대상지는 종로구 서촌 일대 즉, 청운효자동과 사직동 일대이다(Fig. 1.). 대상지 범위 인근에 문화재가 위치하며, 주거, 상업 등이 혼재되어 나타난다는 특징이 있다(Fig. 2.). 특히, 본 연구의 대상지에 포함되어 있는 서촌은 경복궁의 서측에 위치하며 서울의 한옥이 밀집되어 있는 지역으로, 관광지의 역할도 하고 있다. 이러한 지역적 특징은 유동인구 분석에 적합하며, 특히 본 연구에서는 이 지역의 유동인구 및 관련 분석을 위한 적정 공간 분석단위를 파악해보고자 하였다. 본 연구에서는 대상지를 격자화하여 연구의 범위로 설정하였다(Fig. 3.).
3.2. 변수 및 자료
본 연구에서는 유동인구 자료와 상업용도 연면적 자료를 이용하였다(Table 3.). 유동인구 자료는 SKT 통신사 접속자를 바탕으로 한 추정 자료이다. 월 단위로 누계되어 있으며, 50×50m의 격자로 구분되어 있다. 상업용도 연면적 자료는 국토교통부에서 제공하는 건축데이터 민간개방 시스템(http://open.eais.go.kr/)에서 추출하였으며, 포인트 자료이다. 이 포인트 자료를 유동인구 자료 구조에 일치시키기 위해 50×50m 격자 자료로 변환하였다.
유동인구 자료는 계절적 변동이 크며, 상업용도 연면적 자료는 변동이 거의 없다. 본 연구에서는 가용한 자료 중 유동인구가 많은 2019년 6월 자료를 이용하였다. 상업용도 연면적 자료는 건축데이터 민간개방 시스템의 자료를 이용하였다. 이 자료는 2022년에 조사되어 2023년 9월에 공개된 자료이다. 코로나 기간 동안 상업용도 연면적의 증가가 크게 없어 자료 사용에 큰 문제는 없는 것으로 판단하였다.
Table 4.는 자료의 기술통계표로, 유동인구 자료와 상업용도 연면적 자료의 특성을 나타낸다. 유동인구 자료와 상업용도 연면적 자료의 통계치는 공간 분석단위 증가에 따라 유사하게 변하는 경향을 띠고 있다. 특이하게, 평균과 표준편차는 200×200m 공간 분석단위부터 급격히 증가하는 경향을 보인다. 두 자료 모두 오른쪽으로 꼬리가 긴 양의 왜도를 보여주고 있으며, 첨도의 경우에는 공간 분석단위가 커질수록 완화되어 정규분포에 가까워지는 경향을 보여주고 있다.
본 연구에서는 유동인구 분석에 적절한 공간 분석단위를 파악하는 것이 목적이므로, 기 구축된 50×50m 자료를 가지고 추가로 100×100m, 200×200m, 400×400m, 500×500m 자료로 구축하였다. 분석의 용의성을 고려하여 정배수 단위의 격자만을 기준으로 하였다. 이렇게 구축된 총 5가지의 자료를 가지고 이후의 분석을 수행하였다. 공간 분석단위 5가지의 자료를 비교하면 Fig. 4.와 같다. Fig. 4.에서 확인할 수 있는 것처럼 공간 분석단위가 증가함에 따라 자료의 평활화(smoothing) 정도가 커지는데, 원래 자료의 세부 정보가 희석되는 경향이 보인다.
3.3. 분석방법
본 연구에서는 분석방법으로는 히스토그램, 공간자기상관분석, 상관분석, 회귀분석을 사용하였다. 유동인구와 상업용도 연면적 데이터에는 각각 히스토그램과 공간자기상관분석을 진행하였다. 이후, 유동인구와 상업용도 연면적 데이터 간의 상관분석과 회귀분석을 진행하였다.
먼저, 히스토그램은 데이터의 빈도 분포를 시각화하여 그래프로 나타낸 것으로, 분포 정도, 중심, 구분적 특징 등을 확인하는데 유용하다(Fig. 5.). 히스토그램을 이용하여 자료의 평균, 표준편차 등이 어느 정도인지 파악할 수 있으며, 자료가 대칭인지 또는 비대칭인지를 확인할 수 있다. 또한, 자료의 왜곡도가 어느 정도인지 이상치가 있는지 등을 파악할 수 있다. 궁극적으로 히스토그램은 자료의 형태가 어떤 확률분포를 따르는 지를 나타낸다. 본 연구에서는 추가로 자료가 쌍봉(bi-modal)의 특징을 나타내는지를 파악하고자 한다. 쌍봉은 2개의 다른 특성의 자료가 혼합되어 있는 경우에 나타나는 현상이다. 반대로 자료가 단봉(uni-modal)인 경우에는 유사한 특성의 자료라고 판단할 수 있다.
공간자기상관분석은 연구의 공간적 범위에 대해 군집 정도를 분석할 수 있는 유용한 분석 방법이다[34]. 본 연구에서 사용한 공간자기상관분석 방법은 전역적 공간자기상관 지수 중 하나인 Moran’s I와 국지적 공간자기상관 지수 중 하나인 Local Moran’s I이다. 이 둘의 산출식은 Eq. 1과 Eq. 2와 같다. Moran’s I는 속성값 사이의 유사성을 측정하는 지수로, (–1)~(+1) 사이의 값을 가지며, (+1)은 공간 분포가 가장 군집 잘 이룸을, (-1)은 공간 분포가 가장 분산되어 있음을, 0은 공간 분포가 무작위적임을 의미한다. Local Moran’s I는 군집의 정도를 시각적으로 파악할 수 있게 한다. Fig. 6.은 Moran’s I 값에 따른 군집 정도를 비교한 것이다[35,36].
| (Eq. 1) |
| (Eq. 2) |
상관분석은 두 변수 사이의 선형적 관계를 설명하는 분석방법이다. 두 변수 간 관계의 강도를 상관관계라고 부르며, 상관계수를 이용하여 측정한다(Eq. 3). 또한, 상관계수의 유의성 확인 방법으로는 t-검증 방법이 일반적으로 사용된다.
| (Eq. 3) |
마지막으로, 유동인구와 상업용도 연면적 자료를 가지고 회귀분석을 수행하였다. 회귀분석은 두 변수 사이의 관계를 함수식으로 나타낸 것이다. 유도된 회귀식의 정도는 결정계수로 판단된다. 특히, 선형회귀식을 유도하는 경우에서 상관계수의 제곱이 결정계수가 된다.
4. 분석결과
4.1. 유동인구 자료
Fig. 7.은 공간 분석단위 50×50m부터 500×500m까지의 총 5가지 공간 분석단위에 대해 ‘0’을 표현한 전체 자료 및 ‘0’을 제거한 자료에 대한 히스토그램을 비교한 것이다. 추가로 ‘0’을 제거한 경우의 히스토그램은 그 특성 파악이 용이하도록 확대한 것이다. 히스토그램 분석의 목적은 유동인구 저밀도의 부분과 고밀도의 부분이 구분되어 나타나는 지를 확인하는 것이다. 분석결과 100×100m부터 저밀도, 고밀도의 구분적 특성이 나타나기 시작하고 200×200m부터는 뚜렷한 구분을 확인할 수 있었다. 이러한 특성은 ‘0’을 제거한 경우의 히스토그램에서 더욱 뚜렷하게 나타났다.
공간자기상관분석은 히스토그램과 동일한 5개의 경우에 대해 진행하였다. 이 경우에는 ‘0’을 제거하지 않고 원자료 그대로를 사용하였다. 공간자기상관분석 결과로 Table 5.와 같이 Moran’s I 값을 계산하였다. 이 값에 대한 유의성은 Z-score와 p-value를 이용하여 판단하였다. Table 5.에서 확인할 수 있는 것처럼 50×50m에서 군집이 제일 잘 이루어지는 특성을 확인할 수 있었다. 100×100m 및 200×200m에서도 0.6 이상의 Moran’s I 값을 보이나, 이후 작아지는 경향을 보였다. Fig. 8.은 Local Moran’s I를 나타낸 것으로 특정 지역과 주변 지역 간의 공간적 자기상관을 나타낸다. Moran’s I가 전체 지역의 변화를 나타내준다면, Local Moran’s I는 특정 부분을 시각화하여 나타내준다. Fig. 8.을 살펴보면, 전반적으로 해상도가 높아질수록 자료의 평활화가 진행됨을 확인할 수 있다. 특히, 대상지 중심지역에서 관측된 고밀도가 200×200m 해상도부터는 나타나지 않았다. 아울러, 더 낮은 해상도에서는 고밀도 지역이 대상지의 아랫부분으로 더욱 집중되어 나타난 것을 확인하였다. 이상과 같은 결과를 종합하면, 100×100m, 200×200m 해상도가 가장 적절한 것으로 판단된다.

Moran’s I values and related statistics of pedestrian traffic depending on the size of spatial units
4.2. 상업용도 연면적 자료
Fig. 9.는 유동인구 자료와 마찬가지로 공간 분석단위 50×50m부터 500×500m까지의 총 5가지 공간 분석단위에 대한 히스토그램을 비교한 것이다. 히스토그램분석 결과 상업용도 연면적 데이터는 유동인구 데이터와 유사한 특징을 가짐을 확인하였다. 0을 제거하지 않은 경우, 200×200m 해상도부터 저밀도와 고밀도의 구분적 특성이 모호하게 나타났지만, 0을 제거한 히스토그램과 이를 확대한 그래프에서는 100×100m 해상도에서 구분적 특징이 나타나기 시작하는 것을 확인할 수 있었다. 200×200m 해상도부터는 구분적 특성이 뚜렷하게 보인다.
공간자기상관분석 결과인 Table 6.을 살펴보면, Moran’s I 값이 100×100m 및 200×200m 해상도에서 0.5 이상으로 군집이 잘 이루어지고 있음을 확인할 수 있었다. 200×200m 해상도까지는 Moran’s I 값이 상승하다가 이후 감소하는 경향을 보인다. Fig. 10.에 나타낸 Local Moran’s I는 유동인구 자료에서와 마찬가지로 자료의 해상도가 높아질수록 자료의 평활화가 급격히 진행됨을 보여준다. 특히, 400×400m 해상도에서는 평활화가 과도하게 진행되었음을 확인할 수 있다. 이상과 같은 결과를 종합하면, 상업용도 연면적 자료의 경우에도 100×100m 또는 200×200m 해상도가 가장 적절한 공간 분석단위인 것으로 판단된다.

Change of Moran’s I values and related statistics of commercial floor area depending on the size of spatial units
4.3. 상관분석 및 회귀분석 결과
유동인구 자료와 상업용도 연면적 자료의 분석결과는 전반적으로 유사한 특징을 보인다. 히스토그램 분석 시에도 유동인구와 상업용도 연면적 자료 모두 100×100m 해상도부터 저밀도와 고밀도의 구분적 특징이 나타나기 시작하였다. 공간자기상관분석 시에는 유동인구는 100×100m, 상업용도 연면적 자료는 200×200m가 더 적합한 공간 분석단위라는 결과가 있었지만 이 역시 유사한 값을 보여준다. 현재까지의 결과들을 중첩해보면, 100×100m가 관련 자료 분석에 적절한 최소 공간 분석단위인 것으로 파악된다.
본 절에서는 이들 2개의 자료를 상관 및 회귀분석과 연결지어 해석하고, 그 결과를 통해 가장 적절한 공간 분석단위가 무엇인지를 탐색하였다. Table 7.은 각 경우의 상관계수를 비교한 것이다. 상관계수를 유동인구와 연면적 자료에서 ‘0’을 포함하는 경우와 그렇지 않은 경우로 나누어, 총 4개의 경우에 대해 추정하였다. 먼저, 이 4가지 경우 모두에서 상관계수는 유의한 것으로 나타났다. 그러나, 공간 분석단위가 커질수록 상관계수가 커지는 특성을 보여주고 있다. 이는 기본적으로 자료의 평활화 정도가 커짐에 따라 나타나는 자연스러운 현상이다.
보다 객관적인 판단을 위해 상관계수의 유의성 정도를 평가해 보았다. 상관계수의 유의성 검증 방법으로 t-검정을 활용하였다(Table 8.). t-검정은 상관계수 유의성 검증을 위한 보편적인 방법으로 t-검정통계량(t*)과 주어진 유의수준(5%)과 자유도(N-2)를 고려한 임계값 t_inv을 비교하여 (t* > t_inv)인 경우 유의성이 있다고 판단한다. t*가 상대적으로 클 경우에는 유의성이 커진다. 본 연구에서 고려한 경우에는 모두 t*값이 t_inv보다 크게 나타났으며, 따라서 모두 유의한 것으로 나타났다. 특히, 50×50m와 100×100m에서 유의성이 큰 것으로 나타났다.

T-test results for the correlation coefficient(N: sample size, t_inv: t_threshold, t*: t-test statistic)
마지막으로 유동인구와 상업용도 연면적 자료 간의 회귀분석을 통해 회귀식을 도출하였다. 회귀식은 y=a+bx 형태로 도출하였다. 그 결과는 Fig. 11., Table 9., Fig. 12.에 정리하였다. Table 9.에서 확인할 수 있는 것처럼, 결정계수는 50×50m에서 상당히 작고, 100×100m에서부터 크게 증가하는 경향을 보인다. 이는 앞서 수행한 상관분석과 비슷하게 자료의 평활화로 인한 것으로 판단된다.
Regression analysis between pedestrian traffic and commercial floor area data for spatial units of 100×100m and 200×200mNote: 1) Including ‘0’ values in the pedestrian traffic data; 2) Including ‘0’ values in the commercial floor area data
Variation of R2 depending on the size of spatial unitsNote: 1) Including ‘0’ values in the pedestrian traffic data; 2) Including ‘0’ values in the commercial floor area data
‘0’을 한 자료에만 포함하는 경우보다는 두 자료 모두에 포함하도록 하는 경우가 결정계수가 크고, 반대로 ‘0’을 모두 고려하는 경우보다는 모두 고려하지 않는 경우에서 결정계수가 크게 나타났다. 이와 같은 결과와 앞서 수행한 유동인구, 상업용도 연면적의 분석결과를 종합할 경우 공간 분석단위 100m가 관련 분석에 가장 적절한 것으로 파악되었다.
5. 결론
본 연구에서는 유동인구의 분석 및 그 영향평가를 위한 연구 및 조사에 적절한 공간 분석단위에 대해 살펴보았다. 본 연구에서는 사용가능한 유동인구의 최소 공간 분석단위로 50×50m를 설정하고, 이를 가지고 만들 수 있는 100×100m, 200×200m, 400×400m, 500×500m 등 다양한 공간 분석단위들에 대해 유동인구 자료를 구축하였다. 이 자료를 히스토그램, 공간자기상관분석을 통해 분석하여 적절한 공간 분석단위를 도출하였다. 추가로 상업용도 연면적 자료도 동일한 형태로 구축하고, 유동인구와의 상관분석 및 회귀분석을 수행하여 이 경우에도 앞서 설정한 공간 분석단위에 유의한지를 파악하였다.
본 연구의 주요 결과를 선행연구와 비교하여 살펴보면, 다음과 같다. 첫째, 히스토그램 분석 결과, 유동인구와 상업용도 연면적 자료 모두 100×100m 공간 분석단위부터 저밀도와 고밀도의 구분적 특징이 나타나기 시작했으며, 200×200m부터 그 특징이 뚜렷해짐을 확인하였다. 본 연구는 더 다양한 격자 크기의 공간 분석단위를 사용하여 결과를 얻었다는 점에서 의미가 있으며, 유동인구 분석에 필요한 공간 분석단위 최적 기준을 제시하였다는 점에서 시사하는 바가 크다.
둘째, 공간자기상관분석 결과 Moran’s I 값은 유동인구 자료의 경우 50×50m, 100×100m, 200×200m에서 0.6 이상의 큰 값을 보였고, 상업용도 연면적 자료의 경우에는 100×100m 및 200×200m에서 0.5 이상의 큰 값을 보였다. 본 연구결과는 상업용도 연면적 자료와 유동인구 자료를 연계하여 분석한 경우, 100×100m 또는 200×200m가 적절하다는 것을 보여주었다는 점에서 향후 분석에 주는 함의가 있다.
셋째, 유동인구와 상업용도 연면적 자료에서 ‘0’을 포함하는 경우와 포함하지 않는 경우 등 총 4가지 경우에 대해 상관분석을 진행하였다. 분석 결과 4가지 경우 모두에서 공간 분석단위의 증가에 따라 상관계수가 증가하는 경향을 확인할 수 있었다. 이는 자료의 평활화 때문에 나타나는 현상으로 판단된다. 추가로, 상관계수 유의성 정도를 평가하기 위해 t-검정을 활용하였다. t-검정 결과에서도 상관관계 분석 결과와 같이 ‘0’을 포함하는 경우와 포함하지 않는 모든 경우에서 유의한 것으로 도출되었다. 이러한 한계를 극복하기 위해 유동인구와 상업용도 연면적 자료 간의 회귀분석을 수행하고, 결정계수를 분석하였다. 결정계수는 공간 분석단위의 증가에 따라 증가하는 경향을 보였다. 그러나, 결정계수는 50×50m에서 상당히 작았고, 100×100m에서부터 크게 증가하는 경향을 보였다. 또한, ‘0’을 모두 고려하지 않은 경우의 결정계수가 고려된 경우보다 크게 나타났다. 이상과 같은 분석 결과는 공간 분석단위 100×100m가 유동인구 관련 분석에 가장 적절한 것임을 나타낸다. 더 큰 공간 분석단위를 고려하는 경우에는 200×200m의 공간 분석단위도 나쁘지 않은 선택이지만, 평활화에 따른 정보 손실의 가능성을 고려해야 한다.
본 연구의 시사점 및 의의는 다음과 같다. 첫째, 기존의 연구들에서는 공간적 단위를 자의적으로 설정하는 경우가 많았으나, 본 연구에서는 다양한 통계적 방법을 통해 적절한 공간 단위를 체계적으로 도출하였다. 둘째, 본 연구에서는 100×100m가 유동인구 분석을 위한 가장 적절한 공간적 규모임을 확인하였다. 이는 실무적으로 도시계획의 공간적 분석이나 유동인구 예측 모형 구축 시 최적의 해상도를 제시했다는 점에서 실질적 의의가 있다. 셋째, 200×200m 공간 분석단위도 현실적으로 적절히 활용할 수 있으나, 이때에는 자료의 평활화에 따른 정보손실을 신중히 고려해야 한다는 중요한 실무적 시사점을 제공하였다. 넷째, 자료에서 ‘0’ 값 포함 여부가 분석 결과에 미치는 영향을 함께 제시함으로써 분석 자료의 특성을 명확히 이해하고 자료 전처리에 대한 명확한 기준을 제시할 수 있다는 데 의미가 있다.
그러나, 본 연구에는 다음과 같은 한계가 있다. 첫째, 본 연구에서 설정한 공간 분석단위는 50×50m 단위의 정배수로만 설정되었으나, 보다 세부적이고 다양한 단위의 공간적 스케일(예: 150×150m 등)에 대한 추가적 분석이 이루어지지 않은 한계가 있다. 향후 연구에서는 더 세부적이고 다양한 공간적 단위에 대한 평가가 요구된다. 둘째, 유동인구 및 상업용도 연면적 외에 도시 기능이나 시설 유형과 같은 다른 변수들을 함께 분석하지 않아, 공간 분석단위 설정에 있어 다차원적 요인의 영향이 충분히 반영되지 않은 한계가 있다. 향후에는 도시기능의 다양성, 시설 특성, 교통 접근성 등의 추가 변수를 포함한 보다 포괄적인 분석이 필요해 보인다. 셋째, 사용된 자료의 수집 시기의 차이가 있다는 한계가 있다. 비록 코로나 기간 전후라는 특수성으로 인해 상업지역 연면적의 증가가 미미할 것이라는 가정을 하였지만, 자료간 시간적 불일치로 인해 분석결과 및 그 해석에 오차가 포함될 수 있다는 것을 부인하기는 어렵다. 추후 연구에서는 이런 점을 유의하여, 특히 자료 수집 시기의 차이가 없도록 하는 것이 필요해 보인다.
References
-
X. Wang et al., Predicting the city foot traffic with pedestrian sensor data, Conference of the 14th EAI International Conference on Mobile and Ubiquitous Systems (MobiQuitous 2017), ACM, 2017, pp.1-10.
[https://doi.org/10.1145/3144457.3152355]
-
W.K. Lee, S.Y. Sohn, J. Heo, Utilizing mobile phone-based floating population data to measure the spatial accessibility to public transit, Applied Geography, 92, 2018, pp.123-130.
[https://doi.org/10.1016/j.apgeog.2018.02.003]
-
S. Islam et al., Spatiotemporal prediction of foot traffic, Conference of the 5th ACM SIGSPATIAL International Workshop on Location-based Recommendations, Geosocial Networks and Geoadvertising (LocalRec '21), ACM, 2021, pp.1-8.
[https://doi.org/10.1145/3486183.3490997]
-
H. Su, W. Chen, M. Cheng, Using the variable two-step floating catchment area method to measure the potential spatial accessibility of urban emergency shelters, GeoJournal, 87, 2022, pp.2625-2639.
[https://doi.org/10.1007/s10708-021-10389-3]
- H.W. Shin, Y.O. Kim, A.H. Kim, A study on the correlation between pedestrian network and pedestrian volume according to land use pattern, Conference of the 6th International Space Syntax Symposium, 2007.
-
H.N. Im, C.G. Choi, Measuring pedestrian volume by land use mix: Presenting a new entropy-based index by weighting walking generation units, Environment and Planning B: Urban Analytics and City Science, 47(7), 2019, pp.1219-1236.
[https://doi.org/10.1177/2399808318824112]
- S. Openshaw, The modifiable areal unit problem, CATMOG: Concepts and techniques in modern geography, 38, Institute of British Geographers, 1984.
-
하혜영, 류영아, 새로운 인구개념인 “생활인구”의 의미와 향후 과제, 이슈와 논점, 2013호, 국회입법조사처, 2022.
H.Y. Ha, Y.A. Ryu, The meaning and future challenges of “living population” as a new demographic concept, Issues and Perspectives, No. 2013, National Assembly Research Services, 2022. -
변미리, 서우석, 도시 거리의 주간활동인구 측정과 해석: 서울시 유동인구 조사 사례, 조사연구, 제12권 제2호, 2011, pp.27-50.
M.R. Byun, U.S. Seo, How to measure daytime population in urban streets?: Case of Seoul pedestrian flow survey, Survey Research, 12(2), 2011, pp.27-50. -
W. Qi et al., Modeling the spatial distribution of urban population during the daytime and at night based on land use: A case study in Beijing, China, Journal of Geographical Sciences, 25(6), 2015, pp.756-768.
[https://doi.org/10.1007/s11442-015-1200-0]
-
N. Mileu, M. Queiros, Nighttime and daytime population estimation from open data, Geographia Technica, 17(2), 2022, pp.179-192.
[https://doi.org/10.21163/GT_2022.172.15]
-
J. Behnam, B.G. Patel, Pedestrian volume estimation by land-use variables, Transportation Engineering Journal of ASCE, 103(4), 1977, pp.507-520.
[https://doi.org/10.1061/TPEJAN.0000649]
-
G. Dobler, J. Vani, T.T.L. Dam, Patterns of urban foot traffic dynamics, Computers, Environment and Urban Systems, 89, 2021, 101674.
[https://doi.org/10.1016/j.compenvurbsys.2021.101674]
-
S.G. Lee, C.S. Yoo, K.W. Seo, Determinant factors of pedestrian volume in different land-use zones: Combining space syntax metrics with GIS-based built-environment measures, Sustainability, 12(20), 2020, pp.1-15.
[https://doi.org/10.3390/su12208647]
-
이주영, 박헌진, 유동인구를 활용한 ConvLSTM AutoEncoder 기반 핫플레이스 탐지, 한국빅데이터학회지, 제8권 제2호, 2023, pp.97-107.
J.Y. Lee, H.J. Park, Hot place detection based on ConvLSTM AutoEncoder using foot traffic data, The Korea Journal of BigData, 8(2), 2023, pp.97-107. - A. Ozbil, D. Yesiltepe, G. Argin, Modeling walkability: The effects of street design, street-network configuration and land-use on pedestrian movement, A/Z ITU Journal of Faculty of Architecture, 12(3), 2015, pp.189-207.
-
장진영 외 4인, 토지이용유형별 보행량 영향 요인 비교‧분석: 서울시 유동인구 조사자료를 바탕으로, 한국ITS학회 논문지, 제14권 제2호, 2015, pp.39-53.
J.Y. Jang et al., A comparison analysis of factors to affect pedestrian volumes by land-use type using Seoul pedestrian survey data, Journal of Korean Society of Intelligent Transport Systems, 14(2), 2015, pp.39-53. [ https://doi.org/10.12815/kits.2015.14.2.039 ]
-
N. Aziz, Land-use, street configuration and pedestrian volume: The case of a historic town, Mymensingh, Bangladesh, Nakhara, Journal of Environmental Design and Planning, 15(1), 2018, pp.137-154.
[https://doi.org/10.54028/NJ201815137154]
-
C. Lee, The relationship between foot traffic and commercial land prices, Geografie, 129(1), 2024, pp.1-13.
[https://doi.org/10.37040/geografie.2024.005]
-
C.E. Gehlke, K. Biehl, Certain effects of grouping upon the size of the correlation coefficient in census tract material, Journal of the American Statistical Association, 29(185), 1934, pp.169-170.
[https://doi.org/10.1080/01621459.1934.10506247]
-
최돈정, 서용철, 장수 인구의 분포 패턴에 관한 탐색적 공간 데이터 분석과 수정 가능한 공간단위 문제(MAUP)의 Scale Effect에 관한 연구, 한국지리정보학회지, 제16권 제3호, 2013, pp.40-53.
D.J. Choi, Y.C. Suh, A study on the exploratory spatial data analysis of the distribution of longevity population and the scale effect of the modifiable areal unit problem (MAUP), Journal of the Korean Association of Geographic Information Studies, 16(3), 2013, pp.40-53. [ https://doi.org/10.11108/kagis.2013.16.3.040 ]
-
J.K. Nelson, C.A. Brewer, Evaluating data stability in aggregation structures across spatial scales: Revisiting the modifiable areal unit problem, Cartography and Geographic Information Science, 44(1), 2017, pp.35-50.
[https://doi.org/10.1080/15230406.2015.1093431]
-
N. Dong et al., Research on grid size suitability of gridded population distribution in urban area: A case study in urban area of Xuanzhou district, China, PLoS ONE, 12(1), 2017, e0170830.
[https://doi.org/10.1371/journal.pone.0170830]
-
채한희, 이경환, 상업지역 유동인구에 영향을 미치는 도시공간구조 및 물리적 환경특성 분석: 서울 도심부 상업지역을 대상으로, 대한건축학회 논문집, 제39권 제8호, 2023, pp.165-173.
H.H. Chae, K.H. Lee, Examining the impact of urban spatial structure and physical environment on the floating population in commercial zones, Journal of the Architectural Institute of Korea, 39(8), 2023, pp.165-173. -
S.Y. Eom, T. Suzuki, Spatial distribution of pedestrian space in central Tokyo, International Review for Spatial Planning and Sustainable Development, 7(2), 2019, pp.108-124.
[https://doi.org/10.14246/irspsda.7.2_108]
-
하재현, 이수기, 보행자 경로안내 API 정보를 활용한 대중교통 접근성 영향요인 분석 - 서울시 지하철역 보행 접근성을 중심으로 -, 국토계획, 제52권 제3호, 2017, pp.155-170.
J.H. Ha, S.G. Lee, Analysis of influential factors to public transportation accessibility using pedestrian route guide API information service - Focused on walking accessibility to subway station in Seoul, Korea -, Journal of Korea Planning Association, 52(3), 2017, pp.155-170. [ https://doi.org/10.17208/jkpa.2017.06.52.3.155 ]
-
이건원, 미시공간에서 도시‧건축형태요소가 보행량에 미치는 영향, 한국산학기술학회논문지, 제7권 제10호, 2016, pp.310-318.
G.W. Lee, The effect of the urban and architectural form factors on pedestrian volume, Journal of the Korea Academia Industrial Cooperation Society, 7(10), 2016, pp.310-318. [ https://doi.org/10.5762/KAIS.2016.17.10.310 ]
-
이정우, 김혜영, 전철민, 가로유형별 물리적 환경특성과 보행량간의 연관성 분석, 도시설계학회지, 제16권 제2호, 2015, pp.123-140.
J.W. Lee, H.Y. Kim, C.M. Jun, Analysis of physical environmental factors that affect pedestrian volumes by street type, Journal of the Urban Design Institute of Korea, 16(2), 2015, pp.123-140. -
윤정미, 최돈정, 서울시 유동인구 분포의 공간 패턴과 토지이용 특성에 관한 지리가중회귀분석, 한국지형공간정보학회지, 제23권 제3호, 2015, pp.77-84.
J.M. Yun, D.J. Choi, Geographically weighted regression on the characteristics of land use and spatial patterns of floating population in Seoul City, Journal of Korean Society for Geospatial Information Science, 23(3), 2015, pp.77-84. [ https://doi.org/10.7319/kogsis.2015.23.3.077 ]
-
김은정, 안동혁, 보행친화도 검색 시스템 개발, 예술인문사회 융합 멀티미디어 논문지, 제9권 제12호, 2019, pp.987-997.
E.J. Kim, D.H. An, Development of walkability search system, Asia-Pacific Journal of Multimedia Services Convergent with Art, Humanities, and Sociology, 9(12), 2019, pp.987-997. [ https://doi.org/10.35873/ajmahs.2019.9.12.087 ]
-
최돈정, 박정환, 소상공인 입지특성과 유동인구의 공간적 상관성에 관한 그리드 기반 연구: 천안‧아산시를 사례로, 2018 한국지역지리학회 학술대회 발표논문, 2018, pp.46-47.
D.J. Choi, J.H. Park, A grid-based study on the spatial correlation between small business location characteristics and floating population: The case of Cheonan and Asan, Conference of the 2018 Annual Korean Association of Regional Geographers, 2018, pp.46-47. -
윤나영, 최창규, 서울시 상업가로 보행량과 보행 환경 요인의 관련성 실증 분석, 국토계획, 제38권 제4호, 2013, pp.135-150.
N.Y. Yun, C.G. Choi, Relationship between pedestrian volume and pedestrian environmental factors on the commercial streets in Seoul, Journal of Korea Planning Association, 38(4), 2013, pp.135-150. -
S.O. Woo et al., Optimal cooling shelter assignment during heat waves using real-time mobile-based floating population data, Urban Climate, 38, 2021, 100874.
[https://doi.org/10.1016/j.uclim.2021.100874]
-
임현철, 박윤환, 우리나라 지역안전의 공간적 패턴에 대한 연구, 지방정부연구, 제21권 제3호, 2017, pp.385-407.
H.C. Lim, Y.H. Park, A study on the spatial pattern of regional safety in Korea, The Korean Journal of Local Government Studies, 21(3), 2017, pp.385-407. [ https://doi.org/10.20484/klog.21.3.15 ]
- S.I. Lee, Spatial association measures for an ESDA-GIS framework: Developments, significance tests, and applications to spatio-temporal income dynamics of United States labor market areas, Doctoral dissertation, The Ohio State University, 2001.
-
S.I. Lee, Developing a bivariate spatial association measure: An Integration of Pearson’s r and Moran’s I, Journal of Geographical Systems, 3, 2001, pp.369-385.
[https://doi.org/10.1007/s101090100064]









