<aside> 📌 주요 역할
인천광역시 빅데이터 팀에서 무단 투기 민원 증가에 따른 정책 수립을 위해 예측 분석 모델을 제작하고, 위험 지역 7곳을 선정했습니다.
2018년 대비 2019년 인천광역시 미추홀 구의 무단 투기 민원/단속 건수는 6054 건에서 13701 건으로 약 226% 증가했습니다. 2020년 COVID-19 발생과 배달 음식 증가 등이 맞물려 시 전체 폐기물 양 또한 증가해 무단 투기 문제가 더 심화될 것으로 예상되었습니다. 이에 인천시 빅데이터 팀은 정책 수립 지원을 위해 정량, 정성 데이터를 종합해 무단투기 현황 및 예측 분석을 실시했습니다.
수기를 포함한 시 전체 무단 투기 민원 데이터와 구별 주요 단속 지역, 기존 단속 CCTV 설치 지역 등을 종합해 하나의 데이터 베이스를 형성하고, 이를 바탕으로 구별 현황을 라인과 히트맵으로 제작했습니다. 이때 소득, 인구 밀도, 무단 투기 민원 건수 등을 기준으로 군집 분석을 수행해 구별 특성을 파악하면서 분석 대상을 미추홀구와 남동구로 구체화했습니다.
무단 투기 예상 지역 모델링은 종속, 독립 변수 설정, 회귀 분석 및 통계적 유의성 판단을 통한 모델링 순서로 이어졌습니다. 무단 투기 행위 자체를 특정할 수 없기 때문에 민원, 단속 CCTV 설치 대수를 종속 변수로 설정했습니다. 상관 계수가 상위 10개 변수를 중심으로 단계적 선택법으로 독립 변수를 선택했고, statsmodels.ols 라이브러리를 활용해 R-squared값으로 설명력 뿐 아니라, p-value로 통계적 유의성, 잔차 그림을 통해 등분산성, Q-Q plot으로 정규성, Durbin-Watson 검정으로 독립성을 확인했습니다.
모델링 결과를 바탕으로 각 변수의 지수를 산정하고, 이를 QGIS 상 미추홀구와 남동구 100m 격자 지도에 적용해 히트맵으로 시각화했습니다. 이후 답사를 통해 특히 점수가 높고, 발생 위험이 존재하는 7개 지역을 선정했습니다.
[ 문제💢 ]
2018년 대비 2019년 무단 투기 민원 증가
[ 액션⚡ ]
데이터 수집 및 전처리
현황 시각화
분석 대상 구체화: 군집 분석
변수 설정
종속: 민원 수, 단속 CCTV 설치 대 수
독립: 단계적 선택법**,** 회귀 분석→통계적 유의성 판단
무단 투기 예상 지역 회귀 모델링
통계적 유의성 판단: p-value, VIF
QGIS 100m 격자 시각화
[ 결과😮 ]
남동구, 미추홀구 무단 투기 취약 지역 선정

무단투기 단속 CCTV 지수 산출 격자