요약
사 통계자료에서 무응답이 대량으로 발생하는 경우, 이는 통계 신뢰도 하락의 주요 원인이 될 수 있다. 경제활동인구조사에서 무응답률이 최근 9%를 상회하는 것으로 나타나, 이를 보완할 방안을 선제적으로 연구할 필요성이 있다. 이를 위해 본 연구에서는 우선 미국의 대규모 조사자료 NHANES의 무응답 대체 사례를 분석하고, 관련 통계 방법론들을 검토하였다. 조사 대상 가구의 불응에 따른 단위 무응답 문제를 항목 무응답 문제로 전환하기 위하여, 2개 명부 자료와 조사응답자료 36개월 분량을 연계하는 방안을 제안하였다. 이어 우리나라 경제활동인구조사 자료의 무응답 구조를 분석하고, 해외 사례에서 이용된 다중대체 기법을 적용하였다. 다중대체 기본모형 구축을 위하여 우리나라 경제활동인구조사에 해당하는 미국 CPS의 재현자료 생성 모형을 벤치마킹하였다. 먼저 무응답 편향이 없다는 가정하에 모의실험을 실시하고, 다음으로 실업자의 무응답률을 변화시켜가며 모의실험을 실시하였다. 대체결과에서 편의를 축소하기 위하여 변수선택과 다양한 모형 적용 등의 모의실험을 추가하여 수행하였다. 마지막으로 모의실험에서 실시한 시나리오를 실제 무응답이 발생한 경제활동인구조사 자료에 적용하여 그 결과를 제시하였다.
본 연구에서는 자료연계, 해외사례 벤치마킹, 다중대체 모의실험 및 실제 조사 자료에 대한 다중대체 결과 도출 등을 모두 수행하였으며, 설명변수로 사용할 주요한 보조 정보를 보강할 수 있다면 효율적인 대체 결과를 도출할 수 있도록다양한 방안을 제안하였다. 한편, 본 연구 과제를 통해 습득한 조사표 구조를 반영한 다중대체 방식은 향후 데이터 정보보호(data privacy)를 위한 베이지안 재현자료 생성에 기술적인 노하우로 활용될 수 있다.