본 연구에서는 통계지리정보서비스(SGIS)에서 제공하는 빈도표에 대하여 비밀보호 알고리즘이 적용되는 방법을 설명하였다. 해당 자료의 빈도표는 위계 구조를 가지고 있어 이를 기저 빈도표와 상위 빈도표로 구분하였다. 기저 빈도표에서는 랜덤 라운딩을 적용하고, 상위 빈도표에서는 중앙값 조정과 추가적인 조치를 통해 노출 위험을 제어할 수 있음을 예시를 활용하여 설명하였다. 또한 2018년 인구주택총조사 자료 중 대전 지역에 해당하는 자료에 비밀보호 알고리즘을 적용하여 빈도표를 생성하는데 소요되는 시간을 행정 구역과 격자 단위 자료로 구분하여 정리하였다.
다음으로 비밀보호 알고리즘 적용에 따른 빈도의 분포 변화를 행정 단위 및 격자 단위 빈도표로 나누어 검토하였다. 알고리즘 적용 후 기저 빈도표에서는 빈도가 1 또는 2인 셀의 비율이 없어지고, 대신 빈도가 0 또는 3인 셀의 비율이 증가하였다. 반면 상위 빈도표에서는 빈도가 3인 셀의 비율이 최대 11.2%p 증가하였고, 빈도가 4 이상인 셀의 비율은 5%p 내외로만 변화되어 알고리즘 적용 전과 상당히 유사한 분포를 보였다.
한편 알고리즘 적용으로 인한 정보손실은 필연적으로 발생하게 되는데, 그 범위는 3 이내임을 확인하였다. 특히 기저 빈도표에 가까운 형태일수록 정보손실이 발생하지 않을 확률이 높았다. 상위 빈도표에서는 정보손실이 1만큼 발생하는 경우가 가장 많았고, 최대 3만큼의 정보손실이 발생하는 셀 비율은 전체적으로 0.5%를 넘지 않는 것을 확인하였다.
따라서 이러한 정보손실을 빈도표에서의 노출 위험 제어를 위한 기회비용에 해당하는 것으로 이해할 수 있다면, 사용자에게 현행 SGIS의 자료 제공 방식에 비해 보다 많은 정보가 담겨있는 빈도표를 제공할 수 있을 것으로 기대된다.