
1. 통계 데이터 분류
숙박업 관련 통계 자료들은 집계 범위에 따라 전수조사 자료와 표본조사 자료로 구분될 수 있습니다.
표본조사의 경우, 표본에 대한 현황은 비교적 정확하게 반영되어 있겠지만, 표본이 대상 집단 전체의 대표성을 갖지 못하는 경우가 많습니다. 다만, 소요 비용과 기간의 측면에서 효율적이기 때문에 널리 사용되고 있습니다.
전수조사의 경우, 대상 집단 전체의 대표성 측면에서 표본조사의 한계가 해소되지만, 막대한 소요 비용과 기간으로, 집계 대상과 빈도가 제한될 수밖에 없습니다.
한편, 숙박업 관련 통계 자료들은 집계 방식에 따라 설문조사 자료와 기록조회 자료로 구분될 수 있습니다.
설문조사의 경우, 응답 여부를 응답자가 선택하기 때문에 자료 수집 및 활용에 제한이 없는 반면, 정보 부족 또는 고의로 잘못된 대답이 제출되는 경우가 빈번하여 데이터의 오염이 불가피합니다.
기록조회의 경우, 데이터 오염 우려가 낮은 반면, 기록의 종류에 따라 수집 및 활용이 제한될 수 있습니다.
2. 케이스 스터디
3. 데이터 가공 절차
로빈컴퍼니는 통계를 직접 집계하는 것이 아니라 집계된 여러 통계 자료들을 수집, 조정, 취합하여 사용합니다. 로빈컴퍼니가 통계 자료들을 수집, 조정, 취합하는 과정은 크게 3 단계로 요약될 수 있습니다.
- 데이터 항목별 시퀀스 및 상관관계를 설정합니다. 시퀀스 및 상관관계 알고리즘은 국제적으로 통용되는 숙박업 관련 지표들의 계산식을 기준으로 합니다.
- 각 항목별로 관련 통계 데이터들을 수집합니다. 항목에 따라 시장 단위 또는 개별 숙박업소 단위 데이터가 수집되어 시퀀스 및 상관관계 알고리즘에 입력됩니다.
- 인접 시퀀스의 결과값과 상호검증을 반복하여 데이터들을 조정 및 취합합니다. 상호검증은 직전 회차 결과값과의 차이가 목표 허용오차 이하로 되면 멈춥니다.
이를 통해 다양한 통계 데이터의 속성들을 모두 포착하는 동시에 각각의 오염을 제거함으로써, 통계 데이터의 실무적 활용성을 확보하고 우리나라 숙박시장에 대한 온전한 가시성을 제공합니다.