데이터 > 데이터 프로세싱
데이터 프로세싱
숙박업소 유형이 다변화되고 숙박시장의 변동성은 증가하고 있지만, 정보의 비대칭 심화로 리스크는 가중되고 있습니다. 이처럼 불확실성이 높은 시장에 대응하는 가장 효과적인 방법은 최대한의 선택지를 확보하는 것입니다. 그리고, 데이터는 이러한 선택지를 가장 효율적으로 발굴할 수 있는 수단입니다.
1. 데이터의 의의
로빈의 포괄적 숙박업 데이터베이스는 변동성이 큰 숙박시장에서 개별 숙박업소들이 데이터에 기반하여 리스크에 효과적으로 대응하도록 하는 데 목적이 있습니다. 역동적으로 변화하는 숙박시장에서 데이터는 다음과 같은 의의를 갖습니다.
- 숙박시장에서는 비탄력적 공급과 탄력적 수요의 비대칭으로 현금흐름의 장단기 변동성이 두드러지게 나타납니다. 이러한 변동성에 효과적으로 대응하기 위해서는 시장 전체를 포괄적으로 조망할 수 있는 데이터가 필요합니다.
- 숙박업소 유형이 다변화되면서, 경쟁은 더 이상 숙박업소 유형에 국한되지 않습니다. 즉, 다른 유형의 숙박업소들이 같은 수요를 두고 경쟁하는 경우가 늘고 있으며, 시장 전체에 대한 포괄적 조망은 더욱 중요해지고 있습니다.
2. 데이터의 수집
로빈의 포괄적 숙박업 데이터베이스는 가용 실제 데이터에 기반을 두고 있습니다. 즉, 우리나라 숙박시장과 관련하여 수집 및 활용이 가능한 국내외 통계 데이터가 데이터베이스의 중추를 구성합니다. 여기에는 다음의 통계 데이터가 포함됩니다.
구분
원본
공급
시설
건축물대장정보, 건축인허가정보, 부동산 등기부등본
업체
사업자등록정보
업소
숙박업 등록현황, 관광숙박업 등록현황, 농어촌민박업 등록현황, 도시민박업 등록현황
수요
내수
국민여행조사 (2005-), 호텔업 운영현황 (2005-)
외수
외래관광객조사 (2005-), 호텔업 운영현황 (2005-)
재무
매출
경제총조사 (MDIS, 2010, 2015), 서비스업총조사 (MDIS, 2005), 호텔업 운영현황 (2005-)
손익
경제총조사 (MDIS, 2010, 2015), 서비스업총조사 (MDIS, 2005), 기업경영분석 (2005-)
기타
서비스업총조사 (MDIS, 2005), 기업경영분석 (2005-), 관광경영실적통계 (2005-2009)
3. 데이터의 가공
그러나, 다양한 가용 실제 데이터간의 범위와 형식에 차이가 있기 때문에, 일관된 기준에 따라 가공하여 사용합니다. 목적은 숙박사업 경영 및 숙박시설 투자 관련 의사결정에 데이터가 활용되도록 하는 것으로, 다음과 같은 원칙에 근거합니다.
- 숙박시장 전체에 대한 온전한 가시성 확보를 목표로 합니다. 다양한 유형의 숙박업소들이 함께 경쟁하는 반면, 가용 데이터 불균형으로 경쟁환경의 가시성은 제한적입니다. 로빈은 숙박시장의 사각지대를 메워가고자 합니다.
- 숙박시장의 장기간 변화에 대한 가시성 확보를 목표로 합니다. 갈수록 확대되는 불확실성 해소에 있어 가장 확실한 단서는 과거의 변동성 패턴입니다. 로빈은 장기간 시계열 패턴을 정밀하게 분석하여 불확실성을 해소합니다.
- 숙박업 가치사슬 전체를 관통하는 데이터를 기준으로 합니다. 숙박업의 현금흐름 변동성에 대응하기 위해서는 빈틈없는 재무관리 체계가 필요합니다. 로빈은 매출은 물론, 운영비용 및 재무상태 데이터를 일괄 제공합니다.
- 숙박업소 단위 데이터를 기준으로 합니다. 숙박시장 데이터는 개별 숙박업소에서 활발하게 활용될 수 있을 때 의미를 가질 수 있습니다. 로빈은 개별 숙박업소 단위 데이터를 통해 각 숙박업소에 데이터 활용성을 제공합니다.
4. 보정 및 추정
또한, 다양한 가용 실제 데이터간 항목이나 수치의 불일치 등으로 인해 발생하는 오류를 보정하고 결손값을 추정하여 사용합니다. 특히 결손값 추정에는 지역별 및 유형별 주기성과 계절성을 포착하도록 자체 개발된 알고리즘이 사용됩니다.
구분
세부사항
보정
대상
동일 항목 값이 불일치한 수요 및 재무 데이터
방법
1) 각 원본 독립변수 판별 및 관련 함수 추출
2) 독립변수 값 오류: 확정 실제 통계 값으로 치환
3) 함수 오류: 히스토리 및 벤치마킹 분석 통한 보정
2) 독립변수 값 오류: 확정 실제 통계 값으로 치환
3) 함수 오류: 히스토리 및 벤치마킹 분석 통한 보정
기준
업소별 판매단위 기준으로 보정 후 판매물량 반영하여 연산
검증
해당 항목 합산 통계 값과 비교 (동일 표본, 신뢰수준 95%)
추정
대상
값이 누락된 수요 및 재무 데이터 세부항목
방법
1) 해당 항목 관련 독립변수 판별 및 값 추출
2) 지역 및 유형별 주기성 및 계절성 분석 및 함수 추출
3) 히스토리 및 벤치마킹 분석 통한 누락 항목 값 추정
2) 지역 및 유형별 주기성 및 계절성 분석 및 함수 추출
3) 히스토리 및 벤치마킹 분석 통한 누락 항목 값 추정
기준
업소별 판매단위 기준으로 보정 후 판매물량 반영하여 연산
검증
해당 항목 합산 통계 값과 비교 (동일 표본, 신뢰수준 95%)
* 히스토리 분석은 해당 숙박업소의 과거 지표와의 비교분석, 벤치마킹 분석은 현재 경쟁시장 평균 지표와의 비교분석을 통칭.