데이터웨어 하우스 설계 기법-준수 차원
내 마지막 블로그 게시물에서,나는 당신에게 더 널리 사용되는 고급 기술 차원 설계 기술의 일부를 제시했다. 앞으로 몇 주 동안 각 설계 기술에 대한 세부 정보를 제공 할 것입니다.
준치수
준치수는 창고의 여러 주제 영역에 있는 많은 팩트 테이블에서 치수를 사용할 수 있도록 설계된 치수입니다. 이러한 차원에 대한 설계자는 주제 영역 간에 보고 일관성을 제공하고 기존 차원의 재사용을 통해 해당 주제 영역의 개발 비용을 절감할 수 있도록 계획해야 합니다. 날짜 차원은 준수 차원의 훌륭한 예입니다. 대부분의 창고에는 창고 전체에서 사용되는 단일 날짜 차원만 있습니다.
준수 차원–과제
- 구조적 차이–경우에 따라 다음과 같은 다른 테이블 구조를 포함하는 소스 테이블을 갖게됩니다:
- 추가 또는 누락된 열
- 다른 데이터 형식을 가진 열
- 동일하거나 유사한 데이터를 포함하는 다르게 명명된 열
이 다름은 흔하게 쉽게 결심될 수 있는다 그러나 다름이 근원 체계의 사업 소유자에의해 결심하,합의해야 하기 때문에 임시로 이것은 곤란할 수 있는다. 이러한 문제를 해결하지 않으면 시간이 지남에 따라 유지 관리 및보고 문제가 발생하는 해결 방법이 구현됩니다.
아래의 두 제품 테이블을 결합하는 문제에 유의하십시오. 제품_반환 표에서 기본 키는 제품 _스퀘어이고,제품 _이름 필드는 바차(100)로 정의되고,제품 _설명은 바차(100)로 정의되고,제품 _가격은 숫자(5,2)로 정의된다.
제품 판매 테이블에서 기본 키로 정의됩니다. 이 필드는 제품 반환 테이블의 제품 반환 필드와 일치합니다. 제품 _이름 필드는 제품 _이름(50)으로 정의되고,제품 _이름(150)으로 정의되고,제품 _이름(7,2)으로 정의된다. 두 테이블 간의 데이터가 일치하는지 확인하려면 데이터 프로파일링 및 데이터 검증이 필요합니다. 제품_판매 테이블에는 제품 _카테고리에 대한 열이 없습니다. 이 문제를 해결하려면 다음 단계를 수행하십시오. 이 필드는 제품 반환 테이블에 의해 캡처되지 않은 제품의 변경 내역을 캡처하는 데 사용됩니다.
이러한 문제를 해결하고 테이블을 준수하기 위해 다음과 같은 준수 제품 차원을 제안합니다.
- 내용 차이-때때로 당신은 테이블에 저장된 내용이 다른 것을 발견 할 것이다:
- 텍스트 필드는 대소 문자를 혼합 대소 문자를 포함
- 열은 다른/누락 된 데이터를 포함
제품 반환 테이블의 데이터는 몇 가지 주목할만한 예외를 제외하고 제품 판매 테이블의 데이터와 일치하는 것으로 나타납니다. 제품 이름이 두 테이블 간에 항상 일치하는 것은 아닙니다. 따라서 제품 _반품 테이블에 있는 제품이 역사적으로 신뢰할 수 있고 새로운 차원의 속성으로 사용될 수 있는지 확인해야 합니다. 앞으로 나아 가기 전에 이러한 문제는 이러한 데이터 이상에 대한 상호 합의 된 해결을 위해 소스 시스템 제품 소유자에게 제기되어야합니다.
제품_반환
제품 _판매
준수 차원-유형
- 공유 차원–팩트 테이블이 다른 스타 또는 데이터 마트의 다른 팩트 테이블과 동일한 논리 차원을 공유하는 경우. 날짜 차원은 공유 차원의 예입니다.
- 순응 롤업-차원 테이블의 데이터 하위 집합이며 데이터 하위 집합은 동일한 구조 및 내용을 공유합니다. 롤업 차원의 예는 아래 표시된 월 차원에서 볼 수 있습니다. 당신이 볼 수 있듯이 월 차원은 날짜 차원에 연결하고 한 달에 하루에 데이터를”롤업”하는 데 사용할 수 있습니다.
- 겹치는 차원–겹치는 속성을 통해 일치하는 소스 테이블 및 차원입니다. 대부분의 경우 겹치는 필드를 새 차원으로 이동하여 겹치지 않도록 하고 유지 관리가 용이한 모델을 만들고 팩트 테이블을 통해 시간 경과에 따른 관계 변경 내용을 추적할 수 있습니다.
준수 치수–이점
준수 치수는 유연하고 확장 가능한 치수 모델이 구축되는 기초입니다. 데이터 모델러는 엔터프라이즈의 주요 차원이 시간에 따라 새 특성을 포함하도록 확장할 수 있는 준수 차원인지 확인하여 설계의 적합성을 계획해야 합니다. 일치된 차원이 없는 차원 모델은 차원이 작성된 특정 데이터 마트에 대한 간단한 질문에만 응답할 수 있습니다. 적절하게 설계된 경우,준수 차원은 초기 기대를 초과하는 데이터에 대한 통찰력을 고객에게 제공,여러 데이터 마트에 의해 사용될 수 있습니다.