Armazém de Dados Técnicas de Design – Conformes Dimensões
No meu último post do blog, eu apresentei a vocês algumas das mais amplamente utilizadas técnicas avançadas dimensional técnicas de design. Durante as próximas semanas, vou fornecer detalhes para cada uma das técnicas de design.Dimensões conformadas
Dimensões conformadas
dimensões conformadas são as dimensões que foram concebidas de tal forma que a dimensão pode ser utilizada em muitas tabelas factuais em diferentes áreas temáticas do armazém. É imperativo que o plano de concepção para estas dimensões proporcione coerência de comunicação entre as áreas temáticas e reduza os custos de desenvolvimento dessas áreas mediante a reutilização das dimensões existentes. A dimensão da data é um excelente exemplo de uma dimensão conformada. A maioria dos armazéns tem apenas uma única dimensão de data usada em todo o armazém.
dimensão conformada-desafios
- diferenças estruturais-em alguns casos terá tabelas-fonte que contêm diferentes estruturas de tabelas que podem incluir:
- adicionais ou falta colunas
- colunas com tipos de dados diferentes
- colunas nomeadas de forma diferente que contém o mesmo ou semelhante dados
Estas diferenças geralmente pode ser resolvido facilmente, mas às vezes isso pode ser difícil, pois as diferenças devem ser resolvidas, e de acordo com os proprietários de negócios dos sistemas de origem. Sem a resolução destas questões, serão implementados mecanismos que, ao longo do tempo, causarão problemas de manutenção e relatórios.
Note os desafios que combinam os dois quadros de produtos abaixo. No PRODUCT_RETURN tabela, a chave primária é PRODUCT_SKU, o PRODUCT_NAME campo é definido como varchar(100), PRODUCT_DESCRIPTION é definido como varchar(100) e PRODUCT_PRICE é definido como o número(5,2).
na tabela PRODUCT_SALES, o PRODUCT_UPC é definido como a chave primária. Felizmente, este campo corresponde ao campo PRODUCT_UPC na tabela PRODUCT_RETURN. O campo PROD_NAME é definido como varchar(50), PROD_DESCRIPTION é definido como varchar(150) e PROD_PRICE é definido como número(7,2), sendo todos diferentes do da tabela PRODUCT_RETURN. O perfil dos dados e a verificação dos dados serão necessários para garantir que os dados entre as duas tabelas coincidam. A tabela PRODUCT_SALES não tem uma coluna para PRODUCT_ category. Uma diferença final é a PROD_TYPE, PROD_ACTIVE_FL, PROD_START_DT e PROD_END_DT. Estes campos são usados para capturar o histórico de mudanças de um produto que não é capturado pela tabela PRODUCT_RETURN.
para resolver estas questões e conformar as tabelas eu proporia a seguinte dimensão conformed do produto.
- Conteúdo Diferença – às vezes, você vai descobrir que o conteúdo armazenado nas tabelas são diferentes:
- campos de Texto contêm letras maiúsculas vs. misto caso caracteres
- Colunas contêm diferentes/falta de dados
Os dados no PRODUCT_RETURN tabela parece corresponder ao que o PRODUCT_SALES tabela com algumas exceções notáveis. Os nomes dos produtos nem sempre correspondem entre as duas tabelas e os UPCs repetem na tabela PRODUCT_SALES. A tabela PRODUCT_SALES não tem SKUs, portanto, precisamos garantir que a SKUs na tabela PRODUCT_RETURN é confiável historicamente e pode ser usada como um atributo na nova dimensão. Antes de avançar, estas questões devem ser trazidos perante os proprietários do sistema de origem de produtos para uma resolução mutuamente agradável para estas anomalias de dados.
PRODUCT_RETURN
PRODUCT_SALES
Conformou-Dimensão – Tipos de
- Dimensão Compartilhada – quando uma tabela de fato compartilha a mesma lógica dimensão de uma outra tabela de fatos em outra estrela ou data mart. A dimensão da data é um exemplo de uma dimensão partilhada.
- Dimensões sobrepostas – são as tabelas-fonte e dimensões que se conformam através de alguns atributos sobrepostos. Na maioria dos casos, os campos sobrepostos podem ser movidos para uma nova dimensão para evitar sobreposições, criar um modelo mais fácil de manter e fornecer a capacidade de acompanhar as mudanças nas relações ao longo do tempo através de uma tabela de fatos.
dimensão conformada – benefícios
dimensões conformadas são a base sobre a qual modelos dimensionais flexíveis e escaláveis são construídos. Um modelador de dados deve planejar a conformidade em seu projeto, garantindo que as dimensões chave da empresa são conformadas dimensões que podem ser expandidas para incluir novos atributos ao longo do tempo. Modelos dimensionais que não possuem dimensões conformadas só serão capazes de responder perguntas simples para o data mart particular para o qual a dimensão foi construída. Quando projetado corretamente, as dimensões conformadas podem e serão usadas por vários marts de dados, proporcionando ao cliente uma visão de seus dados que excede suas expectativas iniciais.