Data Warehouse Design Techniques-Conformed Dimensions
edellisessä blogikirjoituksessani esittelin teille joitakin laajemmin käytettyjä kehittyneitä teknisiä dimensionsuunnittelutekniikoita. Seuraavien viikkojen aikana, annan yksityiskohtaisesti kunkin suunnittelun tekniikoita.
Konformoidut mitat
Konformoidut mitat ovat niitä ulottuvuuksia, jotka on suunniteltu siten, että dimensiota voidaan käyttää monissa faktataulukoissa varaston eri aihealueilla. On välttämätöntä, että suunnittelija suunnittelee nämä ulottuvuudet, koska ne tarjoavat raportoinnin johdonmukaisuutta eri aihealueilla ja vähentää näiden aihealueiden kehittämiskustannuksia käyttämällä uudelleen olemassa olevia ulottuvuuksia. Päivämääräulottuvuus on erinomainen esimerkki mukautetusta ulottuvuudesta. Useimmissa varastoissa on vain yksi päiväysulottuvuus, jota käytetään koko varastossa.
Conformed Dimension-Challenges
- Structural Differences-joissakin tapauksissa sinulla on lähdetaulukoita, jotka sisältävät erilaisia taulukkorakenteita näitä voivat olla:
- lisäsarakkeet tai puuttuvat sarakkeet
- eri tietotyyppejä sisältävät sarakkeet
- eri tavalla nimetyt sarakkeet, jotka sisältävät samat tai samankaltaiset tiedot
nämä erot voidaan yleensä ratkaista helposti, mutta joskus tämä voi olla vaikeaa, koska erot on ratkaistava ja sovittu yritysten omistajat lähdejärjestelmien. Ilman näiden ongelmien ratkaisemista toteutetaan kiertoteitä, jotka ajan myötä aiheuttavat ylläpito-ja raportointiongelmia.
huomaa kahden alla olevan tuotetaulukon yhdistämisen haasteet. PRODUCT_RETURN-taulukossa ensisijainen avain on PRODUCT_SKU, PRODUCT_NAME-kenttä määritellään varchariksi(100), PRODUCT_DESCRIPTION varchariksi(100) ja PRODUCT_PRICE numeroksi (5,2).
PRODUCT_SALES-taulukossa PRODUCT_UPC määritellään ensisijaiseksi avaimeksi. Onneksi tämä kenttä vastaa PRODUCT_UPC-kenttää PRODUCT_RETURN-taulukossa. PROD_NAME kenttä on määritelty varchar(50), PROD_DESCRIPTION on määritelty varchar(150) ja PROD_PRICE on määritelty numero (7,2), jotka kaikki ovat erilaisia kuin PRODUCT_RETURN taulukko. Tietojen profilointi ja tietojen todentaminen on tarpeen sen varmistamiseksi, että tiedot kahden taulukon välillä täsmäävät. PRODUCT_SALES-taulukossa ei ole PRODUCT_CATEGORY-saraketta. Yksi lopullinen ero on PROD_TYPE, PROD_ACTIVE_FL, PROD_START_DT ja PROD_END_DT. Näitä kenttiä käytetään kuvaamaan sellaisen tuotteen muutoshistoriaa, jota ei ole kuvattu PRODUCT_RETURN-taulukossa.
näiden ongelmien ratkaisemiseksi ja taulukoiden noudattamiseksi ehdotan seuraavaa mukautettua tuoteulottuvuutta.
- sisällöllinen ero-joskus huomaat, että taulukoihin tallennettu sisältö on erilainen:
- tekstikentät sisältävät isoja kirjaimia vs. sekatapausmerkit
- sarakkeet sisältävät erilaisia / puuttuvat tiedot
PRODUCT_RETURN-taulukon tiedot näyttävät vastaavan PRODUCT_SALES-taulukon tietoja joitakin huomattavia poikkeuksia lukuun ottamatta. Tuotenimet eivät aina täsmää näiden kahden taulukon välillä ja UPCs toistuu PRODUCT_SALES-taulukossa. PRODUCT_SALES-taulukossa ei ole susta, joten meidän on varmistettava, että PRODUCT_RETURN-taulukossa oleva sus on historiallisesti luotettava ja sitä voidaan käyttää attribuuttina uudessa ulottuvuudessa. Ennen kuin siirrytään eteenpäin, nämä asiat on tuotava lähdejärjestelmän tuotteiden omistajille, jotta nämä tiedot poikkeavat toisistaan.
TUOTTEEN_PALAUTUS
tuotteiden myynti
Conformed Dimension-Types
- Shared Dimension – when a fact table shares the same logical dimension as another fact table in another star or data mart. Päivämääräulottuvuus on esimerkki yhteisestä ulottuvuudesta.
- Conformed Rollup-on dimensiotaulukon tietojen osajoukko, ja datan osajoukko jakaa saman rakenteen ja sisällön. Esimerkki rollup ulottuvuus voidaan nähdä kuukauden ulottuvuus alla. Kuten näette kuukausi ulottuvuus voidaan liittää päivämäärä ulottuvuus ja käytetään “roll up” tiedot yhden päivän kuukaudessa.
- päällekkäinen ulottuvuus-ovat ne lähdetaulukot ja mitat, jotka vastaavat kautta joitakin päällekkäisiä ominaisuuksia. Useimmissa tapauksissa päällekkäiset kentät voidaan siirtää uuteen ulottuvuuteen päällekkäisyyksien välttämiseksi, luoda helpommin ylläpidettävä malli ja tarjota mahdollisuus seurata suhteiden muutoksia ajan myötä faktataulukon kautta.
Conformed Dimension – Benefits
Conformed dimensions on se perusta, jolle joustavat ja skaalautuvat dimensiomallit rakennetaan. Tietomallinnuksen suorittajan on suunniteltava vaatimustenmukaisuus suunnittelussaan varmistamalla, että yrityksen keskeiset mitat ovat mukautettuja ulottuvuuksia, joita voidaan ajan myötä laajentaa uusiin ominaisuuksiin. Dimensional mallit, jotka eivät ole mukautetut mitat voivat vain vastata yksinkertaisiin kysymyksiin erityisesti data mart, jota varten ulottuvuus on rakennettu. Kun se on suunniteltu oikein, useat datamarketit voivat käyttää ja tulevat käyttämään mukautettuja mittoja, mikä antaa asiakkaalle käsityksen heidän tiedoistaan, jotka ylittävät heidän alkuperäiset odotuksensa.