adattárház tervezési technikák-megfelelő méretek

az utolsó blogbejegyzésben bemutattam Önnek a szélesebb körben használt fejlett műszaki dimenziós tervezési technikákat. A következő néhány hétben részletesen bemutatom az egyes tervezési technikákat.

megfelelő méretek

megfelelő méretek azok a méretek, amelyeket úgy terveztek meg, hogy a dimenzió a raktár különböző tárgyterületein számos ténytáblán használható legyen. Elengedhetetlen, hogy a tervező tervezze meg ezeket a dimenziókat, mivel ezek biztosítják a jelentéstétel következetességét a tématerületek között, és csökkentik e tématerületek fejlesztési költségeit a meglévő dimenziók újrafelhasználása révén. A dátum dimenzió kiváló példa a megfelelő dimenzióra. A legtöbb raktár csak egyetlen dátumdimenzióval rendelkezik, amelyet az egész raktárban használnak.

Konformed Dimension-Challenges

  • szerkezeti különbségek-bizonyos esetekben olyan forrástáblák lesznek, amelyek különböző táblázatszerkezeteket tartalmaznak:
    • kiegészítő vagy hiányzó oszlopok
    • különböző adattípusú oszlopok
    • azonos vagy hasonló adatokat tartalmazó, eltérő nevű oszlopok

ezek a különbségek általában könnyen megoldhatók, de néha ez nehéz lehet, mivel a különbségeket a forrásrendszerek üzleti tulajdonosainak meg kell oldaniuk és el kell fogadniuk. E problémák megoldása nélkül olyan megoldások kerülnek bevezetésre, amelyek idővel karbantartási és jelentési problémákat okoznak.

vegye figyelembe az alábbi két terméktáblázat kombinálásának kihívásait. A PRODUCT_RETURN táblázatban az elsődleges kulcs a PRODUCT_SKU, a PRODUCT_NAME mező a varchar(100), a PRODUCT_DESCRIPTION a varchar(100), a PRODUCT_PRICE pedig a number(5,2).

a PRODUCT_SALES táblázatban a PRODUCT_UPC az elsődleges kulcs. Szerencsére ez a mező megegyezik a PRODUCT_UPC mezővel a PRODUCT_RETURN táblázatban. A PROD_NAME mező a varchar(50), a PROD_DESCRIPTION a varchar(150), a PROD_PRICE pedig a number(7,2), amelyek mindegyike különbözik a PRODUCT_RETURN táblától. Az adatok profilozása és az adatok ellenőrzése szükséges lesz annak biztosításához, hogy a két táblázat közötti adatok egyezzenek. A PRODUCT_SALES tábla nem tartalmaz oszlopot a PRODUCT_CATEGORY számára. Az utolsó különbség a PROD_TYPE, PROD_ACTIVE_FL, PROD_START_DT és PROD_END_DT. Ezek a mezők egy olyan termék változási előzményeinek rögzítésére szolgálnak, amelyet a PRODUCT_RETURN tábla nem rögzít.

ezeknek a problémáknak a megoldásához és a táblázatok megváltoztatásához a következő megfelelő termék dimenziót javasolnám.

  • tartalmi különbség-néha azt tapasztalja, hogy a táblázatokban tárolt tartalom eltérő:
    • a szövegmezők nagybetűs vs. vegyes karaktereket tartalmaznak
    • az oszlopok különböző / hiányzó adatokat tartalmaznak

úgy tűnik, hogy a PRODUCT_RETURN tábla adatai megegyeznek a PRODUCT_SALES tábla adataival, néhány figyelemre méltó kivétellel. A terméknevek nem mindig egyeznek meg a két tábla között, és az UPC-k ismétlődnek a PRODUCT_SALES táblában. A PRODUCT_SALES tábla nem rendelkezik SKU-kkal, ezért biztosítanunk kell, hogy a PRODUCT_RETURN tábla SKU-ja történelmileg megbízható legyen, és attribútumként használható legyen az új dimenzióban. Mielőtt továbblépnénk, ezeket a kérdéseket a forrásrendszer terméktulajdonosai elé kell vinni, hogy kölcsönösen elfogadható megoldást találjanak ezekre az adat anomáliákra.

TERMÉK_VISSZATÉRÉS

TERMÉK_ÉRTÉKESÍTÉS

megfelelő dimenzió-típusok

  • megosztott dimenzió – amikor egy ténytábla ugyanazt a logikai dimenziót osztja meg, mint egy másik csillag vagy adatpiac másik ténytáblája. A dátum dimenzió egy példa a megosztott dimenzióra.
  • Konformed Rollup – egy dimenziótáblából származó adatok részhalmaza, és az adatok részhalmaza ugyanazt a struktúrát és tartalmat használja. Az összegző dimenzióra példa látható az alább látható hónap dimenzióban. Amint láthatja, a hónap dimenzió összekapcsolható a dátum dimenzióval, és az adatok “összegyűjtésére” használható egyetlen napról egy hónapra.

  • átfedő dimenzió – azok a forrástáblák és dimenziók, amelyek megfelelnek néhány átfedő attribútumon keresztül. A legtöbb esetben az átfedő mezők áthelyezhetők egy új dimenzióba, hogy elkerüljék az átfedéseket, könnyebben karbantartható modellt hozzanak létre, és lehetővé tegyék a kapcsolatok időbeli változásainak nyomon követését egy ténytáblán keresztül.

megfelelő dimenzió – előnyök

a megfelelő dimenziók képezik az alapot, amelyre a rugalmas és skálázható dimenziós modellek épülnek. Az adatmodellezőnek meg kell terveznie a megfelelőséget a tervezés során annak biztosításával, hogy a vállalkozás kulcsfontosságú dimenziói megfelelő dimenziók legyenek, amelyek idővel új attribútumokkal bővíthetők. Azok a dimenziós modellek, amelyek nem rendelkeznek megfelelő dimenziókkal, csak arra az adatpiacra vonatkozó egyszerű kérdésekre tudnak válaszolni, amelyre a dimenzió épült. Megfelelő tervezés esetén a megfelelő dimenziókat több adatpiac is felhasználhatja és fogja használni, így az ügyfél olyan betekintést nyerhet az adataiba, amely meghaladja a kezdeti elvárásokat.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.