adattárház tervezési technikák-megfelelő méretek
az utolsó blogbejegyzésben bemutattam Önnek a szélesebb körben használt fejlett műszaki dimenziós tervezési technikákat. A következő néhány hétben részletesen bemutatom az egyes tervezési technikákat.
megfelelő méretek
megfelelő méretek azok a méretek, amelyeket úgy terveztek meg, hogy a dimenzió a raktár különböző tárgyterületein számos ténytáblán használható legyen. Elengedhetetlen, hogy a tervező tervezze meg ezeket a dimenziókat, mivel ezek biztosítják a jelentéstétel következetességét a tématerületek között, és csökkentik e tématerületek fejlesztési költségeit a meglévő dimenziók újrafelhasználása révén. A dátum dimenzió kiváló példa a megfelelő dimenzióra. A legtöbb raktár csak egyetlen dátumdimenzióval rendelkezik, amelyet az egész raktárban használnak.
Konformed Dimension-Challenges
- szerkezeti különbségek-bizonyos esetekben olyan forrástáblák lesznek, amelyek különböző táblázatszerkezeteket tartalmaznak:
- kiegészítő vagy hiányzó oszlopok
- különböző adattípusú oszlopok
- azonos vagy hasonló adatokat tartalmazó, eltérő nevű oszlopok
ezek a különbségek általában könnyen megoldhatók, de néha ez nehéz lehet, mivel a különbségeket a forrásrendszerek üzleti tulajdonosainak meg kell oldaniuk és el kell fogadniuk. E problémák megoldása nélkül olyan megoldások kerülnek bevezetésre, amelyek idővel karbantartási és jelentési problémákat okoznak.
vegye figyelembe az alábbi két terméktáblázat kombinálásának kihívásait. A PRODUCT_RETURN táblázatban az elsődleges kulcs a PRODUCT_SKU, a PRODUCT_NAME mező a varchar(100), a PRODUCT_DESCRIPTION a varchar(100), a PRODUCT_PRICE pedig a number(5,2).
a PRODUCT_SALES táblázatban a PRODUCT_UPC az elsődleges kulcs. Szerencsére ez a mező megegyezik a PRODUCT_UPC mezővel a PRODUCT_RETURN táblázatban. A PROD_NAME mező a varchar(50), a PROD_DESCRIPTION a varchar(150), a PROD_PRICE pedig a number(7,2), amelyek mindegyike különbözik a PRODUCT_RETURN táblától. Az adatok profilozása és az adatok ellenőrzése szükséges lesz annak biztosításához, hogy a két táblázat közötti adatok egyezzenek. A PRODUCT_SALES tábla nem tartalmaz oszlopot a PRODUCT_CATEGORY számára. Az utolsó különbség a PROD_TYPE, PROD_ACTIVE_FL, PROD_START_DT és PROD_END_DT. Ezek a mezők egy olyan termék változási előzményeinek rögzítésére szolgálnak, amelyet a PRODUCT_RETURN tábla nem rögzít.
ezeknek a problémáknak a megoldásához és a táblázatok megváltoztatásához a következő megfelelő termék dimenziót javasolnám.
- tartalmi különbség-néha azt tapasztalja, hogy a táblázatokban tárolt tartalom eltérő:
- a szövegmezők nagybetűs vs. vegyes karaktereket tartalmaznak
- az oszlopok különböző / hiányzó adatokat tartalmaznak
úgy tűnik, hogy a PRODUCT_RETURN tábla adatai megegyeznek a PRODUCT_SALES tábla adataival, néhány figyelemre méltó kivétellel. A terméknevek nem mindig egyeznek meg a két tábla között, és az UPC-k ismétlődnek a PRODUCT_SALES táblában. A PRODUCT_SALES tábla nem rendelkezik SKU-kkal, ezért biztosítanunk kell, hogy a PRODUCT_RETURN tábla SKU-ja történelmileg megbízható legyen, és attribútumként használható legyen az új dimenzióban. Mielőtt továbblépnénk, ezeket a kérdéseket a forrásrendszer terméktulajdonosai elé kell vinni, hogy kölcsönösen elfogadható megoldást találjanak ezekre az adat anomáliákra.
TERMÉK_VISSZATÉRÉS
TERMÉK_ÉRTÉKESÍTÉS
megfelelő dimenzió-típusok
- megosztott dimenzió – amikor egy ténytábla ugyanazt a logikai dimenziót osztja meg, mint egy másik csillag vagy adatpiac másik ténytáblája. A dátum dimenzió egy példa a megosztott dimenzióra.
- Konformed Rollup – egy dimenziótáblából származó adatok részhalmaza, és az adatok részhalmaza ugyanazt a struktúrát és tartalmat használja. Az összegző dimenzióra példa látható az alább látható hónap dimenzióban. Amint láthatja, a hónap dimenzió összekapcsolható a dátum dimenzióval, és az adatok “összegyűjtésére” használható egyetlen napról egy hónapra.
- átfedő dimenzió – azok a forrástáblák és dimenziók, amelyek megfelelnek néhány átfedő attribútumon keresztül. A legtöbb esetben az átfedő mezők áthelyezhetők egy új dimenzióba, hogy elkerüljék az átfedéseket, könnyebben karbantartható modellt hozzanak létre, és lehetővé tegyék a kapcsolatok időbeli változásainak nyomon követését egy ténytáblán keresztül.
megfelelő dimenzió – előnyök
a megfelelő dimenziók képezik az alapot, amelyre a rugalmas és skálázható dimenziós modellek épülnek. Az adatmodellezőnek meg kell terveznie a megfelelőséget a tervezés során annak biztosításával, hogy a vállalkozás kulcsfontosságú dimenziói megfelelő dimenziók legyenek, amelyek idővel új attribútumokkal bővíthetők. Azok a dimenziós modellek, amelyek nem rendelkeznek megfelelő dimenziókkal, csak arra az adatpiacra vonatkozó egyszerű kérdésekre tudnak válaszolni, amelyre a dimenzió épült. Megfelelő tervezés esetén a megfelelő dimenziókat több adatpiac is felhasználhatja és fogja használni, így az ügyfél olyan betekintést nyerhet az adataiba, amely meghaladja a kezdeti elvárásokat.