Data Warehouse Design Techniques–Conformed Dimensions

前回のブログ記事では、より広く使用されている高度な技術的な次元設計技術のいくつかを紹介しました。 今後数週間にわたって、私はそれぞれの設計技術の詳細を提供します。

適合ディメンション

適合ディメンションは、倉庫のさまざまなサブジェクト領域の多くのファクトテーブルでディメンションを使用できるように設計されたディメンションです。 これらのディメンションの設計者は、対象領域全体でレポートの一貫性を提供し、既存のディメンションの再利用を通じてそれらの対象領域の開発コ 日付ディメンションは、適合ディメンションの優れた例です。 ほとんどの倉庫では、倉庫全体で使用される単一の日付分析コードのみが使用されます。

適合ディメンション-課題

  • 構造的な違い–場合によっては、異なるテーブル構造を含むソーステーブルがあります。:
    • 追加または欠落している列
    • 異なるデータ型を持つ列
    • 同じまたは類似のデータを含む異なる名前の列

これらの相違は通常容易に解決することができるが、相違が源システムのビジネス所有者によってに解決され、合意されなければならないので時折これは困難である場合もある。 これらの問題を解決することなく、時間の経過とともにメンテナンスと報告の問題を引き起こす回避策が実装されます。

以下の二つの製品表を組み合わせた課題に注意してください。 PRODUCT_RETURNテーブルでは、主キーはPRODUCT_SKU、PRODUCT_NAMEフィールドはvarchar(100)、PRODUCT_DESCRIPTIONはvarchar(100)、PRODUCT_PRICEはnumber(5,2)として定義されています。

PRODUCT_SALESテーブルでは、PRODUCT_UPCが主キーとして定義されています。 幸いなことに、このフィールドはPRODUCT_RETURNテーブルのPRODUCT_UPCフィールドと一致します。 PROD_NAMEフィールドはvarchar(50)として定義され、PROD_DESCRIPTIONはvarchar(150)として定義され、PROD_PRICEはnumber(7,2)として定義されますが、これらはすべてPRODUCT_RETURNテーブルとは異なります。 2つのテーブル間のデータが一致するようにするには、データプロファイリングとデータ検証が必要です。 PRODUCT_SALESテーブルには、PRODUCT_CATEGORYの列がありません。 最後の違いは、prod_TYPE、PROD_ACTIVE_FL、PROD_START_DT、およびPROD_END_DTです。 これらのフィールドは、PRODUCT_RETURNテーブルによって取得されない製品の変更履歴を取得するために使用されます。

これらの問題を解決し、テーブルを適合させるために、私は次の適合した製品の寸法を提案するでしょう。

  • コンテンツの違い-テーブルに格納されているコンテンツが異なることがあります:
    • テキストフィールドには大文字と小文字の混在文字が含まれています
    • 列には異なる/欠落しているデータが含まれています

PRODUCT_RETURNテーブルのデータは、PRODUCT_SALESテーブルのデータと一致するように見えますが、いくつかの注目すべき例外があります。 製品名は、2つのテーブル間で常に一致するとは限らず、PRODUCT_SALESテーブル内のUPCsの繰り返しです。 PRODUCT_SALESテーブルにはSkuがないため、PRODUCT_RETURNテーブルのSkuが歴史的に信頼でき、新しいディメンションの属性として使用できることを確認する必要があります。 先に進む前に、これらの問題は、これらのデータの異常に相互に快い解決のためにソースシステムの製品所有者の前にもたらされなければなりません。

製品_販売

適合ディメンション-タイプ

  • 共有ディメンション–ファクトテーブルが別のスターまたはデータマート内の別のファクトテーブルと同じ論理ディメンション 日付ディメンションは、共有ディメンションの例です。
  • 準拠ロールアップ–ディメンションテーブルのデータのサブセットであり、データのサブセットは同じ構造とコンテンツを共有します。 ロールアップディメンションの例は、以下に示す月ディメンションで見ることができます。 ご覧のとおり、月ディメンションは日付ディメンションにリンクされ、1日から1か月にデータを「ロールアップ」するために使用できます。

  • 重複する次元–いくつかの重複する属性を介して適合するソーステーブルと次元です。 ほとんどの場合、重複しているフィールドを新しいディメンションに移動して、重複を回避し、モデルを維持しやすくし、ファクトテーブルを介して時間の経過に伴うリレーションシップの変更を追跡する機能を提供することができます。

適合寸法–利点

適合寸法は、柔軟でスケーラブルな寸法モデルが構築される基礎です。 データモデラーは、企業の主要なディメンションが、時間の経過とともに新しい属性を含むように拡張できる適合ディメンションであることを確 適合した寸法を持たない寸法モデルは、寸法が構築された特定のデータマートに関する簡単な質問にのみ答えることができます。 適切に設計された場合、適合された寸法は、いくつかのデータマートによって使用され、初期の期待を超えるデータへの洞察を顧客に提供します。

コメントを残す

メールアドレスが公開されることはありません。