Join Your Data

Häufig ist es erforderlich, Daten aus mehreren Orten — verschiedenen Tabellen oder sogar Datenquellen — zu kombinieren, um eine gewünschte Analyse durchzuführen. Abhängig von der Struktur der Daten und den Anforderungen der Analyse gibt es mehrere Möglichkeiten, die Tabellen zu kombinieren.

Beziehungen vs. Joins

Die Standardmethode in Tableau Desktop ist die Verwendung von Beziehungen. Bei Beziehungen wird der Detaillierungsgrad der Originaltabellen beim Kombinieren von Informationen beibehalten. Beziehungen ermöglichen es auch, kontextbasierte Verknüpfungen blattweise durchzuführen, wodurch jede Datenquelle flexibler wird. Beziehungen sind in den meisten Fällen die empfohlene Methode zum Kombinieren von Daten. Weitere Informationen finden Sie unter Wie sich Beziehungen von Joins unterscheiden.

Es kann jedoch vorkommen, dass Sie einen Join direkt einrichten möchten, entweder zur Kontrolle oder für gewünschte Aspekte eines Joins im Vergleich zu einer Beziehung, z. B. absichtliches Filtern oder Duplizieren.

Hinweis: Beziehungen nutzen schließlich Joins (direkt hinter den Kulissen). Beispielsweise erzeugt eine Beziehung über Datenquellen hinweg einen datenbankübergreifenden Join, wenn die Visualisierung Felder aus Tabellen in verschiedenen Datenquellen verwendet. Daher kann eine Verbesserung der Leistung für datenbankübergreifende Verknüpfungen relevant sein.

Häufige Probleme

  • Um Verknüpfungen anzuzeigen, zu bearbeiten oder zu erstellen, müssen Sie eine logische Tabelle im Beziehungsbereich öffnen — dem Bereich, den Sie beim ersten Öffnen oder Erstellen einer Datenquelle sehen — und auf den Verknüpfungsbereich zugreifen.
  • Veröffentlichte Tableau-Datenquellen können nicht in Joins verwendet werden. Um veröffentlichte Datenquellen zu kombinieren, müssen Sie die ursprünglichen Datenquellen so bearbeiten, dass sie den Join nativ enthalten, oder eine Datenmischung verwenden.
  • Beim Verknüpfen von Tabellen müssen die Felder, denen Sie beitreten, denselben Datentyp haben. Wenn Sie den Datentyp nach dem Join der Tabellen ändern, wird der Join unterbrochen.
  • Felder, die in der join-Klausel verwendet werden, können nicht entfernt werden, ohne den Join zu unterbrechen. Verwenden Sie Tableau Prep Builder anstelle von Desktop, um Daten zu verknüpfen und doppelte Felder zu bereinigen

Tipp: Während Tableau Desktop Verknüpfungen erstellen und einige grundlegende Datenformen durchführen kann, ist Tableau Prep Builder für die Datenvorbereitung konzipiert. Wenn Sie mehrere Joins durchführen, Feldnamen bereinigen, Datentypen ändern, mehrere Pivots durchführen oder andere Arten der Datenvorbereitung durchführen müssen, sollten Sie Tableau Prep Builder verwenden (Link wird in einem neuen Fenster geöffnet).

Erstellen Sie einen Join

  1. Um einen Join zu erstellen, stellen Sie eine Verbindung mit der oder den relevanten Datenquellen her. Siehe Verbinden mit Ihren Daten.

    Diese können sich in derselben Datenquelle befinden (z. B. Tabellen in einer Datenbank oder Tabellen in einer Excel-Tabelle) oder in verschiedenen Datenquellen (dies wird als datenbankübergreifende Verknüpfung bezeichnet). Wenn Sie Tabellen mithilfe eines datenbankübergreifenden Joins kombiniert haben, färbt Tableau die Tabellen in der Arbeitsfläche und die Spalten im Datenraster ein, um Ihnen anzuzeigen, aus welcher Verbindung die Daten stammen.

    Hinweis: Nicht alle Datenquellen unterstützen datenbankübergreifende Verknüpfungen, einschließlich veröffentlichter Tableau-Datenquellen. Um veröffentlichte Datenquellen zu kombinieren, bearbeiten Sie die ursprünglichen Datenquellen so, dass sie den Join nativ enthalten, oder verwenden Sie eine Datenmischung.

  2. Ziehen Sie die erste Tabelle auf die Leinwand.

    Beachten Sie, dass sich eine Beziehung bildet, wenn Sie an dieser Stelle eine zweite Tabelle herausziehen.

  3. Wählen Sie Öffnen aus dem Menü oder doppelklicken Sie auf die erste Tabelle, um den Join-Canvas (physische Ebene) zu öffnen.

    Durch Doppelklicken auf eine Tabelle im Beziehungsbereich wird der Join-Bereich geöffnet

  4. Doppelklicken Sie auf eine andere Tabelle oder ziehen Sie sie in den Join-Canvas.

    Wenn Ihre nächste Tabelle vollständig aus einer anderen Datenquelle stammt, klicken Sie im linken Bereich unter Verbindungen auf die Schaltfläche Hinzufügen ( in Web Authoring), um der Tableau-Datenquelle eine neue Verbindung hinzuzufügen. Ziehen Sie bei ausgewählter Verbindung die gewünschte Tabelle in den Join-Canvas.

  5. Klicken Sie auf das Join-Symbol, um den Join zu konfigurieren. Fügen Sie eine oder mehrere Join-Klauseln hinzu, indem Sie ein Feld aus einer der in der Datenquelle verfügbaren Tabellen, einen Join-Operator und ein Feld aus der hinzugefügten Tabelle auswählen.

    Hinweis: Sie können unerwünschte Join-Klauseln löschen, indem Sie auf das “x” klicken, das angezeigt wird, wenn Sie den Mauszeiger über die rechte Seite der Join-Klausel bewegen.

  6. Wenn Sie fertig sind, schließen Sie den Join-Dialog und Join canvas.

Nachdem Sie einen Join erstellt haben, verbinden Sie Ihre Daten. Informationen zur Fehlerbehebung bei Ihrem Join finden Sie unter Verbinden Ihrer Daten.

Anatomie eines Joins

Joins werden durch ihren Typ sowie die Join-Klausel definiert.

Join-Typen

Im Allgemeinen gibt es vier Join-Typen, die Sie in Tableau verwenden können: inner, left, right und full outer. Wenn Sie nicht sicher sind, welchen Join-Typ Sie zum Kombinieren von Daten aus mehreren Tabellen verwenden möchten, sollten Sie Beziehungen verwenden.

Join-Typ Ergebnis

Innere

Wenn Sie einen Inner Join zum Kombinieren von Tabellen verwenden, ist das Ergebnis eine Tabelle, die Werte enthält, die Übereinstimmungen in beiden Tabellen aufweisen.

Wenn ein Wert nicht in beiden Tabellen übereinstimmt, wird er vollständig gelöscht.

Links

Wenn Sie einen Left Join zum Kombinieren von Tabellen verwenden, ist das Ergebnis eine Tabelle, die alle Werte aus der linken Tabelle und die entsprechenden Übereinstimmungen aus der rechten Tabelle enthält.

Wenn ein Wert in der linken Tabelle keine entsprechende Übereinstimmung in der rechten Tabelle aufweist, wird im Datenraster ein Nullwert angezeigt.

Rechts

Wenn Sie einen Right Join zum Kombinieren von Tabellen verwenden, ist das Ergebnis eine Tabelle, die alle Werte aus der rechten Tabelle und die entsprechenden Übereinstimmungen aus der linken Tabelle enthält.

Wenn ein Wert in der rechten Tabelle keine entsprechende Übereinstimmung in der linken Tabelle aufweist, wird im Datenraster ein Nullwert angezeigt.

Volle äußere

Wenn Sie einen vollständigen äußeren Join zum Kombinieren von Tabellen verwenden, ist das Ergebnis eine Tabelle, die alle Werte aus beiden Tabellen enthält.

Wenn ein Wert aus einer der beiden Tabellen nicht mit der anderen Tabelle übereinstimmt, wird im Datenraster ein Nullwert angezeigt.

Union

Obwohl Union kein Join-Typ ist, ist Union eine andere Methode zum Kombinieren von zwei oder mehr Tabellen, indem Datenzeilen von einer Tabelle an eine andere angehängt werden. Idealerweise haben die Tabellen, die Sie erstellen, die gleiche Anzahl von Feldern, und diese Felder haben übereinstimmende Namen und Datentypen. Weitere Informationen zu Union finden Sie unter Union Ihre Daten.

Nicht alle Datenbanken unterstützen alle Join-Typen. Wenn eine Option im Join-Dialogfeld nicht verfügbar ist, liegt dies wahrscheinlich an einer Einschränkung Ihrer Datenquelle.

Join-Klauseln

Ein Join wird ausgeführt, indem eine oder mehrere Join-Klauseln eingerichtet werden. Die join-Klausel teilt Tableau mit, welche Felder von den Tabellen gemeinsam genutzt werden und wie die entsprechenden Zeilen abgeglichen werden. Beispielsweise werden Zeilen mit derselben ID in der Ergebnistabelle ausgerichtet.

Join-Klauseln verwenden meistens den Gleichheitsoperator (=), der Zeilen mit denselben Werten abgleicht. Es ist auch möglich, Nicht-Equi-Joins durchzuführen, z. B. kleiner als (<) und ungleich (<>).

Ein Join kann auch mehrere Join-Klauseln haben. Wenn beispielsweise Vorname und Nachname in separaten Spalten gespeichert sind, kann es vorteilhaft sein, nur beizutreten, wenn “Vorname = Vorname” und “Nachname = Nachname”. Beide Bedingungen müssen wahr sein, damit Zeilen verbunden werden können. Wenn das Ziel darin bestand, Ergebnisse zurückzugeben, wenn der Nachname gemeinsam genutzt wird, der Vorname jedoch nicht, können die Join-Klauseln “Vorname <> Vorname” und “Nachname = Nachname” lauten.

Join-Klauseln können auch Berechnungen enthalten. Die join-Klausel könnte beispielsweise die Verkettung der Namensfelder ” + = + ” sein. Beachten Sie, dass nicht alle Datenquellenverbindungen Berechnungen in Join-Klauseln unterstützen.

Über Nullwerte in Join-Schlüsseln

Im Allgemeinen werden Joins auf Datenbankebene ausgeführt. Wenn die zum Verknüpfen von Tabellen verwendeten Felder Nullwerte enthalten, geben die meisten Datenbanken Daten ohne die Zeilen zurück, die die Nullwerte enthalten. Für bestimmte Datenquellen mit nur einer Verbindung bietet Tableau jedoch eine zusätzliche Option, mit der Sie Felder, die Nullwerte enthalten, mit anderen Feldern verknüpfen können, die Nullwerte enthalten.

Nachdem Sie Ihre Datenquelle eingerichtet haben, wählen Sie auf der Seite Datenquelle Data > Join null values to null values.

Wenn die Option ausgegraut ist, ist sie für Ihre Datenquelle nicht verfügbar. Beachten Sie, dass beim Hinzufügen einer zweiten Verbindung zu einer Datenquelle, die diese Option verwendet, der Join auf das Standardverhalten des Ausschlusses von Zeilen mit Nullwerten zurückgesetzt wird.

Datenbankübergreifende Joins

Tableau erlaubt Joins aus Tabellen in verschiedenen Datenquellen, allerdings mit einigen Einschränkungen auf der Datenbankseite, auf welchen Plattformen sie kompatibel sind. Datenbankübergreifende Verknüpfungen erfordern eine Datenquelle mit mehreren Verbindungen, d. h. Sie erstellen eine neue Verbindung zu jeder Datenbank, bevor Sie die Tabellen verknüpfen.

  1. Wenn Sie eine Verbindung zur ersten Datenquelle hergestellt haben, verwenden Sie die Option Hinzufügen im Datenbereich, um eine weitere Verbindung hinzuzufügen.

    Hinweis: Wenn der gewünschte Connector in der Verbindungsliste nicht verfügbar ist, wenn Sie versuchen, eine weitere Verbindung hinzuzufügen, werden datenbankübergreifende Verknüpfungen für die Kombination von Quellen, denen Sie beitreten möchten, nicht unterstützt. Dazu gehören Verbindungen zu Cube-Daten (z. B. Microsoft Analysis Services), den meisten reinen Extraktdaten (z. B. Google Analytics und OData) und veröffentlichten Tableau Server-Datenquellen.

  2. Dadurch wird eine zweite Verbindung anstelle einer völlig anderen Datenquelle erstellt. Sie können auf der Registerkarte Datenquelle zwischen den beiden (oder mehreren) Verbindungen wechseln.

  3. Sobald Sie zu einem Arbeitsblatt wechseln und mit der Analyse beginnen, fungiert die Datenquelle als einzelne, kombinierte Datenquelle. Dies steht im Gegensatz zu zwei unabhängigen Datenquellen, zwischen denen in einem Arbeitsblatt umgeschaltet werden kann.

    Die Book+-Datenquelle enthält zwei Verbindungen mit einem datenbankübergreifenden Join. Es fungiert als eine einzige Datenquelle. Die Movie Adaptations-Datenquelle ist eine unabhängige Datenquelle.

Hinweis: In der Regel führt das Verknüpfen von Tabellen aus derselben Datenbank zu einer besseren Leistung. Dies liegt daran, dass das Abfragen von Daten, die in derselben Datenbank gespeichert sind, weniger Zeit in Anspruch nimmt und die systemeigenen Funktionen der Datenbank zum Ausführen des Joins nutzt. Weitere Informationen zur datenbankübergreifenden Join-Leistung finden Sie unter Verbessern der Leistung für datenbankübergreifende Joins.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.