Join Your Data
Spesso è necessario combinare dati da più posizioni—tabelle diverse o anche origini dati—per eseguire un’analisi desiderata. A seconda della struttura dei dati e delle esigenze dell’analisi, esistono diversi modi per combinare le tabelle.
Relazioni vs Join
Il metodo predefinito in Tableau Desktop consiste nell’utilizzare le relazioni. Le relazioni mantengono il livello di dettaglio delle tabelle originali quando si combinano le informazioni. Le relazioni consentono inoltre di eseguire join basati sul contesto su base foglio per foglio, rendendo ogni origine dati più flessibile. Le relazioni sono il metodo consigliato per combinare i dati nella maggior parte dei casi. Per ulteriori informazioni, vedere Come le relazioni differiscono dai join.
Tuttavia, ci possono essere momenti in cui si desidera stabilire direttamente un join, per il controllo o per gli aspetti desiderati di un join rispetto a una relazione, come il filtraggio deliberato o la duplicazione.
Nota: le relazioni alla fine sfruttano i join (appena dietro le quinte). Ad esempio, una relazione tra origini dati produrrà un join cross-database quando viz utilizza campi da tabelle in origini dati diverse. Come tale, Migliorare le prestazioni per i join cross-Database può essere rilevante.
Problemi comuni
- Per visualizzare, modificare o creare join, è necessario aprire una tabella logica nell’area di disegno relazione, l’area visualizzata quando si apre o si crea un’origine dati per la prima volta, e accedere all’area di disegno join.
- Le origini dati Tableau pubblicate non possono essere utilizzate nei join. Per combinare le origini dati pubblicate, è necessario modificare le origini dati originali per contenere nativamente il join o utilizzare una miscela di dati.
- Quando si uniscono le tabelle, i campi in cui si uniscono devono essere dello stesso tipo di dati. Se si modifica il tipo di dati dopo l’iscrizione alle tabelle, il join si interromperà.
- I campi utilizzati nella clausola join non possono essere rimossi senza interrompere il join. Per unire i dati ed essere in grado di ripulire i campi duplicati, utilizzare Tableau Prep Builder invece di Desktop
Suggerimento: Mentre Tableau Desktop ha la capacità di creare join e fare un po ‘ di modellazione dei dati di base, Tableau Prep Builder è progettato per la preparazione dei dati. Se è necessario eseguire più join, pulire i nomi dei campi, modificare i tipi di dati, eseguire più pivot o altri tipi di preparazione dei dati coinvolti, considerare l’utilizzo di Tableau Prep Builder(il collegamento si apre in una nuova finestra).
Crea un join
-
Per creare un join, connettersi alla o alle origini dati pertinenti. Vedere Connessione ai dati.
Questi possono essere nella stessa origine dati (ad esempio tabelle in un database o fogli in un foglio di calcolo Excel) o origini dati diverse (questo è noto come cross-database join). Se le tabelle sono state combinate utilizzando un join cross-database, Tableau colora le tabelle nell’area di disegno e le colonne nella griglia dati per mostrare da quale connessione provengono i dati.
Nota: non tutte le origini dati supportano join cross-database, incluse le origini dati Tableau pubblicate. Per combinare le origini dati pubblicate, modificare le origini dati originali per contenere nativamente il join o utilizzare una miscela di dati.
-
Trascina la prima tabella sulla tela.
Si noti che se si trascina una seconda tabella a questo punto si formerà una relazione.
-
Selezionare Apri dal menu o fare doppio clic sulla prima tabella per aprire la tela join (livello fisico).
Facendo doppio clic su una tabella nell’area di disegno delle relazioni si apre l’area di unione
-
Fare doppio clic o trascinare un’altra tabella nella tela join.
Se la tabella successiva proviene interamente da un’altra origine dati, nel riquadro di sinistra, in Connessioni, fare clic sul pulsante Aggiungi ( in creazione Web) per aggiungere una nuova connessione all’origine dati Tableau. Con quella connessione selezionata, trascinare la tabella desiderata nella tela join.
-
Fare clic sull’icona join per configurare il join. Aggiungere una o più clausole join selezionando un campo da una delle tabelle disponibili utilizzate nell’origine dati, scegliendo un operatore join e un campo dalla tabella aggiunta.
Nota: È possibile eliminare una clausola join indesiderata facendo clic sulla ” x ” che viene visualizzata quando si passa il mouse sul lato destro della clausola join.
-
Al termine, chiudere la finestra di dialogo join e join canvas.
Dopo aver creato un join, unisci i tuoi dati. Per risolvere i problemi del tuo join, vedi Join Your Data.
Anatomia di un join
I join sono definiti dal loro tipo e dalla clausola join.
Tipi di join
In generale, esistono quattro tipi di join che è possibile utilizzare in Tableau: interno, sinistro, destro e esterno completo. Se non si è sicuri del tipo di join che si desidera utilizzare per combinare i dati da più tabelle, è necessario utilizzare le relazioni.
Join Type | Risultato |
Interno
|
Quando si utilizza un join interno per combinare le tabelle, il risultato è una tabella che contiene valori che hanno corrispondenze in entrambe le tabelle. Quando un valore non corrisponde in entrambe le tabelle, viene eliminato completamente. |
Sinistra
|
Quando si utilizza un join sinistro per combinare le tabelle, il risultato è una tabella che contiene tutti i valori della tabella sinistra e le corrispondenze corrispondenti dalla tabella destra. Quando un valore nella tabella di sinistra non ha una corrispondenza corrispondente nella tabella di destra, viene visualizzato un valore null nella griglia dati. |
Giusto
|
Quando si utilizza un join destro per combinare le tabelle, il risultato è una tabella che contiene tutti i valori della tabella destra e le corrispondenze corrispondenti dalla tabella sinistra. Quando un valore nella tabella di destra non ha una corrispondenza corrispondente nella tabella di sinistra, viene visualizzato un valore null nella griglia dati. |
Esterno completo
|
Quando si utilizza un join esterno completo per combinare le tabelle, il risultato è una tabella che contiene tutti i valori di entrambe le tabelle. Quando un valore da una tabella non ha una corrispondenza con l’altra tabella, viene visualizzato un valore null nella griglia dati. |
Unione
|
Sebbene union non sia un tipo di join, union è un altro metodo per combinare due o più tabelle aggiungendo righe di dati da una tabella all’altra. Idealmente, le tabelle che si uniscono hanno lo stesso numero di campi e tali campi hanno nomi e tipi di dati corrispondenti. Per ulteriori informazioni su union, vedere Unione i tuoi dati. |
Non tutti i database supportano tutti i tipi di join. Se un’opzione non è disponibile nella finestra di dialogo join, è probabile che sia dovuta a un vincolo dall’origine dati.
Clausole join
Un join viene eseguito impostando una o più clausole join. La clausola Join indica a Tableau quali campi sono condivisi tra le tabelle e come abbinare le righe corrispondenti. Ad esempio, le righe con lo stesso ID vengono allineate nella tabella dei risultati.
Le clausole Join utilizzano più spesso l’operatore di uguaglianza (=) che corrisponde a righe con gli stessi valori. È anche possibile eseguire join non equi, ad esempio minore di (<) e non uguale (<>).
Un join può anche avere più clausole join. Ad esempio, se Nome e cognome sono memorizzati in colonne separate, può essere utile unirsi solo se “Nome = Nome” e “Cognome = Cognome”. Entrambe le condizioni dovranno essere vere per le righe da unire. In alternativa, se l’obiettivo era quello di restituire i risultati quando il cognome è condiviso ma il nome non lo è, le clausole di join potrebbero essere “Nome <> Nome” e “Cognome = Cognome”.
Le clausole Join possono anche contenere calcoli. Ad esempio, la clausola join potrebbe essere la concatenazione dei campi del nome ” + = + “. Si noti che non tutte le connessioni di origine dati supportano i calcoli nelle clausole join.
Informazioni sui valori null nelle chiavi di join
In generale, i join vengono eseguiti a livello di database. Se i campi utilizzati per unire le tabelle contengono valori null, la maggior parte dei database restituisce dati senza le righe che contengono i valori null. Tuttavia, per alcune origini dati a connessione singola, Tableau fornisce un’opzione aggiuntiva per consentire di unire campi che contengono valori null con altri campi che contengono valori null.
Dopo aver impostato l’origine dati, nella pagina Origine dati selezionare Data > Unisci valori null a valori null.
Se l’opzione è disattivata, non è disponibile per l’origine dati. Si noti che se si aggiunge una seconda connessione a un’origine dati che utilizza questa opzione, il join ritorna al comportamento predefinito di escludere righe con valori null.
Join cross-database
Tableau consente join da tabelle in diverse origini dati, anche se con alcune limitazioni dal lato del database su cui le piattaforme sono compatibili. I join cross-database richiedono un’origine dati multi-connessione, ovvero si crea una nuova connessione a ciascun database prima di unirsi alle tabelle.
- Una volta connesso alla prima fonte di dati, utilizzare l’opzione Aggiungi nel riquadro dati per aggiungere un’altra connessione.
Nota: Se il connettore desiderato non è disponibile nell’elenco Connetti quando si tenta di aggiungere un’altra connessione, i join cross-database non sono supportati per la combinazione di origini a cui si desidera unire. Ciò include le connessioni ai dati cube (ad esempio, Microsoft Analysis Services), la maggior parte dei dati solo estratti (ad esempio, Google Analytics e OData) e le origini dati Tableau Server pubblicate.
- Questo crea una seconda connessione piuttosto che un’origine dati completamente diversa. È possibile passare tra le due (o più) connessioni mentre sulla scheda origine dati.
- Una volta che si passa a un foglio di lavoro e si inizia l’analisi, l’origine dati funziona come un’unica origine dati combinata. Ciò è in contrasto con due origini dati indipendenti che possono essere attivate su un foglio di lavoro.
L’origine dati Book + contiene due connessioni con un join cross-database. Funziona come una singola fonte di dati. L’origine dati degli adattamenti cinematografici è un’origine dati indipendente.
Nota: in genere, l’unione di tabelle dallo stesso database offre prestazioni migliori. Questo perché l’interrogazione dei dati memorizzati nello stesso database richiede meno tempo e sfrutta le funzionalità native del database per eseguire il join. Per ulteriori informazioni sulle prestazioni di join cross-database, vedere Miglioramento delle prestazioni per Join cross-database.