Varför ska du blanda när du redan kan delta i Tableau?

Datablandning i tablett - en metod som används när det finns relaterad data i flera datakällor, som du vill analysera tillsammans i en enda vy.

I en värld som genererar och förbrukar 2,5 miljon byte data om dagen är organisationer tvungna att leta efter nya metoder för att omvandla och kombinera data för att uppnå optimal effektivitet. En sådan metod för att kombinera data är Datablandning i tablett .

vad används nagios för

Eftersom detta tjänar ett så viktigt syfte i datacykeln för en viss organisation är det nu en mycket viktig modul i de flesta . I den här bloggen ska vi diskutera följande begrepp:





Varför behöver du datablandning i Tableau?

Antag att du är en Utvecklarbord som har transaktionsdata lagrade i Salesforce och kvotdata lagras i Access. De data du vill kombinera lagras i olika databaser, och detaljnivån för de data som fångas i varje tabell skiljer sig åt i de två datakällorna, så datablandning är det bästa sättet att kombinera dessa data.

Datablandning är användbar under följande förhållanden:



  1. Du vill kombinera data från olika databaser som inte stöds av anslutningar över flera databaser.

    Tvärdatabasanslutningar stöder inte anslutningar till kuber (till exempel Oracle Essbase) eller till vissa endast extraktanslutningar (till exempel Google Analytics). I det här fallet ställer du in enskilda datakällor för de data du vill analysera och använder sedan datablandning för att kombinera datakällorna på ett enda ark.

  2. Data finns på olika detaljeringsnivåer.

    Ibland fångar en datamängd data med hjälp av olika detaljeringsnivåer dvs större eller mindre granularitet än den andra datamängden.

    Antag till exempel att du analyserar transaktionsdata och kvotdata. Transaktionsdata kan fånga alla transaktioner. Kvotdata kan dock samla transaktioner på kvartalsnivå. Eftersom transaktionsvärdena fångas upp på olika detaljeringsnivåer i varje datauppsättning bör du använda datablandning för att kombinera data.



Vad är datablandning i Tableau?

Datablandning är en mycket kraftfull funktion i Styrelse . Den används när det finns relaterad data i flera datakällor, som du vill analysera tillsammans i en enda vy. Det är en metod för att kombinera data som kompletterar en datatabell från en datakälla med datakolumner från en annan datakälla.

Vanligtvis använder du joins för att utföra denna typ av datakombination, men det finns tillfällen, beroende på faktorer som typ av data och dess granularitet, när det är bättre att använda datablandning.

system.exit (1) java

Hur skiljer det sig från dataanslutning?

Datablandning simulerar en traditionell vänsterkoppling. Huvudskillnaden mellan de två är när sammanfogningen utförs med avseende på aggregering.

Vänster gå med

När du använder en vänster koppling för att kombinera data skickas en fråga till databasen där kopplingen utförs. Genom att använda en vänster koppling returneras alla rader från den vänstra tabellen och alla rader från den högra tabellen som har en motsvarande radmatchning i den vänstra tabellen. Resultaten av anslutningen skickas sedan tillbaka till och aggregeras av Tableau.

Antag till exempel att du har följande tabeller. Om de vanliga kolumnerna är användar ID , en vänster koppling tar alla data från den vänstra tabellen, liksom alla data från den högra tabellen eftersom varje rad har en motsvarande radmatchning i den vänstra tabellen.

Data Joining - Data Blending in Tableau - EdurekaDatablandning

När du använder datablandning för att kombinera data skickas en fråga till databasen för varje datakälla som används på arket. Resultaten av frågorna, inklusive aggregerade data, skickas tillbaka och kombineras av Tableau. I vyn används alla rader från den primära datakällan, den vänstra tabellen och de aggregerade raderna från den sekundära datakällan, den högra tabellen, baserat på dimensionen för länkfälten.

Du kan ändra länkfältet eller lägga till fler länkfält för att inkludera olika eller ytterligare datarader från den sekundära datakällan i blandningen och ändra de aggregerade värdena.

Antag till exempel att du har följande tabeller. Om länkfältet är användar ID i båda tabellerna blandar dina data alla data från den vänstra tabellen och kompletterar den vänstra tabellen med data från den högra tabellen. I det här fallet kan inte alla värden vara en del av den resulterande tabellen på grund av följande:

  • En rad i den vänstra tabellen har inte en motsvarande radmatchning i den högra tabellen, vilket indikeras av nollvärdet.
  • Det finns flera motsvarande värden i raderna i den högra tabellen, vilket indikeras av asterisken (*).

Antag att du har samma tabeller som ovan, men den sekundära datakällan innehåller ett nytt fält som heter Syften . Återigen, om länkfältet är användar ID , att blanda dina data tar all information från den vänstra tabellen och kompletterar den med data från den högra tabellen. I det här fallet ser du samma nollvärde och asterisker i föregående exempel utöver följande:

  • Eftersom det Syften fältet är ett mått, du ser radvärdena förSyftenfält aggregerat innan data i höger tabell kombineras med data i vänster tabell.
  • Som med föregående exempel har en rad i den vänstra tabellen inte motsvarande rad för Syften fält, som indikeras av det andra nollvärdet.

När ska jag ersätta Blandning

1. Data måste rengöras.

Om dina tabeller inte matchar varandra korrekt efter en anslutning, ställ in datakällor för varje tabell, gör nödvändiga anpassningar (det vill säga byta namn på kolumner, ändra kolumndatatyper, skapa grupper, använd beräkningar etc.) och använd sedan blandning av data för att kombinera data.

2. Sammanfogningar orsakar duplikatdata.

Dubblettdata efter en koppling är ett symptom på data på olika detaljeringsnivåer. Om du märker dubbla data, istället för att skapa en koppling, använd datablandning för att blanda en gemensam dimension istället.

3. Du har massor av data.

Vanligtvis rekommenderas anslutningar för att kombinera data från samma databas. Joins hanteras av databasen, vilket gör det möjligt för joins att utnyttja några av databasens inbyggda funktioner. Men om du arbetar med stora datauppsättningar kan anslutningar påverka databasen och påverka prestandan avsevärt. I det här fallet kan datablandning hjälpa till. Eftersom Tableau hanterar att kombinera data efter att data har aggregerats finns det färre data att kombinera. När det finns färre data att kombinera förbättras i allmänhet prestanda.

Blanda dina data i Tableau

Du kan använda datablandning när du har data i separata datakällor som du vill analysera tillsammans på ett enda ark. Tableau har två inbyggda datakällor Prov-superbutik och Exempel på kaffekedja. Mdb som kommer att användas för att illustrera datablandning.

Steg 1: Anslut till dina data och ställ in datakällorna

  • Anslut till en uppsättning data och ställ in datakällan på datakällasidan. Ett jagnbyggd datakälla Exempel på kaffekedja. Mdb ,som är en MS Access-databasfil, kommer att användas för att illustrera datablandning.
  • Gå till Data > Ny datakälla, anslut till den andra uppsättningen data.I detta exempel används Exempel - Superstore datakälla. Tsedan ställa in datakällan.
  • Klicka på arkfliken för att börja bygga din vy.

Steg 2: Ange en primär datakälla

  • Dra minst ett fält från din primära datakälla till vyn för att ange det som den primära datakällan. I Data Klicka på den datakälla som du vill ange som den primära datakällan. I detta exempel, Exempel på kaffekedja är vald.
  • Följande skärmdump visar de olika tabeller och kopplingar som finns i filen.

jobtracker och tasktracker i hadoop

Steg 3: Ange en sekundär datakälla

  • Fält som används i vyn från datakällor som inte är den primära datakällan eller aktiva länkar anger automatiskt efterföljande datakällor som sekundär datakälla. I detta fall Sample Superstore.

Steg 4: Blanda data

  • Nu kan du integrera data från båda källorna baserat på en gemensam dimension ( stat , I detta fall). Observera att en liten länkbild visas bredvid dimensionen - State. Detta indikerar den gemensamma dimensionen mellan de två datakällorna.
  • Antag att du skapar ett stapeldiagram med Vinstförhållande i kolumnhyllan och stat i radhyllan visar diagrammet hur vinstkvoten varierar för varje stat i både stormarknaden och kaffekedjebutikerna.

Begränsningar av datablandning i Tableau

  1. Det finns vissa begränsningar för blandning av data kring icke-tillsatsaggregat, t.ex. MEDIAN och RAWSQLAGG .
  2. Datablandning äventyrar hastigheten på frågan i hög granularitet.
  3. När du försöker sortera efter ett beräknat fält som använder blandad data listas inte det beräknade fältet i rullgardinsmenyn Fält i dialogrutan Sortera.
  4. Kubdatakällor kan endast användas som den primära datakällan för blandning av data i Tableau. De kan inte användas som sekundära datakällor.

Jag hoppas att ni alla nu har en rättvis uppfattning om Datablandning i tablett från den här bloggen. Hungrig efter mer kunskap? Oroa dig inte, den här videon ger dig en bättre förståelse för konceptet.