NewDataLabS

Tableau - Narzędzia Business Intelligence

PL / EN
  • Wydarzenia
    • Konferencje
      • Data Strategy Day
    • Webinary
      • Salesforce
      • Tableau
      • Power BI
    • Szkolenia Tableau
      • Szkolenia online
      • Szkolenia zamknięte
    • Szkolenia Power BI
      • Kurs Power BI online
  • Baza Wiedzy
    • Baza Wiedzy Tableau
    • Baza Wiedzy Power BI
    • Baza Wiedzy Salesforce
  • Blog
  • Kontakt
  • Rozwiązania
    • Tableau
    • Power BI
    • Salesforce
    • Snowflake
    • AI - Einstein Discovery
    • Amplitude
  • Usługi
    • Warsztaty Proof of Concept
    • Warsztaty CRM
    • ETL - przygotowanie danych
    • Hurtownie danych
    • Wdrożenia BI
    • Wdrożenia CRM
    • Migracje
      • Migracje CRM
      • Migracje systemów BI
    • Asysta eksploatacyjna
    • Embedded Analytics
    • Audyty Tableau
    • Szkolenia otwarte
      • Tableau
      • Power BI
    • Szkolenia zamknięte
      • Tableau
      • Salesforce
  • O firmie
    • O nas
    • Kariera
  • Klienci
    • Wybrani Klienci
    • Case Study

Tableau 2020.2 – Nowy Data Model

12 maja 2020

W Tableau 2020.2 wprowadzone zostały rozwiązania określane zbiorczo jako New Data Model Tableau. Do znanego nam podłączania danych dodany został nowy poziom – warstw relacji. Dzięki nim zyskujemy więcej elastyczności i mamy szansę poprawić wydajność. Do tego spędzające wielu sen z oczu blendowania powoli odchodzą do lamusa. Jest to jednocześnie pierwsza aktualizacja od dawna, której nie da się przeoczyć. Zatem kto się boi relacji?

Warstwa fizyczna: świat, który znamy


Nowy model danych Tableau zbudowany jest z dwóch poziomów warstw. Pierwszy poziom – warstwy fizyczne, to wszystko to, co już znamy w podłączaniu danych do Tableau. Mogą być wykorzystywane join, union. Tu można skorzystać z opcji Custom SQL, czy obrócić dane wykorzystując pivot. Tutaj spotkamy wszystko to, czego efektem jest powstanie płaskiej tabeli. Może to być także pojedyncza fizyczna płaska tabela. Nowością jest to, że takich warstw może być wiele. A ponad światem tabel fizycznych powstał nowy poziom – warstwa logiczna.



New Data Model- warstwa logiczna czyli warstwa relacji



Na warstwę logiczną składają się tabele logiczne i relacje. Tabele logiczne to „opakowania” na tabele fizyczne. Relacje to to, co łączy je ze sobą. Tak samo jak w przypadku joina, by ją utworzyć potrzebne jest pole łączące. Koniecznie ze wspólnymi wartościami i o tym samym formacie np. pole tekstowe. Podobnie jak outer join, w relacji „nie gubimy” wierszy tabel, które nie mają odpowiedników w innej tabeli. I na tym kończą się podobieństwa. Relacja bowiem nie łączy tabel w tabelę zbiorczą. Każda z nich pozostaje niezależna. Każda utrzymuje swój oryginalny poziom agregacji. Odpowiednie joiny i agregacje zostaną stworzone automatycznie, w locie, w trakcie tworzenia konkretnej wizualizacji. Oznacza to większą elastyczność, możliwość efektywnego korzystania ze znacznie szerszych struktur danych i uniknięcie zwielokrotniania danych przy łączeniu tabel o różnym poziomie agregacji.

Ograniczenia relacji



Skoro relacje tworzą tak elastyczne połączenia, po co utrzymywać warstwy fizyczne? Otóż relacje mają swoje ograniczenia. Do stworzenia relacji nie możemy wykorzystać niczego co byłoby odpowiednikiem join calculation. Kiedy tworzymy join mamy też do wykorzystania inne operatory niż tylko równość. Tej opcji nie mamy przy tworzeniu relacji. Relacja nie skojarzy nam danych tak jak spatial join. Te możliwości pozostają dostępne jedynie w warstwach fizycznych. Z relacji nie skorzystamy też do modyfikowania już opublikowanych źródeł i łączenia ich. Relacji nie są też wspierane dla danych z kostek OLAP, SAP HANA, Google Analytics i plików JSON. Są też sytuacje, jak dołączanie tabel uprawnień Row Level Security, gdzie wręcz zależy nam na duplikacji wierszy, więc użycie joina jest zalecane.

New Data Model Tableau 2020.2- zmiany w funkcjonalnościach



Jak napisałam na wstępie nowy model danych to nowinka, której nie da się łatwo przeoczyć. Dlaczego? Otóż nowa logika spowodowała, że w szeregu miejsc zmienił się też interface Tabelau. Co zrozumiałe zmienił się wygląd widoku Data Source Ilustracje do tego znajdują się w dalszej części artykułu. Co ważne w tym widoku podgląd tabeli jest teraz oddzielny dla każdej z tabel logicznych. Podobnie przy eksporcie danych np. przy użyciu View Data, otrzymamy plik z każdą z tabel logicznych w osobnej zakładce. Co ważne bardzo zmienia się półka Data. Do tej pory podzielona była na części Dimensions i Measures. Liczbę wierszy w tabeli można było uzyskać dzięki automatycznie tworzonej mierze Number of Records. Teraz półka jest podzielona na części wymiarów i miar przypisanych do poszczególnych tabel logicznych, a poniżej znajduje się część z kalkulacjami i parametrami nie przypisanymi do żadnej z nich. Liczbę wierszy w każdej z tabel określa tabletka z nazwą tabeli i dopiskiem (Count) np. Author (Count). Znaczne zmiany wprowadzono także w ekstraktach, ale to już materiał na osobny artykuł.



Performance w New Data Model



Wiele mniejszych tabel zamiast jednej łączącej wszystkie dane cząstkowe oznacza szybsze realizowanie zapytań leżących u podstaw wizualizacji. Brak powielania wierszy oznacza z kolei, że unikamy większości sytuacji, w których należy sięgnąć po jedną z najbardziej spowalniających agregacji – Count Distinct (COUNTD). To wszystko oznacza możliwość poprawienia wydajności workbooka tworzonego w oparciu o relacje. Dodatkowo twórcy relacji dali użytkownikom dodatkowe możliwości doprecyzowywania tzw. Performance Options.



Performance Options pozwalają nam określić Cardinality, czyli liczność lub unikalność i Referential Integrity, czyli zgodność powiązań. W pierwszym przypadku określamy, czy wiersz z jednej tabeli odpowiada jednemu, czy wielu z drugiej. Możliwe jest też powiązanie „wiele do wielu”. To ostatnie jest opcją domyślną, ale mając pewność, że lepsze będą opcje „jeden do jednego” lub „jeden do wielu”, możemy je wybrać. Referential integrity to sytuacja, w której każdemu wierszowi z jednej tabeli odpowiada jakiś wiersz w innej. Jeśli mamy do czynienia z taką sytuacją, możemy wybrać zamiast domyślnego Some records match („Wybrane rekordy pasują”) – All records match. Zawężenie opcji wydajności pozwala Tableau zastosować dodatkowe automatyczne metody poprawy performance’u.

Podłączenia w istniejących raportach



No dobrze, a co z raportami i źródłami danych, które już istnieją? Po otwarciu takiego raportu w Tableau 2020.2, w widoku danych zobaczymy prostokąt z napisem Migrated Data. Będzie też na nim charakterystyczny symbol joina. To tabela logiczna. Dwukrotne kliknięcie w nią przeniesie nas do widoku warstwy fizycznej. W niej znajdziemy pełną konstrukcję dotychczasowej tabeli źródłowej. Jeśli nie mamy tu do czynienia z publikowanym źródłem danych, możemy dalej rozbudowywać te tabele w bardziej skomplikowany model. Można dodać do niego dodatkowe tabele logiczne i relacje.



Czy relacje działają w starszych wersjach?



Decyzja o przejściu do wersji 2020.2 i rozpoczęciu korzystania z udogodnień nowego modelu danych powinna być przemyślana. Dlaczego, bo nie zawsze istnieje możliwość otworzenia raportu zbudowanego z użyciem relacji w niższych wersjach. Podniesienie wersji i używanie New Data Model Tableau musi więc dotyczyć całego ekosystemu, w którym pracujemy.



Wszystkich tych, którzy chcieliby praktycznie spróbować pracy w nowym modelu, poznać sposoby radzenie sobie z typowymi problemami i budowania kalkulacji w oparciu o nową logikę zapraszamy na szkolenie.

Agata Mężyńska, Tableau Desktop Certified Professional
webinarium tableau Pobierz trial Tableau Desktop >
Pobierz trial Tableau Prep >
Wydarzenia
> Konferencja Tableau MBA
> Konferencja użytkowników Power BI
Webinary
> Webinary Salesforce
> Webinary Amplitude
> Webinary Tableau
> Webinary Power BI

Szkolenia Tableau
Szkolenia Power BI
ETL
> Tableau Prep
> Airflow
> Power Query
> Microsoft Integration Services
Hurtownie danych
> Snowflake
> Google BigQuery
> Microsoft SQL Server
> PostgreSQL
Business intelligence
> Tableau
> Salesforce
> Power BI
Analityka internetowa
> Amplitude
Salesforce
> Zarządzanie relacjami z Klientami
> Sprzedaż
> Zarządzanie szansami sprzedaży
> Analiza Business Intelligence
> Salesforce Manufacturing Cloud
> Salesforce Service Cloud
> Salesforce Marketing Cloud
Kontakt

kontakt@newdatalabs.com
kontakt@newdatalabs.com


601797783
781 648 194


Adres
Adres do korespondencji:
al. T. Boy’a – Żeleńskiego 26,
51-160 Wrocław

Copyright © 2025