Od zawsze jednym z głównych atutów Tableau był wizualny aspekt analizy danych. To nie tylko czytelne i ładne wykresy, ale także dodatkowe elementy analityczno-wizualne wspomagające proces przedstawianie informacji. Jednym z tych elementów są linie referencyjne, które dodają dodatkowy element w postaci odniesienia na wykresach. Umożliwia to rozbudowę podstawowych funkcjonalności wizualizacji, dodając dodatkowy wymiar analizy. Linie referencyjne mogą przedstawiać wartości średnie, minimalne/maksymalne, mediany, a także reprezentować referencje w postaci poprzednich okresów, celów, targetów czy budżetów. Dzięki temu możliwe jest zauważanie pewnych odchyleń i na tej podstawie podjęcie odpowiednich działań.
Dodajemy linie referencyjną do wykresu
Linie referencyjne możemy dodać z panelu Analytics lub klikając daną oś i wybierając Add reference line. Wybierając opcję z Analytics pane linia od razu jest przedstawiana na wykresie, a przy dodanie z menu osi mamy dostępne na początku okno konfiguracji. Tak czy inaczej dostajemy linię referencyjną na wykresie, domyślnie przedstawiającą średnią:
Już sama ta linia dostarcza nam dodatkowego wymiaru analizy – od razy widzimy, które kategorie mają sprzedaż powyżej, a które poniżej średniej.
Konfiguracja linii referencyjnych
Domyślna linia oczywiście jest użyteczna, natomiast możemy ją w dużym zakresie dostosować do naszych potrzeb. Klikają linię i wybierając opcję Edit, dostajemy dostęp do okna edycji linii:
W oknie mamy dostępne do wyboru:
- Rodzaj referencji – oprócz linii możemy wybrać Band (zakres pomiędzy wartościami), Distribution (wizualizacja rozkładu danych) lub Box Plot (wykres pudełkowy). W zależności od wyboru w tym punkcie, kolejne opcje różnią się – my skupimy się na opcjach dostępnych dla linii
- Scope – określa sposób kalkulacji linii – dla całej tabeli, dla grupy danych i dla pojedynczego elementu wykresu:
- Line – określa sposób kalkulacji linii. Możemy wybrać miarę (która musi być na wykresie – ale może być np. ukryta w tooltipie) lub parametr, sposób agregacji (total, suma, stała, min, max, średnia, mediana), etykietę danych (nazwę miary, wartość lub dowolną zdefiniowaną przez użytkownika), ustawić tooltip oraz dodać przedziały ufności.
- Formatting – ustawiamy tutaj formatowanie linii oraz opcjonalnie wypełnienie ponad/poniżej linii
Zastosowanie linii referencyjnych
Podstawową funkcja linii referencyjnych jest dodanie kolejnego wymiaru analizy danych. Oprócz kalkulacji średnich i na podstawie identyfikacji odchyleń jak na wykresach powyżej, możemy linie referencyjne wykrozystać do analizy odchyleń do zadanej referencji. W tym celu potrzebujemy dwóch miar pokazujących aktualną i referencyjną wartość, przykładowo sprzedaż obecną i poprzednią. Następnie jedną z nich (odniesienie) przedstawiamy w postaci linii referencyjnych na poziomie komórki (per cell). Jeżeli dodatkowo wykorzystamy kolor, od razu możemy zidentyfikować pozytywne i negatywne odchylenia:
Innym zastosowaniem może być segmentacja danych – w tym celu wykorzystamy scatter plot z dwoma miarami, następnie dodamy dwie linie średnie, dzieląc tym samym wykres na cztery ćwiartki, dzieląc dane na grupy:
Otrzymany w ten sposób podział jasno wskazuje kategorie top – wysoka sprzedaż i zysk – prawy górny róg. Z drugiej strony mamy kategorie w lewym dolnym roku, z niską sprzedaż i zyskiem (w niektórych przypadkach nawet ujemnym).
Dynamiczne linie referencyjne
Przy konfiguracji linii referencyjnych wspomniałem, że oprócz miary możemy wybrać parametr jako wartość przedstawianą przez linię. Może być to przydatne przy dynamicznych scenariuszach, gdzie chcemy oddać użytkownikowi kontrolę nad odniesieniem. Aby wykorzystać tę funkcjonalność musimy zacząć od stworzenia parametrów do sterowania wartościami:
Następnie edytujemy linie referencyjne, zmieniając miarę w polu Value z miary na parametr:
Kolejnym krokiem jest dodanie sterowania parametrami na wykresie. Aby dopełnić analizy możemy stworzyć segmenty powyżej/poniżej celu i nadać odpowiednie kolory kategoriom:
Tym sposobem uzyskujemy niezwykle użyteczne narzędzie wizualno-analityczne, które umożliwia dynamiczną segmentację w zależności od zadanych celów. Tak uzyskane narzędzie możemy dalej modyfikować, dodając filtry i większe poziomy szczegółowości:
Linie referencyjne wspomagają analizę danych
Linie referencyjne są bardzo użytecznym i funkcjonalnym elementem wspomagającym wizualną analitykę danych. Dostarczają dodatkowego wymiaru analizy poprzez dodanie wartości zagregowanych (jak średnia) i pozwala tym samym na identyfikację odchyleń. Pozwalają również ocenić realizację danych wskaźników biznesowych w odniesieniu do referencji w postaci poprzednich okresów lub zdefiniowanych celów. Używając linii referencyjnych należy jednak pamiętać o czytelności naszych wizualizacji – nadmierna liczba linii może ograniczyć użyteczność głównych wizualizacji. Dobrze jest więc używać ich oszczędnie, na tyle na ile jest to potrzebne – nie więcej. Warto jednak sięgać po linie referencyjne, ponieważ dostarczają realnej wartości poprzez zwiększenie użyteczności wizualizacji w środowisku biznesowym.
Mateusz Karmalski Tableau Author