Webinaria: Biurowe narzedzia informatyczne | Narzedzia business intelligence

Tableau – Data blending, czyli mieszanie danych o różnych poziomach agregacji

Udostępnij!

Tableau skrywa w sobie wiele możliwości. Aby w pełni z nich skorzystać należy zagłębić się m.in. w temat mieszania danych (data blending). Jest to opcja pozwalająca na wykorzystanie w wizualizacjach danych agregowanych na różnych poziomach szczegółowości (np. dane dobowe w porównaniu z zestawieniem rocznym). Ten film w prosty sposób wyjaśni Ci jak wykorzystać takie dane oraz pokaże w jaki sposób je łączyć nawet gdy na pierwszy rzut oka nie ma kolumn, które do takiego połączenia się nadają.

 

TRANSKRYPCJA

Witam Państwa, dzisiaj zaawansowany temat. Tableau, czyli Data Blending, bądź, jak kto woli, mieszanie danych, które jest niezwykle interesującą, choć dość trudną opcją jeżeli chodzi o Tableau.

 

Data Blending, czyli nasze mieszanie danych, polega na używaniu w ramach jednej wizualizacji danych o różnym stopniu agregacji. Co przez to możemy rozumieć? Tutaj możemy zerknąć sobie na początek na naszego Excela gdzie będziemy łączyć dane sprzedażowe gdzie sprzedaż mamy w kontekście każdego jednego dnia i będziemy łączyć to z planami do wykonania, które tak naprawdę są w kontekście miesiąca. Więc mamy tutaj inny poziom szczegółowości danych, tam mamy pojedyncze dni, a tutaj mamy plan do wykonania per miesiąc. Więc za pomocą Tableau będziemy chcieli połączyć te dwa źródła i wykonać z nich wizualizacje. Zabieramy się za pracę.

 

Więc po pierwsze, pobierzemy sobie nasze dane z Excela, zaczniemy od sprzedaży i potrzebujemy naszego arkusza „Sprzedaż” gdzie będziemy używać właśnie tych dat. Tu problem będzie też polegał na tym, że nie będziemy mogli tego Data Blendingu przeprowadzić na poziomie daty ponieważ tam jest zawsze data na koniec miesiąca, chociaż trafiają się też oczywiście sprzedaże w środku miesiąca i to jest nasze pierwsze źródło danych, czyli sprzedaż. Potrzebujemy zrobić sobie nowe źródło danych, czyli New Data Source, również z Excela i będą to nasze plany do wykonania i one są na innym poziomie szczegółowości bo mimo, że mamy podaną tę datę, to tak naprawdę jest to data z końca miesiąca więc jest to zestawienie za ostatni dzień danego miesiąca jaki plan dany pracownik powinien wykonać.

 

Mamy już nasze dwa źródła danych pobrane więc możemy przejść do arkusza i spróbować wykonać naszą wizualizację, czyli mamy źródło danych „Sprzedaż”, mamy nasz plan pracownika i będziemy chcieli odpowiednio dla każdego pracownika sprawdzić sprzedaż w czasie. Możemy nawet zrobić to w rozbiciu w kontekście miesięcznym, dodatkowo wybierzemy sobie naszą wartość i podsumujemy wartość sprzedaży dla każdego pracownika, odrobinę więcej miejsca żeby ładniej wyglądało. Teraz tę naszą sprzedaż chcemy pokazać w kontekście planów jakie dany pracownik miał w konkretnym miesiącu więc możemy teraz połączyć te dwa źródła danych i to oczywiście na odpowiednim poziomie szczegółowości. Więc wybierzemy sobie w naszym Data, czyli wybierzemy w danych, wybierzemy polecenie odpowiednie „Edit Relationships” i wskażemy niestandardowy sposób połączenia. Dodajemy takie połączenie, w którym odpowiednio wskażemy, że nasz pracownik z jednego źródła musi się zgadzać z pracownikiem z drugiego źródła, ale to za mało. Musimy jeszcze powiedzieć, że odpowiedni miesiąc ma się zgadzać z miesiącem z drugiego źródła no i dodamy sobie jeszcze jedno określenie, że oczywiście też rok wchodzi w grę, czyli rok w tym wypadku, year, zgadza się z naszym planem, też z jego rokiem.

 

Czyli mimo, że w tych jednych i drugich danych nie mieliśmy takiego połączenia, to możemy sobie, że tak powiem, za pomocą funkcji wyciągnąć te informacje i zrobić takie połączenie. Mamy nasze podsumowanie wartości więc chcemy jeszcze do tego nałożyć na to plan naszego pracownika więc łapiemy plan, dołożymy go do naszej wizualizacji, widzimy w tym momencie wartość sprzedaży oraz plan jaki tam był. Chcielibyśmy nałożyć te wartości na siebie więc zamienimy ten wykres typu Dual Axis, czyli podwójną oś, zarówno oś po lewej jak i po stronie prawej i dzięki temu nakładamy na siebie te dwa wykresy. Ale uwaga, operacja ta jest niebezpieczna dlatego, że te osie w tym momencie są ze sobą niezsynchronizowane więc może być to mylące, że mamy jedną skalę do 30 tys., drugą właściwie do 10. Więc koniecznie jeszcze jest niezbędne zsynchronizowanie tych osi ze sobą i dopiero wtedy faktycznie możemy porównywać te wartości.

 

Aby nam było łatwiej, wybierzemy sobie tę właśnie naszą sumę planów, zamienimy jej typ wykresu na Area, czyli powierzchniowy, dołożymy do tego w kolorze odpowiedni poziom przezroczystości tak żeby nie były za bardzo przesłonięte dane pod spodem, a nasze wyniki, czyli sumę wartości, zamieniamy na wykres typu Bar, czyli słupkowy. Więc dzięki temu zobaczymy jak, w którym miejscu nasze dane, czyli nasz plan, został wykonany, w którym miejscu nie został wykonany. Możemy ewentualnie dla drobnej kosmetyki zamienić jeszcze dane naszych miesięcy na Discrete, tak żeby się nam zaczynały w połowie, a nie na początku danego miesiąca. I w ten sposób dla każdego pracownika widzimy tym lekkim wykresem jego plan jaki miał do wykonania w danym miesiącu, a słupki wskazują czy ten plan wykonał czy go nie wykonał. Dziękuję serdecznie i zapraszam na kolejne filmy z serii Tableau.