Progowanie danych w Google Analytics 4
Pracując z Google Analytics 4 możesz mieć do czynienia z sytuacją, kiedy na Stronie Głównej lub dowolnego, otwartego raportu zauważysz charakterystyczny pomarańczowy alert informujący o zastosowaniu progowania. Jak go rozumieć?
Co to jest progowanie danych?
Progowanie danych to jedna z funkcji Google Analytics 4 wdrożona do ochrony prywatności użytkowników — poprzez wyeliminowanie możliwości ustalania ich tożsamości na podstawie zainteresowań, czy danych demograficznych: wieku, płci. Jak wskazuje Google w oficjalnym komunikacie:
Progi danych są stosowane, aby nikt, kto przegląda raport lub eksplorację, nie mógł wnioskować o tożsamości poszczególnych użytkowników na podstawie danych demograficznych, zainteresowań lub innych sygnałów obecnych w danych.
Źródło: [GA4] Wartości progowe danych
Warto w tym miejscu zaznaczyć, że część z danych demograficznych GA4 gromadzi domyślnie, w tym: język (pochodzi z ustawień przeglądarki), kraj i miasto (z adresu IP).
Co wpływa na progowanie danych w Google Analytics 4?
Za pojawienie się progu danych odpowiada Google Signals — kolejna z funkcji nowej edycji Analytics. Dzięki Signals i jego mechanizmowi reklamowego ID (z ang. advertising ID) przypisanego indywidualnie do urządzenia mobilnego, Analytics jest w stanie dokładnie identyfikować użytkowników w zależności od urządzenia, z jakiego odwiedzają Twoją witrynę, a nawet segmentować ich w zależności od między innymi:
-
danych demograficznych,
-
zainteresowań (w tym intencji zakupowych),
-
aktywności na witrynie (historia przeglądania).
Pozostałe korzyści wynikające z aktywacji Google Signals omawiamy w artykule:
Google Signals. Co to jest i jakie korzyści przynosi?
Dane gromadzone dzięki Signals są anonimowe i agregowane; maksymalnie przez 26 miesięcy. Co oznacza, że wgląd do nich możliwy jest dopiero po zebraniu ich w wystarczającej ilości — gwarantującej nierozpoznawalność użytkowników, tj. 50 na zdarzenie. Kiedy zatem raport Pozyskiwanie ruchu przefiltrujesz według kryterium Źródło/Medium i zauważysz, iż dla niektórych źródeł ruchu liczba użytkowników na zdarzenie wynosi poniżej 50, możesz być pewien, że Google Analytics ukrył dotyczące ich dane.
Kiedy Google Analytics stosuje progowanie danych?
Każdorazowo w sytuacji, kiedy liczba użytkowników raportowana dla określonego przedziału czasu jest zbyt niska, tj. nie sięga co najmniej 50 (na zdarzenie).
Czy progowanie danych wpływa na dokładność gromadzonych danych?
To zależy.
W przypadku dużych witryn internetowych, które odwiedzane są przez tysiące użytkowników dziennie, progowanie obejmuje zwykle nie więcej niż zaledwie kilka procent całego ruchu. Nie wpływa zatem w znaczącym stopniu na szczegółowość danych, szczególnie że Analytics 4 ma możliwość wypełnienia ewentualnych luk choćby modelowanymi danymi.
Niemniej jednak dla niewielkich stron internetowych, notujących zaledwie kilkadziesiąt czy kilkaset odwiedzin w ciągu dnia, czy nawet tygodnia, progowanie stanowi duży kłopot. By zniwelować jego oddziaływanie na gromadzone dane oraz zwiększyć możliwości ich obiektywnej analizy, konieczne jest włączenie na stałe tożsamości raportowania bazującej na urządzeniu.
Jak poradzić sobie z progowaniem danych?
Jakie działania można podjąć, by poradzić sobie z progowaniem w GA4?
Nie włączaj funkcji Google Signals
Rozwiązanie sprawdzi się wyłącznie pod warunkiem, że nie planujesz wykorzystywać raportów demograficznych ani list odbiorców domyślnie tworzonych przez Google Analytics 4 — na podstawie danych gromadzonych dzięki Google Signals — w kampaniach Google Ads. Przede wszystkim remarketingu.
Edytuj raporty
W przypadku, kiedy Google Signals jest włączone i zależy nam na danych, jakie dzięki niemu gromadzimy, możemy usunąć progowanie poprzez wykluczenie danych o użytkownikach z raportów (Pozyskiwanie użytkowników, Pozyskiwanie ruchu). Z reguły wystarczy ukryć wskaźnik Użytkownicy. Dodatkowo możemy usunąć z raportu także wskaźnik Sesje z zaangażowaniem na użytkownika.
Edytuj domyślną tożsamość raportowania
Domyślna tożsamość raportowania wskazuje, w jaki sposób Analytics 4 oblicza liczbę użytkowników, którzy odwiedzają zarówno witryny, jak i aplikacje. Chcąc ją zweryfikować — i ewentualnie zaktualizować — wejdź w Administracja -> Tożsamość na potrzeby raportowania.
Źródło: panel administracyjny Google Analytics 4
Po przejściu do zakładki zauważysz dwie możliwe do wyboru opcje:
-
Mieszana,
-
Obserwowane kategorie.
W rzeczywistości są trzy:
-
Mieszana,
-
Obserwowane kategorie,
-
Zależnie od urządzenia.
Źródło: panel administracyjny Google Analytics 4
Mieszana tożsamość raportowania
Najbardziej zaawansowana opcja, obejmuje metody identyfikacji użytkownika, jakie wykorzystywane są w pozostałych wariantach — ID użytkownika, ID urządzenia, Google Signals. Ponadto wykorzystuje uczenie maszynowe do modelowania danych. Co z kolei pozwala na uzupełnianie luk na ścieżce konwersji. Aktywacja mieszanej tożsamości raportowania wymaga wdrożenia na witrynę Consent Mode.
Źródło: panel administracyjny Google Analytics 4
Tożsamość raportowania – obserwowane kategorie
Średniozaawansowana metoda tożsamości raportowania bazująca na trzech wymiarach — ID użytkownika, ID urządzenia, Google Signals. Pozwalają one Google Analytics na poprawną identyfikację użytkownika (jako pojedynczej osoby) w przypadku, gdy na ścieżce konwersji korzysta z kilku różnych urządzeń.
Źródło: panel administracyjny Google Analytics 4
Tożsamość raportowania – zależne od urządzenia
Podstawowy wariant definiowania tożsamości na potrzeby raportowania używa jedynie ID urządzenia. NIE OBEJMUJE GOOGLE SIGNALS, a tym samym uniemożliwia Google Analytics identyfikację użytkowników w zależności od urządzenia (użytkownik korzystający na ścieżce konwersji z kilku urządzeń traktowany jest jako kilku niezależnych odbiorców). Co z kolei oznacza BRAK PROGOWANIA danych.
Źródło: panel administracyjny Google Analytics 4
W pozostałych wariantach tożsamości raportowania — Mieszana, Obserwowane kategorie — progowanie stosowane jest ze względu obecność aktywnej funkcji Signals.
Pomarańczowy alert widoczny w raportach Google Analytics 4 to nic innego, jak komunikat o zastosowaniu progowania danych. Mimo iż nie można wyeliminować go zupełnie, to istnieje kilka sposobów na to, by zniwelować jego wpływ na przemyślaną analitykę szeroko pojętych danych marketingowych. Nie jesteś pewien, który przyniesie najwięcej korzyści dla Twojego biznesu? Skonsultuj się z nami!
autor artykułu
Paulina Rybak
PERFORMANCE SPECIALIST