SlideShare a Scribd company logo
1 of 15
Download to read offline
Google Analytics 4
a BigQuery
JanTichý
Realtime
Endpoint Storage
Linked Products
Ads
Reporting
Query Engine
Processing
Collection
Google Analytics 4 Platform Architecture
JanTichý, www.jantichy.cz
Browser
Web Server
CRM, ERP
Measurement
Protocol
Endpoint
Prepro-
cessing
Core Data
Processing
Realtime Data Processing
BigQuery
Data API
DWH, ETL, BI
CRM, ERP
Google Analytics
Reports
Data Studio
Power BI
Tableau
Mobile Apps
(Firebase)
Logs
Realtime Data Storage
Raw
Event
Data
Pre-aggreg.
& Expanded
Data
Search Console
Modelling
&
Aggregation
GTM / Gtag
Container
Signals
Data Import
Collection/Processing Time Data Reporting/Query Time Data
Configuration
Google Analytics Admin Admin API Provisioning API User Deletion API
SGTM
Kdy se hodí jaký přístup?
Běžná webová analytika pro většinové
běžné uživatele
Stačí vám agregované reporty
Využijete veškerého luxusu
předpočítaného modelu
Atribuce, cross-device párování,
modelování chybějících uživatelů…
Signály a demografie
Publika a export do Google Ads
Potřebujete jít na detailní granularitu
uživatelů, objednávek nebo událostí
Nevyhovuje vám výchozí metodika
Google Analytics 4
Chcete si napočítávat vlastní modely,
atribuce, predikce…
Chcete mít vše na jednom místě a
spojovat si to s dalšími datovými sily
Tohle vše umíte a chcete dělat sami
Google Analytics 4 Google BigQuery
Výchozí GA4 data v BigQuery stojí za pendrek
Výchozí GA4 data v BigQuery stojí za pendrek
Nenapočítává sám vůbec žádné
metriky, modely, atribuce…
Nic nepredikuje, nemodeluje
chybějící uživatele, nespojuje
cross-device
Jen surová eventová data,
vše si musím spočítat sám
Pro přímý reporting je to
komplikované a drahé
Nešikovně ukládané zdroje návštěv
Nemá unikátní ID událostí
Nemá unikátní ID návštěv
Slabě propojená různá zařízení
stejného přihlášeného uživatele
Zanořené parametry, uživatelské
proměnné i produkty
Vše s sebou nese jen dílčí event,
i zdroje návštěv nebo uživatelské
proměnné
Chyby ve sbíraných datech
(Google Ads jako google/organic)
Musíte si nad tím napočítat vlastní model
Základní principy, co od toho očekáváte
Připravit model přímo použitelný pro reporting
Pokud má něco dělat pokročilý geek, tak jen setup toho modelu
Vše v redundantních flat tabulkách již připravené, dopočítané, rozpočítané
Běžní uživatelé si musí vystačit v nejhorším s triviálními operacemi
SELECT, FROM jedna tabulka,WHERE, AVG/SUM/COUNT, GROUP BY, ORDER BY
Přímé napojení vizualizačního nástroje bez dalšího dopočítávání
Intuitivní naming všech tabulek i sloupců
Šetřit výkon a cenu za dotazy, inkrementální aktualizace
Dlouhodobá udržitelnost, přehlednost, rozšiřitelnost
4 vrstvy datového modelu v BigQuery
Původní raw event data z Google Analytics 4
Normalizovaná granulární event tabulka
all_events (+ recent_events)
Další granulární tabulky
all_users, all_sessions, all_pageviews, all_transactions… (+ recent_...)
Agregované tabulky pro reporting
daily_events, daily_users, daily_sessions, daily_acquisition, daily_items,
daily_pageviews, daily_downloads…
Už třeba jenom definice návštěvy nebo zdroje návštěvnosti:
Nejdřív si vyjasněte metodiku, jakou chcete
page_view
Uživatel page_view page_view
session_start
first_visit
session_start
purchase
Facebook Sklik
Opravte a doplňte data z původní event tabulky
Deduplikované duplicitní události
Dopočítaná unikátní session_id a event_id
Oddělení consentovaných a neconsentovaných eventů
Unnestované všechny parametry a proměnné
Napočítání variantních sloupců
rok, měsíc, den, hodina, minuta, týden… z timestampu
hostname, path, parametry… z page_location
Dotáhnutí detailů o Google Ads kampaních podle GCLID
Očištění a oprava zdrojů dat a dalších nepřesnosti s pomocí „filtrů“
Domodelujte vše, co potřebujete
Spojení uživatelů a prohlížečů pod společnou reporting identity
Dopočítat k uživatelům poslední hodnoty jejich uživatelských proměnných
Provést sessionizaci
Dopočítat k jednotlivým návštěvám jejich zdroje podle zvolené metodiky
First user acquisition, last-click, last-session
Tohle všechno pak zpětně promítnout do úplně každé události
Výsledkem jsou základní granulární tabulky
all_events, all_users, all_sessions, all_pageviews, all_transactions…
Agregujte si nad tím dle potřeby do reporting tabulek
Pro každý reporting usecase připravte jeho ad hoc agregovanou tabulku
Anebo využijte či lehce rozšiřte některou již existující
Ale většinou spíš nereportovat nad základními granulárními tabulkami!
daily_pageviews, daily_downloads, daily_menuclicks, weekly_users,
monthly_acquisitions…
Je OK mít třeba i desítky malých agregovaných reporting tabulek
Hlavní kritérium – kardinalita
Jak to celé udržet a zautomatizovat?
Scheduled queries
DBT + GA4 package
DataForm
Jednoduchý cron přes Cloud Scheduler
Spustit hned po exportu z GA4 přes Pub/Sub event + CloudWorkflow
Související zdroje
Školení GA4 Masterclass
https://academy.taste.cz/google-analytics-4-masterclass
Vašek Jelen: GA4 - vyhodnocování kampaní v Google BigQuery
https://www.linkedin.com/pulse/ga4-vyhodnocov%C3%A1n%C3%AD-kampan%C3%AD-v-google-bigquery-
va%C5%A1ek-jelen
BigQuery SQL Cheat Sheet for GA4
https://tanelytics.com/ga4-bigquery-cheat-sheet/
GA4 package pro DBT
https://hub.getdbt.com/velir/ga4/
Automatické spuštění DataFormu hned po GA4 exportu
https://tanelytics.com/trigger-dataform-after-ga4-bigquery-export/
Díky za pozornost!
Digitální agenturaTaste
taste.cz
info@taste.cz
Google CertifiedTrainer
jantichy.cz
jan.tichy@taste.cz

More Related Content

What's hot

What's hot (20)

PPC Restart 2022: Jan Janoušek - Využijte maximální potenciál kampaně Perform...
PPC Restart 2022: Jan Janoušek - Využijte maximální potenciál kampaně Perform...PPC Restart 2022: Jan Janoušek - Využijte maximální potenciál kampaně Perform...
PPC Restart 2022: Jan Janoušek - Využijte maximální potenciál kampaně Perform...
 
Data Restart 2023: Viet Anh Chu Jakub Kříž - Od teorie k praxi: Efektivní prá...
Data Restart 2023: Viet Anh Chu Jakub Kříž - Od teorie k praxi: Efektivní prá...Data Restart 2023: Viet Anh Chu Jakub Kříž - Od teorie k praxi: Efektivní prá...
Data Restart 2023: Viet Anh Chu Jakub Kříž - Od teorie k praxi: Efektivní prá...
 
Data Restart 2023: Šárka Korychová - Singularita v kontextu zákazníka
Data Restart 2023: Šárka Korychová -  Singularita v kontextu zákazníkaData Restart 2023: Šárka Korychová -  Singularita v kontextu zákazníka
Data Restart 2023: Šárka Korychová - Singularita v kontextu zákazníka
 
PPC Restart 2023: David Janoušek a Jan Janoušek - SATO aneb jak přemýšlet nad...
PPC Restart 2023: David Janoušek a Jan Janoušek - SATO aneb jak přemýšlet nad...PPC Restart 2023: David Janoušek a Jan Janoušek - SATO aneb jak přemýšlet nad...
PPC Restart 2023: David Janoušek a Jan Janoušek - SATO aneb jak přemýšlet nad...
 
Data Restart 2023: Jan Tichý - Keynote: Už je čas začít používat data
Data Restart 2023: Jan Tichý - Keynote: Už je čas začít používat dataData Restart 2023: Jan Tichý - Keynote: Už je čas začít používat data
Data Restart 2023: Jan Tichý - Keynote: Už je čas začít používat data
 
PPC Restart 2023: Matouš Ledvina - AI jako klíč pro efektivní marketing
PPC Restart 2023: Matouš Ledvina - AI jako klíč pro efektivní marketingPPC Restart 2023: Matouš Ledvina - AI jako klíč pro efektivní marketing
PPC Restart 2023: Matouš Ledvina - AI jako klíč pro efektivní marketing
 
Data Restart 2023: Václav Ráš - 10 tipů, jak pracovat s BigQuery
Data Restart 2023: Václav Ráš - 10 tipů, jak pracovat s BigQueryData Restart 2023: Václav Ráš - 10 tipů, jak pracovat s BigQuery
Data Restart 2023: Václav Ráš - 10 tipů, jak pracovat s BigQuery
 
PPC Restart 2023: Jiří Novotný - Zasáhněte svoji cílovou skupinu přesně a spo...
PPC Restart 2023: Jiří Novotný - Zasáhněte svoji cílovou skupinu přesně a spo...PPC Restart 2023: Jiří Novotný - Zasáhněte svoji cílovou skupinu přesně a spo...
PPC Restart 2023: Jiří Novotný - Zasáhněte svoji cílovou skupinu přesně a spo...
 
PPC Restart 2023: Petra Nulíčková - Jsou PPCčkaři diamanty ve světě reklamy?
PPC Restart 2023: Petra Nulíčková - Jsou PPCčkaři diamanty ve světě reklamy?PPC Restart 2023: Petra Nulíčková - Jsou PPCčkaři diamanty ve světě reklamy?
PPC Restart 2023: Petra Nulíčková - Jsou PPCčkaři diamanty ve světě reklamy?
 
Data Restart 2023: Petra Dolejšová - Práce s daty v roce 2023 – držíte krok?
Data Restart 2023: Petra Dolejšová - Práce s daty v roce 2023 – držíte krok?Data Restart 2023: Petra Dolejšová - Práce s daty v roce 2023 – držíte krok?
Data Restart 2023: Petra Dolejšová - Práce s daty v roce 2023 – držíte krok?
 
Data Restart 2023: Stanislav Račinský - Debugování Google Analytics 4 v aplik...
Data Restart 2023: Stanislav Račinský - Debugování Google Analytics 4 v aplik...Data Restart 2023: Stanislav Račinský - Debugování Google Analytics 4 v aplik...
Data Restart 2023: Stanislav Račinský - Debugování Google Analytics 4 v aplik...
 
PPC Restart 2023: Ladislav Vitouš - AI pro PPC: Mezi hypem a realitou
PPC Restart 2023: Ladislav Vitouš - AI pro PPC: Mezi hypem a realitouPPC Restart 2023: Ladislav Vitouš - AI pro PPC: Mezi hypem a realitou
PPC Restart 2023: Ladislav Vitouš - AI pro PPC: Mezi hypem a realitou
 
PPC Restart 2023: Ondřej Sláma - Videoreklama na YouTube - přemýšlíme nad ní ...
PPC Restart 2023: Ondřej Sláma - Videoreklama na YouTube - přemýšlíme nad ní ...PPC Restart 2023: Ondřej Sláma - Videoreklama na YouTube - přemýšlíme nad ní ...
PPC Restart 2023: Ondřej Sláma - Videoreklama na YouTube - přemýšlíme nad ní ...
 
Social Restart 2022: David Čedík, Jana Plháková - Koheze Community management...
Social Restart 2022: David Čedík, Jana Plháková - Koheze Community management...Social Restart 2022: David Čedík, Jana Plháková - Koheze Community management...
Social Restart 2022: David Čedík, Jana Plháková - Koheze Community management...
 
Social Restart 2022: Štěpán Trnka - Nedělejte social blbě
Social Restart 2022: Štěpán Trnka - Nedělejte social blběSocial Restart 2022: Štěpán Trnka - Nedělejte social blbě
Social Restart 2022: Štěpán Trnka - Nedělejte social blbě
 
Data Restart 2022: Jan Tichý - Keynote: Analytika je mrtvá. Ať žije analytika!
Data Restart 2022: Jan Tichý - Keynote: Analytika je mrtvá. Ať žije analytika!Data Restart 2022: Jan Tichý - Keynote: Analytika je mrtvá. Ať žije analytika!
Data Restart 2022: Jan Tichý - Keynote: Analytika je mrtvá. Ať žije analytika!
 
Brand Restart 2023: Martin Bernátek a David Dvořáček - Huňatý branding pro Ov...
Brand Restart 2023: Martin Bernátek a David Dvořáček - Huňatý branding pro Ov...Brand Restart 2023: Martin Bernátek a David Dvořáček - Huňatý branding pro Ov...
Brand Restart 2023: Martin Bernátek a David Dvořáček - Huňatý branding pro Ov...
 
Social Restart 2022: Petra Dolejšová - Právní sedmero pro práci na sociálních...
Social Restart 2022: Petra Dolejšová - Právní sedmero pro práci na sociálních...Social Restart 2022: Petra Dolejšová - Právní sedmero pro práci na sociálních...
Social Restart 2022: Petra Dolejšová - Právní sedmero pro práci na sociálních...
 
PPC Restart 2023: Libor Mattuš - Optimalizujte nejen kampaně, ale i sebe
PPC Restart 2023: Libor Mattuš - Optimalizujte nejen kampaně, ale i sebePPC Restart 2023: Libor Mattuš - Optimalizujte nejen kampaně, ale i sebe
PPC Restart 2023: Libor Mattuš - Optimalizujte nejen kampaně, ale i sebe
 
Prezentace 13. PPC camp - GA4 tipy a triky pro PPCčkaře
Prezentace 13. PPC camp - GA4 tipy a triky pro PPCčkařePrezentace 13. PPC camp - GA4 tipy a triky pro PPCčkaře
Prezentace 13. PPC camp - GA4 tipy a triky pro PPCčkaře
 

Similar to Data Date #3: Jan Tichý - Jak pracovat v BigQuery s daty z Google Analytics 4

Universal Analytics
Universal AnalyticsUniversal Analytics
Universal Analytics
Taste Medio
 

Similar to Data Date #3: Jan Tichý - Jak pracovat v BigQuery s daty z Google Analytics 4 (20)

Google Analytics 4 pro úplné začátečníky - Czech On-line Expo 2024
Google Analytics 4 pro úplné začátečníky - Czech On-line Expo 2024Google Analytics 4 pro úplné začátečníky - Czech On-line Expo 2024
Google Analytics 4 pro úplné začátečníky - Czech On-line Expo 2024
 
Taste webinář: Jan Tichý - Přecházíme na Gogle Analytics 4
Taste webinář: Jan Tichý - Přecházíme na Gogle Analytics 4Taste webinář: Jan Tichý - Přecházíme na Gogle Analytics 4
Taste webinář: Jan Tichý - Přecházíme na Gogle Analytics 4
 
Marketing hackathon 2023 - Google Analytics 4 pro úplné začátečníky
Marketing hackathon 2023 - Google Analytics 4 pro úplné začátečníkyMarketing hackathon 2023 - Google Analytics 4 pro úplné začátečníky
Marketing hackathon 2023 - Google Analytics 4 pro úplné začátečníky
 
Data Restart 2021: Vašek Jelen - Analýza Google Analytics 4 dat v prostředí G...
Data Restart 2021: Vašek Jelen - Analýza Google Analytics 4 dat v prostředí G...Data Restart 2021: Vašek Jelen - Analýza Google Analytics 4 dat v prostředí G...
Data Restart 2021: Vašek Jelen - Analýza Google Analytics 4 dat v prostředí G...
 
Jak na Smartlook, nejen pro Shoptet
Jak na Smartlook, nejen pro ShoptetJak na Smartlook, nejen pro Shoptet
Jak na Smartlook, nejen pro Shoptet
 
Jak číst a vyhodnocovat data v Google Analytics - Czech On-line Expo 2023
 Jak číst a vyhodnocovat data v Google Analytics - Czech On-line Expo 2023 Jak číst a vyhodnocovat data v Google Analytics - Czech On-line Expo 2023
Jak číst a vyhodnocovat data v Google Analytics - Czech On-line Expo 2023
 
Jak přejít z Universal Analytics na GA4 / Marek Čech
Jak přejít z Universal Analytics na GA4 / Marek ČechJak přejít z Universal Analytics na GA4 / Marek Čech
Jak přejít z Universal Analytics na GA4 / Marek Čech
 
SEO Date #3: David Bureš - GA4 pro SEO ve 20 minutách
SEO Date #3: David Bureš - GA4 pro SEO ve 20 minutáchSEO Date #3: David Bureš - GA4 pro SEO ve 20 minutách
SEO Date #3: David Bureš - GA4 pro SEO ve 20 minutách
 
Universal Analytics
Universal AnalyticsUniversal Analytics
Universal Analytics
 
Open Monday: Jak se připravit na zkoušku Google Analytics IQ
Open Monday: Jak se připravit na zkoušku Google Analytics IQOpen Monday: Jak se připravit na zkoušku Google Analytics IQ
Open Monday: Jak se připravit na zkoušku Google Analytics IQ
 
Rozdíl mezi webovou analytikou a počítadlem návštěvnosti
Rozdíl mezi webovou analytikou a počítadlem návštěvnostiRozdíl mezi webovou analytikou a počítadlem návštěvnosti
Rozdíl mezi webovou analytikou a počítadlem návštěvnosti
 
Google Data Studio
Google Data StudioGoogle Data Studio
Google Data Studio
 
Omni-channel data-driven atribuční modelování jednoduše, Marek Kobulský
Omni-channel data-driven atribuční modelování jednoduše, Marek KobulskýOmni-channel data-driven atribuční modelování jednoduše, Marek Kobulský
Omni-channel data-driven atribuční modelování jednoduše, Marek Kobulský
 
Digisemestr - Webová analytika chytře s Google Analytics - workshop 16. 11. 2015
Digisemestr - Webová analytika chytře s Google Analytics - workshop 16. 11. 2015Digisemestr - Webová analytika chytře s Google Analytics - workshop 16. 11. 2015
Digisemestr - Webová analytika chytře s Google Analytics - workshop 16. 11. 2015
 
Synergie PPC a programatických kampaní
Synergie PPC a programatických kampaníSynergie PPC a programatických kampaní
Synergie PPC a programatických kampaní
 
Data Date #2: Aneta Hejnová - Co nám přinesly (a vzaly) Google Analytics 4
Data Date #2: Aneta Hejnová - Co nám přinesly (a vzaly) Google Analytics 4Data Date #2: Aneta Hejnová - Co nám přinesly (a vzaly) Google Analytics 4
Data Date #2: Aneta Hejnová - Co nám přinesly (a vzaly) Google Analytics 4
 
APEK - Facebook reklama pro pokročilé - duben 2022.pdf
APEK - Facebook reklama pro pokročilé - duben 2022.pdfAPEK - Facebook reklama pro pokročilé - duben 2022.pdf
APEK - Facebook reklama pro pokročilé - duben 2022.pdf
 
Automatizace velkých účtů s využitím Google Big Query
Automatizace velkých účtů s využitím Google Big QueryAutomatizace velkých účtů s využitím Google Big Query
Automatizace velkých účtů s využitím Google Big Query
 
Automatizace search term optimalizace
Automatizace search term optimalizaceAutomatizace search term optimalizace
Automatizace search term optimalizace
 
PROFICIO na PPC Restartu 2018
PROFICIO na PPC Restartu 2018PROFICIO na PPC Restartu 2018
PROFICIO na PPC Restartu 2018
 

More from Taste

More from Taste (20)

E-mail Date #2: Jan Krčmář - Retence a RFM: jak pomocí e-mailingu navýšit hod...
E-mail Date #2: Jan Krčmář - Retence a RFM: jak pomocí e-mailingu navýšit hod...E-mail Date #2: Jan Krčmář - Retence a RFM: jak pomocí e-mailingu navýšit hod...
E-mail Date #2: Jan Krčmář - Retence a RFM: jak pomocí e-mailingu navýšit hod...
 
Project Restart 2024: Jiří Langr - Mytologie projektů
Project Restart 2024: Jiří Langr - Mytologie projektůProject Restart 2024: Jiří Langr - Mytologie projektů
Project Restart 2024: Jiří Langr - Mytologie projektů
 
Project Restart 2024: Jan Řezáč - Nahradí AI projektové manažery?
Project Restart 2024: Jan Řezáč - Nahradí AI projektové manažery?Project Restart 2024: Jan Řezáč - Nahradí AI projektové manažery?
Project Restart 2024: Jan Řezáč - Nahradí AI projektové manažery?
 
Project Restart 2024: Hana Březinová - Psychologické tipy pro práci s lidmi n...
Project Restart 2024: Hana Březinová - Psychologické tipy pro práci s lidmi n...Project Restart 2024: Hana Březinová - Psychologické tipy pro práci s lidmi n...
Project Restart 2024: Hana Březinová - Psychologické tipy pro práci s lidmi n...
 
Project Restart 2024: Martin Vasquez - Inteligence je schopnost reagovat na z...
Project Restart 2024: Martin Vasquez - Inteligence je schopnost reagovat na z...Project Restart 2024: Martin Vasquez - Inteligence je schopnost reagovat na z...
Project Restart 2024: Martin Vasquez - Inteligence je schopnost reagovat na z...
 
Project Restart 2024: Pavel Minář - Procesy pro lepší projekty
Project Restart 2024: Pavel Minář - Procesy pro lepší projektyProject Restart 2024: Pavel Minář - Procesy pro lepší projekty
Project Restart 2024: Pavel Minář - Procesy pro lepší projekty
 
Project Restart 2024: Karel Smutný - Specializace patří do 19. století
Project Restart 2024: Karel Smutný - Specializace patří do 19. stoletíProject Restart 2024: Karel Smutný - Specializace patří do 19. století
Project Restart 2024: Karel Smutný - Specializace patří do 19. století
 
Project Restart 2024: Lenka Auerová - Budování holistické organizace
Project Restart 2024: Lenka Auerová - Budování holistické organizaceProject Restart 2024: Lenka Auerová - Budování holistické organizace
Project Restart 2024: Lenka Auerová - Budování holistické organizace
 
E-mail Date #2: Jakub Kalvoda a Barbora Pavlíčková - Jak si udržet skvělé výs...
E-mail Date #2: Jakub Kalvoda a Barbora Pavlíčková - Jak si udržet skvělé výs...E-mail Date #2: Jakub Kalvoda a Barbora Pavlíčková - Jak si udržet skvělé výs...
E-mail Date #2: Jakub Kalvoda a Barbora Pavlíčková - Jak si udržet skvělé výs...
 
E-mail Date #2: Kazimír Krysta - CDP jako stavební kámen retence
E-mail Date #2: Kazimír Krysta - CDP jako stavební kámen retenceE-mail Date #2: Kazimír Krysta - CDP jako stavební kámen retence
E-mail Date #2: Kazimír Krysta - CDP jako stavební kámen retence
 
E-mail Date #2: Markéta Kryštůfková - Multikanálová retence: využijte data o ...
E-mail Date #2: Markéta Kryštůfková - Multikanálová retence: využijte data o ...E-mail Date #2: Markéta Kryštůfková - Multikanálová retence: využijte data o ...
E-mail Date #2: Markéta Kryštůfková - Multikanálová retence: využijte data o ...
 
SEO Restart 2024: Martin Kopta a Jakub Goldmann - Jak se dnes navrhují weby a...
SEO Restart 2024: Martin Kopta a Jakub Goldmann - Jak se dnes navrhují weby a...SEO Restart 2024: Martin Kopta a Jakub Goldmann - Jak se dnes navrhují weby a...
SEO Restart 2024: Martin Kopta a Jakub Goldmann - Jak se dnes navrhují weby a...
 
SEO Restart 2024: Tomáš Zahálka - Tajné SEO tipy pro Shoptet
SEO Restart 2024: Tomáš Zahálka - Tajné SEO tipy pro ShoptetSEO Restart 2024: Tomáš Zahálka - Tajné SEO tipy pro Shoptet
SEO Restart 2024: Tomáš Zahálka - Tajné SEO tipy pro Shoptet
 
SEO Restart 2024: Roman Teuschel - Mezinárodní SEO v kontextu expanze
SEO Restart 2024: Roman Teuschel - Mezinárodní SEO v kontextu expanzeSEO Restart 2024: Roman Teuschel - Mezinárodní SEO v kontextu expanze
SEO Restart 2024: Roman Teuschel - Mezinárodní SEO v kontextu expanze
 
SEO Restart 2024: Sarah Presch - Kognitivní předsudky - jak psychologické teo...
SEO Restart 2024: Sarah Presch - Kognitivní předsudky - jak psychologické teo...SEO Restart 2024: Sarah Presch - Kognitivní předsudky - jak psychologické teo...
SEO Restart 2024: Sarah Presch - Kognitivní předsudky - jak psychologické teo...
 
SEO Restart 2024: Martina Zrzavá Libřická - SEO & DEV: Jak na vývojáře od poc...
SEO Restart 2024: Martina Zrzavá Libřická - SEO & DEV: Jak na vývojáře od poc...SEO Restart 2024: Martina Zrzavá Libřická - SEO & DEV: Jak na vývojáře od poc...
SEO Restart 2024: Martina Zrzavá Libřická - SEO & DEV: Jak na vývojáře od poc...
 
SEO Restart 2024: Vojtěch Fiala - Linkbuilding vs. (digitální) PR: Od odkazů ...
SEO Restart 2024: Vojtěch Fiala - Linkbuilding vs. (digitální) PR: Od odkazů ...SEO Restart 2024: Vojtěch Fiala - Linkbuilding vs. (digitální) PR: Od odkazů ...
SEO Restart 2024: Vojtěch Fiala - Linkbuilding vs. (digitální) PR: Od odkazů ...
 
SEO Restart 2024: Martin Michálek - Nová metrika rychlosti INP a praktické ti...
SEO Restart 2024: Martin Michálek - Nová metrika rychlosti INP a praktické ti...SEO Restart 2024: Martin Michálek - Nová metrika rychlosti INP a praktické ti...
SEO Restart 2024: Martin Michálek - Nová metrika rychlosti INP a praktické ti...
 
SEO Restart 2024: Richard Klačko - Klíčovka s AI pohonem
SEO Restart 2024: Richard Klačko - Klíčovka s AI pohonemSEO Restart 2024: Richard Klačko - Klíčovka s AI pohonem
SEO Restart 2024: Richard Klačko - Klíčovka s AI pohonem
 
SEO Restart 2024: Martin Žatkovič - Můžeme jakožto SEO konzultanti uspět v Go...
SEO Restart 2024: Martin Žatkovič - Můžeme jakožto SEO konzultanti uspět v Go...SEO Restart 2024: Martin Žatkovič - Můžeme jakožto SEO konzultanti uspět v Go...
SEO Restart 2024: Martin Žatkovič - Můžeme jakožto SEO konzultanti uspět v Go...
 

Data Date #3: Jan Tichý - Jak pracovat v BigQuery s daty z Google Analytics 4

  • 1. Google Analytics 4 a BigQuery JanTichý
  • 2. Realtime Endpoint Storage Linked Products Ads Reporting Query Engine Processing Collection Google Analytics 4 Platform Architecture JanTichý, www.jantichy.cz Browser Web Server CRM, ERP Measurement Protocol Endpoint Prepro- cessing Core Data Processing Realtime Data Processing BigQuery Data API DWH, ETL, BI CRM, ERP Google Analytics Reports Data Studio Power BI Tableau Mobile Apps (Firebase) Logs Realtime Data Storage Raw Event Data Pre-aggreg. & Expanded Data Search Console Modelling & Aggregation GTM / Gtag Container Signals Data Import Collection/Processing Time Data Reporting/Query Time Data Configuration Google Analytics Admin Admin API Provisioning API User Deletion API SGTM
  • 3. Kdy se hodí jaký přístup? Běžná webová analytika pro většinové běžné uživatele Stačí vám agregované reporty Využijete veškerého luxusu předpočítaného modelu Atribuce, cross-device párování, modelování chybějících uživatelů… Signály a demografie Publika a export do Google Ads Potřebujete jít na detailní granularitu uživatelů, objednávek nebo událostí Nevyhovuje vám výchozí metodika Google Analytics 4 Chcete si napočítávat vlastní modely, atribuce, predikce… Chcete mít vše na jednom místě a spojovat si to s dalšími datovými sily Tohle vše umíte a chcete dělat sami Google Analytics 4 Google BigQuery
  • 4. Výchozí GA4 data v BigQuery stojí za pendrek
  • 5. Výchozí GA4 data v BigQuery stojí za pendrek Nenapočítává sám vůbec žádné metriky, modely, atribuce… Nic nepredikuje, nemodeluje chybějící uživatele, nespojuje cross-device Jen surová eventová data, vše si musím spočítat sám Pro přímý reporting je to komplikované a drahé Nešikovně ukládané zdroje návštěv Nemá unikátní ID událostí Nemá unikátní ID návštěv Slabě propojená různá zařízení stejného přihlášeného uživatele Zanořené parametry, uživatelské proměnné i produkty Vše s sebou nese jen dílčí event, i zdroje návštěv nebo uživatelské proměnné Chyby ve sbíraných datech (Google Ads jako google/organic)
  • 6. Musíte si nad tím napočítat vlastní model
  • 7. Základní principy, co od toho očekáváte Připravit model přímo použitelný pro reporting Pokud má něco dělat pokročilý geek, tak jen setup toho modelu Vše v redundantních flat tabulkách již připravené, dopočítané, rozpočítané Běžní uživatelé si musí vystačit v nejhorším s triviálními operacemi SELECT, FROM jedna tabulka,WHERE, AVG/SUM/COUNT, GROUP BY, ORDER BY Přímé napojení vizualizačního nástroje bez dalšího dopočítávání Intuitivní naming všech tabulek i sloupců Šetřit výkon a cenu za dotazy, inkrementální aktualizace Dlouhodobá udržitelnost, přehlednost, rozšiřitelnost
  • 8. 4 vrstvy datového modelu v BigQuery Původní raw event data z Google Analytics 4 Normalizovaná granulární event tabulka all_events (+ recent_events) Další granulární tabulky all_users, all_sessions, all_pageviews, all_transactions… (+ recent_...) Agregované tabulky pro reporting daily_events, daily_users, daily_sessions, daily_acquisition, daily_items, daily_pageviews, daily_downloads…
  • 9. Už třeba jenom definice návštěvy nebo zdroje návštěvnosti: Nejdřív si vyjasněte metodiku, jakou chcete page_view Uživatel page_view page_view session_start first_visit session_start purchase Facebook Sklik
  • 10. Opravte a doplňte data z původní event tabulky Deduplikované duplicitní události Dopočítaná unikátní session_id a event_id Oddělení consentovaných a neconsentovaných eventů Unnestované všechny parametry a proměnné Napočítání variantních sloupců rok, měsíc, den, hodina, minuta, týden… z timestampu hostname, path, parametry… z page_location Dotáhnutí detailů o Google Ads kampaních podle GCLID Očištění a oprava zdrojů dat a dalších nepřesnosti s pomocí „filtrů“
  • 11. Domodelujte vše, co potřebujete Spojení uživatelů a prohlížečů pod společnou reporting identity Dopočítat k uživatelům poslední hodnoty jejich uživatelských proměnných Provést sessionizaci Dopočítat k jednotlivým návštěvám jejich zdroje podle zvolené metodiky First user acquisition, last-click, last-session Tohle všechno pak zpětně promítnout do úplně každé události Výsledkem jsou základní granulární tabulky all_events, all_users, all_sessions, all_pageviews, all_transactions…
  • 12. Agregujte si nad tím dle potřeby do reporting tabulek Pro každý reporting usecase připravte jeho ad hoc agregovanou tabulku Anebo využijte či lehce rozšiřte některou již existující Ale většinou spíš nereportovat nad základními granulárními tabulkami! daily_pageviews, daily_downloads, daily_menuclicks, weekly_users, monthly_acquisitions… Je OK mít třeba i desítky malých agregovaných reporting tabulek Hlavní kritérium – kardinalita
  • 13. Jak to celé udržet a zautomatizovat? Scheduled queries DBT + GA4 package DataForm Jednoduchý cron přes Cloud Scheduler Spustit hned po exportu z GA4 přes Pub/Sub event + CloudWorkflow
  • 14. Související zdroje Školení GA4 Masterclass https://academy.taste.cz/google-analytics-4-masterclass Vašek Jelen: GA4 - vyhodnocování kampaní v Google BigQuery https://www.linkedin.com/pulse/ga4-vyhodnocov%C3%A1n%C3%AD-kampan%C3%AD-v-google-bigquery- va%C5%A1ek-jelen BigQuery SQL Cheat Sheet for GA4 https://tanelytics.com/ga4-bigquery-cheat-sheet/ GA4 package pro DBT https://hub.getdbt.com/velir/ga4/ Automatické spuštění DataFormu hned po GA4 exportu https://tanelytics.com/trigger-dataform-after-ga4-bigquery-export/
  • 15. Díky za pozornost! Digitální agenturaTaste taste.cz info@taste.cz Google CertifiedTrainer jantichy.cz jan.tichy@taste.cz