Analytics meetup - Uvod u regularne izraze za Google Analitiku - Dino Kukić

•Download as PPTX, PDF•

1 like•82 views

Meetup održan u Novom Sadu na temu sređivanja loših tj. polusirovih podataka u Google Analitici. Glavni deo predavanja bio je uvod u regularne izraze kako bi slušaoci naučili više o ovoj metodi filtriranja.

Data & Analytics

Kako srediti podatke u
Google Analitici?

O čemu ćemo pričati
• Zašto podatke u Google Analitici uopšte treba filtrirati
• Regularni izrazi (RegEx) kao metoda filtriranja
• Šta je „Ghost“ saobraćaj i kako ga filtrirati
• Kako filtrirati interni saobraćaj

Zašto nam treba filtriranje podataka
u GA
• Ono što dobijamo u GA je obično u nekom polu-sirovom
formatu
• Google se trudi da izbaci sve poznate spamere, ali to
nije uvek lako
• Mi sami provodimo previše vremena na sajtu
• Filtriranje radi segmentacije

Šta su regularni izrazi
• Karakteri namenjeni za pretragu obrazaca u tekstu
• Počeci u ’50-ima
• Stariji i od samog interneta

http://primerprodavnica.com/muskarci/jakne/jakna-1
http://primerprodavnica.com/muskarci/jakne/jakna-2
/jakna-[123]/
/jakna-[456]/

http://primerprodavnica.com/muskarci/jakne/jakna-1
http://primerprodavnica.com/muskarci/jakne/jakna-2
/jakna-[1-3]/
/jakna-[4-6]/

/jakne/hvala-na-kupovini
/majice/hvala-na-kupovini
/cipele/hvala-na-kupovini
/.*/hvala-na-kupovini

Behaviou?r, Colou?r
Behavior|Behaviour, Color|Colour
Behavior, Behaviour, Color, Colour

Co{1,5}l
Cl,Col,Cool,Coool,…
Cooool, Coooool…
Cooooool

http://primerprodavnica.com/muski/jakne/jakna-1
http://primerprodavnica.com/zenski/jakne/jakna-2
/(mu|zen)ski/.*

http://primerprodavnica.com/muski/jakne/jakna-1
http://primerprodavnica.com/zenski/jakne/jakna-2
http://primerprodavnica.com/deca/zenski/jakna-1
/(mu|zen)ski/.*

http://primerprodavnica.com/muski/jakne/jakna-1
http://primerprodavnica.com/zenski/jakne/jakna-2
/jakne/$

Sve je to strava, ali šta ja
da radim s tim?

Šta je to „Ghost“ saobraćaj
• Nisu sve zabeležene posete zaista posete
• Automatizovane skripte poput crawlera trigeruju GA kod
na vašoj stranici i šalju zahtev

Možda će vam delovati poznato...
• Languages report:
• Source:

Identifikacija obrazaca
• Svaka serija SPAMa ima neke obrasce koje je potrebno
identifikovati
• Obično je to Source, Language ili Event
• Konkretno prethodni primer je imao specifičan „jezik“
gde su to bile rečenice:
.{15,}

Hostname
• Jedna od stvari na koju se obično ne obraća pažnja
• U prevodu to je vaš domen
• Shodno tome filter bi bio:
^vasdomen.rs$
^www.vasdomen.rs$

Uklanjanje internog saobraćaja
• Preduslov za ovo je statička IP adresa
• Broj sesija nastalih tokom rada na sajtu može biti
iznenađujuće velik
• Naročito vreme provedeno na sajtu

^192.168.0.1$
^192.168.0.([1-9]|1[0-5])$

^192.168.0.1$
^192.168.0.([1-9]|1[0-5])$
^192.168.0.1?[0-9]$

Analytics meetup - Uvod u regularne izraze za Google Analitiku - Dino Kukić

Featured

Content Methodology: A Best Practices Report (Webinar)contently

How to Prepare For a Successful Job Search for 2024Albert Qian

Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)

Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal

5 Public speaking tips from TED - Visualized summarySpeakerHub

ChatGPT and the Future of Work - Clark Boyd Clark Boyd

Getting into the tech field. what next Tessa Mero

Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray

How to have difficult conversations Rajiv Jayarajah, MAppComm, ACC

Introduction to Data ScienceChristy Abraham Joy

Time Management & Productivity - Best PracticesVit Horky

The six step guide to practical project managementMindGenius

Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36

Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools

12 Ways to Increase Your Influence at WorkGetSmarter

ChatGPT webinar slidesAlireza Esmikhani

More than Just Lines on a Map: Best Practices for U.S Bike RoutesProject for Public Spaces & National Center for Biking and Walking

Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...DevGAMM Conference

Barbie - Brand Strategy PresentationErica Santiago

Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them wellSaba Software

Featured (20)

Content Methodology: A Best Practices Report (Webinar)

How to Prepare For a Successful Job Search for 2024

Social Media Marketing Trends 2024 // The Global Indie Insights

Trends In Paid Search: Navigating The Digital Landscape In 2024

5 Public speaking tips from TED - Visualized summary

ChatGPT and the Future of Work - Clark Boyd

Getting into the tech field. what next

Google's Just Not That Into You: Understanding Core Updates & Search Intent

How to have difficult conversations

Introduction to Data Science

Time Management & Productivity - Best Practices

The six step guide to practical project management

Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...

Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...

12 Ways to Increase Your Influence at Work

ChatGPT webinar slides

More than Just Lines on a Map: Best Practices for U.S Bike Routes

Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...

Barbie - Brand Strategy Presentation

Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well

Analytics meetup - Uvod u regularne izraze za Google Analitiku - Dino Kukić

1. Kako srediti podatke u Google Analitici?

2. O čemu ćemo pričati • Zašto podatke u Google Analitici uopšte treba filtrirati • Regularni izrazi (RegEx) kao metoda filtriranja • Šta je „Ghost“ saobraćaj i kako ga filtrirati • Kako filtrirati interni saobraćaj

3. Zašto nam treba filtriranje podataka u GA • Ono što dobijamo u GA je obično u nekom polu-sirovom formatu • Google se trudi da izbaci sve poznate spamere, ali to nije uvek lako • Mi sami provodimo previše vremena na sajtu • Filtriranje radi segmentacije

4. Šta su regularni izrazi • Karakteri namenjeni za pretragu obrazaca u tekstu • Počeci u ’50-ima • Stariji i od samog interneta

5. |

6. facebook|twitter

7. facebook|twitter|t.co

8. [ ]

9. http://primerprodavnica.com/muskarci/jakne/jakna-1 http://primerprodavnica.com/muskarci/jakne/jakna-2 /jakna-[123]/ /jakna-[456]/

10. –

11. http://primerprodavnica.com/muskarci/jakne/jakna-1 http://primerprodavnica.com/muskarci/jakne/jakna-2 /jakna-[1-3]/ /jakna-[4-6]/

12. .

13. 192.168.0..

14. *

15. Co*l Cl,Col,Cool,Coool,…

16. .*

17. /jakne/hvala-na-kupovini /majice/hvala-na-kupovini /cipele/hvala-na-kupovini /.*/hvala-na-kupovini

18. ?

19. Behaviou?r, Colou?r Behavior|Behaviour, Color|Colour Behavior, Behaviour, Color, Colour

20. +

21. Co+l Cl,Col,Cool,Coool,…

22. { }

23. Co{1,5}l Cl,Col,Cool,Coool,… Cooool, Coooool… Cooooool

24. ( )

25. http://primerprodavnica.com/muski/jakne/jakna-1 http://primerprodavnica.com/zenski/jakne/jakna-2 /(mu|zen)ski/.*

26. ^

27. http://primerprodavnica.com/muski/jakne/jakna-1 http://primerprodavnica.com/zenski/jakne/jakna-2 http://primerprodavnica.com/deca/zenski/jakna-1 /(mu|zen)ski/.*

28. http://primerprodavnica.com/muski/jakne/jakna-1 http://primerprodavnica.com/zenski/jakne/jakna-2 http://primerprodavnica.com/deca/zenski/jakna-1 /(mu|zen)ski/.*

29. http://primerprodavnica.com/muski/jakne/jakna-1 http://primerprodavnica.com/zenski/jakne/jakna-2 http://primerprodavnica.com/deca/zenski/jakna-1 ^/(mu|zen)ski/.*

30. http://primerprodavnica.com/muski/jakne/jakna-1 http://primerprodavnica.com/zenski/jakne/jakna-2 http://primerprodavnica.com/deca/zenski/jakna-1 ^/(mu|zen)ski/.*

31. $

32. http://primerprodavnica.com/muski/jakne/jakna-1 http://primerprodavnica.com/zenski/jakne/jakna-2 /jakne/$

33. ^/$

34. s S d D w W

35. Sve je to strava, ali šta ja da radim s tim?

36. Šta je to „Ghost“ saobraćaj • Nisu sve zabeležene posete zaista posete • Automatizovane skripte poput crawlera trigeruju GA kod na vašoj stranici i šalju zahtev

37. Možda će vam delovati poznato... • Languages report: • Source:

38. Identifikacija obrazaca • Svaka serija SPAMa ima neke obrasce koje je potrebno identifikovati • Obično je to Source, Language ili Event • Konkretno prethodni primer je imao specifičan „jezik“ gde su to bile rečenice: .{15,}

39. Hostname • Jedna od stvari na koju se obično ne obraća pažnja • U prevodu to je vaš domen • Shodno tome filter bi bio: ^vasdomen.rs$ ^www.vasdomen.rs$

40.

41. Uklanjanje internog saobraćaja • Preduslov za ovo je statička IP adresa • Broj sesija nastalih tokom rada na sajtu može biti iznenađujuće velik • Naročito vreme provedeno na sajtu

42. ^192.168.0.1$ ^192.168.0.([1-9]|1[0-5])$

43. ^192.168.0.1$ ^192.168.0.([1-9]|1[0-5])$

44. ^192.168.0.1$ ^192.168.0.([1-9]|1[0-5])$

45. ^192.168.0.1$ ^192.168.0.([1-9]|1[0-5])$ ^192.168.0.1?[0-9]$

46. ^192.168.0.1$ ^192.168.0.([1-9]|1[0-5])$ ^192.168.0.1?[0-9]$

47. ^192.168.0.1$ ^192.168.0.([1-9]|1[0-5])$ ^192.168.0.1?[0-9]$

48. Regexpal.com Rexegg.com

49. Pitanja?

Analytics meetup - Uvod u regularne izraze za Google Analitiku - Dino Kukić

Recommended

Recommended

More Related Content

Featured

Featured (20)

Analytics meetup - Uvod u regularne izraze za Google Analitiku - Dino Kukić