Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

BlackHat Analytics

1,702 views

Published on

Prezentacja z XV SEMcampu w Warszawie jest wprowadzeniem do tematyki związanej z BlackHatem w Google Analytics.

Published in: Internet

BlackHat Analytics

  1. 1. @lewwwinSEMcamp SEMcamp BlackHat Analytics Wprowadzenie. SkyNet. Przygotuj się! Maciej Lewiński - @lewwwin XV SEMCamp @ Warszawa
  2. 2. @lewwwinSEMcamp UWAGA! Przedstawione w niniejszej prezentacji przykłady oraz techniki BlackHatu są przytaczane tylko w celach edukacyjnych. Autor niniejszej prezentacji nie bierze odpowiedzialności za wcielenie omawianych metod w życie.
  3. 3. @lewwwinSEMcamp
  4. 4. @lewwwinSEMcamp Definicja BlackHat
  5. 5. @lewwwinSEMcamp Podsumowanie ostatnich 15 SEMcampów ;) BlackHat SEO • ukryty tekst • cloaking • keyword stuffing • automatyczne generowanie treści • SWL • infekowanie linkami • budowanie zaplecza BlackHat PPC • boty generujące wyświetlenia • wyklikiwanie budżetu dziennego • CTR Nuke • ominięcie ograniczeń znaków towarowych • manipulowanie zawartością stron docelowych • ukrywanie reklam przed konkurencją
  6. 6. @lewwwinSEMcamp Dlaczego BlackHat Analytics? Trend Automatyka Kasa
  7. 7. @lewwwinSEMcamp Definicja BlackHat Analytics Celowe działanie zakłócające, usuwające, przechwytujące dane WA przy użyciu luk technicznych lub prawnych; celem czerpania zysków finansowych, lub uzyskania przewagi konkurencyjnej. Phil Pearce
  8. 8. @lewwwinSEMcamp Nasze dane
  9. 9. @lewwwinSEMcamp BlackHat Analytics Zrozumied. Wykryd. Zareagowad. Zapobiec.
  10. 10. @lewwwinSEMcamp SEMcamp Na czym opiera się analityka?
  11. 11. @lewwwinSEMcamp Ciasteczkologia #1 1st party cookies 3rd party cookies Jak się ich pozbyd? Wyczyścid zawartośd przeglądarki ;)
  12. 12. @lewwwinSEMcamp Czytanie z ciastek <script type="text/javascript"> function readCookie(name) { var nameEQ = name + "="; var ca = document.cookie.split(';'); for(var i=0;i < ca.length;i++) { var c = ca[i]; while (c.charAt(0)==' ') c = c.substring(1,c.length); if (c.indexOf(nameEQ) == 0) return c.substring(nameEQ.length,c.length); } return null; } function googleCookieReferrer() { var feed=readCookie("__utmz"); feed=feed.split("|"); feed=feed[0].split("="); return feed[1];}; if (googleCookieReferrer() == "google") { document.location.href("http://www.akademiaanlytics.pl/pogoda/");} </script>
  13. 13. @lewwwinSEMcamp Ciasteczkologia #2 Flash cookies Jak się ich pozbyd? Windows XP C:Documents and Settings[Twój Profil]Application DataMacromediaFlash Player#SharedObjects[Random Name][Web Site Path] Windows 7/Vista C:Users[Twój Profil]AppDataRoamingMacromediaFlash Player#SharedObjects[Random Name][Web Site Path] MacOS ~/Library » Preferences » Macromedia » Flash Player » macromedia.com » support » flashplayer » sys http://www.wired.com/2009/08/you-deleted-your-cookies-think-again/
  14. 14. @lewwwinSEMcamp
  15. 15. @lewwwinSEMcamp Prawie Ciasteczkologia #3 EverCookie Jak się go pozbyd? Jakby to ująd? :) http://samy.pl/evercookie/
  16. 16. @lewwwinSEMcamp EverCookie w praktyce http://samy.pl/evercookie/
  17. 17. @lewwwinSEMcamp Coś więcej niż Ciasteczkologia #4 FingerPrint Jak się go pozbyd? Zmieo przeglądarkę https://github.com/carlo/jquery-browser-fingerprint
  18. 18. @lewwwinSEMcamp Ile % z UU to ludzie? 3304 / 4100 * 100% = 80% Czyści ciacha? 
  19. 19. @lewwwinSEMcamp Fingerprint, a UU 1745/1808 *100% = 96% https://github.com/carlo/jquery-browser-fingerprint
  20. 20. @lewwwinSEMcamp SEMcamp Ograniczenia w Web Analytics
  21. 21. @lewwwinSEMcamp Użytkownik jest najważniejszy (not provided)
  22. 22. @lewwwinSEMcamp #takabranża
  23. 23. @lewwwinSEMcamp Modyfikacja klasycznego GATC <script type="text/javascript"> var _gaq = _gaq || []; _gaq.push(['_setAccount', 'UA-123456789-1']); _gaq.push(['_trackPageview']); (function() { var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true; ga.src = ('https:' == document.location.protocol ? 'https://' : 'http://') + 'stats.g.doubleclick.net/dc.js'; var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s); })(); </script>
  24. 24. @lewwwinSEMcamp Co muszę zrobić?
  25. 25. @lewwwinSEMcamp Progi w GA
  26. 26. @lewwwinSEMcamp Czego NIE mogę przechowywać w GA? • Danych osobowych • Adresów e-mail • Numerów telefonów • Adresów IP oraz wszelkich pozostałych danych wrażliwych: • Dokładna data urodzin • Preferencje seksualne • Upodobania polityczne • Itp.. http://www.google.com/analytics/terms/us.html
  27. 27. @lewwwinSEMcamp Konsekwencje http://www.google.com/analytics/terms/us.html
  28. 28. @lewwwinSEMcamp Przykład 1: celowe działanie
  29. 29. @lewwwinSEMcamp Przykład 2: „przypadkowe” działanie site:konkurent.pl inurl:”utm_content * gmail.com” http://www.google.pl/#q=inurl:pl+inurl:utm_content+*+g mail&pws=0&num=100&filter=0& as_qdr=all www.twojadomena.pl https://support.google.com/adwords/answer/8206?contact=1&rd=1# lub
  30. 30. @lewwwinSEMcamp Zabezpieczenie ;) Wyklucz parametry: email, mail utm_source, utm_medium, utm_campaign, utm_content, utm_keyword lub User-agent: * Disallow: /*utm_medium=email Disallow: /*gmail.com Noarchive: /*utm_medium=email Noarchive: /*gmail.com
  31. 31. @lewwwinSEMcamp SEMcamp 3:> Dane, dane, dane…
  32. 32. @lewwwinSEMcamp Współczynnik konwersji Cele/Transakcje Sesje 100%. Mogę popsud :) Mogę popsud :)
  33. 33. @lewwwinSEMcamp Przypadek 1: zaprzyjaźnieni porywacze :) 30% ruchu nie należy do mnie
  34. 34. @lewwwinSEMcamp Zabezpieczenie :)
  35. 35. @lewwwinSEMcamp Przykładowy podział konta GA
  36. 36. @lewwwinSEMcamp Przypadek: 2 - Skynet http://www.incapsula.com/blog/bot-traffic-report-2013.html
  37. 37. @lewwwinSEMcamp Co nagle to po diable
  38. 38. @lewwwinSEMcamp Co nagle to po diable
  39. 39. @lewwwinSEMcamp Przypadek 2: roboty sieciowe atakują
  40. 40. @lewwwinSEMcamp Rozwiązanie: wyklucz ^(inktomi corporation|iac search.*|yahoo! inc.|facebook inc.|stumbleupon inc.|dub6 ec2|site confidence.* |apache ltd.|nielsen netratings|affinity internet inc|dub6 ec2|Amazon (A9|Web|Data|Tech).*|microsoft corp)$
  41. 41. @lewwwinSEMcamp Uwaga na bezgłowe roboty! • Zombie.js • Phantom.js • HtmlUnit http://moz.com/blog/just-how-smart-are-search-robots
  42. 42. @lewwwinSEMcamp Pułapka na robota 1. Utwórz katalog i zablokuj ruch do niego w robots.txt dla wszystkich agentów. 2. Na swojej stronie daj link np. z obrazka 1x1px do zablokowanego katalogu. 3. Tylko złe roboty dostaną się do tego katalogu. 4. Te roboty możesz teraz przekierować na skrypt, który wyciągnie z nich adresy IP, User Agent itp. 5. Powyższe dane dodaj do pliku .htaccess, aby je banować :)
  43. 43. @lewwwinSEMcamp Ukrywanie się przed innymi .htaccess Options +FollowSymLinks RewriteEngine on <Files .htaccess> order allow,deny deny from all </Files> <Limit GET HEAD POST> order allow,deny deny from 74.53.36.242 deny from 65.39.72.142 deny from keywordspy.com deny from keywordspypro.com allow from all </LIMIT> RewriteCond %{HTTP_REFERER} keywordspy.com [NC,OR] RewriteCond %{HTTP_REFERER} keywordspypro.com RewriteRule .* - [F]
  44. 44. @lewwwinSEMcamp Nie przesadź, bo…
  45. 45. @lewwwinSEMcamp HARD CORE Tylo dla e-commerce
  46. 46. @lewwwinSEMcamp Przypadek 3: psucie danych javascript:_gaq.push(['_setAccount','UA-xxxxxx-1'],[' _addTrans','8148350','affiliation','-9223372036854775807','- 9223372036854775807','0.00','-','-','-'],['_addItem','SKU 00001','8148350','BIG refund','-','- 9223372036854775807','1'],['_trackTrans']);http://www.google- analytics.com/__utm.gif?utmwv=5.4.6&utms=44&utmn=393079074&utmhn= twojadomena.pl&utmt=tran&utmtid=8148350&utmtst= affiliation&utmtto=-9223372036854775807&utmttx=- 9223372036854775807&utmtsp=0.00&utmtci=-&utmtrg=-&utmtco=-&utmcs= UTF-8&utmsr=1366x768&utmvp=1366x550&utmsc=24- bit&utmul=en- us&utmje=1&utmfl=11.9r900&utmdt=TITLE&utmhid=509485053&utmr=- &utmp=/&utmht=1385061484294&utmac=UA-XXXXX-1&utmc c=__utma=251194116.2116214072.1385060410.1385060410.1385060410.1; __utmz=251194116.1385060410.1.1.utmcsr=(direct)|utmccn=(direct)|u tmcmd=(none)
  47. 47. @lewwwinSEMcamp Mieszanie w danych
  48. 48. @lewwwinSEMcamp Czy temat BHA został wyczerpany? • Hackowanie WiFi • DDoS Analytics • Zrzut 3rd cookies przez banery/iFrame • Infekowanie ga.js • Wyciąganie danych z autouzupełniania przeglądarki
  49. 49. @lewwwinSEMcamp SEMcamp Na wynos
  50. 50. @lewwwinSEMcamp Przejrzyj swoje widoki danych • Uwzględnij tylko swój Hostname (^|.)twojadomena.pl$ • Wyklucz boty, roboty, crawlery, itp. • Przejrzyj raport najlepszych treści (email|mail|kod|tel) lub [?&](.+)=(.*)gmail.com • Monitoruj w dane zbierane w zdarzeniach, zmiennych niestandardowych, własnych wymiarach • Przejrzyj czysty profil • Zaplanuj przegląd serwisu raz w miesiącu
  51. 51. @lewwwinSEMcamp
  52. 52. @lewwwinSEMcamp
  53. 53. @lewwwinSEMcamp SEMcamp Dzięki, że dotrwaliście do końca Twitter G+ Web @lewwin +MaciejLewinski www.akademiaanalytics.pl Slajdy @ SlideShare.net

×