Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Hledání témat pro homepage Seznamu na základě segmentace publika a obsahu

160 views

Published on

Vojtěch Matoušek na konferenci Data Restart 2019.

Jak se chovají uživatelé Seznam.cz? Jaký obsah je zajímá? Ukážeme vám, jak v Seznamu segmentujeme obsah i publikum pomocí klastrové analýzy. Zaměříme se na kategorizaci obsahu na základě zjištěných segmentů a charakteristik uživatelů a využití této segmentace pro doporučení rozšíření nabízeného obsahu.

Published in: Data & Analytics
  • Be the first to comment

  • Be the first to like this

Hledání témat pro homepage Seznamu na základě segmentace publika a obsahu

  1. 1. Hledání nových témat na základě segmentace publika a obsahu Vojtěch Matoušek Obsahový analytik
  2. 2. Explorace nových témat
  3. 3. Explorace nových témat
  4. 4. Segmentace na základě předdefinovaných kategorií • Segmentace obsahu  Jaký počet dimenzí je dost?  Jak detailní by měly segmenty být? • Segmentace uživatelů  Demografické údaje (neměnné)  Zájmy (měnné) Segmentace na základě vztahů • Segmentace obsahu na základě uživatelů  Clustrová analýza Segmentace
  5. 5. Explorace (nalézání) zcela nových témat Expanze (rozšiřování) současných témat Konexe (propojování) současných témat ? Možné cesty při rozšiřování obsahu ? ?
  6. 6. Clusterová analýza Vícedimenzionální analýza, která se používá ke klasifikaci objektů. Segmentujeme obsah na základě chování uživatelů. Získané klastry mají určitou specifickou charakteristiku jak v dimenzi obsahu tak uživatelů. Na co si dát pozor! • Clusterová analýza může propojovat i tam, kde propojení není! • Získané klastry může spojovat na základě jiné dimenze než předpokládáme.
  7. 7. Ukázka postupu
  8. 8. Feed
  9. 9. Dendrogram klastrace feedu
  10. 10. Síťový graf korelací stránek na základě Klastrové A. Lidé které zajímá echo24 zároveň zajímá forum24
  11. 11. Síťový graf korelací stránek na základě Klastrové A. Auto – Moto tématika Populárně naučná (historická) tématika Army tématika
  12. 12. Rozložení top témat dle prokliků z feedu Jiné možné metriky: - CTR (poměr kliků na zobrazení) - Doba strávená na stránce po prokliku
  13. 13. Kam na seznam.cz nové téma umístit?
  14. 14. Síťový graf – kladná korelace Stream.cz ? ? Mladí diváci Starší diváci Mladí diváci
  15. 15. Síťový graf – kladná korelace Stream.cz + Nové téma by mělo být zaměřené na mladšího diváka
  16. 16. Síťový graf – záporná korelace
  17. 17. Výsledky Téma: • Vojenská tématika • Důraz na techniku a zajímavosti Divák: • 25-45 let • Muž • Středoškolské vzdělání – vyšší odborné vzdělání
  18. 18. Konfrontace statistiky s ostatními informacemi Je publikum, které přitahujeme, relevantní pro danou službu? Je takto vybrané téma vhodné pro publikaci obecně? Je pro nás možné vybrané téma realizovat na dostatečné úrovni kvality?
  19. 19. Návrhy možných nových témat Na základě témat: • Moderní historické bitvy • Současná vojenská technika Na základě znalosti publika • Survival • Extrémní sporty
  20. 20. Předání témat pro další výzkum
  21. 21. Špatné filmy
  22. 22. Věda zábavně
  23. 23. Video esej
  24. 24. Hry na hrdiny
  25. 25. Vojtěch Matoušek Analytik obsahu E-mail: vojtech.matousek@firma.seznam.cz Tel.: +420 722 067 307 Kontakt

×