Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Novinky v Seznam.cz vyhledávání
Martin Kirschner
Petr Vondrášek
Robot
Index
Internet
Relevance
Výběr stránek pro hledání
Robot dodává do hledání obraz internetu
• Úplný
• Aktuální
• Z pohledu člověka
Robot
Index
Internet
Relevance
Stránky robot vybírá podle skóre
Robot
Index
Internet
Relevance
• Počítá se per URL
• Odráží statickou kvalitu stránky
• V...
Skóre se snaží dostat dobré
stránky do indexu
• Zrno
• Plevel
• Hlína
Změny ve skórovací funkci
• Predikce kvality stránky podle URL
• Vyšší váha URL v sitemapě
• Lepší pokrytí sezónních strán...
Vyčistěte si web
• Používejte self cannonical
• Omezte nekonečné kalendáře
• Podívejte se na poslední stránku výsledků z v...
Novinky v relevanci
Robot
Index
Internet
Relevance
• Přesnost
─ Jak moc dokument souvisí s dotazem
• Užitečnost
─ Jak moc je dokument vzhledem k dotazu užitečný
• Kvalita
─ ...
Přesnost
[bazénové fólie]
Užitečnost
[bazénové fólie]
Kvalita
• „Page quality“
• Spam
Relevantní odpověď musí být
přesná, užitečná a kvalitní.
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Přesnost, užitečnost, kvalita, ...
3/2018
• Vyšší přesnost a užitečnost výsledků v SERPu
• Menší učící data
• Více výsledků z jedné domény
6/2018
• Nové zpracování dotazu
• Úpravy v penalizaci spamu
Robot 2018
• Kanonizace – slučování duplicitního obsahu
• Interpretace stránky
Hledáme produkťáky i vývojáře (Java, C++)
Pojď s námi rozvíjet hledání!
martin.kirschner@firma.seznam.cz
@SeznamBot
petr.v...
Novinky v seznam.cz vyhledávání (Martin Kirschner, Petr Vondrášek)
Novinky v seznam.cz vyhledávání (Martin Kirschner, Petr Vondrášek)
Novinky v seznam.cz vyhledávání (Martin Kirschner, Petr Vondrášek)
Novinky v seznam.cz vyhledávání (Martin Kirschner, Petr Vondrášek)
You’ve finished this document.
Download and read it offline.
Upcoming SlideShare
What to Upload to SlideShare
Next
Upcoming SlideShare
What to Upload to SlideShare
Next
Download to read offline and view in fullscreen.

Share

Novinky v seznam.cz vyhledávání (Martin Kirschner, Petr Vondrášek)

Download to read offline

Jak vypadá cesta webové stránky z širého internetu až do SERPu. Novinky ve výběru webových stránek do databáze a vylepšení algoritmu řazení dokumentů na položený dotaz.

  • Be the first to like this

Novinky v seznam.cz vyhledávání (Martin Kirschner, Petr Vondrášek)

  1. 1. Novinky v Seznam.cz vyhledávání Martin Kirschner Petr Vondrášek
  2. 2. Robot Index Internet Relevance
  3. 3. Výběr stránek pro hledání
  4. 4. Robot dodává do hledání obraz internetu • Úplný • Aktuální • Z pohledu člověka Robot Index Internet Relevance
  5. 5. Stránky robot vybírá podle skóre Robot Index Internet Relevance • Počítá se per URL • Odráží statickou kvalitu stránky • Výběr do DB robota i do indexu
  6. 6. Skóre se snaží dostat dobré stránky do indexu • Zrno • Plevel • Hlína
  7. 7. Změny ve skórovací funkci • Predikce kvality stránky podle URL • Vyšší váha URL v sitemapě • Lepší pokrytí sezónních stránek
  8. 8. Vyčistěte si web • Používejte self cannonical • Omezte nekonečné kalendáře • Podívejte se na poslední stránku výsledků z vašeho webu
  9. 9. Novinky v relevanci
  10. 10. Robot Index Internet Relevance
  11. 11. • Přesnost ─ Jak moc dokument souvisí s dotazem • Užitečnost ─ Jak moc je dokument vzhledem k dotazu užitečný • Kvalita ─ Jak dobře použitelný je obsah dokumentu Relevance
  12. 12. Přesnost [bazénové fólie]
  13. 13. Užitečnost [bazénové fólie]
  14. 14. Kvalita • „Page quality“ • Spam
  15. 15. Relevantní odpověď musí být přesná, užitečná a kvalitní.
  16. 16. 0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Přesnost, užitečnost, kvalita, ...
  17. 17. 3/2018 • Vyšší přesnost a užitečnost výsledků v SERPu • Menší učící data • Více výsledků z jedné domény
  18. 18. 6/2018 • Nové zpracování dotazu • Úpravy v penalizaci spamu
  19. 19. Robot 2018 • Kanonizace – slučování duplicitního obsahu • Interpretace stránky
  20. 20. Hledáme produkťáky i vývojáře (Java, C++) Pojď s námi rozvíjet hledání! martin.kirschner@firma.seznam.cz @SeznamBot petr.vondrasek@firma.seznam.cz @hledani_seznam

Jak vypadá cesta webové stránky z širého internetu až do SERPu. Novinky ve výběru webových stránek do databáze a vylepšení algoritmu řazení dokumentů na položený dotaz.

Views

Total views

1,186

On Slideshare

0

From embeds

0

Number of embeds

397

Actions

Downloads

12

Shares

0

Comments

0

Likes

0

×