Your SlideShare is downloading. ×
Architecture challenges of search
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Saving this for later?

Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime - even offline.

Text the download link to your phone

Standard text messaging rates apply

Architecture challenges of search

262
views

Published on

Published in: Technology

0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
262
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
5
Comments
0
Likes
2
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Architecture challenges of search.Torsten Bøgh Köster (Shopping24) University of Hamburg, November, 14th 2011
  • 2. Inhalt‣ Ich & mein Brötchengeber‣ Von Totalausfällen und roten Kleidern‣ Von „Pimping“ und „Tweaking“‣ Authentifizierung und Caching‣ Von Flüssen und Klötzen
  • 3. @tboeghk‣ Software- and systems- architect‣ Studied at University of Hamburg (class of 2005)‣ Thesis on geo-spatial search‣ 4y experience with Solr / Lucene‣ 5y software architect at Deutscher Ring insurance developing customer and sales internet / intranet portals‣ 2y system administrator & PHP/Perl hacker‣ Currently team of 8 Java developers at Shopping24
  • 4. shopping24 internet group
  • 5. google legt die messlatte ...
  • 6. ... sehr hoch
  • 7. suche hat viele facetten
  • 8. Suche bei shopping24
  • 9. apache solr
  • 10. aktuelle sucharchitektur
  • 11. Eine neue API!
  • 12. Rahmenbedingungen‣ Jeder Aspekt ein Deployable‣ Caching‣ Authentifizierung‣ Vollständige fachliche Kapselung‣ Suchmaschine austauschbar‣ 1 Request <> 1 Portalseite‣ 100ms
  • 13. Inhalt‣ Ich & mein Brötchengeber‣ Von Totalausfällen und roten Kleidern‣ Von „Pimping“ und „Tweaking“‣ Authentifizierung und Caching‣ Von Flüssen und Klötzen
  • 14. von totalausfällenund roten kleidern
  • 15. Precision & Recall
  • 16. Suchqualität manuell ermitteln
  • 17. Entwicklungserfolg wird messbar
  • 18. Zugriffszeitenminimieren
  • 19. highly effective: data sharding ...
  • 20. let “sharding“ follow your data ...
  • 21. ... and build separate cores for every client.
  • 22. Duplicate data as long as access is fast.andybahn / photocase.com
  • 23. Authentifizierung vs. Caching ...
  • 24. ... gelöst durch transparente Infrastrukturkomponenten
  • 25. Datenfluss zur Suchmaschine
  • 26. Daten werden von Klotz zu Klotz geworfen
  • 27. Extraktion eines denormalisierten Sortiments
  • 28. Wozu brauche ich jetzt nochmal einen Search Consultant?
  • 29. Dedizierte Suchcores - dedizierte ETL-Prozesse
  • 30. Alle Daten maximal vorverarbeiten
  • 31. das auge entwickelt mit:umfassende doku mussnicht hässlich sein.
  • 32. zweifel, ein treuer begleiter: transparenz von anfang an schaffen
  • 33. Questions? Comments?‣ Twitter:@tboeghk‣ Github: @tboeghk‣ Email: torsten.koester@s24.com‣ Web: s24.com‣ Developer (old): developer.smatch.com‣ Developer (new): developer.s24.comImages: sxc.hu (unless noted otherwise)