Architecture challenges of search

467 views

Published on

Published in: Technology
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
467
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
6
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Architecture challenges of search

  1. 1. Architecture challenges of search.Torsten Bøgh Köster (Shopping24) University of Hamburg, November, 14th 2011
  2. 2. Inhalt‣ Ich & mein Brötchengeber‣ Von Totalausfällen und roten Kleidern‣ Von „Pimping“ und „Tweaking“‣ Authentifizierung und Caching‣ Von Flüssen und Klötzen
  3. 3. @tboeghk‣ Software- and systems- architect‣ Studied at University of Hamburg (class of 2005)‣ Thesis on geo-spatial search‣ 4y experience with Solr / Lucene‣ 5y software architect at Deutscher Ring insurance developing customer and sales internet / intranet portals‣ 2y system administrator & PHP/Perl hacker‣ Currently team of 8 Java developers at Shopping24
  4. 4. shopping24 internet group
  5. 5. google legt die messlatte ...
  6. 6. ... sehr hoch
  7. 7. suche hat viele facetten
  8. 8. Suche bei shopping24
  9. 9. apache solr
  10. 10. aktuelle sucharchitektur
  11. 11. Eine neue API!
  12. 12. Rahmenbedingungen‣ Jeder Aspekt ein Deployable‣ Caching‣ Authentifizierung‣ Vollständige fachliche Kapselung‣ Suchmaschine austauschbar‣ 1 Request <> 1 Portalseite‣ 100ms
  13. 13. Inhalt‣ Ich & mein Brötchengeber‣ Von Totalausfällen und roten Kleidern‣ Von „Pimping“ und „Tweaking“‣ Authentifizierung und Caching‣ Von Flüssen und Klötzen
  14. 14. von totalausfällenund roten kleidern
  15. 15. Precision & Recall
  16. 16. Suchqualität manuell ermitteln
  17. 17. Entwicklungserfolg wird messbar
  18. 18. Zugriffszeitenminimieren
  19. 19. highly effective: data sharding ...
  20. 20. let “sharding“ follow your data ...
  21. 21. ... and build separate cores for every client.
  22. 22. Duplicate data as long as access is fast.andybahn / photocase.com
  23. 23. Authentifizierung vs. Caching ...
  24. 24. ... gelöst durch transparente Infrastrukturkomponenten
  25. 25. Datenfluss zur Suchmaschine
  26. 26. Daten werden von Klotz zu Klotz geworfen
  27. 27. Extraktion eines denormalisierten Sortiments
  28. 28. Wozu brauche ich jetzt nochmal einen Search Consultant?
  29. 29. Dedizierte Suchcores - dedizierte ETL-Prozesse
  30. 30. Alle Daten maximal vorverarbeiten
  31. 31. das auge entwickelt mit:umfassende doku mussnicht hässlich sein.
  32. 32. zweifel, ein treuer begleiter: transparenz von anfang an schaffen
  33. 33. Questions? Comments?‣ Twitter:@tboeghk‣ Github: @tboeghk‣ Email: torsten.koester@s24.com‣ Web: s24.com‣ Developer (old): developer.smatch.com‣ Developer (new): developer.s24.comImages: sxc.hu (unless noted otherwise)

×