Suche mit Apache Solr
Nader Cserny, compuccino
Agenda


• Vorstellung

• Einführung

• Funktionen

• Beispiele

• Praxis

• Fragen
Vorstellung
Vorstellung

                             Hamburg.de, BILD, WELT, Moneywise,
                             Berliner Morgenp...
Einführung
Einführung – Was ist Solr?


• Enterprise Suchmaschine

• Ursprung bei CNET Networks Inc.

• seit 2004 in Entwicklung, akt...
Funktionen
Funktionen – Was kann Solr? (1)


• Volltext-Suche

• Ranking und Relevanz

• Faceted Search => vielfältige Kategorisierun...
Funktionen – Was kann Solr? (2)


• Unterstützung von Synonymen, Stop-Wortlisten

• Auto-Vervollständigung

• Hervorheben ...
Funktionen – Was kann Solr? (3)


• Schnell, schneller, am schnellsten bei vielen Zugriffen (Caching)

• Skalierbar durch ...
Funktionen – Was kann Solr? (4)


• Monitoring, Logging von Suchanfragen

• Kon guration über XML-Dateien

• Multiple Date...
Beispiele
Beispiele – White House




                            Sortierung




                          Suchergebnis




        ...
Beispiele – CNET Networks Inc.




                                 Verwandte Suchbegriffe




                           ...
Beispiele – MTV




                  Auto-Vervollständigung
Beispiele – Net ix




            Auto-Vervollständigung
Beispiele – Mattel




                     Zufalls-Produkt aus Ergebnis




          Filter
Beispiele – Disney




       Filter
Beispiele – CNN




                  Suchergebnis




                                 Filter
Beispiele – la Repubblica




                            Erweiterte Suche   Anderer Inhaltstyp
Praxis
Praxis – Prototyp


• Langsamer, alter Rechner im Büro (Kosten: EUR 200,00)

  • AMD, 512 MB RAM => trotzdem schnell

• We...
Praxis – Suchanfragen


• Suche: „schwäbich“ => Meinen Sie: „schwäbisch“

• Auto-Vervollständigung: „Polizei“ => „Polizeib...
Fragen
Abschließend...
Abschließend...


• Mehr über uns:

  • http://compuccino.com



• Fragen:

  • of ce@compuccino.com

  • T: 030 247 24 000
Upcoming SlideShare
Loading in …5
×

Suche mit Apache Solr

6,032 views

Published on

Mit Apache Solr können Website-Betreiber mit überschaubarem Aufwand eine relevantere und performantere Suche implementieren als dies bspw. mit MySQL Full-Text Search möglich ist.

Unsere Präsentation gibt einen kurzen Einblick in die Kernfunktionen und zeigt verschiedene Beispiele.

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
6,155
On SlideShare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide



  • compuccino wurde 2007 von Klas Roggenkamp & Nader Cserny gegründet
    Organisch auf 15 Mitarbeiter gewachsen
    Spezialisierung auf Entwicklung und Design von komplexen Inhalten

  • Cnet: Medien-Unternehmen aus den USA
    Multi-Plattform: Windows, Mac, Linux
    Apache Lizenz: frei verwenden, Änderungen müssen nicht veröffentlicht werden


  • Faceted: Kategorisierung nach Autor, Kategorie, Datum, Inhaltstyp, etc.
    Ranking: relevante Faktoren flexibel konfigurierbar
    Stammworterkennung: Haus findet Häuser, Porter-/Snowball-Stemmer für versch. Sprachen
    Meinten Sie: Korrektur von „schwäbich“ zu „schwäbisch“
  • Synonyme: Fahrzeug = Auto, Computer = PC
    Hervorheben mit CSS-Attributen
    Verfeinerung durch Auswahl von Parametern
  • Flexibel, ...: Suchfunktionalitäten mit Plugins erweiterbar
    Caching: je mehr Suchanfragen umso schneller => Zwischenspeicher
  • Daten-Import Handler: CSV, URLs, Files

  • Faceted Search => Filterungsoptionen
    Sortierung nach Relevanz, Titel, ..., Datum auf-/absteigend
  • Kategorien: Product Reviews, Downloads, News & Photos, Videos
    Darstellung des Suchergebnisses frei wählbar
    Narrow your results
  • Auto-Vervollständigung bei Eingabe des Suchbegriffs
    „Michael“ findet „Michael Jackson“, „Michael Jackson Music Videos“ auf Basis der häufigsten Suchbegriff-Nennung
  • Suche in Videos per Auto-Vervollständigung
  • „Surprise Me“ wählt zufälliges Suchergebnis aus und leitet direkt auf die Produktseite
  • „Toy Story“ findet den aktuellsten Film „Toy Story 3“

  • Erweiterte Suche: Datum von/bis, Autor, etc.
    Foto: Direkte Anzeige von anderen Inhaltstypen

  • DB Import: Felder definiert, Inhalte & Dokumente geparsed, etc.
    Initialer Import hat ca. 10 Stunden gedauert
    Bereits mit der Standardinstallation erzielt man bessere Suchergebnisse als mit MySQL Full-Text Search




  • Suche mit Apache Solr

    1. 1. Suche mit Apache Solr Nader Cserny, compuccino
    2. 2. Agenda • Vorstellung • Einführung • Funktionen • Beispiele • Praxis • Fragen
    3. 3. Vorstellung
    4. 4. Vorstellung Hamburg.de, BILD, WELT, Moneywise, Berliner Morgenpost, Merian, FAZ, WWF, Entwicklung, Design, Hedgemedia, Schwäbische Post, 24h Berlin, Mercedes, Berliner Bank, Pernod Ricard, Konzeption, Beratung Milchverband, easyJet, XAVER.de, OTTO Nader Cserny Klas Roggenkamp 15! 2007!
    5. 5. Einführung
    6. 6. Einführung – Was ist Solr? • Enterprise Suchmaschine • Ursprung bei CNET Networks Inc. • seit 2004 in Entwicklung, aktive Community • Open Source > kostenlos • Multi-Plattform dank Java • Apache Lizenz
    7. 7. Funktionen
    8. 8. Funktionen – Was kann Solr? (1) • Volltext-Suche • Ranking und Relevanz • Faceted Search => vielfältige Kategorisierung • Stammworterkennung / Rechtstrunkierung • Filterung mit regulären Ausdrücken, phonetische Filter • „Meinten Sie...?“ => Rechtschreibvorschläge
    9. 9. Funktionen – Was kann Solr? (2) • Unterstützung von Synonymen, Stop-Wortlisten • Auto-Vervollständigung • Hervorheben des Suchbegriffs in Ergebnissen • Verfeinerung des Suchergebnisses durch Filter, Sortierung • Vorschläge für ähnliche Treffer • Indizierung von Inhalten in Dokumenten (Word, PDF, ... mit Tika)
    10. 10. Funktionen – Was kann Solr? (3) • Schnell, schneller, am schnellsten bei vielen Zugriffen (Caching) • Skalierbar durch verteilte Indizes auf mehreren Rechnern • Mehr Performance, ausfallsicher • Flexibel erweiterbar durch Plugins • Schnittstellen (RESTful API) zur Eingabe / Ausgabe von Daten • Administrationsober äche
    11. 11. Funktionen – Was kann Solr? (4) • Monitoring, Logging von Suchanfragen • Kon guration über XML-Dateien • Multiple Daten-Schemas • numerisch, Datum, dynamisch, eindeutiger Schlüssel (UUID) • Daten-Import Handler • CSV, URL, Dateien, ...
    12. 12. Beispiele
    13. 13. Beispiele – White House Sortierung Suchergebnis Filter
    14. 14. Beispiele – CNET Networks Inc. Verwandte Suchbegriffe Suchergebnis
    15. 15. Beispiele – MTV Auto-Vervollständigung
    16. 16. Beispiele – Net ix Auto-Vervollständigung
    17. 17. Beispiele – Mattel Zufalls-Produkt aus Ergebnis Filter
    18. 18. Beispiele – Disney Filter
    19. 19. Beispiele – CNN Suchergebnis Filter
    20. 20. Beispiele – la Repubblica Erweiterte Suche Anderer Inhaltstyp
    21. 21. Praxis
    22. 22. Praxis – Prototyp • Langsamer, alter Rechner im Büro (Kosten: EUR 200,00) • AMD, 512 MB RAM => trotzdem schnell • Webserver, CMS & Solr installiert • Datenbank-Inhalte eingespielt • 400.000 kategorisierte Artikel, PDF-Dokumente (Stand: 19.05.2010) • Standardinstallation bringt bessere Ergebnisse als MySQL Full-Text Search
    23. 23. Praxis – Suchanfragen • Suche: „schwäbich“ => Meinen Sie: „schwäbisch“ • Auto-Vervollständigung: „Polizei“ => „Polizeibericht“, „Polizeirevier“, „Polizeidirektion“, ... • Suche: „einkaufen aalen mitternacht“ (785 Treffer, vgl. SP => 12 Treffer und kein direktes Ergebnis) • Suche: „Schatzsuche Umweltmuseum“ => Meinen Sie: „Schatzsuche Urweltmuseum“ (vgl. SP => Unterschriften) • Suche: „Gmünder Pferdetage“ => Findet etwas im PDF (vgl. SP: kein direktes Ergebnis) • Suche: „Aalen Wandern“ => Findet im Titel „Wandern in Aalen“
    24. 24. Fragen
    25. 25. Abschließend...
    26. 26. Abschließend... • Mehr über uns: • http://compuccino.com • Fragen: • of ce@compuccino.com • T: 030 247 24 000

    ×