0
SharePoint Community
Mittelland
Enterprise Search
21. November 2013
Über mich
Patrick Mäschli
pm@garaio.com
Senior Consultant / Solution Architect
GARAIO AG
www.garaio.com
SharePoint Community
Mittelland

• Plattform für SharePoint Developer, IT Professionals und
Power User im Espace Mittellan...
Suchen, Finden, Suchen,
Finden..

ENDLESS POSSIBILITIES
Enterprise Search
Enterprise Search bzw. Unternehmensweite Suche bezeichnet ein
Teilgebiet von Information Retrieval und b...
Enterprise Search
•
•
•
•
•
•
•
•
•
•
•
•

Relevanz
Security!
Entity Extraction
Federated Search
Word Stemming / Breaking
...
Los geht’s

ENDLESS POSSIBILITIES
Definitionen
• Strukturierte Inhalte
Klar definierte Metainformationen, z.Bsp Datenbanken
• Unstrukturierte Inhalte
Eine S...
Theorie
• Metadatenkonzept

• Alles gem. Konzept
Praxis
• Metadatenkonzept?

• Keine Grüne Wiese
• Inhalte ausserhalb «kontrolliertem»
Repository / Legacy Systeme
Herausforderungen
• Schlechte Metadaten, schlechte Resultate

• Unzufriedene Benutzer..
Logische Architektur

ENDLESS POSSIBILITIES
Logische
Content Processing
• Verarbeitet die gecrawlten Inhalte

• Parsing der Inhalte
• Mapping der Properties

• Lingustische Op...
Entity Extraction

ENDLESS POSSIBILITIES
Entity Extraction
Parsing der Inhalte und Mapping auf Termstore

Es stehen 2 Varianten zur Verfügung
• Company Name Extrac...
Hands-On I

ENDLESS POSSIBILITIES
Company Name Extraction
• Definieren eines Managed Property als «Company Name
Extraction»
z.Bsp Body
• Befüllen eines Term...
Hands-On II

ENDLESS POSSIBILITIES
Custom Extraction
• Erstellen eines CSV für das Termset
• Import des Termsets
$searchApp = Get-SPEnterpriseSearchServiceAp...
Wordpart & Co
• Word Extraction
Case-Insensitive, das gesamte Wort muss passen
• Word Part Extraction
Case-Insensitive, de...
Fazit
• Strukturiertere Suche mittels Refinements

• Auch auf Fremdinhalten nutzbar (Fileserver, Externes DMS)
• Nicht der...
Kontext ist King

ENDLESS POSSIBILITIES
Kontext ist King
Durch Anreicherung der eigentlichen Inhalte mit Informationen aus
dem Kontext kann der Inhalt *verbessert...
Content Enrichment

ENDLESS POSSIBILITIES
Content Enrichment
Zur Anreicherung der Index Daten kann der Content Enrichtment
Web Service genutzt werden
Jedes Element ...
Content Enrichment
Content Processing

Processed
Item

To
Index

Webservice
Callout

Magic
Code
Content Enrichment

Magic
Code
Content Enrichment: How To
• Webservice erstellen der IContentProcessingEnrichmentService
implementiert.
• In public Proce...
Hands-On III

ENDLESS POSSIBILITIES
Content Enrichment
Anreicherungen von Daten in bestehendem Index
Vorteile:
• Suchabfragen sind performant
• Businesslogik ...
Fazit
Content Enrichment ermöglicht die Ergänzung und
Anreicherungen des SharePoint Such-Indexes
Im Gegensatz zu Entity Ex...
Mehr..
REST API
http://msdn.microsoft.com/en-us/library/office/jj163876.aspx
Company Name Extraction
http://technet.micros...
WETTBEWERB!
Gutschein für ein gratis eBook von O’Reilly
http://www.sharepointmittelland.ch/
Save the Date
SharePoint Apps Hack Day
SA 30. November 2013, 12.00 Uhr – 18.00 Uhr
isolutions AG, Bern
Danke…

ENDLESS POSSIBILITIES
Kontaktperson
Patrick Mäschli
+41 58 310 70 58
pm@garaio.com

GARAIO AG – Laupenstrasse 45 – Postfach 6249 – 3001 Bern – w...
SharePoint Community Mittelland - GARAIO : Enterprise Search
Upcoming SlideShare
Loading in...5
×

SharePoint Community Mittelland - GARAIO : Enterprise Search

1,344

Published on

Viel wurde bereits über die neue Suche in SharePoint 2013 geschrieben. Wir gehen dem Ganzen auf den Grund, und schauen uns die spannendsten Funktionen an, welche im Bereich des „Information Retrieval“ zur Verfügung stehen. Primär geht es darum, wie ich auch bei Inhalten ohne explizite Metadaten gute Resultaten erzielt werden. Dazu gehören unter anderem automatische Extraktion von Metadaten und Ergänzung der Suche um eigene Informationen – und was da genau dahinter steckt.

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
1,344
On Slideshare
0
From Embeds
0
Number of Embeds
7
Actions
Shares
0
Downloads
4
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Transcript of "SharePoint Community Mittelland - GARAIO : Enterprise Search"

  1. 1. SharePoint Community Mittelland Enterprise Search 21. November 2013
  2. 2. Über mich Patrick Mäschli pm@garaio.com Senior Consultant / Solution Architect GARAIO AG www.garaio.com
  3. 3. SharePoint Community Mittelland • Plattform für SharePoint Developer, IT Professionals und Power User im Espace Mittelland • Offen für alle interessierten Personen (Kunden und Microsoft Partner) • Gratis • Geplant 9 Events / Jahr • Website: http://ww.sharepointmittelland.ch • Yammer: http://bit.ly/134JEcq • XING: http://bit.ly/Xxgjm1 • Kontakt: Roger Haueter, David Schneider und Patrick Mäschli
  4. 4. Suchen, Finden, Suchen, Finden.. ENDLESS POSSIBILITIES
  5. 5. Enterprise Search Enterprise Search bzw. Unternehmensweite Suche bezeichnet ein Teilgebiet von Information Retrieval und bezeichnet den Vorgang der computergestützten inhaltsorientierten Suche mit Hilfe einer unternehmensinternen Suchmaschine, welche Content mittels so genannter Crawler indexiert. http://de.wikipedia.org/wiki/Enterprise_Search Verwandte Themen • Semantische Suche • Taxonomie • Big Data
  6. 6. Enterprise Search • • • • • • • • • • • • Relevanz Security! Entity Extraction Federated Search Word Stemming / Breaking Linguistic Support Alerting Query Suggestions Saved Searches Classification Enterprise Content Aggregation Skalierbarkeit
  7. 7. Los geht’s ENDLESS POSSIBILITIES
  8. 8. Definitionen • Strukturierte Inhalte Klar definierte Metainformationen, z.Bsp Datenbanken • Unstrukturierte Inhalte Eine Sammlung von Informationen wie z.Bsp Dokumenteninhalte • Unstrukturierte Suche Volltextsuche in einem Index • Strukturierte Suche Suche nach Metadatum(Author:Arno Meister)
  9. 9. Theorie • Metadatenkonzept • Alles gem. Konzept
  10. 10. Praxis • Metadatenkonzept? • Keine Grüne Wiese • Inhalte ausserhalb «kontrolliertem» Repository / Legacy Systeme
  11. 11. Herausforderungen • Schlechte Metadaten, schlechte Resultate • Unzufriedene Benutzer..
  12. 12. Logische Architektur ENDLESS POSSIBILITIES
  13. 13. Logische
  14. 14. Content Processing • Verarbeitet die gecrawlten Inhalte • Parsing der Inhalte • Mapping der Properties • Lingustische Operationen (Entity Extraction)
  15. 15. Entity Extraction ENDLESS POSSIBILITIES
  16. 16. Entity Extraction Parsing der Inhalte und Mapping auf Termstore Es stehen 2 Varianten zur Verfügung • Company Name Extraction Auslesen der Inhalte und Mapping auf ein Termset • Custom Extraction Erstellung eines eigenen Termsets und Mapping auf Refiner
  17. 17. Hands-On I ENDLESS POSSIBILITIES
  18. 18. Company Name Extraction • Definieren eines Managed Property als «Company Name Extraction» z.Bsp Body • Befüllen eines Termsets mit den zu extrahierenden Namen • Konfiguration Refiner
  19. 19. Hands-On II ENDLESS POSSIBILITIES
  20. 20. Custom Extraction • Erstellen eines CSV für das Termset • Import des Termsets $searchApp = Get-SPEnterpriseSearchServiceApplication Import-SPEnterpriseSearchCustomExtractionDictionary –SearchApplication $searchApp –Filename serverc$folderWordPartExtraction.csv –DictionaryName Microsoft.UserDictionaries.EntityExtraction.Custom.WordPart.3 • Konfiguration Refiner
  21. 21. Wordpart & Co • Word Extraction Case-Insensitive, das gesamte Wort muss passen • Word Part Extraction Case-Insensitive, der Wortteil muss passen • Word Exact Extraction Case-Sensitive, das gesamte Wort muss passen • Word Part Exact Extraction Case-Sensitive, der Wortteil muss passen
  22. 22. Fazit • Strukturiertere Suche mittels Refinements • Auch auf Fremdinhalten nutzbar (Fileserver, Externes DMS) • Nicht der Schlüssel zum Glück – Entity Extraction erlaubt Extraktion auf bestehenden Inhalten, kein «Mehrwert»
  23. 23. Kontext ist King ENDLESS POSSIBILITIES
  24. 24. Kontext ist King Durch Anreicherung der eigentlichen Inhalte mit Informationen aus dem Kontext kann der Inhalt *verbessert* werden • Informationen von übergeordneten Ebenen • Informationen des Bearbeitenden Benutzers • Informationen aus einem LOB / Umsystem Z.Bsp SAP / DB / etc.. Echtes Information Retrieval
  25. 25. Content Enrichment ENDLESS POSSIBILITIES
  26. 26. Content Enrichment Zur Anreicherung der Index Daten kann der Content Enrichtment Web Service genutzt werden Jedes Element welches im Content Processing Schritt durchlaufen wird, kann ergänzt werden Einerseits um Kontextinformationen hinzuzufügen, oder um eigene prozessierungen durchzuführen (Spracherkennung, Erstellung Vorschaubilder usw)
  27. 27. Content Enrichment Content Processing Processed Item To Index Webservice Callout Magic Code
  28. 28. Content Enrichment Magic Code
  29. 29. Content Enrichment: How To • Webservice erstellen der IContentProcessingEnrichmentService implementiert. • In public ProcessedItem ProcessItem(Item item) die Businesslogik implementieren • Managed Property erstellen • Powershell zur Konfiguration des Services aufrufen (Service Endpoint, Input & Output Property set-SPEnterpriseSearchContentEnrichmentConfiguration • Full Crawl
  30. 30. Hands-On III ENDLESS POSSIBILITIES
  31. 31. Content Enrichment Anreicherungen von Daten in bestehendem Index Vorteile: • Suchabfragen sind performant • Businesslogik kann im Suchprozess abgedeckt werden • Dadurch *einfache* Integration • Anreicherung auch Asynchron möglich • Mit dem Content Search WebPart kann direkt der Index abgefragt werden • Ergänzung von Daten durch Umsysteme oder hierarchische Informationen Szenarien • Anreicherung aus Kontext • Integration von LOB Daten direkt auf dem Element • Erweitertes processing (Spracherkennung usw)
  32. 32. Fazit Content Enrichment ermöglicht die Ergänzung und Anreicherungen des SharePoint Such-Indexes Im Gegensatz zu Entity Extraction auch mit eigener Logik Dies erlaubt es, der Suche Zusatzinformationen mitzugeben, um die Resultate «Intelligenter» zu gestalten! Bessere Resultate – Zufriedene Nutzer
  33. 33. Mehr.. REST API http://msdn.microsoft.com/en-us/library/office/jj163876.aspx Company Name Extraction http://technet.microsoft.com/en-us/library/jj591605.aspx Erstellen eines Custom Entity Extractors http://technet.microsoft.com/en-us/library/jj219480.aspx Content Enrichment Webservice Callout http://msdn.microsoft.com/en-us/library/jj163982.aspx Conten
  34. 34. WETTBEWERB! Gutschein für ein gratis eBook von O’Reilly http://www.sharepointmittelland.ch/
  35. 35. Save the Date SharePoint Apps Hack Day SA 30. November 2013, 12.00 Uhr – 18.00 Uhr isolutions AG, Bern
  36. 36. Danke… ENDLESS POSSIBILITIES
  37. 37. Kontaktperson Patrick Mäschli +41 58 310 70 58 pm@garaio.com GARAIO AG – Laupenstrasse 45 – Postfach 6249 – 3001 Bern – www.garaio.com
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×