2. SharePoint Truths
Truth:
1. the true or actual state of a matter
2. conformity with fact or reality; verity
3. a verified or indisputable fact, proposition, principle, or the like
4. the state or character of being true.
5. actuality or actual existence.
Verkoop verhaal > mogelijkheden product = A
Mogelijkheden product > Verwachting van product = B
A + B = SharePoint Truths
1
3. Introductie
Johan Kroese
● Solution Architect @ Sparked
● ASP script + SQL ASP.NET SharePoint ?
● @johankroese
● Johan.kroese@sparked.nl
2
4. SharePoint Enterprise Search
SharePoint Enterprise Search != SharePoint Enterprise licentie!
Product lijn:
SharePoint Foundation 2010
SharePoint Server 2010
SharePoint Search Server 2010
SharePoint Search Server Express 2010
Microsoft FAST Search Server 2010 For SharePoint
4
8. Klant case 1: MT slechte performance
Probleem: trage zoekresultaten SharePoint
• Alleen bij zoeken naar collega‘s
• Alleen klachten vanuit de top 50 medewerkers van de organisatie
• 10k+ medewerkers
Nader onderzoek:
• Login als ‘probleem gebruiker’
• Conclusie: hele bedrijf hangt onder paar managers in AD
• Standaard ranking model people search = MainPeopleModel
• MainPeopleModel: ranking dmv social distance
• Social distance: weging obv org structuur
• Ranking = query-time
Conclusie:
Zorg dat het manager veld in AD geen onlogische waarden bevat
8
9. Klant case 2: phonetic search
Probleem: zoeken naar collega’s
• Zoeken op naam collega’s: onverwachte resultaten
• Multilingual (phonetic) search
• Werkt ook met ‘nicknames’: zoeken op Bill levert William op
Nader onderzoek:
• Phonetic search afhankelijk van Speech Server runtime
(op alle index en query servers)
• People search gebruikt de taal van het my site host template
• Tot voor kort in 10 talen beschikbaar, geen Nederlands
• Nu in 54 talen, mits geinstalleerd
9
10. Klant case 3: indexing LOB data
Uitdaging: Enterprise Search over klant gegevens & dossiers
• Data beschikbaar via custom WCF service
• 100k clienten
• 15k dossiers
• 200k archief dossiers
• BCS – out of the box WCF Connector
• Security trimming gewenst, incl custom business logica
Probleem:
• Crawl duurt te lang
• Search refinements ‘werken niet goed’
• Sortering zoekresultaten gewenst
10
12. Klant case 3: indexing LOB data
Nader onderzoek:
• Lage crawl frequentie (3 records / sec)
• Crawl lijkt niet multithreaded meer onderzoek nodig
• Geen incremental crawl
• Search refinements op te schroeven tot 500 resultaten max
• Ranking ipv Sortering gebruikt
• Splitsing content sources
Conclusie:
Plan en onderzoek goed voordat je grote hoeveelheden data via BCS gaat indexeren
12
Beginnen onderaan: de crawl servers indexeren de contentDocumenten worden opgehaald en uit elkaar gepeuterd.- Metadata wordt opgeslagen in de property database- Crawl data gaat in de crawl dbGeindexeerde data gaat naar de index (op de query servers)ACL’s gaan naar de search admin DB
Nu vanaf boven:Gebruiker voert zoekopdracht inWFE gaat via Search SA proxy naar de Query Processor (dmv round robin)QP:vraagt van alle partities de zoekresultaten uit de index en doet een mergequeried de property DB op metadataquried de admin DB om de ACL’s op te halen en security trimming te doendoet duplicate detectionRanking