SharePoint 2013
новые возможности поиска
Виталий Жуков
Новый поиск
Сравнение компонентов поиска до и после SharePoint 2013
Компоненты до SharePoint 2013
SharePoint 2003 Search
Расширенные SQL-запросы к полнотекстовому индексу SQL Server

SharePoint 2007 Search
Появился обработчик запросов, что позволило управлять поиском

Search Server 2008
Расширение для SharePoint 2007

SharePoint 2010 Search (Foundation, Server)
Search Server 2010 (Express)
FAST Search Server 2010
Компоненты SharePoint 2013
SharePoint 2013 Foundation Search
SharePoint 2013 Server Search
Standard Edition
Enterprise Edition
Прощай FAST?
Прощай FAST?
От FAST 2010 остались
Index component
Query Engine
Analytics Processing Component
Crawl component

Новые
Content Processing Component
Query Processing Component

SharePoint Server
UI
Новая архитектура
Компоненты поиск SharePoint 2013 и их особенности
Логическая архитектура поиска
Crawl Component
 Недокраулер. Отвечает только за получение контента, подлежащего
индексации

 Set-SPEnterpriseSearchService -PerformanceLevel
 Список контента, подлежащего скачиванию, определяет Admin Component
 Каждый компонент имеет доступ ко всем crawler-БД

 Больше нельзя создавать правила распределения узлов, теперь этим
занимается SharePoint
Content Processing Component
 Новые обработчики (Format Handler вместо iFilter)
 На обработку передаются только свойства индексируемого
файла
 Старый Content Enrichment заменен новым на основе WCF
 Новый Content Enrichment может иметь условия на запуск
Analytics Processing Component
 Состоит из двух частей:
 Поисковая аналитика (проиндексированное содержимое, поисковые запросы, использование
результатов поиска)
 Аналитика использования сайтов SharePoint (просмотр элементов, переход по ссылкам,
использование навигации)

 Берет данные из многих источников (ресурсоемкий)
 Некоторые данные реплицируются в индексе (через Content Processing Component)
 APC может использовать несколько экземпляров БД (Link DB, Analytics Reporting DB)
Index Component
 Content Processing пишет, Query читает
 Реплики используются не только для отказоустойчивости
 При перестроении индекса ни его наполнение, ни его
чтение недоступны
 Реплики синхронизируются по расписанию
Query Processing Component
 Первичная обработка поискового запроса
синонимы
проверка правописания
стемминг
 Пост-обработка результатов поиска
объединение результатов из нескольких компонентов индекса
удаление дубликатов из результатов поиска
Administration Component
 Хранит информацию о:
 Топологии
 Правилах запросов и краулинга
 Схеме поиска (Crawled, Managed properties)
 Источники контента
 Расписания обхода контента

 Отслеживает состояние компонентов поиска
 ACL перенесены в индекс
 Может быть развернут на нескольких серверах
Процессы поиска
 MSSearch.exe
 Crawl Component

 NodeRunner.exe

 На каждый компонент поиска (кроме Crawl)
на сервере запускается процесс
noderunner.exe

 Search Admin

 MSSearch - Windows-служба

 Analytic Processing

 Search Host Controller – Windows-служба,

 Index

отслеживающая работу компонентов поиска

 Content Processing

(процессы noderunner.exe)

 Query Processing

 Primary Host Controller
 Master Data Repository

 Secondary Host Controller(s)
Новые возможности
Обзор возможностей поиска в SharePoint 2013 OTB
Подсказки поиска
Персонализированный поиск
HTML/JS rich rendering
Социальный поиск
Callouts, preview
Thesaurus

 Не более 100.000 синонимов, иначе словарь будет игнорироваться
 Начиная с CU August 2013 синонимы могут быть на разных языках
Spell checking

Слово считается написанным правильно, если его написание встречается
более чем в 1000 (по умолчанию, можно менять) разных документах.
Extensibility
Механизмы расширения поиска в SharePoint 2013
REST API
 Взамен существующей службы search.asmx
 Доступна по адресу http://server/_api/search (алиас для
http://server/_vti_bin/client.svc/search)
Ranking model
 Использование линейных моделей и основанных на нейронных сетях
 Комбинирование разных типов моделей
Query rules
 Три уровня иерархии
 Приложение поиска

 Коллекция сайтов
 Сайт

 Определяется тремя показателями:
 Condition – когда применять правило?
 Action – что необходимо сделать?
 Publishing – когда применяется правило?
Display templates, Result Types
 Использование HTML-шаблонов и .js файлов для рендеринга
 Control templates – определяет шаблон результатов поиска (список, пейджинг,
слайды)
 Item template – определяет шаблон элемента

 Определение типов результатов
 Создание правил определения типа на основе свойств элемента
 Указание шаблона отображения, используемого для отображения типа в
результатах поиска
Спасибо за внимание
Skype: zhukovvitaly
Email: vzhukov@live.ru
Blog: http://blog.vitalyzhukov.ru

Новые возможности поиска в SharePoint 2013

  • 1.
    SharePoint 2013 новые возможностипоиска Виталий Жуков
  • 2.
    Новый поиск Сравнение компонентовпоиска до и после SharePoint 2013
  • 3.
    Компоненты до SharePoint2013 SharePoint 2003 Search Расширенные SQL-запросы к полнотекстовому индексу SQL Server SharePoint 2007 Search Появился обработчик запросов, что позволило управлять поиском Search Server 2008 Расширение для SharePoint 2007 SharePoint 2010 Search (Foundation, Server) Search Server 2010 (Express) FAST Search Server 2010
  • 4.
    Компоненты SharePoint 2013 SharePoint2013 Foundation Search SharePoint 2013 Server Search Standard Edition Enterprise Edition
  • 5.
  • 6.
    Прощай FAST? От FAST2010 остались Index component Query Engine Analytics Processing Component Crawl component Новые Content Processing Component Query Processing Component SharePoint Server UI
  • 7.
    Новая архитектура Компоненты поискSharePoint 2013 и их особенности
  • 8.
  • 9.
    Crawl Component  Недокраулер.Отвечает только за получение контента, подлежащего индексации  Set-SPEnterpriseSearchService -PerformanceLevel  Список контента, подлежащего скачиванию, определяет Admin Component  Каждый компонент имеет доступ ко всем crawler-БД  Больше нельзя создавать правила распределения узлов, теперь этим занимается SharePoint
  • 10.
    Content Processing Component Новые обработчики (Format Handler вместо iFilter)  На обработку передаются только свойства индексируемого файла  Старый Content Enrichment заменен новым на основе WCF  Новый Content Enrichment может иметь условия на запуск
  • 11.
    Analytics Processing Component Состоит из двух частей:  Поисковая аналитика (проиндексированное содержимое, поисковые запросы, использование результатов поиска)  Аналитика использования сайтов SharePoint (просмотр элементов, переход по ссылкам, использование навигации)  Берет данные из многих источников (ресурсоемкий)  Некоторые данные реплицируются в индексе (через Content Processing Component)  APC может использовать несколько экземпляров БД (Link DB, Analytics Reporting DB)
  • 12.
    Index Component  ContentProcessing пишет, Query читает  Реплики используются не только для отказоустойчивости  При перестроении индекса ни его наполнение, ни его чтение недоступны  Реплики синхронизируются по расписанию
  • 13.
    Query Processing Component Первичная обработка поискового запроса синонимы проверка правописания стемминг  Пост-обработка результатов поиска объединение результатов из нескольких компонентов индекса удаление дубликатов из результатов поиска
  • 14.
    Administration Component  Хранитинформацию о:  Топологии  Правилах запросов и краулинга  Схеме поиска (Crawled, Managed properties)  Источники контента  Расписания обхода контента  Отслеживает состояние компонентов поиска  ACL перенесены в индекс  Может быть развернут на нескольких серверах
  • 15.
    Процессы поиска  MSSearch.exe Crawl Component  NodeRunner.exe  На каждый компонент поиска (кроме Crawl) на сервере запускается процесс noderunner.exe  Search Admin  MSSearch - Windows-служба  Analytic Processing  Search Host Controller – Windows-служба,  Index отслеживающая работу компонентов поиска  Content Processing (процессы noderunner.exe)  Query Processing  Primary Host Controller  Master Data Repository  Secondary Host Controller(s)
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21.
  • 22.
    Thesaurus  Не более100.000 синонимов, иначе словарь будет игнорироваться  Начиная с CU August 2013 синонимы могут быть на разных языках
  • 23.
    Spell checking Слово считаетсянаписанным правильно, если его написание встречается более чем в 1000 (по умолчанию, можно менять) разных документах.
  • 24.
  • 25.
    REST API  Взаменсуществующей службы search.asmx  Доступна по адресу http://server/_api/search (алиас для http://server/_vti_bin/client.svc/search)
  • 26.
    Ranking model  Использованиелинейных моделей и основанных на нейронных сетях  Комбинирование разных типов моделей
  • 27.
    Query rules  Триуровня иерархии  Приложение поиска  Коллекция сайтов  Сайт  Определяется тремя показателями:  Condition – когда применять правило?  Action – что необходимо сделать?  Publishing – когда применяется правило?
  • 28.
    Display templates, ResultTypes  Использование HTML-шаблонов и .js файлов для рендеринга  Control templates – определяет шаблон результатов поиска (список, пейджинг, слайды)  Item template – определяет шаблон элемента  Определение типов результатов  Создание правил определения типа на основе свойств элемента  Указание шаблона отображения, используемого для отображения типа в результатах поиска
  • 29.
    Спасибо за внимание Skype:zhukovvitaly Email: vzhukov@live.ru Blog: http://blog.vitalyzhukov.ru