Sphinx   на  реальных  проектах
Что такое Sphinx? Система полнотекстового поиска,  разработанная   Андреем Аксеновым. <ul><li>Open Source GPL 2.0 </li></u...
Конкуренты? <ul><li>MySQL FTS +  из коробки - позиция слова  - один  FT - index </li></ul><ul><li>Zend Lucene + написан на...
Хотите еще? Sphinx ( англ.  SQL Phrase Index ) – создавался специально для индексации БД. <ul><li>C++ -  бинарник </li></u...
С чего начать? Имеем проект и  Sphinx , как их сконнектить? <ul><li>Качаем, ставим или собираем </li></ul><ul><li>Пишем   ...
Конфиг source  documents_src   { type = mysql sql_host = localhost sql_user = test-user sql_pass =   god-love-sex sql_db =...
С чего начать? Имеем проект и  Sphinx , как их сконнектить? <ul><li>Качаем, ставим или собираем </li></ul><ul><li>Пишем   ...
PHP
Профит!!!
Что пишут в новостях? <ul><li>Поиск информации в белорусских электронных СМИ </li></ul>
Где -то тут писали… <ul><li>Поиск среди 1 млн. новостей с учетом морфологии </li></ul><ul><li>Фильтрация по категориям и и...
Хоть прячься,  все равно моя ты <ul><li>Режимы поиска </li></ul><ul><li>Со всеми  словами </li></ul><ul><li>С точной фразо...
На фене ботаешь? <ul><li>Язык запросов </li></ul><ul><li>Кошки & мышки </li></ul><ul><li>Кошки | мышки </li></ul><ul><li>К...
Так ли очевидно?
Проблемы морфологии
Ищем  _ свежие _  новости Main   + Delta
Пишем плагин Sphinx +  SugarCRM =    Белый  Lexus :)
Хочу все и сразу <ul><li>Полнотекстовый поиск по нескольким полям одновременно </li></ul><ul><li>Учет релевантности </li><...
Внезапно <ul><li>GUID   вместо целочисл . ID </li></ul><ul><li>Сортировка по полям </li></ul><ul><li>Индексация связанных ...
Все равно прикручу <ul><li>Добавляем auto_increment </li></ul><ul><li>Сортируем на стороне MySQL </li></ul><ul><li>Использ...
Еще истории...
Facet search
Вопросы?
 
Upcoming SlideShare
Loading in …5
×

Sphinx в реальных проектах: шишки и плюшки

4,654 views

Published on

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
4,654
On SlideShare
0
From Embeds
0
Number of Embeds
1,182
Actions
Shares
0
Downloads
23
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Sphinx в реальных проектах: шишки и плюшки

  1. 1. Sphinx на реальных проектах
  2. 2. Что такое Sphinx? Система полнотекстового поиска, разработанная Андреем Аксеновым. <ul><li>Open Source GPL 2.0 </li></ul><ul><li>Высокая скорость индексации 600 Mb /мин ( Apache Lucene – 20 Mb /мин) </li></ul><ul><li>Высокая скорость поиска 150-250 req/s на 1 M документов </li></ul>
  3. 3. Конкуренты? <ul><li>MySQL FTS + из коробки - позиция слова - один FT - index </li></ul><ul><li>Zend Lucene + написан на PHP - ме-е-е-е-едленный </li></ul>Mb/h
  4. 4. Хотите еще? Sphinx ( англ. SQL Phrase Index ) – создавался специально для индексации БД. <ul><li>C++ - бинарник </li></ul><ul><li>MySQL protocol </li></ul><ul><li>Дополнительные поля </li></ul><ul><li>Delta- индекс </li></ul><ul><li>Кластеризация </li></ul>
  5. 5. С чего начать? Имеем проект и Sphinx , как их сконнектить? <ul><li>Качаем, ставим или собираем </li></ul><ul><li>Пишем конфиг … </li></ul>
  6. 6. Конфиг source documents_src { type = mysql sql_host = localhost sql_user = test-user sql_pass = god-love-sex sql_db = test- db sql_port = 3306 sql_query = SELECT id, title, content FROM documents } index documents { source = documents_src path = /var/sphinx/data/test1 charset_type = utf-8 }
  7. 7. С чего начать? Имеем проект и Sphinx , как их сконнектить? <ul><li>Качаем, ставим или собираем </li></ul><ul><li>Пишем конфиг </li></ul><ul><li>Индексируем источник </li></ul><ul><li>Ищем </li></ul>
  8. 8. PHP
  9. 9. Профит!!!
  10. 10. Что пишут в новостях? <ul><li>Поиск информации в белорусских электронных СМИ </li></ul>
  11. 11. Где -то тут писали… <ul><li>Поиск среди 1 млн. новостей с учетом морфологии </li></ul><ul><li>Фильтрация по категориям и источникам </li></ul><ul><li>Сортировка по дате и рейтингу </li></ul>
  12. 12. Хоть прячься, все равно моя ты <ul><li>Режимы поиска </li></ul><ul><li>Со всеми словами </li></ul><ul><li>С точной фразой </li></ul><ul><li>С любым из ключевых слов </li></ul>
  13. 13. На фене ботаешь? <ul><li>Язык запросов </li></ul><ul><li>Кошки & мышки </li></ul><ul><li>Кошки | мышки </li></ul><ul><li>Кошки –мышки </li></ul><ul><li>(кошки мышки) </li></ul><ul><li>“ кошки мышки” </li></ul><ul><li>“ кошки собаки мышки”~5 </li></ul><ul><li>“ Игра в кошки мышки”/2 </li></ul><ul><li>Кошки << мышки </li></ul>
  14. 14. Так ли очевидно?
  15. 15. Проблемы морфологии
  16. 16. Ищем _ свежие _ новости Main + Delta
  17. 17. Пишем плагин Sphinx + SugarCRM = Белый Lexus :)
  18. 18. Хочу все и сразу <ul><li>Полнотекстовый поиск по нескольким полям одновременно </li></ul><ul><li>Учет релевантности </li></ul>
  19. 19. Внезапно <ul><li>GUID вместо целочисл . ID </li></ul><ul><li>Сортировка по полям </li></ul><ul><li>Индексация связанных данных </li></ul>
  20. 20. Все равно прикручу <ul><li>Добавляем auto_increment </li></ul><ul><li>Сортируем на стороне MySQL </li></ul><ul><li>Используем View </li></ul>
  21. 21. Еще истории...
  22. 22. Facet search
  23. 23. Вопросы?

×