cosicas de sphinx que lo mismo no sabías

1,520 views

Published on

talk about sphinx search delivered in Madrid-rb on 2011 by javier ramírez

Published in: Technology
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,520
On SlideShare
0
From Embeds
0
Number of Embeds
36
Actions
Shares
0
Downloads
11
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

cosicas de sphinx que lo mismo no sabías

  1. 1. Cosicas de Sphinx que lo mismo no sabías por javier ramírez @supercoco9 @aspgems http://javier-ramirez.com
  2. 2. cosicas que sí deberías saber ya buscador ligero y rápido fácil de integrar en rails gracias a thinking sphinx permite búsquedas por texto libre permite usar comodines permite buscar y ordenar por atributos permite usar grupos y facetas permite buscar por geoposición
  3. 3. cosicas que voy a contar (por encima) ciclo de indexado / ciclo de búsqueda spa / spi / sph / spd / spm / spp búsquedas extendidas, pesos y ordenaciones excerpts charsets, stemmers, stopwords, excepciones deltas / index merge / indexar en tiempo real indexando ficheros (texto y xml) performance: extern / hitless/ distribuir el índice modificando thinking sphinx
  4. 4. indexado / búsqueda sql_query_pre sql_query sql_query_post sql_query_post_index sql_ranged_throttle sql_query_info
  5. 5. ficheros spa: attributes spd: doc ID <=> word ID sph: headers spi: word <=> word ID spk: kill list spm: MVA spp: hits sps: string attributes
  6. 6. extended search OR | val AND & val NOT !val -val field @name val relaxed @@relaxed field pos @name[p] val multifield @(n1,n2) val all fields @* val phrase “hello world” proximity “end world”~5 near val1 NEAR/3 val2 quorum “val val2 val3”/2 exact form =val before val1 << val2 field start ^val field end val$ sentence val SENTENCE val2 paragraph val PARAGRAPH val2
  7. 7. sorting SPH_SORT_RELEVANCE SPH_SORT_ATTR_DESC / SPH_SORT_ATTR_ASC SPH_SORT_TIME_SEGMENTS SPH_SORT_EXTENDED (@id, @weight, @random) SPH_SORT_EXPR &quot;@weight + ( user_karma + ln(pageviews) )*0.1&quot;
  8. 8. excerpts
  9. 9. words words words charsets stemmers stopwords wordforms exceptions
  10. 10. Delta, MERGE, Real Time INDEX deltas index merge indexar en tiempo real
  11. 11. XML & TEXfILES sql_file_field xmlpipe2
  12. 12. Performance extern storage (attributes) hitless words (positions) distributed indexes
  13. 13. Thinking Sphinx thinking sphinx vendor/riddle riddle gem
  14. 14. Cosicas de Sphinx que lo mismo no sabías por javier ramírez @supercoco9 @aspgems http://javier-ramirez.com

×