Motores de búsqueda de información científica y académica

1,254 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,254
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
25
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Motores de búsqueda de información científica y académica

  1. 1. 1. Motores académicos 1.1. Scirus 1.1.1. Contexto 1.1.2. Inputs 1.2. Google Scholar 1.2.1. Contexto 1.2.2. Inputs 1.3. Live Search Academic 1.3.1. Contexto 1.3.2. Inputs 2. Conclusiones 3. Agradecimientos 4. Bibliografía
  2. 2. La importante editorial Elsevier fue la primera en detectar que existía una nueva necesidad de información académica en la Web y que, por tanto, se necesitaba una nueva clase de sistemas de Información para la Web. En concreto, Elsevier concibió un sistema capaz de indizar páginas web de manera automática. Ese producto se llamó Scirus.
  3. 3. Proponemos la siguiente tipología de documentos académicos:  Tipo 1: Páginas web y documentos de todo publicados en sitios de instituciones académicas o científicas.  Tipo 2: Artículos de publicaciones científicas tipo peer review .  Tipo 3: Trabajos académicos tales como tesis doctorales o tesis de licenciatura.
  4. 4. Tipo 4: Documentos depositados en repositorios científicos ya sean pre-prints, post-prints, materiales didácticos, etc.  Tipo 5: Patentes  Tipo 6: Libros (monografías). Los seis tipos de documentos anteriores se solapan entre ellos. Pese a todo, la distribución anterior nos será útil aquí para situar en contexto a los motores de búsqueda académicos. 
  5. 5. Una creación de la importante editorial de revistas científicas holandesa Elsevier que es parte, a su vez, del gigante editorial anglo-holandés Reed-Elsevier, editor de libros y revistas y productor de bases de datos como Lexis-Nexis . Dispone de otras dos grandes bases de Datos: Science Direct y Scopus.
  6. 6. Scirus fue fundado en el año 2001 y, poco a poco ha ido ampliando su campo de acción incorporando sucesivamente nuevas fuentes hasta convertirse en un auténtico gigante y en el más completo sistema de los tres. En un análisis realizado a finales del año 2006 se constató que contenía más de 300 millones de documentos. Otros dos análisis previos confirmaron en su momento que Scirus era, con mucha diferencia más completo que Google Scholar por lo que hacía a repositorios científicos del tipo American Physical Society o PubMed.
  7. 7. Los inputs de Scirus, es decir, el origen de los documentos que incluye en sus índices son los siguientes:  Artículos de revistas: principalmente, publicaciones académicas de la propia editorial Elsevier más un amplio grupo de publicaciones de tipo open access. Son los documentos que Scirus agrupa bajo la denominación Journal Sources en su página de resultados y la opción del mismo nombre que se puede marcar o desmarcar en su formulario de búsqueda.
  8. 8.  Repositorios institucionales o académicos: hasta un total de 18 repositorios, además el de tesis doctorales de la red internacional NDLTD y el de patentes de Lexis-Nexis .Decimos "en teoría" porque las pruebas demuestran que en realidad utiliza más repositorios. Esta clase de documentos está señala por Scirus bajo la denominación Preferred Web Sources.
  9. 9.  Páginas y documentos publicados en sitios web: en este caso se trata exclusivamente de servidores de universidades, de instituciones académicas o de departamentos o institutos de I+D de algunas empresas. Desde el punto de vista del dominio. Este grupo se identifica en Scirus como Other Web Sources.
  10. 10. Ha sido la empresa que ha revolucionado la búsqueda y ha acabado afectando a los hábitos de navegación. Ha empujado a los directorios generalistas, como Yahoo o Dmoz. La influencia de Google se ha dejado sentir también en el primer modelo de negocio que ha sido capaz de generar beneficios en la Web: su sistema de anuncios AdWord y AdSense, imitado también por sus competidores.
  11. 11. Por último, prácticamente han creado el análisis de enlaces. Lo cierto es que son muchas cosas las que Google ha aportado a la Web. La cuestión es que, en su búsqueda de nuevas actividades, lanzó Google Scholar con algunas ideas nuevas. La más importante, sin duda, la de llevar a la Web el análisis de citaciones.
  12. 12. De acuerdo con la documentación oficial los inputs de Google Scholar consisten en lo siguiente:  Artículos de revistas: se trata de artículos de las editoriales académicas que han aceptado formar parte del programa de Google Scholarno, existe una documentación pública que detalle qué editoriales son en concreto. Es fácil ver que hay una amplia representación de ellas, esto no substituye la buena práctica que consistiría en ir publicando qué editoriales están en el programa de Google Scholar.
  13. 13.  Libros: se trata de editoriales que han aceptado formar parte de los contenidos de Google Scholar, en este caso, editoriales de libros. Tampoco disponemos de forma pública de una lista de estas editoriales. La segunda consiste en acuerdos con bibliotecas para obras. En general, señala que, en el caso que alguno de los resultados de Scholar sea un libro, el sistema nos remitirá a Google Books para su examen. Entendemos que debemos incluir aquí esta categoría documental porque está integrada en las búsquedas de Scholar.
  14. 14.  Sitios Web : Al igual que Scirus, incluye documentos y páginas de sitios web vinculados con el mundo académico. La documentación oficial de Scholar no explica cómo seleccionan estos sitios. Es posible deducir, que debe utilizar un sistema similar al de Scirus, a saber, indizar sitio del tipo.edu, etc., sin de partida para analizar y a partir de los cuales encuentren otros, etc. En esta categoría, Google Scholar incluye también repositorios de e-prints como los mencionados a propósito de Scirus.
  15. 15. La lista de inputs es simple: artículos de revistas académicas procedentes de diversas editoriales y sociedades científicas . Lo que no indica Live Academic es cuántos títulos de estas editoriales incluye, es decir, si incluye todas sus publicaciones o solamente una parte. Si Microsoft piensa tomar en serio su nuevo motor de búsqueda no hay duda que deberá ampliar su lista de "publishers" a varias bandas: editoriales de otros países, pero también mayor número de títulos de cada editorial.
  16. 16. Hasta hace poco, la Web había demostrado de sobras su capacidad para actuar como un agente de primer orden. Faltaba el elemento de la ciencia y de la información académica. En esta nueva etapa que está abriendo los motores ninguno de los tres actores haya considerado incluir alguno de los aspectos de la Web semántica .Tal vez se trate de iniciativas ambas demasiado tempranas como para que puedan pensar en unirse. Será necesario que antes maduren cada una de ellas por separado antes de que puedan pensar siquiera en unir esfuerzos. De momento, las evidencias son muy prometedoras.
  17. 17. Este trabajo ha sido financiado por el Ministerio de Educación y Ciencia (España) como parte del proyecto HUM2004-03162/FILO.
  18. 18.       Codina, Lluís. (2006). "Motores de búsqueda para usos académicos: ¿Cambio de Paradigma?". ThinkEPI, Enero 2006. [Acceso: http://www.thinkepi.net/repositorio/motores-de-busqueda-para-usosacademicos- ¿cambio-de-paradigma/] Doldi, L. M.; Bratengeyer, E. (2005). "The web as a free source for scientific information: a comparison with fe-based databases". Online information review, v. 29, n. 4, p. 400-411 Giustini, D.; Barsky, E. (2005). " A look at Google Scholar, PubMed, and Scirus: comparisons and recommendations" JCHLA/JABSC, 26, 2005, P. 85-89. [Acceso: http://pubs.nrc-cnrc.gc.ca/jchla/jchla26/c05-030.pdf ] Grupo Digidoc. Web semántica y Sistemas de Información Documental. Acceso: http://www.semanticaweb.net/ Jacsó, Peter. Péter's Digital Reference Shelf. December, 2006. [Acceso: http://www.gale.com/reference/peter/ ] Rovira, Cristòfol; Marcos, Mari-Carmen; Codina, Lluís (2007). "Repositorios de publicaciones digitales de libre acceso en Europa: análisis y valoración de la accesibilidad, posicionamiento web y calidad del código". El Profesional de la Información , v. 16, n. 1, enero-febrero 2007. [Acceso en: http://eprints.rclis.org/archive/00008668/ ]

×