Google worldcatdialnet

2,398 views

Published on

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
2,398
On SlideShare
0
From Embeds
0
Number of Embeds
1,555
Actions
Shares
0
Downloads
19
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide
  • La palabra clave aquí es “CIENTÍFICA”, o “ACADÉMICA”.
    Cuando un estudiante universitario se enfrenta a una tarea que requiere información (un examen, un trabajo escrito para una asignatura, una presentación oral sobre un tema, participar en un foro de discusión, el Trabajo de Fin de Grado…), debe ser capaz, entre otras cosas de reconocer cuando una fuente de información es “científica” o “académica”, porque solamente con este tipo de información podrá resolver la tarea planteada.
    ¿Cómo sabemos cuándo una fuente es científica?
    En primer lugar mediante los conocimientos y el criterio que se va adquiriendo al estudiar y profundizar en los contenidos y la metodología de una disciplina científica.
    Por otra parte la información científica viaja por los canales que le son propios, y es producida por los emisores que le son propios. Podemos reconocer si una información es científica si el autor es una autoridad en el tema (pertenece al ámbito académico o investigador), si está publicada en una revista académica (hay diversos indicadores para evaluar a las revistas académicas), o en una editorial o página web de una institución académica o dedicada a la investigación
    Además la literatura científica se recoge en fuentes de información dedicadas precisamente al almacenamiento y difusión de este tipo de literatura: bases de datos, motores de búsqueda, bibliografías especializadas…
    El estudiante universitario debe saber formular sus necesidades de información científica, reconocer cuándo una información es científica y conocer las fuentes de información científica generales y las especializadas en su disciplina.
    Hoy vamos a empezar con algunas de las fuentes generales: Google, WorldCat y Dialnet
  • Todos hemos usado Google alguna vez. Su funcionamiento es extremadamente sencillo [hacemos una búsqueda sobre CRISIS ECONOMICA y nos preguntamos qué es lo que ha pasado, ¿Cómo ha obtenido Google estos resultados?
    El buscador de Google o buscador web de Google (en inglés Google Search) es un motor de búsqueda en la web.
    El objetivo principal del buscador de Google es buscar texto en las páginas web, en lugar de otro tipo de datos, fue desarrollado originalmente por Larry Page y Sergey Brin en 1997.
    El orden de los resultados de búsqueda (ghits por Google hits) en las páginas de resultados de Google se basa, en parte, en un rango de prioridad llamado "PageRank"
  • Aspectos del motor de búsqueda
    Rastreo (crawling)
    La tarea de un crawler es localizar y obtener los contenidos de la Web y pasar el contenido a subsistemas de indexado. Para ello se utiliza el software Googlebot que, recursivamente, lee una página web dada obteniendo los enlaces y planificando nuevas operaciones de rastreo. La frecuencia de las visitas depende de cuánto cambia la página.
    El crawler en primer lugar determina si el servidor restringe el acceso a las páginas de los crawlers (Robots Exclusion Protocol, passwords…)
    A continuación el crawler trata de acceder a la página un pasarla al componente de indexador del motor de búsqueda
    Si está compuesta de html no hay problema, se indexa
    Si es un formulario, se indexa el formulario, pero no tiene acceso al contenido que se genera dinámicamente a partir del formulario
    Si es una página web dinámica, teóricamente podría indizarse, pero los motores de búsqueda no lo hacen por el peligro de bucles
    Puede ser una página sin nada que indizar (sólo imagen, o sonido…)
    Páginas que ofrecen datos dinámicos en tiempo real, que son inindizables para un motor de búsqueda
    Textos en PDF (Google indexa hasta 120K)
    Si es una base de datos ofreciendo un interfaz web, o es contenido de pago, restringido, etc. no puede indexar
    Indexación
    Produce un índice de contenidos similar al de un libro. Técnicamente se denomina indexado inverso de palabras que aparecen en páginas web y otros recursos textuales como documentos en .pdf, .doc y otros formatos. No solo guarda la posición, también almacena otra información relevante como el tamaño de fuente y capitalización. Utilizando este índice, se reduce el número de páginas candidatas de miles de millones a unas decenas de miles, según el poder discriminativo de las palabras buscadas.
    La indexación también mantiene un índice de enlaces, llevando un seguimiento de qué páginas apuntan a una página web.
    Datos no indexables: A pesar de su índice inmenso, también existe una considerable cantidad de información disponible en bases de datos en línea que se puede acceder por medio de consultas, pero no por enlaces. Esta "Internet profunda" o "Internet invisible" está mínimamente cubierta por Google y otros motores de búsqueda. La Internet profunda contiene catálogos de bibliotecas, documentos oficiales legislativos de los gobiernos, guías telefónicas y otros contenidos que son dinámicamente preparados para responder a una consulta.
  • El algoritmo analiza la búsqueda y utiliza más de 200 parámetros y filtros para decidir cuáles de los millones de páginas y contenidos existentes contienen las repuestas más relevantes para la búsqueda. Google afina sus algoritmos de ránking con más de 500 mejoras al año.
    Algunos de los parámetros y filtros utilizados son:
    La actualización del contenido del sitio web
    El número de sitios que enlazan con ese sitio y la autoridad de estos sitios (Page Rank)
    Las palabras del sitio web (frecuencia, posición, etiquetado…)
    Sinónimos
    Calidad del contenido
    Url y título de la página web…
  • El buscador de Google o buscador web de Google (en inglés Google Search) es un motor de búsqueda en la web.
    El objetivo principal del buscador de Google es buscar texto en las páginas web, en lugar de otro tipo de datos, fue desarrollado originalmente por Larry Page y Sergey Brin en 1997.
    El orden de los resultados de búsqueda (ghits por Google hits) en las páginas de resultados de Google se basa, en parte, en un rango de prioridad llamado "PageRank"
    Aspectos del motor de búsqueda
    Rastreo (crawling)
    La tarea de un crawler es localizar y obtener los contenidos de la Web y pasar el contenido a subsistemas de indexado. Para ello se utiliza el software Googlebot que, recursivamente, lee una página web dada obteniendo los enlaces y planificando nuevas operaciones de rastreo. La frecuencia de las visitas depende de cuánto cambia la página. Incluso los crawlers más rápidos revisitan la mayor parte de los sitios como mucho una vez al mes.
    El crawler en primer lugar determina si el servidor restringe el acceso a las páginas de los crawlers (Robots Exclusion Protocol, passwords…)
    A continuación el crawler trata de acceder a la página un pasarla al componente de indexador del motor de búsqueda
    Si está compuesta de html no hay problema, se indexa
    Si es un formulario, se indexa el formulario, pero no tiene acceso al contenido que se genera dinámicamente a partir del formulario
    Si es una página web dinámica, teóricamente podría indizarse, pero los motores de búsqueda no lo hacen por el peligro de bucles
    Puede ser una página sin nada que indizar (sólo imagen, o sonido…)
    Páginas que ofrecen datos dinámicos en tiempo real, que son inindizables para un motor de búsqueda
    Textos en PDF (Google indexa hasta 120K)
    Si es una base de datos ofreciendo un interfaz web, o es contenido de pago, restringido, etc. no puede indexar
    Indexación
    Produce un índice de contenidos similar al de un libro. Técnicamente se denomina indexado inverso de palabras que aparecen en páginas web y otros recursos textuales como documentos en .pdf, .doc y otros formatos. No solo guarda la posición, también almacena otra información relevante como el tamaño de fuente y capitalización. Utilizando este índice, se reduce el número de páginas candidatas de miles de millones a unas decenas de miles, según el poder discriminativo de las palabras buscadas.
    La indexación también mantiene un índice de enlaces, llevando un seguimiento de qué páginas apuntan a una página web.
    Datos no indexables: A pesar de su índice inmenso, también existe una considerable cantidad de información disponible en bases de datos en línea que se puede acceder por medio de consultas, pero no por enlaces. Esta "Internet profunda" o "Internet invisible" está mínimamente cubierta por Google y otros motores de búsqueda.41 La Internet profunda contiene catálogos de bibliotecas, documentos oficiales legislativos de los gobiernos, guías telefónicas y otros contenidos que son dinámicamente preparados para responder a una consulta.
  • Sherman, C. & Price, G., 2003. The Invisible Web: Uncovering Sources Search Engines Can’t See. Available at: https://www.ideals.illinois.edu/handle/2142/8528 [Accessed February 5, 2014].
    La web visible son todas las páginas HTML incluidas en los índices de los motores de búsqueda. La web invisible es todo el contenido de la web que está excluído de los buscadores generales como p. ej. Google
    A veces esto sucede porque los buscadores las excluyen deliberadamente
    Porque se utiliza tecnologías de bases de datos
    Porque se usan una variedad de medios y tipos de archivo, algunos de los cuales son accesibles a los buscadores y otros no (“web opaca”) (imagen, sonido, pdf, postscript, flash, shockwave, ejecutables, comprimidos)
    Porque no es práctico indizar toda la web (información efímera…)
    “The Invisible Web: Text pages, files, or other often high-quality authoritative information available via the World Wide Web that general-purpose search engines cannot, due to technical limitations, or will not, due to deliberate choice, add to their indices of Web pages.”
    El crawler en primer lugar determina si el servidor restringe el acceso a las páginas de los crawlers (Robots Exclusion Protocol, passwords…)
    A continuación el crawler trata de acceder a la página un pasarla al componente de indexador del motor de búsqueda
    Si está compuesta de html no hay problema, se indexa
    Si es un formulario, se indexa el formulario, pero no tiene acceso al contenido que se genera dinámicamente a partir del formulario
    Si es una página web dinámica, teóricamente podría indizarse, pero los motores de búsqueda no lo hacen por el peligro de bucles (trampas para spiders)
    Puede ser una página sin nada que indizar (sólo imagen, o sonido…)
    Páginas que ofrecen datos dinámicos en tiempo real, que son inindizables para un motor de búsqueda
    Textos en PDF (Google indexa hasta 120K)
    Si es una base de datos ofreciendo un interfaz web, o es contenido de pago, restringido, etc. no puede indexar
    Cuatro tipos de invisible:
    La web opaca: incluye los archivos que los motores podrían indizar, pero que no se indizan por diversos motivos:
    Profundiad del rastreo: rastrear un sitio web consume recursos, por lo que los crawlers dejan páginas sin rastrear. Aunque cada vez se rastrea más en profundidad
    Frecuencia del rastreo: los rastreadores más potentes rastrean 10 millones de páginas al día. La renovación de las páginas exige a los crawlers revisitar constantemente las páginas, las páginas nuevas en principio forman parte de la web invisible
    Número máximo de resultados visibles: algunos motores limitan el número de resultados
    Páginas desconectadas, no enlazadas por otras páginas y por tanto invisibles a los crawlers
    La web privada: páginas excluídas de los motores de búsqueda deliberadamente por los web masters
    La web propietaria: páginas que solamente son accesibles para persona que han acordado unos términos a cambio de ver el contenido de la página (se han registrado)
    La web realmente invisible: la que por razones técnicas realmente no se puede acceder o indizar por los motores:
    páginas con formatos de archivo que los motores no pueden gestionar (PDF, Postscript, Flash, Shockwave, ejecutables y comprimidos), estos archivos no tienen contenido textual. Se soluciona con metadatos, y cada vez los motores de búsqueda pueden gestionar más formatos.
    Páginas dinámicas: los spiders podrían rastrearlas en algunos casos pero pueden caer en spider traps mediante scripts maliciosos que generen miles o millones de páginas.
    Páginas elaboradas a partir de bases de datos relacionales: los crawlers no están programados para comprender su estructura, o el lenguaje de comandos para extraer la información.
    CONCLUSIÓN: Aunque los motores de búsqueda mejoran, la web invisible permanece; y contiene muchos de los recursos necesarios para obtener información científica y técnica; por ello debemos tratar estos recursos igual que las herramientas de referencia tradicionales: saber cuáles son, que contienen, cómo funcionan, qué podemos obtener de ellas.
  • http://www.elperroflaco.com/88/la-voz-de-galicia-froilan-y-los-lunnis.html
    En las navidades de 2005 la familia real felicita las fiestas con la foto de arriba, ya entonces no se debían llevar lo suficientemente bien como para posar juntos, y realizaron un fotoshop mal hecho. El asunto generó bastante cachondeo en la web, apareciendo múltiples parodias, como por ejemplo el mismo fotoshop pero con los lunnis
  • El 25 de octubre de 2006 la Voz de Galicia publica un reportaje sobre los Lunnis, y la ilustran con la ilustración de la parodia de la felicitación navideña de la familia real.
    La reportera había hecho una búsqueda en Google, pero no se había entretenido en verificar la fiabilidad de la fuente.
  • El periódico oficial chino 'Diario del Pueblo' se hizo eco de la selección de Kim Jong Un como "el hombre más sexy del mundo" y publicó una serie de nada menos que 55 fotografías para avalar esa tesis, sin haberse dado cuenta de que ese nombramiento es tan sólo una parodia.
    http://www.theonion.com/articles/kim-jongun-named-the-onions-sexiest-man-alive-for,30379/
  • EXPLICAR LOS TIPOS DE RESULTADOS: ESPECIALMENTE TRABAJOS DEPOSITADOS EN REPOSITORIOS; RESÚMENES Y CITAS; Y DOCUMENTOS A TEXTO COMPLETO
    HACER LA BÚSQUEDA : CRISIS ECONOMICA
  • Los operadores del primer grupo son comunes a todo Google. Los del segundo grupo sólo de Google Académico
    La elección de los términos de búsqueda cuanto buscamos documentación sobre algún tema es un asunto de capital importancia: debemos en primer lugar familiarizarnos con la terminología de la disciplina, para ello es útil el manejo de obras de referencia general: diccionarios, enciclopedias, manuales… etc. Algunas fuentes nos facilitarán esta tarea con listas de encabezamientos o tesauros (no es el caso de Google).
    A medida que vayamos avanzando en la búsqueda, probablemente tengamos que modificar los términos y las estrategias de búsqueda.
    QUEREMOS INFORMACIÓN SOBRE LOS EFECTOS DE LA CRISIS ECONÓMICA EN EL MERCADO LABORAL.
    TÉRMINOS DE BÚSQUEDA CRISIS ECONÓMICA LABORAL TRABAJO EMPLEO DESEMPLEO PARO
  • Google worldcatdialnet

    1. 1. OBJETIVO: Aprender a obtener información científica utilizando estas herramientas, y poder elaborar una bibliografía sobre un tema académico. DURACIÓN: 2 horas. SESIONES: 1 CONTENIDO: Una visión panorámica de Google, WorldCat y Dialnet Para cada una de las tres herramientas veremos: Qué es/qué ofrece Cómo acceder Cómo activar una cuenta Cómo se busca Qué se puede hacer con los resultados de la búsqueda
    2. 2. CUIDADO AL USAR
    3. 3. Kim Jong-Un declarado el Hombre Vivo Más Sexy por la revista The Onion “… con su rostro redondo y arrolladoramente hermoso, su encanto juvenil y su fuerte y robusta complexión, este rompecorazones de Pyongyang es el sueño de toda mujer hecho realidad…”
    4. 4. ¿ES ÚTIL GOOGLE PARA ENCONTRAR INFORMACIÓN CIENTÍFICA? - NO ES EXHAUSTIVO (no rastrea una gran cantidad de recursos relevantes de información científica) - NO TIENE CARÁCTER CIENTÍFICO (Google es una herramienta de carácter general, de la que podemos obtener todo tipo de resultados – también científicos) - HAY MEJORES OPCIONES
    5. 5. Es el buscador especializado de Google que limita los resultados al mundo de la investigación científica.
    6. 6. Permite realizar búsquedas en la literatura académica de forma sencilla. Desde aquí puedes buscar en múltiples disciplinas y fuentes: artículos científicos, tesis, tesinas, trabajos de grado, libros, ponencias y comunicaciones, informes científicos y técnicos, resúmenes y citas…, procedentes de editoriales académicas, sociedades profesionales, universidades, repositorios online, centros de investigación y otros sitios web. Google Académico ayuda a encontrar literatura relevante en el mundo de la investigación científica.
    7. 7. QUE UN DOCUMENTO PROVENGA DE UN SITIO CIENTÍFICO, NO IMPLICA NECESARIAMENTE QUE SE TRATE DE UN DOCUMENTO CIENTÍFICO DE CALIDAD. ¡¡DEBEMOS EVALUAR SIEMPRE LOS RESULTADOS!!
    8. 8. BÚSQUEDAS: OPERADORES • OPERADORES: • • • • • • • • “ “ : frase exacta OR: incluye cualquiera de los términos - : excluye palabra (=not) * : comodín Site: limita la búsqueda a un sitio Link: páginas que dirijan a una url Related: páginas similares .. : intervalo de números • • author: Busca por autor intitle: Busca por título + operadores de Google
    9. 9. BÚSQUEDA AVANZADA “”= Or = - = Intitle: = Author: =
    10. 10. ORDEN DE LOS RESULTADOS: - POR RELEVANCIA - (publicación, autor, citas recibidas) - Se pueden acotar fechas - POR FECHA
    11. 11. RESULTADOS: • TIPOS DE RESULTADOS: – [CITAS] referencias bibliográficas con y sin enlace – [LIBRO] referencia de libro en Google Books – TEXTOS COMPLETOS: [PDF] documento en formato pdf [DOC] documento en formato word [HTML] documento en formato html
    12. 12. RESULTADOS: AMPLIAR LA BÚSQUEDA
    13. 13. EXPORTACIÓN ELABORAR UNA BIBLIOGRAFÍA CON CORTA Y PEGA:
    14. 14. EXPORTACIÓN GUARDAR EN MI BIBLIOTECA
    15. 15. EXPORTACIÓN EXPORTAR A UN GESTOR DE REFERENCIAS: … podemos seleccionar el formato de exportación desde la configuración
    16. 16. de búsquedas de citas
    17. 17. - Ofrece un ránking de las 100 mejores revistas en español según el índice h a 5 años - Ofrece un ránking de las 20 mejores revistas en inglés según del índice h a 5 años
    18. 18. DIALNET ES UNA BASE DE DATOS QUE CONTIENE (CASI) TODA LA LITERATURA CIENTÍFICA QUE SE ESTÁ PUBLICANDO EN REVISTAS CIENTÍFICAS ESPAÑOLAS
    19. 19.  Especialmente en CC.SS. y HH.  Contiene también libros, capítulos, tesis, congresos  Recoge también algunas revistas extranjeras  Es el 2º portal en contenidos bibliográficos a nivel mundial  Es fruto de la colaboración de Bcas. Científicas españolas e iberoamericanas
    20. 20. + PRESTACIONES:  Registrarse 
    21. 21. BÚSQUEDAS: OPERADORES  * (Comodín)  OR  AND  () Paréntesis  “ ” Dobles comillas
    22. 22. BÚSQUEDA AVANZADA
    23. 23. RESULTADOS: FILTROS LISTADO BREVE
    24. 24. ENLACE AL REGISTRO COMPLETO ENLACE AL REGISTRO DEL AUTOR SELECCIONAR REGISTRO ENLACE AL REGISTRO DE LA REVISTA ENLACE AL RESUMEN ENLACE AL TEXTO COMPLETO ENLACE AL SUMARIO DEL NÚMERO
    25. 25. EXPORTACIÓN:  GUARDAR BÚSQUEDAS  CONFIGURAR ALERTAS A BÚSQUEDAS
    26. 26. EXPORTACIÓN:  GUARDAR REFERENCIAS  ORGANIZARLAS EN CARPETAS
    27. 27. EXPORTACIÓN:  EMAIL  GESTORES DE REFERENCIAS
    28. 28.  CREAR ALERTAS A REVISTAS
    29. 29. Enlaces a información sobre la revista Valoración de la revista Enlace al catálogo USAL Enlace a REBIUN
    30. 30. • www.worldcat.org • www.usal.worldcat.org • Worldcat = CATÁLOGO COLECTIVO MUNDIAL (creado en 1971) • Es la mayor base de datos bibliográfica del mundo: + de 2.000.000.000 de registros de ejemplar
    31. 31. La USAL participa en WorldCat a través de BUCLE (Bibliotecas Universitarias de Castilla y León)
    32. 32. Podemos buscar en:  La USAL  BUCLE  TODO EL MUNDO
    33. 33. PODEMOS INCORPORAR OTRAS BASES DE DATOS A LA BÚSQUEDA
    34. 34. BÚSQUEDAS: OPERADORES  AND  OR  NOT  () Paréntesis  “ ” Dobles comillas  Comodines: #, ?, *  Operadores de campo: kw:, au:, de:, ti:, so:, …
    35. 35. BÚSQUEDA AVANZADA
    36. 36. RESULTADOS: LISTADO BREVE ORDENAR FILTRAR  SELECCIONAR  GUARDAR BÚSQUEDA
    37. 37. RESULTADOS: REGISTRO COMPLETO EXPORTAR (citar, gestores, imprimir, email, guardar, redes sociales, permalink…) MATERIAL RELACIONADO
    38. 38. RESULTADOS: REGISTRO COMPLETO  LOCALIZAR
    39. 39. RESULTADOS:REGISTRO COMPLETO  AÑADIR RESEÑAS Y ETIQUETAS
    40. 40. PERFIL PERSONAL
    41. 41. EXPORTAR

    ×