3m 8ago11E-investigación bibliográfica: Web 2.0 y 3.0, teoría y práctica

  • 2,581 views
Uploaded on

E-investigación …

E-investigación
bibliográfica: Web 2.0 y 3.0, teoría y práctica plática en 3M México, 8 agosto 2010

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
2,581
On Slideshare
0
From Embeds
0
Number of Embeds
15

Actions

Shares
Downloads
13
Comments
0
Likes
1

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. E-investigación bibliográfica:Web 2.0 y 3.0, teoría y práctica Layla Michán Departamento de Biología Comparada
  • 2. Laboratorio de Cienciometría, Información e Informática en Ciencias Biológicas Facultad de Ciencias, UNAM PROBLEMAS ENFOQUE MULTIDISCIPLINARIO1. (R)evolución digital en las ciencias 1.Ciencia2. Características de la E-ciencia 2. Ciencias de la información y3. Dinámica, estructura y relaciones de la ciencia reciente documentación4. Publicación científica en la Web 3. Tecnologías de la Información y5. Recursos web y ciberinfraestructura para ciencia comunicación6. Colecciones de datos 4.Ciencias de la computación e informática7. Meta-análisis de literatura: bibliometría, análisis de redes, 5.Historia, sociología, filosofía yminería de textos, semántica comunicación de la ciencia TIPOS 1.científica 2.Bibliográfica 1. Objeto 3.Institucional INFORMACIÓN 2. Proceso CIENTÍFICA 3. Producto ÁREAS (Literatura) 1.Biodiversidad 2.Biomedicina APLICACIONES 1.Análisis de la ciencias biológicas actuales: desarrollo, dinámica, estructura, relaciones y tendencias 2.Información e informática en ciencias , relacionadas y afines 3.Obtención de nuevo conocimiento científico 4.Planeación, evaluación, gestión y política científica
  • 3. • Estructura • Desarrollo Impacto de la • Tendencias revolución digital en • Métodos biología • Patrones Análisis de las Ciencias Biológicas • Relaciones Teorías Métodos Difundir Herramientas electrónicas BibliometríaAnálisis de redes BúsquedaMinería de textos Recuperación Semántica Manejo Meta-análisis
  • 4. Enfoques actuales Información, informática y cienciometría para el estudio del envejecimiento RetosPerspectivas
  • 5. (Re)evolución de la información• Diseño de las computadoras, aparición del Internet masificación de la web.• Formato digital: bajo costo, poco espacio.• Explosión de la información.• Desapareció la distinción entre escribir y publicar, se volvió un proceso simultáneo.• Gran cantidad de colecciones de datos .• Dinámica: cambia, está en modificación constante, tanto el contenido como los formatos.• Masiva• Democrática: Cualquiera puede publicar información sin revisión o edición
  • 6. Contenido• Introducción – La Web 2.0 y 3.0
  • 7. • Seis grados de separación es una teoría que intenta probar que cualquiera en la Tierra puede estar conectado a cualquier otra persona del planeta a través de una cadena de conocidos que no tiene más de cinco intermediarios (conectando a ambas personas con sólo seis enlaces) o más popularmante que "el mundo es un pañuelo". La teoría fue inicialmente propuesta en 1930 por el escritor húngaro Frigyes Karinthy en un cuento llamadoChains. El concepto está basado en la idea de que el número de conocidos crece exponencialmente con el número de enlaces en la cadena, y sólo un pequeño número de enlaces son necesarios para que el conjunto de conocidos se convierta en la población humana entera.• Según esta teoría, cada persona conoce de media, entre amigos, familiares y compañeros de trabajo o escuela, a unas 100 personas. Si cada uno de esos amigos o conocidos cercanos se relaciona con otras 100 personas, cualquier individuo puede pasar un recado a 10.000 personas más tan sólo pidiendo a un amigo que pase el mensaje a sus amigos.
  • 8. E-cienciaLA WEB
  • 9. Efecto 10X• En la industria de TI, la tecnología y el uso evoluciona más rápido que tal vez en cualquier otra industria.• Como regla general, los sistemas pueden crecer 10 veces en su actual arquitectura o paradigma, entonces debe ser r ediseñado.• Este efecto hace que las tecnologías de 10X de edad para convertirse en los obsoletos y los nuevos que surjan.
  • 10. Ley de Moore• Describe el número de transistores que pueden caber en un circuito integrado.• Se duplica aproximadamente cada 18 meses.• La Internet se duplicará en tamaño cada 5. 32 años.
  • 11. Teoría de la evolución tecnológica• Según Richta y más tarde Bloomfield, [1] [2]• La tecnología (que Richta define como "una entidad material creado por la aplicación de un esfuerzo mental y físico de la naturalezacon el fin de alcanzar un cierto valor") se desarrolla en tres etapas: herramientas,máquina , La automatización.• Esta evolución, dice, sigue dos tendencias: la sustitucióndel trabajo físico, con más trabajo intelectual eficaz y el resultado del grado mayor decontrol sobre el medio ambiente natural, incluyendo la capacidad para transformarmaterias primas en productos cada vez más complejo y flexibl
  • 12. E-cienciaLA WEB
  • 13. Cloud computing (cómputo en nube)Es un enfoque transformador de la computación que involucra muchos aspectos, entre los que se incluyen: algoritmos a gran escala que se ejecutan en diversos conjuntos de datos (estructurados, semi-estructurados y no estructurados), almacenados en grandes equipos con enormes cantidades de datos de enorme, utilidades basadas en la rápida provisión de recursos informáticos personalizados, y la web ubicua con aplicaciones accesibles desde cualquier lugar.Sin embargo, es mucho más que lo que la tecnología promete: transformar radicalmente nuestra manera de interactuar con la información.
  • 14. Ecosistemas digitales• En el mundo de Internet, el rápido crecimiento y el uso exponencial de los medios digitales ha dado lugar a la aparición de entornos virtuales denominados ecosistemas digitales.• Están integrados por varias entidades independientes, como: individuos, organizaciones, servicios, software y aplicaciones para compartir una o varias misiones y centrarse sobre las interacciones e interrelaciones entre ellos.• Permiten la auto-organización de los ambientes, gracias a la recombinación y la evolución de sus "componentes digitales", en los que los recursos proporcionados por cada entidad están bien conservadas y son factibles de gestionar y utilizar en conjunto.• Debido a la naturaleza multidisciplinar de los ecosistemas digitales y sus características, son muy complejos para el estudio y diseño. http://130.102.71.54/medes
  • 15. ¿Qué son los Ecosistemas digitales? Exhiben ambientes virtuales, gracias a la re-combinación y evolución de sus ―componentes virtuales‖En el mundo del Internet, constantemente Ambiente virtualeshay un crecimiento rápido y exponencialusando los medios digitales Ecosistemas digitales Formados por entidades múltiples e independientes: • individuos • organizaciones • servicios Interacciones e interelaciones entre • software equipos • aplicaciones para compartir
  • 16. La aplicación de las Tecnologías de la información pueden ser mejoradas a través de técnicas novedosas, modelos y metodologías para cada archivo como:• la gestión de datos• tecnologías Web• redes• seguridad• interacciones computadora-humano• inteligencia artificial• e-servicios• sistemas de auto-organización Comprenden: •manejo de datos Soporta la estabilidad de los ecosistemas •servicios innovadores digitales y el manejo de •inteligencia computacional sus recursos •plataformas de auto-organización
  • 17. Cómputo en grid• No hay otro gran avance tecnológico ha demostrado el poder de los individuos de más de grid computing.• Al donar su tiempo en la computadora sin usar, puede empezar a cambiar el mundo para mejor. Empezar es fácil! Simplemente haga clic aquí para unirse a la World Community Griden la actualidad.
  • 18. World Community Grid• La computación grid se une a muchos equipos individuales, creando un gran sistema con el poder computacional masivo que supera con creces el poder de un puñado de superordenadores. Debido a que el trabajo se divide en trozos pequeños que se pueden procesar simultáneamente, se reduce el tiempo de investigación de años a meses. La tecnología también es más rentable, lo que permite un mejor uso de los fondos de crítica.• Cambiando nuestro mundo ahora. La computación grid no es una tecnología futurista.• World Community Grid está trabajando en este momento la aplicación de esta tecnología a los proyectos de investigación que puede beneficiar a todos nosotros.• Nuestro primer proyecto, Pliegue del Proteoma Humano, es la identificación de las proteínas producidas por los genes humanos. Con esta información, los científicos pueden entender cómo los defectos en las proteínas pueden causar enfermedades, por lo que es más fácil para encontrar la cura.• En 2003, con la computación grid, en menos de tres meses los científicos identificaron44 posibles tratamientos para combatir la enfermedad mortal viruela. Sin la red, el trabajo se ha tomado más de un año en completarse.
  • 19. Web 1.0 2000• Páginas electrónicas• Portales (sitios web)• Motores de bùsqueda •Consumidores• Metabuscadores (contenido)• Correo electrónico• Chats• Alertas Diferencias• Listas de discusión •Tecnológicas Web 2.0 •Estructurales 2003 •Filosóficas •Comunidades (conexiones •Sociológicas entre usuarios) •Actualización constante• Blogs •Intercambiar contenido• Redes sociales •Compartir• Wikis •Cargar• Folksonomias (social bookmarking) •Creadores (contenido) •Democrático• Weminarios •Se combina información de• Web feed diferentes bases de datos •Etiquetas •Ratings
  • 20. Etiquetar CompartirPublicar Clasificar
  • 21. AmigablesFáciles Aplicaciones Web Web 2.0 y 3.0: El proceso Funciones 4. Actualizar 2. Buscar 3. Marcar 6. Analizar 5. Manejar 1. Explorar 7. Compartir
  • 22. E-investigación bibliográfica en la Web• Explorar – Personalizar: complementos• Buscar – Buscadores, metabuscadores, colecciones• Guardar – Marcar, compartir, etiquetar• Actualizar – Automatizar: RSS y lectores de feeds: automatizar• Sistematizar – Manejar, citar, compartir• Difundir – Redes sociales• Meta-análisis
  • 23. Navegadores COLECCIONES DEGoogle, Bing DATOS Alertas Bases de datos Correos electrónicos Sistemas de 1 Navegar Listas de discusión información Agregadores Proveedores Recomendación Buscar Meta-análisis Bibliometría Selección Recuperación Análisis de redes Descubrimiento Basado en Literatura 2 3 PUBLICACIÓN PDF HTLM Lectura Guardar Marcadores TXT Google marcadores y 5 4 block Facebook Obtener Folkosomias Referencias metadatos Delicious Citar Citeulike Comentar Gestores de Gestores de 7 bibliografía bibliografía Citar mientras Endnote 6 escribo Refworks 1/100 Comentar Ciberinfraestructura Mendeley* Zotero PDFs Citeulike* Acrobat PDF Exchange*
  • 24. Herramientas electrónicas•Programas•Aplicaciones•Recursos•Utilidades•Herramientas http://www.victorinox.ch/•Servicios•Complementos (gadgets y plugins)
  • 25. Recursos Web 2.0
  • 26. Marcadores/Guardar etiquetar Marcador bibliografíaMarcador web Marcador imágenes Manejador bibliografíaca
  • 27. Library
  • 28. Torres-Salinas, D. and E. Delgado-López-Cózar (2009, September). Estrategia para mejorar la difusión de los resultados deinvestigación con la web 2.0. El Profesional de la Informacion 18 (5), 534-539.
  • 29. Redes sociales/Marcar compartir
  • 30. Varios
  • 31. Delicious VisualizeusMendeley CiteUlikeBarra de herramientas de Google Vista Previa Interclue Zotero Interclue Xmarks Delicious
  • 32. Publish or perish
  • 33. Torres-Salinas, D. and E. Delgado-López-Cózar (2009, September). Estrategia para mejorar la difusión de los resultados deinvestigación con la web 2.0. El Profesional de la Informacion 18 (5), 534-539.
  • 34. Recursos Web 2.0
  • 35. Meta-análisis• Simultáneo al desarrollo de ciencias de la información (CI) y las tecnologías la información y la comunicación (TICS), en especial con el desarrollo de las bases de datos y la Internet, se han producido formas sistémicas de análisis de cantidades colosales de información (terabites).• Técnica cuantitativa que usa mediciones específicas para indicar la fuerza (tendencias) de relaciones variables en los estudios incluidos en el análisis. La técnica enfatiza los resultados entre múltiples estudios en oposición a los resultados obtenidos de una sola investigación.
  • 36. • La Web semántica (del inglés semantic web) es la "Web de los datos".1 Se basa en la idea de añadir metadatos semánticos y ontológicos a la World Wide Web. Esas informaciones adicionales —que describen el contenido, el significado y la relación de los datos— se deben proporcionar de manera formal, para que así sea posible evaluarlas automáticamente por máquinas de procesamiento. El objetivo es mejorar Internet ampliando la interoperabilidad entre los sistemas informáticos usando "agentes inteligentes". Agentes inteligentes son programas en las computadoras que buscan información sin operadores humanos.
  • 37. ChilibotRelaciones entre un subconjunto de genes afectados por el tratamiento concocaína.
  • 38. Web 2.0
  • 39. Artículos de vanguardia Comentar Calificar c Ranking Buscar c Marcar Compartir
  • 40. XML XML, siglas en inglés de eXtensible Markup Language (lenguaje de marcas extensible), es un metalenguaje extensible de etiquetas desarrollado por el World Wide Web Consortium (W3C).
  • 41. http://www.personalizemedia.com/garys-social-media-count/
  • 42. Metrics
  • 43. MENDELEY
  • 44. Library
  • 45. Statistics
  • 46. Browse I Aplicaciones Web II Colecciones bibliográficas Web Metabrowser web browsers Libraries Browsers s specialized Editors Suppliers Search Information systemsBookmark Indexes and catalogsManage ShareIII Meta-analisis• Scientometrics• Network Analysis• Text mining Repositories• Semantics
  • 47. Colecciones/Sistematizar
  • 48. Colecciones bibliográficas Repositorios Editoriales y revistas Catálogos e índicesSistemas de información E-bibliotecas
  • 49. La Web 2.0 (Social)• Se centra en la capacidad de las personas para colaborar y compartir información en línea.• Transición de la Web estática a una dinámica, que es más organizada.• Comunicación abierta con un énfasis en comunidades de usuarios e intercambio de información.• Ya no sólo se trata de ofrecer la posibilidad de encontrar información, sino de lograr objetivos específicos, pues es factible, crear, etiquetar jerarquizar y compartir datos.• Lenguaje HTLM Web 3.0 (Semántica)• Basada en la idea de añadir metadatos semánticos e información (a través de mapas• cognitivos).• Desarrollar nuevos sistemas de interoperabilidad que permitan interpretar• metadatos para adaptarse a las acciones de los usuarios .• Minería de textos y ontologías• Lenguajes: XML (etiquetas) y RDF (metadatos)
  • 50. Propósitos1. Recuperación de información.2. Obtención de nuevo conocimiento.3. Evaluación.4. Análisis, desarrollo, estructura y relaciones de la dinámica científica.
  • 51. Entomology
  • 52. Resultados de laencuesta: conjunto de datos más grande analizadoshttp://www.kdnuggets.com/2011/05/largest-dataset-analyzed.html
  • 53. Meta-análisis para PubMed META-ANALISIS Bibliometría Análisis de Text Mining Redes
  • 54. Bibliometría para artículos
  • 55. Búsqueda Bibliometría para consultas Tendencias
  • 56. Bibliometría para dominios
  • 57. 2002 1996 1990 1984 1978 Taxonomía AL 1972 1966 1960 Bibliometría para colecciones 1954 1948 1942 1936 1930 1924 Periodica 1918 Scopus Biosis 1912 1906 1900 1894 1888 CAB 1882 SCI SCI ZR 1876 1870 1864 10 1 1000 100100000 10000 log Documentos
  • 58. Boquím y biol mol Periódica Agricultura Biosis CAB SCI ZR Forestal Enfer infeccBibliometría para colecciones FisiologíaTaxonomía América Latina Biol reprod Parasitología Taxonomía AL Genética y herencia Biodiv y conserv Biol mar y acuát Paleontología Botànica Anat y morf Cienc biolog Ecol y cienc amb Zooloogía Biol Evolut 0 100 90 80 70 60 50 40 30 20 10 %
  • 59. Bibliometría para países/regiones
  • 60. Redes paraobtención de nuevo conocimiento
  • 61. Redes para palabrasFig. 2. Co-word space of the top 50 highly frequent and bursty words used in the top10% most highly cited PNAS publications in 1982-2001.
  • 62. ChilibotRelaciones entre un subconjunto de genes afectados por el tratamiento concocaína.
  • 63. Redes para elconocimiento
  • 64. Bibliometría para el conocimiento
  • 65. Modelos en Biomedicina SCI 3000 400 Neurospora (6640) Dictyostelium (6191) Chlamydomonas (5646) Caenorhabditis (5353) 300 Schizosaccharomyces (3183) Danio (973) 2500 Documentos 200 100 2000 0 1940 1945 1950 1955 1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 AñoDocumentos 1500 Escherichia (94873) Drosophila (48989) Saccharomyces (27549) Arabidopsis (18094) 1000 Zea (7636) Neurospora (6640) Dictyostelium (6191) Chlamydomonas (5646) 500 Caenorhabditis (5353) Schizosaccharomyces (3183) Danio (973) 0 1900 1905 1910 1915 1920 1925 1930 1935 1940 1945 1950 1955 1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 Año
  • 66. web semántica
  • 67. La Web semántica• (del inglés semantic web) es la "Web de los datos".1• Se basa en la idea de añadir metadatos semánticos y ontológicos a la World Wide Web.• Esta información adicional —que describen el contenido, el significado y la relación de los datos— se deben proporcionar de manera formal, para que así sea posible evaluarlas automáticamente por máquinas de procesamiento.• El objetivo es mejorar Internet ampliando la interoperabilidad entre los sistemas informáticos usando "agentes inteligentes". Agentes inteligentes son programas en las computadoras que buscan información sin operadores humanos.
  • 68. Tim Berners-Lee, el creador de laidea, la expresó de la siguientemanera:"Mi sueño es una Web en la que lasmáquinas sean capaces de analizartodos los datos –contenido, enlacesy transacciones entre la gente y losordenadores–. La Web Semántica,que haría esto posible, está todavíapor llegar, pero cuando llegue, larutina de nuestras compras,burocracia y vida diaria serágestionada por máquinas hablandocon máquinas. Los AgentesInteligentes que han sidoanunciados durante décadas seharán por fin realidad".
  • 69. InteroperatibilidadLa interoperabilidad es la propiedad de un producto osistema, cuyas interfaces se conocen porcompleto, para trabajar con otros productos o sistemas,presentes o futuros, sin ningún tipo de accesorestringido o de ejecución.
  • 70. Estándares• XML (eXtensible Markup Language)• RDF (Resource Description Framework)• SPARQL (an RDF Query Language)
  • 71. XML XML, siglas en inglés de eXtensible Markup Language (lenguaje de marcas extensible), es un metalenguaje extensible de etiquetas desarrollado por el World Wide Web Consortium (W3C).
  • 72. Ontologías taxonomía• Una ontología es una manera formal de representar el conocimiento en el que los conceptos son descritos por su significado y su relación con los demás.• Se asignan identificadores únicos que se asocian con cada concepto en ontologías biológicas (bio- ontologías) puede ser utilizada para enlazar información de diversas bases de datos.
  • 73. http://richard.cyganiak.de/2007/10/lod/lod-datasets_2010-09-22_colored.html
  • 74. Dublin Core Metadata Element Set (DCMES)• 15 elementos de meta-datos básicos.
  • 75. Retos actuales• Una nueva cultura (informática)• La explosión de la cantidad y diversidad de herramientas digitales (Web)• Colaboración• Estándares• Colecciones• Normalización• Semántica (Ontologías)• Nube• Acceso Abierto• Derechos de Autor (Plagio)• Nuevas especialidades
  • 76. http://biiiogeek.blogspot.com/
  • 77. • Esta investigación se lleva a cabo gracias al financiamiento de:• DGAPA, UNAM. Proyecto PAPIME PE 201509• CONACYT, Ciencia Básica. Proyecto 13276 2011-2014.
  • 78. Licencia Creative Commons Forma de citar este trabajo Michán, L. 2011. Presentaciónhttp://creativecommons.org/licenses/by/3.0/deed.es_GT