Memoria de Título

989 views
904 views

Published on

Análisis de la Comunidad Científica Nacional en Ciencias de la Computación - Memoria de Título para optar a Ingeniero Civil Informático en la Universidad de Concepción, Chile. Nota máxima.

Published in: Technology, News & Politics
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
989
On SlideShare
0
From Embeds
0
Number of Embeds
36
Actions
Shares
0
Downloads
11
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Memoria de Título

  1. 1. Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación Jaime A. Terán Moya Prof. Patrocinante: Sra. Andrea Rodríguez T. Agosto, 2007
  2. 2. Contenidos • Descripción General y Objetivos • Métricas e Indicadores Analizados • Fuentes de Información e Integración • Análisis de Datos • Conclusiones y Trabajo Futuro Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  3. 3. Descripción General y Objetivos Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  4. 4. Descripción General • ¿Ciencias de la Computación? • Comunidades como Redes Sociales • ¿Por qué es importante evaluar? • ¿Cómo hacerlo? Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  5. 5. Objetivos • Definición e incorporación de información a un modelo de datos. • Análisis y comparación de métricas. Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  6. 6. Redes Complejas • Alto número de unidades dinámicas e interconectadas • Topología Característica • Small World Networks • Scale Free Networks Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  7. 7. Contenidos ✓ Descripción General y Objetivos • Métricas e Indicadores Analizados • Fuentes de Información e Integración • Análisis de Datos • Conclusiones y Trabajo Futuro Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  8. 8. Métricas e Indicadores Analizados Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  9. 9. Dos Perspectivas Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  10. 10. Publicaciones • cito a, citado por • Temporalidad • Medios de Publicación Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  11. 11. Publicaciones 2 • Referencias/Publicaciones • H-Index • Número de publicaciones Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  12. 12. Co-Autoría • Caracterización topológica de la red • Centralidad de nodos en la red Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  13. 13. Co-Autoría 2 • Topología • Distribución de Grados de la red • Presencia y tamaño de un componente gigante • Ruta mínima promedio • Coeficiente de clustering Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  14. 14. Co-Autoría 3 • Centralidad • Número de Co-autores • Cercanía (closeness) Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  15. 15. Co-Autoría 4 • Centralidad • Interconexión (betweenness) • PageRank Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  16. 16. Contenidos ✓ Descripción General y Objetivos ✓ Métricas e Indicadores Analizados • Fuentes de Información e Integración • Análisis de Datos • Conclusiones y Trabajo Futuro Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  17. 17. Fuentes de Información e Integración Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  18. 18. DBLP Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  19. 19. DBLP Ventajas: • XML (390+MiB) + DTD • Clasificación de documentos • Información por documento Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  20. 20. DBLP Problemas: • Referencias cruzadas • Baja capacidad de ingreso • Sesgo • Identificación de personas Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  21. 21. Google Scholar Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  22. 22. Google Scholar Ventajas: • Resultados ordenados por relevancia • Número de citas actualizado • Listado ‘citado por’ Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  23. 23. Google Scholar Problemas: • No API o XML • Resultados no 100% fiables Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  24. 24. Web of Science Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  25. 25. Web of Science Ventajas: • Acceso vía Web Services • Búsqueda exacta según diferentes criterios • Relaciones ‘cita a’ y ‘citado por’ entre documentos indexados Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  26. 26. Web of Science Problemas: • Pobre en material relativo a Ciencias de la Computación • Acceso restringido Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  27. 27. Publicación id Publicación_autor tipo_fk Revista/Conf id journal_fk id publicacion_fk titulo titulo autor_fk año tipo posicion dblp_key citas_gs citas_wos Autor Autor_dblp_fondecyt id autor_id nombre autor_fondecyt_fk Autor_fondecyt id Institucion_Depto Institución nombre1 id id nombre2 institucion_fk nombre apellido1 departamento_fk pais apellido2 institucion_fk departamento_fk Departamento id nombre Modelo de Datos Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  28. 28. toDB() NO SI ¿Existe? Insertar Rescatar ID PUB Rescatar ID PUB NO SI ¿Autor en cola? NO SI NO SI ¿Existe ¿Existe? Journ/Conf? Rescatar ID Insertar Rescatar ID AUT Insertar JOUR/CONF Rescatar ID Rescatar ID AUT JOUR/CONF Relacionar ID Relacionar ID PUB + ID JOUR/ PUB + ID AUT CONF fin Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  29. 29. Publicación id Publicación_autor tipo_fk Revista/Conf id journal_fk id publicacion_fk titulo titulo autor_fk año tipo posicion dblp_key citas_gs citas_wos Autor Autor_dblp_fondecyt id autor_id nombre autor_fondecyt_fk Autor_fondecyt id Institucion_Depto Institución nombre1 id id nombre2 institucion_fk nombre apellido1 departamento_fk pais apellido2 institucion_fk departamento_fk Departamento id nombre Modelo de Datos Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  30. 30. Frontend PHP Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  31. 31. Publicación id Publicación_autor tipo_fk Revista/Conf id journal_fk id publicacion_fk titulo titulo autor_fk año tipo posicion dblp_key citas_gs citas_wos Autor Autor_dblp_fondecyt id autor_id nombre autor_fondecyt_fk Autor_fondecyt id Institucion_Depto Institución nombre1 id id nombre2 institucion_fk nombre apellido1 departamento_fk pais apellido2 institucion_fk departamento_fk Departamento id nombre Modelo de Datos Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  32. 32. inicio DB SI XML ¿datos? Publicaciones NO ¿Publicación fin citingArticles en cola? SI Título, Año ut SI NO ¿datos? searchRetrieve Citas Web of Science Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  33. 33. 277/834 33,2 % Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  34. 34. inicio Publicaciones nacionales y DB autores NO ¿Publicación fin actualizar en cola? SI Construcción URL SI NO ¿citas? cURL Citas Google Scholar Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  35. 35. Google Scholar v/s Web of Science Comparando las Top 10: • Top 10 WoS tienen datos en GS • 6 previas al 2000 en WoS, 2 en GS Sin embargo: • WoS no considera auto-citas • WoS sólo considera datos indexados Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  36. 36. Problemas • Incompletitud y accesibilidad de relaciones • Tamaño del grafo • Nombres Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  37. 37. Contenidos ✓ Descripción General y Objetivos ✓ Métricas e Indicadores Analizados ✓ Fuentes de Información e Integración • Análisis de Datos • Conclusiones y Trabajo Futuro Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  38. 38. Análisis de Datos Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  39. 39. Referencias Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  40. 40. Métricas • Número de Publicaciones • H-Index en base a los datos de GS • H-Index en base a los datos de WoS • Número de co-autores • Citas promedio en base a GS y el número de publicaciones • Citas promedio en base a WoS y el número de publicaciones Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  41. 41. Ranking & Comparación           Rank #Pubs 1         Rank Co-A 0,791429882 1       Rank h-GS 0,889590105 0,674904654 1     Rank h-WoS 0,784187662 0,623087252 0,803371338 1 Rank avgGS 0,55462994 0,406154185 0,796117283 0,649332508 1  Rank avgWoS 0,531160828 0,391395307 0,599777774 0,874112818 0,642437539 1   Rank #Pubs Rank Co-A Rank h-GS Rank h-WoS Rank avgGS Rank avgWoS Relación entre h-index según GS y WoS Relación entre h-index y número de publicaciones 70 80 70 60 60 50 50 h-index (WoS) h-index (GS) 40 40 30 30 20 20 10 10 0 0 0 10 20 30 40 50 60 70 80 0 10 20 30 40 50 60 70 80 h-index (GS) #Publicaciones por autor Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  42. 42. Publicaciones por autor 12 10 8 Autores 6 4 2 0 1 8 15 22 29 36 43 50 57 64 71 78 85 92 99 106 113 120 127 134 141 148 Publicaciones Publicaciones por autor Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  43. 43. ¿Dónde se publican los artículos? 120 100 80 56 50 s En Conferencia 44 60 En Journal 40 36 40 33 26 45 18 41 20 37 11 31 25 18 6 15 13 10 5 0 Top 10 Top 20 Top 30 Top 40 Top 50 Top 60 Top 70 Top 80 Top 90 Top 100 ¿Dónde publican los autores nacionales? Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  44. 44. ¿Dónde se publican los artículos? 900 800 700 600 604 580 500 499 En Conferencia En Journal 419 400 344 300 265 192 200 121 228 221 202 182 100 157 56 136 109 80 45 0 Top 100 Top 200 Top 300 Top 400 Top 500 Top 600 Top 700 Top 800 Top 900 ¿Dónde publican los autores nacionales? Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  45. 45. 27% Revistas 73% Actas de Conferencias Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  46. 46. 140 120 100 80 #Pubs #en Revistas #en Conferencias 60 40 20 0 05 04 03 02 01 00 99 98 97 96 95 94 93 92 91 75 90 9 * 98 06 20 20 20 20 20 20 19 19 19 19 19 19 19 19 19 19 -1 20 19 Evolución Temporal Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  47. 47. Actas con mayor publicación nacional 40 35 30 25 20 15 10 5 0 LA-WEB LATIN SCCC SAC SPIRE PODS CRIWG CIARP SPIRE/CRIWG CPM Actas de mayor publicación nacional Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  48. 48. Revistas con mayor publicación nacional 16 14 12 10 8 6 4 2 0 Theor. Comput. Sci. Pattern Recognition Pattern Recognition Inf. Process. Lett. Acta Inf. Algorithms Computers & OR Algorithmica CoRR BIT J. Discrete Letters Revistas de mayor publicación nacional Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  49. 49. Revistas / Actas con mayor tasa de citas por publicación según GS 50 45 40 35 30 25 20 15 10 5 0 Theor. Comput. Inf. Process. Algorithmica Algorithms SAC SPIRE/CRIWG CP PODS CoRR CPM J. Discrete Lett Sci. Revistas/Actas de mejor rendimiento según GS Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  50. 50. Revistas / Actas con mayor tasa de citas por publicación según WoS 6 5 4 3 2 1 0 Theor. Comput. SWAT Acta Inf. Inf. Process. Algorithmica SPIRE/CRIWG CoRR CP PODS CPM Lett Sci. Revistas/Actas de mejor rendimiento según WoS Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  51. 51. Investigadores por Institución 3% 3% 14% 21% EMPRESA 3% PUC 1% PUCV UCHILE 6% 1% UCN UDEC UFRO UMAG USACH UTFSM 17% UVALPO 30% 1% Investigadores por Institución Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  52. 52. Publicaciones por Institución 2% 1% 10% 15% 0% EMPRESA 1% PUC 2% 1% PUCV UCHILE UCN UDEC UFRO 9% UMAG 0% USACH UTFSM UVALPO 59% Publicaciones por Institución Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  53. 53. Co-Autoría Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  54. 54. Co-Autores por componentes Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  55. 55. Distribución de grados 450 400 350 300 Número de nodos 250 200 150 100 y = 256,69x −2,004 50 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Grado € Distribución de Grados Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  56. 56. Distribución de pesos 600 500 400 Frecuencia 300 200 y = 487,44 x −2,1123 100 0 € 9..10 10..11 11..12 12..13 13..14 14..15 15..16 16..17 0..1 1..2 2..3 3..4 4..5 5..6 6..7 7..8 8..9 Rango Distribución de Pesos Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  57. 57. Indicadores Topológicos Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  58. 58. Componente Gigante Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  59. 59. Rankings Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  60. 60. PageRank Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  61. 61. Contenidos ✓ Descripción General y Objetivos ✓ Métricas e Indicadores Analizados ✓ Fuentes de Información e Integración ✓ Análisis de Datos • Conclusiones y Trabajo Futuro Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  62. 62. Conclusiones y Trabajo Futuro Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  63. 63. Conclusiones • Estado del arte • Interpretación de métricas • Caracterización de la red • Co-Autoría de Primer Grado • Herramientas disponibles Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  64. 64. Trabajo Futuro • Incorporar áreas de trabajo por investigador • Disponibilidad de datos vía XML • Definir nuevas perspectivas de análisis • Definir mecanismos de comparación de comunidades a nivel macro Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  65. 65. ¿Preguntas? Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
  66. 66. Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación ¡Gracias! Jaime A. Terán Moya Prof. Patrocinante: Sra. Andrea Rodríguez T. Agosto, 2007

×