Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Bibliotecari@s en la ‪Big Data‬

1,626 views

Published on

CONGRESO INTERNACIONAL SOBRE METADATOS 2016
“Tendencias multidisciplinarias en el uso de los metadatos”
1, 2 y 3 de junio de 2016.

Published in: Education

Bibliotecari@s en la ‪Big Data‬

  1. 1. Fernando  Ariel  López     @fernando__lopez  
  2. 2. Big Data
  3. 3. ¿Qué  es  Big  Data?   •  disponibilidad  de  datos   •  capacidad  para  almacenarlo   •  capacidad  para  procesarlos              —>  provenientes  de  dis8ntas  fuentes            —>  crecimiento  extraordinario                —>  disminución  de  los  costos  asociados     VOLUMEN - VARIEDAD - VELOCIDAD Algunos agregan 2 “V” más: VALOR y VERACIDAD
  4. 4. kilobyte  (kB)   megabyte  (MB)   gigabyte  (GB)   terabyte  (TB)   petabyte  (PB)   exabyte  (EB)   zeIabyte  (ZB)   yoIabyte  (YB)   1  Exabyte  (1.099.511.627.776  MB):     equivale  a  20  veces  todos  los  libros  escritos  de   la  historia  hasta  2013,  o  a  85  veces  el  material   cultural  guardado  por  Internet  Archive.   1  YoHabyte  (1.152.921.504.606.846.976  MB):   equivale  a  1.257  iPad  3  de  máxima  capacidad   por  cada  habitante  de  la  8erra,  o  la  capacidad   del  datacenter  que  la  NSA  inaugurará  en  2013.  
  5. 5. Fuentes de Datos
  6. 6. CAPAS   1. Fuentes  de  datos   2. Infraestructura   3. Aplicaciones   4. Analí8cas   5. Cross  Infraestructuras  y  Analí8cas   SEMÁNTICA:   datos  enlazados,  esquemas  de  metadatos  y  ontologías      
  7. 7. El lado oscuro de la Big Data
  8. 8. Desafíos
  9. 9. CIENCIA   Polí8ca  de  Datos   Plan  de  Ges8ón  de  Datos  Cienaficos  (DMP)   Repositorios  de  Datos  Cienaficos   MEDIOS  SOCIALES   Presencia  en  la  web  social   Desarrollos  de  Productos  y  Servicios     Creación  de  COMUNIDAD   Análisis  y  Monitoreo   MAKERSPACES  en  BIBLIOTECAS   Hardware  abierto  à  SENSORES   Impresoras  3D.  Modelado  3D,  Scanner  3D.  Fresadoras   Realidad  Virtual.  Otras  tecnologías  disrup8vas   Innovación  abiertas  à  Hackathones  
  10. 10. CIENCIA Líneas  de  Trabajo:   1.  POLÍTICA  DE  DATOS  CIENTÍFICOS     2.  CICLO  DE  VIDA  DE  LOS  DATOS  CIENTÍFICOS   3.  PLAN  DE  GESTIÓN  DE  DATOS  CIENTÍFICOS   4.  E-­‐INFRAESTRUCTURAS  
  11. 11. CICLO DE VIDA DE LOS DATOS CIENTÍFICOS 1.  Diseño  y  planificación  de  la  creación/extracción  de   datos   2.  Creación/Extracción  de  Datos   3.  Limpieza,  Normalización  y  Descripción  de  Datos     4.  Almacenamiento  y  Preservación  de  Datos   5.  Exploración,  Explotación  y  Visualización  de  Datos   6.  DataMining  &  Knowledge  Discovery  
  12. 12. e-INFRAESTRUCTURAS Repositorio Interoperable de Datos •  Datos Públicos Argentina (CKAN, OKF), •  Zenodo (Invenio, CERN) •  DRYAD, PLICSS, LAGOS (DSpace, MIT & HP), •  Harvard DATAVERSE (Eprints) Plataforma de Trabajo para Investigadores •  OSF, HubZero, MyExperiment.org, etc. Cluster de Almacenamiento y/o Procesamiento
  13. 13. PLAN DE GESTIÓN DE DATOS
  14. 14. Y en las bibliotecas tenemos… ¿Datos? ¿Sensores? ¿Algo más? SemanVzar  los  datos  
  15. 15. NUEVOS  PERFILES  
  16. 16. CDO:  Chief  Data  Officer,  es  la  persona  responsable  de  toda  la  organización  rela8va  a   los  datos,  desde  su  origen,  función,  tratamiento  o  propiedad.  No  debería  estar  en  el   departamento  de  IT,  ni  reportar  al  CIO.  Idóneamente  debería  reportar  al  director   general,  coordinando  su  ac8vidad  con  tecnología,  operaciones  y  las  áreas  de  negocio.     Data  Architect:  Responsable  de  la  arquitectura  (funcional  y/o  técnica)  de  la   infraestructura  y  modelado  de  los  datos.  También  de  diseñar  el  procesamiento  y  la   integración  de  datos  desde  su  origen  hasta  los  análisis  finales.     Data  Developer:  es  la  persona  encargada  de  realizar  el  procesamiento  de  los  datos   desde  los  sistemas  origen  hasta  las  estructuras  de  análisis.  Debe  tener  sólidos   conocimientos  en  procesamiento  paralelo,  algoritmos,  procesos  ETL,  modelos  de   datos,  ficheros,  etc.     Data  ScienVst:  La  profesión  del  futuro.  Es  el  encargado  en  extraer  el  conocimiento  de   los  datos.  Para  ello  deber  tener  sólidos  conocimientos  estadís8cos,  poseer  destrezas   para  resolver  problemas,  hacer  preguntas  y  explicar  los  resultados  obtenidos.       ¿y  el  Data  Librarian?  
  17. 17. Bibliotecari@ de Datos Es un término ad-hoc, es la aplicación de los principios y las prácticas tradicionales de los bibliotecarios a los datos. El perfil del bibliotecario de datos requiere: •  Competencias informáticas •  Conocimiento de la disciplina (corpus, prácticas de investigación y flujos de trabajo) •  Gestión de datos: q  adquisición (desarrollo de la colección), q  organización (catalogación y metadatos), q  preservación y conservación a largo plazo q  implementación de servicios adecuados para los usuarios.
  18. 18. NUEVAS  COMPETENCIAS  
  19. 19. COMPETENCIAS •  Estadística, Algebra y Programación •  Tecnologías y Formatos Abiertos •  Estrategia, Análisis y Gestión •  Design Thinking + Canvas •  Comunicación (oral, escrita, visual y audiovisual) •  Diseño Centrado en el Usuario (UX)
  20. 20. Palabras finales…
  21. 21. •  Repensar  nuestros  roles  y  datos  con  crea8vidad   •  Ampliar  y  afianzar  los  horizontes  profesionales   •  Empoderar  al  inves8gador,  a  las  ins8tuciones,  al   ciudadano  y  a  nosotros  mismos   •  Contribuir  a  la  seman8zación  de  la  Big  Data     •  Tim  Berners  Lee  “cada  uno  debe  hacer  su  parte”     …  como  Bibliotecari@s,  hagamos  nuestra  parte.  
  22. 22. Fernando Ariel López fernandoariellopez@gmail.com @fernando__lopez

×