Repositorios en la nube


Ricard de la Vega
Jefe del Servicio de Portales y Repositorios
Centre de Supercomputació de Cata...
Centre de Supercomputació de Catalunya


                            Consorcio público
                             Creado...
Nuestros servicios
Agenda




 Introducción                   Repositorios en el cloud
 ¿Qué es el cloud?               • Duracloud
 Tipologí...
Agenda




 Introducción                   Repositorios en el cloud
 ¿Qué es el cloud?               • Duracloud
 Tipologí...
Tendencia en las TIC
“Cuanto más cambia una cosa...”



  “Cuanto más cambia una cosa, más se convierte en lo
  mismo. Fijémonos en el cloud co...
Mainframes...




                           VAX 8600            Controladora discos HSC50




        Terminal Digital VT...
Clouds...




                                Centros de datos
  El terminal es el navegador
Agenda




 Introducción                   Repositorios en el cloud
 ¿Qué es el cloud?               • Duracloud
 Tipologí...
Definiciones y conceptos clave



“The services themselves have long been referred to as Software as a 
Service (SaaS). Th...
Agenda




 Introducción                   Repositorios en el cloud
 ¿Qué es el cloud?               • Duracloud
 Tipologí...
Tipos de cloud




Fuente: http://www.ucar.edu/educ_outreach/webweather/cloud3.html
“as a service”


  Software como un servicio (SaaS)
   • Aplicaciones de Google (Gmail, Calendar...)
   • Salesforce.com

...
Pública, privada...



  Una nube pública es el hardware y software de un centro
  de datos ofrecido en la modalidad de “p...
Agenda




 Introducción                   Repositorios en el cloud
 ¿Qué es el cloud?               • Duracloud
 Tipologí...
Participantes y beneficios

  Transferencia del riesgo a los proveedores del cloud
   • Service Level Agreement (SLA)

  P...
Como el car sharing
Agenda




 Introducción                   Repositorios en el cloud
 ¿Qué es el cloud?               • Duracloud
 Tipologí...
Data deluge
Agenda




 Duracloud
  • DURASPACE   • Arquitectura
  • Objetivos   • Pilotos
  • Servicios   • Roadmap
DURASPACE

 DuraCloud es de DURASPACE

  • Non-profit-org que da soporte a las comunidades
    Dspace y Fedora.
  • Innova...
Objetivos



  Soporte a la preservación
  • Replicación de contenido, auditoría (checksums), reparación


  Federación de...
Servicios básicos




Fuente: http://www.duraspace.org/documents/DuraCloudNDIIPPJune09.ppt
Servicios adicionales




Fuente: http://www.duraspace.org/documents/DuraCloudNDIIPPJune09.ppt
Casos de uso con almacenamiento en la nube




Fuente: http://www.duraspace.org/documents/DuraCloudNDIIPPJune09.ppt
Casos de uso con computación en la nube




Fuente: http://www.duraspace.org/documents/DuraCloudNDIIPPJune09.ppt
Servicios de preservación




Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-manag...
Arquitectura




Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-d...
Arquitectura




Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-d...
Arquitectura




Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-d...
Pilotos de casos de uso

  Quieren...
   •   Introducción de gran cantidad de contenidos digitales
   •   Replicar a múlti...
Pilotos de casos de uso




Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managin...
Pilotos de casos de uso




Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managin...
Pilotos de casos de uso




Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managin...
Pilotos de casos de uso, retos




Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-...
Pilotos de beta testers




Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managin...
Pilotos de beta testers




Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managin...
Encuesta




Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-data-...
Encuesta




Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-data-...
Encuesta




Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-data-...
Encuesta




Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-data-...
Roadmap




Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-data-i...
Roadmap




Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-data-i...
Agenda




 Introducción                   Repositorios en el cloud
 ¿Qué es el cloud?               • Duracloud
 Tipologí...
Eprints Cloud Capabilities

  Los datos se pueden              Mediante storage
  almacenar en:                    control...
Arquitectura




Fuente: http://www.slideshare.net/lescarr/eprints-and-the-cloud
Plug-ins de almacenamiento en cloud en el API




Fuente: http://www.slideshare.net/lescarr/eprints-and-the-cloud
Objetivos




Fuente: http://www.slideshare.net/lescarr/eprints-and-the-cloud
EPrints Bazaar




Fuente: http://www.slideshare.net/lescarr/eprints-and-the-cloud
Agenda




 Introducción                   Repositorios en el cloud
 ¿Qué es el cloud?               • Duracloud
 Tipologí...
Reflexión antes de las conclusiones...

 En este contexto (en las nubes), se podría decir que los
 repositorios cooperativ...
Conclusiones


  El cloud es una tendencia en auge en las TIC.

  Existen diferentes tipos de cloud para distintas
  neces...
Conclusiones

  En DuraCloud, aunque el objetivo son servicios de
  almacenamiento y computación en la nube, los primeros
...
Agenda




 Introducción                   Repositorios en el cloud
 ¿Qué es el cloud?               • Duracloud
 Tipologí...
Referencias

  Above the Clouds: A Berkeley View of Cloud Computing,
  Michael Armbrust et alt., UC Berkeley Reliable Adap...
Referencias


  DuraCloud http://www.duraspace.org/duracloud.php

  DuraCloud: Managing Durable Data in the Cloud. Michele...
Referencias

  Repositories and the Cloud. 23 febrero de 2010 en
  Londres (presentaciones y videos en línea en
  http://u...
Más referencias...


     http://www.youtube.com/watch?v=QJncFirhjPg




     http://www.youtube.com/watch?v=XdBd14rjcs0

...
Más referencias...


     http://www.youtube.com/watch?v=Cl6XFZH5aWU




      http://www.youtube.com/watch?v=VjfaCoA2sQk
...
Repositorios en la nube
Upcoming SlideShare
Loading in …5
×

Repositorios en la nube

2,905
-1

Published on

Las aplicaciones que se distribuyen a través de Internet como un servicio (Software as a service, SaaS) y el hardware y software de base de los centros de datos (Nube, Cloud) son los dos elementos de la ecuación llamada cloud computing. En este paradigma, se juegan tres roles principales: proveedor del cloud, usuario del cloud que a su vez es proveedor de servicio (como los repositorios) y los usuarios finales del servicio. Los primeros se benefician de la especialización y las economías de escala; mientras que los segundos de una mayor elasticidad en el aprovisionamiento. En este sentido, DuraSpace ha creado un piloto llamado DuraCloud para probar el uso de tecnologías de almacenamiento en la nube para la preservación de contenido digital.

El taller pretende describir los conceptos básicos del cloud, con ejemplos de donde se está usando este tipo de tecnología; y el impacto que puede tener en los repositorios digitales.

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
2,905
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
74
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Repositorios en la nube

  1. 1. Repositorios en la nube Ricard de la Vega Jefe del Servicio de Portales y Repositorios Centre de Supercomputació de Catalunya 4as Jornadas OS-Repositorios Barcelona, 3-5 marzo de 2010
  2. 2. Centre de Supercomputació de Catalunya Consorcio público Creado en 1991 Formado por: • Generalitat de Catalunya • Fundació Catalana per a la Recerca i la Innovació • 9 universidades catalanas • Consejo Superior de Investigaciones Científicas Anella Científica creada en 1993
  3. 3. Nuestros servicios
  4. 4. Agenda Introducción Repositorios en el cloud ¿Qué es el cloud? • Duracloud Tipología • EPrints storage plug-ins • SaaS, PaaS, IaaS Conclusiones • Público, privado, híbrido Referencias Participantes
  5. 5. Agenda Introducción Repositorios en el cloud ¿Qué es el cloud? • Duracloud Tipología • EPrints storage plug-ins • SaaS, PaaS, IaaS Conclusiones • Público, privado, híbrido Referencias Participantes
  6. 6. Tendencia en las TIC
  7. 7. “Cuanto más cambia una cosa...” “Cuanto más cambia una cosa, más se convierte en lo mismo. Fijémonos en el cloud computing. En cierto modo, se trata de una extensión natural del time-sharing, inventado en los años setenta. De hecho, por aquel entonces ya se oía hablar del término computing utility” Vinton Cerf
  8. 8. Mainframes... VAX 8600 Controladora discos HSC50 Terminal Digital VT220 Impresora LA-36 TA78 Fuente: http://fib.upc.edu/retroinformatica/exposicio/ordinadors.html
  9. 9. Clouds... Centros de datos El terminal es el navegador
  10. 10. Agenda Introducción Repositorios en el cloud ¿Qué es el cloud? • Duracloud Tipología • EPrints storage plug-ins • SaaS, PaaS, IaaS Conclusiones • Público, privado, híbrido Referencias Participantes
  11. 11. Definiciones y conceptos clave “The services themselves have long been referred to as Software as a  Service (SaaS). The datacenter hardware and software is what we will  call a Cloud. When a Cloud is made available in a pay‐as‐you‐go  manner to the general public, we call it a Public Cloud; the service  being sold is Utility Computing. We use the term Private Cloud to refer to internal datacenters of a  business or other organization, not made available to the general  public.” Conceptos: “as a Service”, pago por uso, virtualización Fuente: http://www.eecs.berkeley.edu/Pubs/TechRpts/2009/EECS‐2009‐28.html
  12. 12. Agenda Introducción Repositorios en el cloud ¿Qué es el cloud? • Duracloud Tipología • EPrints storage plug-ins • SaaS, PaaS, IaaS Conclusiones • Público, privado, híbrido Referencias Participantes
  13. 13. Tipos de cloud Fuente: http://www.ucar.edu/educ_outreach/webweather/cloud3.html
  14. 14. “as a service” Software como un servicio (SaaS) • Aplicaciones de Google (Gmail, Calendar...) • Salesforce.com Plataforma como un servicio (PaaS) • Imagen de Xen con SO, Apache, MySQL y aplicación • Google App Engine • Microsoft Azure Infraestructura como un servicio (IaaS) • Amazon Web Services – EC2 para computo – S3 para almacenamiento
  15. 15. Pública, privada... Una nube pública es el hardware y software de un centro de datos ofrecido en la modalidad de “pago por uso”. Una nube privada es el hardware y software de un centro de datos de la propia entidad. Una nube híbrida combina los dos modelos anteriores. Inconvenientes de la nube pública: • Privacidad y protección de datos
  16. 16. Agenda Introducción Repositorios en el cloud ¿Qué es el cloud? • Duracloud Tipología • EPrints storage plug-ins • SaaS, PaaS, IaaS Conclusiones • Público, privado, híbrido Referencias Participantes
  17. 17. Participantes y beneficios Transferencia del riesgo a los proveedores del cloud • Service Level Agreement (SLA) Proveedores del cloud (hardware y software de base) • Reducción de los costes de operación y amortizaciones • Especialización y economías de escala Usuarios de la nube, que a su vez, son proveedores de servicios (SaaS), como los repositorios • Elasticidad en el aprovisionamiento de recursos • Sin sobredimensionamiento ni infradimensionamiento (picos) Usuarios finales, como los investigadores, etc. • Para ellos la nube es transparente
  18. 18. Como el car sharing
  19. 19. Agenda Introducción Repositorios en el cloud ¿Qué es el cloud? • Duracloud Tipología • EPrints storage plug-ins • SaaS, PaaS, IaaS Conclusiones • Público, privado, híbrido Referencias Participantes
  20. 20. Data deluge
  21. 21. Agenda Duracloud • DURASPACE • Arquitectura • Objetivos • Pilotos • Servicios • Roadmap
  22. 22. DURASPACE DuraCloud es de DURASPACE • Non-profit-org que da soporte a las comunidades Dspace y Fedora. • Innovación: – Pensar más allá de las plataformas actuales. – Nuevas estrategias para el acceso y la preservación de contenidos digitales.
  23. 23. Objetivos Soporte a la preservación • Replicación de contenido, auditoría (checksums), reparación Federación de repositorios y ciberinfrastructura • Enlaces entre datos almacenados (linked data) Colecciones compartidas • Acceso vía un motor JPEG2000 a imágenes almacenadas Data mining • Grandes trabajos de computación con los datos almacenados
  24. 24. Servicios básicos Fuente: http://www.duraspace.org/documents/DuraCloudNDIIPPJune09.ppt
  25. 25. Servicios adicionales Fuente: http://www.duraspace.org/documents/DuraCloudNDIIPPJune09.ppt
  26. 26. Casos de uso con almacenamiento en la nube Fuente: http://www.duraspace.org/documents/DuraCloudNDIIPPJune09.ppt
  27. 27. Casos de uso con computación en la nube Fuente: http://www.duraspace.org/documents/DuraCloudNDIIPPJune09.ppt
  28. 28. Servicios de preservación Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-data-in-the-cloud
  29. 29. Arquitectura Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-data-in-the-cloud
  30. 30. Arquitectura Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-data-in-the-cloud
  31. 31. Arquitectura Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-data-in-the-cloud
  32. 32. Pilotos de casos de uso Quieren... • Introducción de gran cantidad de contenidos digitales • Replicar a múltiples plataformas de cloud • Gestionar esta replicación y monitorizarla • Desarrollar servicios Proveedores de cloud Partners iniciales • Amazon • New York Public Library • EMC • Biodiversity Heritage Library • Rackspace • WGBH Media Library and • Sun? Archives • Microsoft?
  33. 33. Pilotos de casos de uso Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-data-in-the-cloud
  34. 34. Pilotos de casos de uso Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-data-in-the-cloud
  35. 35. Pilotos de casos de uso Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-data-in-the-cloud
  36. 36. Pilotos de casos de uso, retos Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-data-in-the-cloud
  37. 37. Pilotos de beta testers Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-data-in-the-cloud
  38. 38. Pilotos de beta testers Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-data-in-the-cloud
  39. 39. Encuesta Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-data-in-the-cloud
  40. 40. Encuesta Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-data-in-the-cloud
  41. 41. Encuesta Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-data-in-the-cloud
  42. 42. Encuesta Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-data-in-the-cloud
  43. 43. Roadmap Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-data-in-the-cloud
  44. 44. Roadmap Fuente: http://www.slideshare.net/eduserv/duracloud-open-technologies-and-services-for-managing-durable-data-in-the-cloud
  45. 45. Agenda Introducción Repositorios en el cloud ¿Qué es el cloud? • Duracloud Tipología • EPrints storage plug-ins • SaaS, PaaS, IaaS Conclusiones • Público, privado, híbrido Referencias Participantes
  46. 46. Eprints Cloud Capabilities Los datos se pueden Mediante storage almacenar en: controller se puede elegir • En disco local o cabinas de a que tipo de disco van los discos (SAN, NAS) documentos (archivo XML • En el cloud de configuración).
  47. 47. Arquitectura Fuente: http://www.slideshare.net/lescarr/eprints-and-the-cloud
  48. 48. Plug-ins de almacenamiento en cloud en el API Fuente: http://www.slideshare.net/lescarr/eprints-and-the-cloud
  49. 49. Objetivos Fuente: http://www.slideshare.net/lescarr/eprints-and-the-cloud
  50. 50. EPrints Bazaar Fuente: http://www.slideshare.net/lescarr/eprints-and-the-cloud
  51. 51. Agenda Introducción Repositorios en el cloud ¿Qué es el cloud? • Duracloud Tipología • EPrints storage plug-ins • SaaS, PaaS, IaaS Conclusiones • Público, privado, híbrido Referencias Participantes
  52. 52. Reflexión antes de las conclusiones... En este contexto (en las nubes), se podría decir que los repositorios cooperativos (TDR, RECERCAT...) están en un private cloud, puesto que las instituciones que los coordinan, CESCA y CBUC, son consorcios de instituciones participantes (más o menos) en estos repositorios. Muchos de los servicios que ofrece/rá DuraCloud ya se están realizando, como la comprobación de la integridad de los ficheros... Pasar a un modelo híbrido podría ser interesante por temas de copias desgeolocalizadas, o si se concretara algún servicio de transformación de formatos. Estaremos atentos a la evolución del proyecto.
  53. 53. Conclusiones El cloud es una tendencia en auge en las TIC. Existen diferentes tipos de cloud para distintas necesidades (público, privado, híbrido, SaaS, PaaS, IaaS). El data deluge ha ayudado a acercar el cloud a los repositorios. DuraCloud es la solución de DURASPACE para acercar el cloud a DSpace y Fedora. Eprints dispone de plug-ins de almacenamiento en cloud.
  54. 54. Conclusiones En DuraCloud, aunque el objetivo son servicios de almacenamiento y computación en la nube, los primeros son los más avanzados con finalidades de preservación. Estamos aun en el principio de DuraCloud, pilotos, beta. Faltan plug-ins para los repositorios, SLAs, precios, casos de éxito, etc. Para seguir su evolución, en el próximo Open Repositorios de Madrid seguro que habrán novedades.
  55. 55. Agenda Introducción Repositorios en el cloud ¿Qué es el cloud? • Duracloud Tipología • EPrints storage plug-ins • SaaS, PaaS, IaaS Conclusiones • Público, privado, híbrido Referencias Participantes
  56. 56. Referencias Above the Clouds: A Berkeley View of Cloud Computing, Michael Armbrust et alt., UC Berkeley Reliable Adaptative Distribute Systems Laboratory, febrero 2009 (en línea en http://eecs.berkeley.edu/Pubs/TechRpts/2009/EECS-2009- 28-pdf). Information Factories, George Gilder, Wired, octubre de 2006 (en línea en http://www.wired.com/wired/archive/14.10/cloudware.html). Prólogo de Vinton Cerf de Todo va a cambiar, Enrique Dans, Ediciones Desto, 2010 (en línea en http://filesocial.com/937y410).
  57. 57. Referencias DuraCloud http://www.duraspace.org/duracloud.php DuraCloud: Managing Durable Data in the Cloud. Michele Kimpton. NDIIPP Washington, DC, junio 2009 (en línea en http://www.duraspace.org/documents/DuraCloudNDIIPPJu ne09.ppt). DuraCloud Frequently asked questions. Michele Kimpton y Bill Branan, octubre 2009 (en línea en http://www.fedora- commons.org/confluence/display/duracloudpilot/Frequently +asked+questions).
  58. 58. Referencias Repositories and the Cloud. 23 febrero de 2010 en Londres (presentaciones y videos en línea en http://userv.org.uk/events/repcloud). • Duracloud – Open technologies and services for managing durable data in the cloud, Michele Kimpton, DuraSpace. • Cloud Services for Repositories, Alex Wade, Microsoft. • Eprints and the Cloud, Les Carr, University of Southampton. • Cloud based Projects at Belfast e-Science Centre, Terry Harmer, Belfast e-Science Centre.
  59. 59. Más referencias... http://www.youtube.com/watch?v=QJncFirhjPg http://www.youtube.com/watch?v=XdBd14rjcs0 http://www.youtube.com/watch?v=n9LmzsaO698
  60. 60. Más referencias... http://www.youtube.com/watch?v=Cl6XFZH5aWU http://www.youtube.com/watch?v=VjfaCoA2sQk http://www.youtube.com/watch?v=TcTnGAQJ7gE
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×