Sistemas de almacenamiento RAID

1,455 views
1,272 views

Published on

Definición de qué es un RAID, sus ventajas y desventajas, niveles (estándar, anidado, y propietario) y cada una de las distintas configuraciones.

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,455
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
90
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Sistemas de almacenamiento RAID

  1. 1.  Siglas que significan Redundant Array of Independent Disks, “Conjunto Redundante deDiscos Independientes”. Es un sistema de almacenamiento que usan múltiples unidades(Discos Duros o SSD) para distribuir y/o replicar los datos. Existen varias configuracionesque son llamadas niveles, cada nivel ofrece características como: mayor integridad mayor tolerancia a fallos mayor throughput (rendimiento) mayor capacidad Los sistemas RAID aparecieron gracias a la habilidad de combinar varios dispositivos debajo coste y tecnología más antigua en un conjunto que ofrecía mayorcapacidad, fiabilidad, velocidad o una combinación de éstas que un solo dispositivo de últimageneración y coste más alto. Un RAID combina varios discos duros en una sola unidad lógica. Así, en lugar de ver variosdiscos duros diferentes, el sistema operativo ve uno solo. Los RAIDs suelen usarse enservidores y normalmente (aunque no es necesario) se implementan con unidades de disco dela misma capacidad. Todas las implementaciones pueden soportar el uso de uno o más discos de reserva (hotspare), unidades preinstaladas que pueden usarse inmediatamente (y casi siempreautomáticamente) tras el fallo de un disco del RAID. Esto reduce el tiempo del período dereparación al acortar el tiempo de reconstrucción del RAID. Algunas compañías que ofrecen servicios RAID son:Adaptec, Areca, Dawicontrol, Highpoint, HP, IBM, Intel, Leaf, LSI, Promise, Supermicro, HDS, Lacie.
  2. 2.  RAID puede mejorar el uptime. Los niveles RAID 1, 0+1 o 10, 5 y 6 (sus variantes, como el50) permiten que un disco falle mecánicamente y que aun así los datos del conjunto sigansiendo accesibles para los usuarios. En lugar de exigir que se realice una restauración costosaen tiempo desde una cinta, DVD o algún otro medio de respaldo lento, un RAID permite quelos datos se recuperen en un disco de reemplazo a partir de los restantes discos delconjunto, mientras al mismo tiempo permanece disponible para los usuarios en un mododegradado. RAID puede mejorar el rendimiento de ciertas aplicaciones. Los niveles RAID 0, 5 y 6 usanvariantes de división (striping) de datos, lo que permite que varios discos atiendansimultáneamente las operaciones de lectura lineales, aumentando la tasa de transferenciasostenida. Las aplicaciones de escritorio que trabajan con archivos grandes, como la ediciónde vídeo e imágenes, se benefician de esta mejora. También es útil para las operaciones decopia de respaldo de disco a disco. Además, si se usa un RAID 1 o un RAID basado endivisión con un tamaño de bloque lo suficientemente grande se logran mejoras derendimiento para patrones de acceso que implique múltiples lecturas simultáneas (porejemplo, bases de datos multiusuario).
  3. 3.  RAID no protege los datos. Un conjunto RAID tiene un sistema de archivos, lo quesupone un punto único de fallo al ser vulnerable a una amplia variedad de riesgosaparte del fallo físico de disco, por lo que RAID no evita la pérdida de datos porestas causas. RAID no simplifica la recuperación de un desastre. Cuando se trabaja con un solodisco, éste es accesible normalmente mediante un controlador ATA o SCSI incluidoen la mayoría de los sistemas operativos. Sin embargo, las controladoras RAIDnecesitan controladores software específicos. RAID no mejora el rendimiento de todas las aplicaciones. RAID no facilita el traslado a un sistema nuevo. Cuando se usa un solo disco, esrelativamente fácil trasladar el disco a un sistema nuevo: basta con conectarlo, sicuenta con la misma interfaz. Con un RAID no es tan sencillo: la BIOS RAID debeser capaz de leer los metadatos de los miembros del conjunto para reconocerloadecuadamente y hacerlo disponible al sistema operativo.
  4. 4. • RAID 0• RAID 1• RAID 2• RAID 3• RAID 4• RAID 5• RAID 6• RAID 5E y 6ENivelesRAIDestándar• RAID 0+1• RAID 1+0• RAID 30• RAID 100• RAID 10+1NivelesRAIDanidados• RAID 50EE• Paridad Doble• RAID 1.5• RAID 7• RAID S o RAID de paridad• Matrix RAID• Linux MD RAID 10• IBM ServeRAID 1E• RAID ZNivelesRAIDpropietarios
  5. 5. Los niveles RAID estándar son un conjunto básico deconfiguraciones RAID y implementación de“striping”, “mirroring(espejeado)”, o pariedad. Hubieroncinco niveles de RAID al inicio, pero muchas más variacionesaparecieron, niveles anidados, y algunos niveles noestandarizados (mayormente propietarios). Los niveles RAIDy sus formatos de almacenar los datos están estandarizadospor la Storage Networking Industry Association (SNIA) en lanorma de Formato de Almacenamiento de Discos RAID(DDF).
  6. 6. Distribuye los datos a través de variosdiscos. Este tipo de configuración noproporciona redundancia (no esprecisamente RAID), pero maneja variosdiscos como si fueran uno solo, lo queproporciona una mayor velocidad delectura y escritura. Lamentablemente, siun disco falla en un arreglo Nivel 0, elsistema se cae. El nivel 0 requiere almenos 2 discos, siendo muy útil cuandose desea añadir capacidad de disco sinaumentar nombres de identificación devolumen.
  7. 7. Utiliza espejeado (mirroring) para proveer la mejorredundancia tolerante a fallas disponible (los discosguardan exactamente la misma información porparejas). Cuando un disco espejeado falla, elsegundo toma su lugar. El problema se presentacuando se escriben datos deteriorados en undisco, pues son duplicados con los mismos defectosen el disco espejo. El espejeado generalmente espoco práctico y costoso, especialmente cuando sealmacenan datos en el orden de cientos degigabytes. Inclusive con los bajos costos actualesde los discos duros, RAID Nivel 1 solo tienesentido para datos de misión crítica que deben estardisponibles permanentemente en línea. El Nivel 1requiere al menos de 2 discos para suimplementación.
  8. 8. Utiliza códigos de correcciónHamming. Está diseñado paraser utilizado con discos quecarecen de detección de errorinterna (discos antiguos).Todos los discos SCSIsoportan detección de errorinterna, por lo que este nivelde RAID tiene muy pocautilidad práctica para esosmodelos de discos.
  9. 9. Introduce el chequeo de pariedad, o lacorrección de errores. Distribuye losdatos a través de múltiples discos alnivel de bytes, y añade redundanciamediante la utilización de un disco depariedad dedicado, que detecta erroresen los datos almacenados producidospor una falla de cualquier disco, y losreconstruye mediante algoritmosespeciales. Si la falla se produce en eldisco de pariedad, se pierde laredundancia, pero se mantiene intactala información original. Debido a queRAID Nivel 3 escribe los datos engrandes bloques de información, esuna alternativa apropiada paraaplicaciones tales como video queenvían y reciben grandes archivos.
  10. 10. Distribuye los datos a nivel de bloque(la principal diferencia con el nivel3), a través de varios discos, con lapariedad almacenada en un disco. Lainformación de pariedad permite larecuperación de cualquier disco en casode falla. El rendimiento de un arreglonivel 4 es muy bueno para lecturas(similar al nivel 0). Sin embargo, laescritura requiere que los datos depariedad sean actualizados cada vez.Esto retarda particularmente lasescrituras aleatorias pequeñas, aunquelas escrituras grandes o secuencialesson razonablemente rápidas. Debido aque solamente un disco es del arregloes utilizado para datos redundantes, elcosto por megabyte de un arreglo nivel4 es relativamente bajo.
  11. 11. Es la alternativa más popular. El Nivel 5 creadatos de pariedad, distribuyéndolos a travésde todos los discos (excepto en aquel discoen que se almacena la informaciónoriginal), obviando la necesidad de un discode pariedad dedicado. El Nivel 5 es el máscompleto de todos los niveles de redundanciapor distribución, por que si un disco falla, lainformación de pariedad en los otros permitela reconstrucción de toda su información.Aún más, el Nivel 5 escribe datos en losdiscos al nivel de bloques (en lugar detrabajar al nivel de bytes), volviéndolo másapropiado para múltiples transaccionespequeñas como e-mail, procesadores depalabras, hojas electrónicas, y aplicacionesde bases de datos. Los niveles 3 y 5 requierenal menos de 3 discos para suimplementación.
  12. 12. Similar al RAID 5, pero incluye unsegundo esquema de paridad distribuidopor los distintos discos y por tanto ofrecetolerancia extremadamente alta a los fallosy a las caídas de disco, ofreciendo dosniveles de redundancia. Hay pocosejemplos comerciales en la actualidad, yaque su coste de implementación es mayoral de otros niveles RAID, ya que lascontroladoras requeridas que soporten estadoble paridad son más complejas y carasque las de otros niveles RAID. Asípues, comercialmente no se implementa.
  13. 13. Se suele llamar RAID 5E y RAID 6E a lasvariantes de RAID 5 y RAID 6 que incluyendiscos de reserva. Estos discos pueden estarconectados y preparados (hot spare) o enespera (standby spare). En los RAIDs 5E yRAID 6E, los discos de reserva estándisponibles para cualquiera de las unidadesmiembro. No suponen mejora alguna delrendimiento, pero sí se minimiza el tiempo dereconstrucción (en el caso de los discos hotspare) y las labores de administración cuandose producen fallos. Un disco de reserva no esrealmente parte del conjunto hasta que undisco falla y el conjunto se reconstruye sobreel de reserva.
  14. 14. Permite que un RAID pueda usarse como elemento básico de otroen lugar de discos físicos. Resulta instructivo pensar en estosconjuntos como capas dispuestas unas sobre otras, con los discosfísicos en la inferior. Los RAIDs anidados se indican normalmenteuniendo en un solo número los correspondientes a los niveles RAIDusados, añadiendo a veces un «+» entre ellos. Al anidar nivelesRAID, se suele combinar un nivel RAID que proporcioneredundancia con un RAID 0 que aumenta el rendimiento. Con estasconfiguraciones es preferible tener el RAID 0 como nivel más alto ylos conjuntos redundantes debajo, porque así será necesarioreconstruir menos discos cuando uno falle.
  15. 15. El RAID 0+1 (STRIPPING +MIRRORING), consiste en laduplicación de los datos endiferentes conjuntos dediscos, para un posterior strippingdentro de cada uno de dichosconjuntos. Este nivel está indicadopara aplicaciones que necesitenaltas prestaciones y un alto nivelde seguridad.Aplicaciones: Aplicaciones deImagen, Servidores de archivosgenerales.
  16. 16. A veces llamado RAID 10, es parecido a unRAID 0+1 con la excepción de que los nivelesRAID que lo forman se invierte: el RAID 10 esuna división de espejos. En cada división RAID 1pueden fallar todos los discos salvo uno sin quese pierdan datos. Sin embargo, si los discos quehan fallado no se reemplazan, el restante pasa aser un punto único de fallo para todo el conjunto.Si ese disco falla entonces, se perderán todos losdatos del conjunto completo. Como en el caso delRAID 0+1, si un disco que ha fallado no sereemplaza, entonces un solo error de medioirrecuperable que ocurra en el disco espejadoresultaría en pérdida de datos. El RAID 10 es amenudo la mejor elección para bases de datos dealtas prestaciones, debido a que la ausencia decálculos de paridad proporciona mayor velocidadde escritura.
  17. 17. El RAID 30 o división con conjunto deparidad dedicado es una combinación de unRAID 3 y un RAID 0. El RAID 30proporciona tasas de transferencia elevadascombinadas con una alta fiabilidad acambio de un coste de implementaciónmuy alto. La mejor forma de construir unRAID 30 es combinar dos conjuntos RAID3 con los datos divididos en ambosconjuntos. El RAID 30 trocea los datos enbloque más pequeños y los divide en cadaconjunto RAID 3, que a su vez lo divide entrozos aún menores, calcula la paridadaplicando un XOR a cada uno y losescriben en todos los discos del conjuntosalvo en uno, donde se almacena lainformación de paridad.
  18. 18. Un RAID 100, a veces llamado tambiénRAID 10+0, es una división de conjuntosRAID 10. El RAID 100 es un ejemplo deRAID cuadriculado, un RAID en el queconjuntos divididos son a su vez divididosconjuntamente de nuevo. Todos los discosmenos unos podrían fallar en cada RAID 1sin perder datos. Sin embargo, el discorestante de un RAID 1 se convierte así en unpunto único de fallo para el conjuntodegradado. A menudo el nivel superior dedivisión se hace por software. Los principalesbeneficios de un RAID 100 (y de los RAIDscuadriculados en general) sobre un úniconivel RAID son mejor rendimiento paralecturas aleatorias y la mitigación de lospuntos calientes de riesgo en el conjunto. Esla mejor elección para bases de datos muygrandes, donde el conjunto softwaresubyacente limita la cantidad de discosfísicos permitidos en cada conjunto estándar.Implementar niveles RAID anidados permiteeliminar virtualmente el límite de unidadesfísicas en un único volumen lógico.
  19. 19. Un RAID 10+1, es un reflejo de dos RAID 10. Seutiliza en la llamados Network RAID que aceptanalgunas cabinas de datos. Es un sistema de altadisponibilidad por red, lo que permite la replicación dedatos entre cabinas a nivel de RAID, con lo cual sesimplifica ampliamente la gestión de replicación decabinas. El RAID 10+1, tratándose de espejos deRAID10 que tienen una gran velocidad de acceso, haceque el rendimiento sea muy aceptable, siempre ycuando se respete el requerimiento de 2ms de latenciacomo máximo.
  20. 20. Aunque todas las implementaciones de RAIDdifieren en algún grado de la especificaciónidealizada, algunas compañías han desarrolladoimplementaciones RAID completamente propietariasque difieren sustancialmente de todas las demás.
  21. 21. Himperia utiliza el RAID 50EE en el ZStore 3212L.Se trata de un RAID 0 de dos pools, cada uno deellos con RAID 5EE (7+1+1). Tolera el fallosimultáneo de dos discos, y hasta 4 discos nosimultáneos. El tiempo de reconstrucción se reduce almínimo, gracias al RAID 5EE. Y se mejora elrendimiento gracias al RAID 0.
  22. 22. La paridad doble, a veces implementada yconocida como paridad diagonal es similaral RAID 6, hay dos conjuntos de informaciónde chequeo de paridad, pero a diferencia deaquél, el segundo conjunto no es otroconjunto de puntos calculado sobre unsíndrome polinomial diferente para losmismos grupos de bloques de datos, sino quese calcula la paridad extra a partir de un grupodiferente de bloques de datos. Porejemplo, sobre el gráfico tanto el RAID 5como el RAID 6 calcularían la paridad sobretodos los bloques de la letra A para generaruno o dos bloques de paridad. Sinembargo, es bastante fácil calcular la paridadcontra múltiples grupos de bloques, en lugarde sólo sobre los bloques de la letra A: puedecalcularse la paridad sobre los bloques de laletra A y un grupo permutado de bloques. Noes recomendable que el sistema de paridaddoble funcione en modo degradado debido asu bajo rendimiento.
  23. 23. RAID 1.5 es un nivel RAIDpropietario de HighPoint aveces llamado erróneamenteRAID 15. Por la pocainformación disponible, pareceser una implementacióncorrecta de un RAID 1.Cuando se lee, los datos serecuperan de ambos discossimultáneamente y la mayoríadel trabajo se hace en hardwareen lugar de en el controladorsoftware.
  24. 24. El RAID 7, este tipo incluye unsistema operativo incrustado detiempo real comocontrolador, haciendo lasoperaciones de caché a través deun bus de alta velocidad y otrascaracterísticas de un ordenadorsencillo. Todas las transferenciasson asíncronas. Y las E/S estáncentralizadas por la caché. Senecesita un disco de paridadexclusivo. El agente SNMPpermite su administración remota.Es una marca registrada de StorageComputer CorporationAplicaciones: Sistemas de TiempoReal (Industriales).
  25. 25. RAID S es un sistema RAID de paridaddistribuida propietario de EMC Corporationusado en sus sistemas de almacenamientoSymmetrix. Cada volumen reside en un únicodisco físico, y se combinan arbitrariamente variosvolúmenes para el cálculo de paridad. EMCllamaba originalmente a esta característica RAIDS y luego la rebautizó RAID de paridad (ParityRAID) para su plataforma Symmetrix DMX.EMC ofrece también actualmente un RAID 5estándar para el Symmetrix DMX.
  26. 26. Matrix RAID o matriz RAID es unacaracterística que apareció por vezprimera en la BIOS RAID IntelICH6R, mas no es un nuevo nivelRAID. El Matrix RAID utiliza dos omás discos físicos, asignando partesde idéntico tamaño de cada uno deellos diferentes niveles de RAID. Esteproducto está dirigido a los usuariosdomésticos, proporcionando una zonasegura (la sección RAID 1) paradocumentos y otros archivos que sedesean almacenar redundantemente yuna zona más rápida (la secciónRAID 0) para el sistemaoperativo, aplicaciones, etcétera.
  27. 27. La controladora RAID software del kernelde Linux (llamada md, de multipledisk, „disco múltiple‟) puede ser usadapara construir un conjunto RAID 1+0clásico, pero también permite un úniconivel RAID 10 con algunas extensionesinteresantes. En particular, soporta unespejado de k bloques en n unidadescuando k no es divisible por n. Esto sehace repitiendo cada bloque k veces alescribirlo en un conjunto RAID 0subyacente de n unidades. Evidentementeesto equivale a la configuración RAID 10estándar. Linux también permite crearotras configuraciones RAID usando lacontroladora md (niveles 0, 1, 4, 5 y 6)además de otros usos no RAID comoalmacenamiento multiruta y LVM2.
  28. 28. La serie de adaptadores IBMServeRAID soportan unespejado doble de un númeroarbitrario de discos, como seilustra en el gráfico. Estaconfiguración es tolerante afallos de unidades noadyacentes. Otros sistemas dealmacenamiento como elStorEdge T3 de Sun soportantambién este modo.
  29. 29. El sistema de archivos ZFS de Sun Microsystemsimplementa un esquema de redundancia integradoparecido al RAID 5 que se denomina RAID Z. Estaconfiguración evita el “agujero de escritura” del RAID5 y la necesidad de la secuencia leer-modificar-escribirpara operaciones de escrituras pequeñas efectuandosólo escrituras de divisiones (stripes)completas, espejando los bloques pequeños en lugar deprotegerlos con el cálculo de paridad, lo que resultaposible gracias a que el sistema de archivos conoce laestructura de almacenamiento subyacente y puedegestionar el espacio adicional cuando lo necesita.

×