Características y aplicaciones de RAID
Upcoming SlideShare
Loading in...5
×
 

Características y aplicaciones de RAID

on

  • 664 views

Documento técnico sobre características, ventajas y área de aplicación de RAID

Documento técnico sobre características, ventajas y área de aplicación de RAID

Statistics

Views

Total Views
664
Views on SlideShare
664
Embed Views
0

Actions

Likes
0
Downloads
39
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Características y aplicaciones de RAID Características y aplicaciones de RAID Document Transcript

  • w h ite p a p er RAID Características, ventajas y aplicaciones. El término RAID (Redundant Array of Independent -or Inexpensive- Disks), cuyos orígenes datan de 1989, hace referencia a una arquitectura para el almacenamiento de datos en discos duros, que basada en niveles define el tipo de tolerancia del sistema y la forma en la que los datos se distribuyen entre los dos o más discos que conforman el “array”. RAID utiliza una técnica llamada “striping” para dividir la información antes de distribuirla en bloques que son almacenados de forma organizada en los diferentes discos del “array”. Remarcar que un sistema RAID puede ser interno o externo y su implementación hardware o software. En este último caso le corresponde a la BIOS del sistema operativo controlar el RAID cuyos discos podrán ser de tipo IDE o SATA. En una implementación hardware el controlador es independiente, cuenta con capacidad de proceso propia y dispone de un interfaz SCSI o SATA para la conexión de los discos que conforman el “array”. Por último incidir en el hecho de que RAID hace referencia a la arquitectura que dota de redundancia o tolerancia a fallos al sistema de almacenamiento, pero en ningún caso el “array” de discos en si mismo. ¿Porqué utilizar RAID? Mayor rendimiento y tasa de transferencia de datos que los discos individuales como resultado de Beneficios y ventajas. las operaciones de lecturas/escritura simultáneas Un disco duro se caracteriza entre otros parámetros realizada sobre múltiples disco en paralelo. por su MTBF (Mean Time Between Failure o tiempo Mayor capacidad de almacenamiento que los medio entre fallos) cuya importancia no sólo radica en discos individuales. Un “array” de disco RAID puede su valor sino también en su significado. EL MTBF nos verse como un disco lógico formado por la suma avisa que sean cuales sean los discos que utilicemos de los discos individuales que lo conforman, por éstos pueden eventualmente dejar de funcionar, lo que en la mayoría de las configuraciones, la ocasionando pérdidas de datos o imposibilitando el capacidad total será superior. acceso a la información por parte de los usuarios. Mayor integridad. Ante un error en los datos Además de resolver el problema citado anteriormente, almacenados en alguno de los discos del “array” un sistema de almacenamiento basado en arquitectura (corrupción de datos, error de grabación, …) la RAID ofrece cuatro ventajas principales: información de paridad generada por los sistemas Mayor fiabilidad que los discos individuales por RAID permitirá reconstruir los datos perdidos tratarse de una arquitectura tolerante a fallos con manteniendo así la integridad de la información. soporte de elementos redundantes.RAID: Características, ventajas y aplicaciones. 1
  • Considerando las ventajas anteriormente deberemos asegurarnos que el rendimiento de expuestas resulta sencillo deducir los dos grandes esta solución se ajusta a nuestras necesidades. Es beneficios que conducen a la implementación aconsejable contar con las herramientas apropiadas de una arquitectura RAID; mejora el tiempo de para este tipo de tareas, como por ejemplo funcionamiento sin fallo (uptime) del sistema de Shadowprotect de StorageCraft. almacenamiento y mejora del rendimiento de las aplicaciones. El primero se basa en funcionalidades de tolerancia a fallos que permiten reconstruir los Tipos de niveles RAID. datos de un disco dañado sobre otro que opera en El documento original en el que se define la modo reserva, sin que ello suponga interrumpir arquitectura RAID (Berkeley 1988) contemplaba cinco el servicio de acceso a la información para los niveles, RAID 1 a RAID 5. Posteriormente la industria de usuarios. Por su parte la mejora en el rendimiento la informática y sus fabricantes ampliaron el número de de algunas aplicaciones (pero no necesariamente niveles que se engloban dentro de la “familia” RAID. en todas) se fundamenta en la capacidad de lectura simultánea de datos en varios discos, lo que supone un incremento de la tasa de transferencia del sistema. Las aplicaciones que trabajan con grandes 1) Niveles RAID “puros”. archivos (vídeo, imágenes, backups, base de datos RAID 0: “array” de discos con “striping” a nivel multiusuarios, …) se verán beneficiadas por esta bloque sin tolerancia a fallos. característica. Realiza “striping” de datos a nivel bloque sin información de paridad con una distribución equitativa Lo que RAID no puede hacer. de estos entre dos o más discos. Este nivel mejora el rendimiento pero no aporta tolerancia a fallos. En caso Como acabamos de ver un sistema RAID aporta de avería en cualquiera de los componentes de “array” múltiples ventajas, sin embargo existen determinados el sistema fallará en su totalidad. aspectos para los que RAID no ha sido diseñado. RAID no protege los datos. Un sistema RAID no RAID 0 impedirá que los datos se vean modificados o borrados como consecuencia de errores A1 A2 accidentales. Ni tampoco podrá evitar que los datos A3 A4 se dañen (corrompan) o que sean destruidos por A5 A6 un agujero de seguridad. Para evitar estos riesgos A7 A8 deberemos disponer de herramientas de “backup o data recovery”. Disco 0 Disco 1 RAID no hace que la recuperación ante desastres sea más simple. Las herramientas de recuperación de datos deberán soportar los controladores RAID Número de discos requeridos: Se precisa un mínimo de apropiados, de lo contrario no podrán acceder a dos (2) discos. los datos almacenados en los discos afectados. Generalmente los dispositivos NAS/SAN incluyen Ventajas: Permite el acceso a más de un disco a la vez, funcionalidades de “backups”, como la replicación logrando una tasa de transferencia más elevada. Al remota, que permite duplicar RAIDs entre unidades no requerir espacio para almacenar información de o en ubicaciones remotas utilizando la nube. redundancia, el coste por megabyte resulta inferior. RAID no facilita la migración a sistemas nuevos. Desventajas: No se dispone de información de paridad y Mover un RAID de una controladora a otra ubicada por tanto no ofrece funcionalidad de tolerancia a fallos. en un nuevo sistema puede resultar complejo, y en algunos ocasiones hasta imposible (tal es el Un RAID 0 puede ser creado con discos de diferentes caso de los sistemas que integran la controladora tamaños, si bien el espacio de almacenamiento del en la placa base). Una implementación RAID por conjunto estará limitado por el tamaño del disco de software eliminaría este inconveniente si bien menor capacidad.2 RAID: Características, ventajas y aplicaciones.
  • RAID 1: “array” de discos en Espejo (o Duplicado funcionar al unísono, generando tasas de trasferencias si se dispone de controladora duplicada) sin extremadamente altas. paridad ni “striping”. Crea una copia idéntica (espejo) de un conjunto de RAID 2 datos en dos o más discos. En esta configuración no se hace “striping” de datos, si bien consigue un alto nivel A1 A2 A3 Ap1 Ap2 de tolerancia a fallos. B1 B2 B3 Bp1 Bp2 C1 C2 C3 Cp1 Cp2 Para alcanzar un máximo rendimiento se recomienda D1 D2 D3 Dp1 Dp2 el uso de controladoras de disco duplicadas, de esta Disco 0 Disco 1 Disco 2 Disco 3 Disco 4 forma será posible leer de los dos discos al mismo tiempo incrementando la tasa de transferencia de lectura al doble de la generada por un disco individual sin alterar el ratio de escritura. Número de discos requeridos: Se precisa un mínimo de RAID 1 tres (3) discos. Ventajas: Buena protección de la información en caso A1 A1 de fallos del disco. A2 A2 A3 A3 La tasa de transferencia de datos puede llegar a ser A4 A4 extremadamente alta. Disco 0 Disco 1 Desventajas: Elevado coste. Según el tipo de configuración requiere un gran número de discos. La controladora resulta ser muy específica, compleja y Número de discos requeridos: Se precisa un mínimo de costosa. dos (2) discos. Ventajas: Protección de la información en caso de fallos del disco y/o de la controladora (en caso de tener RAID 3: “array” de discos con “striping” a nivel byte instalada una controladora duplicada). y paridad dedicada. Desventajas: Ineficiencia debido a las tareas de escritura Es un nivel raramente utilizado. en el disco espejo. Opera con “striping” de datos a nivel byte y dedica Se “desperdicia” el 50% de la capacidad de un disco del “array” para almacenar la información de almacenamiento del sistema haciendo que el coste por paridad que permitirá reconstruir la información en megabyte “útil” sea mayor. caso de fallos. Toda la información se escribe en paralelo entre los discos del “array” mejorando el rendimiento del sistema RAID 2: “array” de discos con “striping” a nivel bit y gracias al incremento en la tasa de transferencia de paridad Hamming-code dedicada. datos que esta funcionalidad conlleva. Este nivel no presenta ninguna ventaja relevante sobre RAID 3 y en la actualidad resulta ser el único nivel RAID RAID 3 de la especificación original que no se utiliza. A1 A2 A3 Ap Funciona con “striping” de datos a nivel de bit en B1 B2 B3 Bp C1 C2 C3 Cp todos los discos, dedicando algunos de estos a D1 D2 D3 Dp almacenar información de verificación y corrección de errores (error checking and correcting, ECC). Los Disco 1 Disco 2 Disco 3 Disco 4 discos son sincronizados por la controladora paraRAID: Características, ventajas y aplicaciones. 3
  • Número de discos requeridos: Se precisa un mínimo de RAID 5: “array” de discos con “striping” a nivel tres (3) discos. bloque y paridad distribuida. Ventajas: Elevada tasa de transferencia de datos tanto Por su bajo coste RAID 5 es una de las implementaciones de lectura como de escritura con alta disponibilidad más populares. Utiliza “striping” de datos a nivel de del “array”. bloque distribuyendo la información de paridad entre todos los discos que conforman el “array”. Esta Desventajas: Un disco de paridad dedicado puede combinación proporciona un excelente rendimiento y convertirse en un cuello de botella porque cada buena tolerancia a fallos. cambio en el grupo RAID requiere un cambio en la información de paridad. No ofrece solución al fallo simultáneo de dos discos. RAID 5 A1 A2 A3 Ap B1 B2 Bp B3 RAID 4: “array” de discos con “striping” a nivel C1 Cp C2 C3 bloque y paridad dedicada. Dp D1 D2 D3 Opera con “striping” de datos a nivel bloque con un Disco 1 Disco 2 Disco 3 Disco 4 disco de paridad dedicado (similar a RAID 3 excepto que divide a nivel de bloque en lugar de a nivel de bytes). Ante el fallo de uno de los discos del “array”, Número de discos requeridos: Se precisa un mínimo de podremos, a partir de la información de paridad, tres (3) discos. reconstruir en un disco de reserva los datos de la unidad averiada. Ventajas: Proporciona un buen rendimiento con mínima pérdida de capacidad de almacenamiento. RAID 4 puede atender varias peticiones simultáneas Aporta un nivel de redundancia suficiente para ser de lectura, siempre que la controladora lo soporte, considerado tolerante a fallos. y también de escritura, pero en este último caso al residir toda la información de paridad en un único Desventajas: Menores prestaciones que en RAID 1. No disco, éste se convertiría en un cuello de botella para ofrece solución al fallo simultáneo en dos discos. el sistema. Cuando las aplicaciones requieren muchas escrituras de tamaño inferior a la división de datos establecida (stripe), el rendimiento ofrecido por RAID 5 no es el RAID 4 óptimo. A1 A2 A3 Ap RAID 5 precisa al menos tres discos aunque las B1 B2 B3 Bp C2 implementaciones más habituales están formadas por C1 C3 Cp D1 D2 D3 Dp “array’s” con cinco unidades. Disco 0 Disco 1 Disco 2 Disco 3 RAID 5E. El término RAID 5E hace referencia a la variante de RAID 5 que incorpora discos de reserva. Estos discos Número de discos requeridos: Se precisa un mínimo de pueden estar en modo conectados y preparados tres (3) discos. (hot spare) o simplemente en espera (standby spare), para cubrir los fallos de cualquiera de las unidades Ventajas: Alta disponibilidad del “array” con elevada tasa que conforman el “array”. No representan mejora en el de transferencia de datos. rendimiento del sistema, pero minimizan las labores de Desventajas: La controladora requerida es compleja y administración cuando se producen fallos y reducen por tanto costa. el tiempo de reconstrucción (en configuraciones con discos hot spare). Técnicamente un disco de reserva no Un disco de paridad dedicado puede convertirse en un forma parte del “array” hasta que uno de los discos falla cuello de botella en escritura. y se reconstruye la información sobre él.4 RAID: Características, ventajas y aplicaciones.
  • RAID 6: “array” de discos con “striping” a nivel 2) Niveles RAID anidados o bloque y doble paridad distribuida. híbridos. Dado su coste, existen pocas implementaciones comerciales. Funciona con “striping” de datos a nivel de Muchas controladoras permiten combinar niveles bloque con doble paridad distribuida entre todos los RAID, es decir, que un RAID pueda usarse como discos y en una posición diferente para cada división elemento básico de otro en lugar de discos físicos. La (stripe), proporcionando protección ante fallos tanto por nomenclatura de los RAID anidados es normalmente el averías en discos como en la reconstrucción de discos. resultado de la unión de los números correspondientes a los niveles RAID usados. Por ejemplo, RAID 01 es el RAID 6 es ineficiente cuando el “array” está formado por resultado de combinar RAID 0 con RAID 1 (en este caso una cantidad pequeña de discos. se suele utilizar la nomenclatura RAID 0+1 para evitar confusiones con RAID 1). Conceptualmente consiste en RAID 6 múltiples “arrays” de nivel 0 con un nivel 1 encima que agrupa dichos niveles 0 (ver imagen más abajo). A1 A2 Ap Aq B1 Bp Bq B2 Como puede deducirse anidar niveles RAID tiene por Cp Cq C1 C2 objetivo combinar un determinado nivel RAID que Dp D1 D2 Dq proporcione redundancia con otro que aumente el rendimiento del sistema, y la prioridad que le demos Disco 0 Disco 1 Disco 2 Disco 3 a dichas funcionalidades determinará cual de los dos será el de mayor nivel. Número de discos requeridos: Se precisa un mínimo de Los niveles RAID anidados más conocidos son: cuatro (4) discos. RAID 01 (0+1): Un espejo de divisiones (“Stripes”). Ventajas: Tolerancia a fallos extremadamente alta. RAID 10: Una división de espejos. Permite el fallo de hasta dos discos. RAID 30: Una división de niveles RAID con paridad Desventajas: Utiliza el equivalente a dos unidades de dedicada. disco para funciones de paridad por lo que el coste por RAID 50: Una división de niveles RAID con paridad megabyte “útil” es mayor. distribuida. Las operaciones de escritura se ven penalizadas por los RAID 60: Una división de niveles RAID con doble cálculos implícitos a la doble paridad. paridad distribuida. Mayor coste que otros niveles RAID. RAID 100: Una división de una división de espejos. RAID 6 no es uno de los niveles incluidos en la RAID 101: Un Espejo de espejos. especificación original de RAID. RAID 6E. A continuación se explican el funcionamiento de los dos primeros, a partir de los cuales el lector podrá Idéntico a RAID 5E pero aplicado a un “array” RAID 6. deducir la operativa de los restantes RAIDs anidados. Es decir se trata de un RAID 6 que incluye discos de reserva en modo “hot spare” o “standby spare”.RAID: Características, ventajas y aplicaciones. 5
  • RAID 01 (0+1): Un espejo de RAID 0. RAID 10 (1+0): Un RAID 0 de Espejos. Primero se crean dos RAID 0 y luego, sobre los Primero se crea un espejo RAID 1 y luego, sobre los anteriores, se crea un RAID 1 para dotar al “array” de anteriores, se establece un RAID 0. El resultado es un funcionalidad espejo. “array” dotado de redundancia con una mejora de rendimiento al no precisar escritura de paridad. La ventaja de un RAID 0+1 es que cuando un disco duro falla, los datos perdidos pueden ser copiados Para que no se pierdan datos cada RAID 1 deberá del otro conjunto de nivel 0. Variantes de este nivel mantener al menos uno de sus discos sin fallos. anidado con mayor tolerancia a falllos son RAID 0+1+5 y RAID 0+1+6. RAID 0+1 RAID 10 (1+0) RAID 1 RAID 0 RAID 0 RAID 0 RAID 1 RAID 1 A1 A2 A1 A2 A1 A1 A2 A2 B1 B2 B1 B2 B1 B1 B2 B2 C1 C2 C1 C2 C1 C1 C2 C2 D1 D2 D2 D2 D1 D1 D2 D2 Disco 0 Disco1 Disco 2 Disco 3 Disco 0 Disco 1 Disco 2 Disco 3 RAID 30 (3+0) RAID 0 RAID 3 RAID 3 A1 A2 A3 Ap A4 A5 A6 Ap B1 B2 B3 Bp B4 B4 B6 Bp C1 C2 C3 Cp C4 C5 C6 Cp D1 D2 D3 Dp D4 D5 D6 Dp Disco 0 Disco 1 Disco 2 Disco 3 Disco 4 Disco 5 Disco 6 Disco 7 RAID 50 (5+0) RAID 0 RAID 5 RAID 5 A1 A2 Ap A3 A4 Ap B1 Bp B2 B3 Bp B4 Cp C1 C2 Cp C3 C4 D1 D2 Dp D3 D4 Dp Disco 0 Disco1 Disco 2 Disco 3 Disco 4 Disco 56 RAID: Características, ventajas y aplicaciones.
  • RAID 60 (6+0) RAID 0 RAID 6 RAID 6 A1 A2 Ap Aq A3 A4 Ap Aq B1 Bp Bq B2 B3 Bp Bq B4 Cp Cq C1 C2 Cp Cq C3 C4 Dp D1 D2 Dq Dp D3 D4 Dq Disco 0 Disco 1 Disco 2 Disco 3 Disco 4 Disco 5 Disco 6 Disco 7 RAID 100 (10+0) RAID 0 RAID 0 RAID 0 RAID 1 RAID 1 RAID 1 RAID 1 A1 A1 A2 A2 A3 A3 A4 A4 B1 B1 B2 B2 B3 B3 B4 B4 C1 C1 C2 C2 C3 C3 C4 C4 D1 D1 D2 D2 D3 D3 D4 D4 Disco 0 Disco 1 Disco 2 Disco 3 Disco 4 Disco 5 Disco 6 Disco 7 RAID 101 (10+1) RAID 1 RAID 0 RAID 0 RAID 1 RAID 1 RAID 1 RAID 1 A1 A1 A2 A2 A1 A1 A2 A2 B1 B1 B2 B2 B1 B1 B2 B2 C1 C1 C2 C2 C1 C1 C2 C2 D1 D1 D2 D2 D1 D1 D2 D2 Disco 0 Disco 1 Disco 2 Disco 3 Disco 4 Disco 5 Disco 6 Disco 7RAID: Características, ventajas y aplicaciones. 7
  • 3) RAID propietarios. resulta muy costosa (p.ej. aplicaciones financieras o de gestión, …). En general las implementaciones de RAID realizadas RAID 2: Es adecuado para aplicaciones que por cada fabricante presenta algunas particularidades demanden una altísima tasa de transferencia de sobre la especificación original, sin embargo algunas datos, no siendo la opción idónea para aquellas compañías han desarrollado soluciones RAID que precisen una elevada tasa de I/O (no existen totalmente propietarias. Entre ellas mencionar: implementaciones comerciales de este nivel de RAID 1.5: Desarrollado por HighPoint. RAID). RAID 50EE: Desarrollado por Himperia. RAID 3: Especialmente indicado para sistemas mono-usuario y aplicaciones que requieran RAID 7: Desarrollado por Storage Computer transferencia de archivos de datos de un gran Corporation. tamaño (vídeo, imágenes, data warehouse, …). En RAID S (Parity RAID): Desarrollado por EMC la actualidad raramente se utiliza. Corporation. RAID 4: Idóneo para almacenar fichero de gran RAID Z: Desarrollado por Sun Microsystem. tamaño (p.ej. aplicaciones gráficas). SERVER RAID: Desarrollado por IBM. RAID 5: Es recomendable para entornos de procesamiento de transacciones donde el nivel de entrada/salida y de lectura/escritura resultan ¿Qué nivel RAID debo utilizar? intensos (p.ej. videovigilancia, servidor de aplicaciones y/o archivo para empresas). El nivel RAID determina la tolerancia a fallos RAID 6: Diseñado para entornos donde proporcionada por el sistema, el rendimiento en la disponibilidad de la información es cuanto a tasa de transferencia de datos, y por último extremadamente crítica y prevalece sobre cualquier la forma de distribución de datos entre los discos que otro aspecto. Es similar a RAID 5 pero con mayor conforman el “array”. nivel de tolerancia a fallos (p.ej. cualquier aplicación El nivel adecuado de RAID a utilizar depende de de las denominadas “de misión crítica”). básicamente de dos factores: RAID 10: Pensado para entornos que requieran La aplicaciones que vayamos a utilizar. alto rendimiento y tolerancia a fallos (p.ej. servidores de bases de datos). La inversión que estemos dispuestos a realizar. RAID 50: Presenta una mayor tolerancia a fallos Cada aplicación presenta unos requerimientos que RAID 5 a la vez que mantiene la tasa de concretos en cuanto a rendimiento y tolerancia a transferencia de éste (p.ej. aplicaciones “de misión fallos. En función de la importancia que tenga cada crítica” con alto requerimiento y torelancia a fallos). uno de estos podremos determinar el nivel RAID más idóneo. RAID 60: Aporta un rendimiento de RAID 6 pero con mayor tolerancia a fallos. En términos de Sea cual sea nuestra situación de forma generalista rendimiento global resulta ligeramente inferior a podemos decir que: RAID 50 siendo este hecho despreciable cuando lo prioritario es la seguridad y protección de los datos RAID 0: Presenta la más alta tasa de transferencia (p.ej. cualquier aplicación que requiera máxima pero sin tolerancia a fallos. Resulta especialmente torelancia a fallos). apropiado para aplicaciones que requieran operaciones secuenciales con ficheros de gran tamaño donde el rendimiento sea más importante que la seguridad de los datos (p.ej. servidores de BBDD, vídeo, imágenes, CAD/CAM, …). RAID 1: Resulta más lento que un disco individual Teléfono: 934 090 770 si bien aporta redundancia total. Está diseñado www.almacenamientodlink.es para entornos donde el rendimiento de lectura o la www.youtube.com/user/DLINKIberiaTV disponibilidad de la información han de ser altos, y www.dlink.es donde la recuperación de datos no es asumible o8 RAID: Características, ventajas y aplicaciones.