1. 1. ¿Qué es RAID?
El acrónimo RAID (Redundant Array of Indenpendent Disks o Redundant Array of
Inexpensive Disks) es un sistema de almacenamiento que utiliza varios discos duros de
bajo coste y tecnología antigua entre los que distribuye o replica la información para
mejorar las características respecto a un único disco de nueva tecnología. Existen
muchas configuraciones RAID y cada una de ellas recibe el nombre de nivel. Cada nivel
presenta mejoras respecto a un único disco de nueva tecnología: mayor integridad,
mayor tolerancia a fallos, mayor rendimiento y mayor capacidad.
Los RAID suelen usarse en servidores y normalmente se implementan con unidades de
disco del mismo fabricante y la misma capacidad. Los RAID pueden soportar el uso de
RAID Francesc Pérez Fdez.
disco del mismo fabricante y la misma capacidad. Los RAID pueden soportar el uso de
uno o más discos de reserva (hot spare), unidades preinstaladas que pueden usarse
inmediatamente tras el fallo de un disco del RAID. Esto reduce el tiempo del período de
reparación al acortar el tiempo de reconstrucción del RAID.
Existen dos tipos de RAID en cuanto a su implementación física: basado en hardware y
basado en software. En el RAID basado en hardware es necesario contar con un
dispositivo externo independiente del servidor. Las operaciones RAID basado en
hardware se llevan a cabo mediante un controlador situado en el subsistema de
almacenamiento RAID externo, que se conecta al servidor mediante un adaptador de
bus de host SCSI o Fibre Channel.
2. 1. ¿Qué es RAID?
El servidor ve a este dispositivo como si fuera otro disco duro más y son muchos más
rápidos que los basados en software. En el RAID basado en software es el servidor
quien realiza, gestiona y mantiene el conjunto RAID pudiendo afectar al rendimiento
global de la máquina. Son de coste más reducido que los RAID basados en hardware.
Sin embargo, cuando se considera el coste total de propiedad, los costes ocultos del
software RAID pueden convertirlo en la opción más cara a largo plazo. Sistemas
operativos de redes como NetWare y Windows incluyen software RAID integrado.
Además, el RAID basado en software no cuenta con importantes características, como
el intercambio de unidades de repuesto en funcionamiento (hot spare).
RAID Francesc Pérez Fdez.
3. 2. Niveles RAID
Aunque existen una gran variedad de niveles RAID, los más utilizados son el RAID0, el
RAID1 y el RAID5.
RAID0 (Conjunto dividido o volumen dividido)
En el RAID0 los datos se distribuyen equitativamente entre dos o más discos sin
información de paridad y sin redundancia. El RAID 0 se usa normalmente para disminuir
el tiempo de lectura y escritura en disco.
RAID Francesc Pérez Fdez.
4. 2. Niveles RAID
La probabilidad de fallo del conjunto es la suma de todas las probabilidades de fallo de
cada uno de los discos.
Probabilidad de fallo RAID0 = Prob.fallo HD1 + Prob.fallo HD2 + …
RAID1 (conjunto espejo)
En el RAID1 los datos se replican en todos los discos del conjunto. Un RAID 1 clásico
consiste en dos discos en espejo, lo que incrementa exponencialmente la fiabilidad
respecto a un solo disco. Dado que todos los datos están en dos o más discos el
rendimiento de lectura se incrementa aproximadamente como múltiplo lineal del
RAID Francesc Pérez Fdez.
rendimiento de lectura se incrementa aproximadamente como múltiplo lineal del
número del copias; es decir, un RAID 1 puede estar leyendo simultáneamente dos datos
diferentes en dos discos diferentes, por lo que su rendimiento se duplica. Para
maximizar los beneficios sobre el rendimiento del RAID 1 se recomienda el uso de
controladoras de disco independientes, una para cada disco (práctica que algunos
denominan splitting o duplexing). Al escribir, el conjunto se comporta como un único
disco, dado que los datos deben ser escritos en todos los discos del RAID 1. Por tanto, el
rendimiento no mejora. La probabilidad de fallo del conjunto es el producto de todas
las probabilidades de fallo de cada uno de los discos.
Probabilidad de fallo RAID1 = Prob.fallo HD1 x Prob.fallo HD2 x …
6. 2. Niveles RAID
RAID5 (Bloques de paridad distribuidos)
En el RAID5 los datos se dividen en bloques, que es la cantidad más pequeña de datos
que pueden transferirse en una operación de entrada/salida entre la memoria principal
y los dispositivos periféricos o viceversa, distribuyendo la información de paridad, bits
redundantes para detectar o corregir errores de almacenamiento, entre todos los
discos miembros del conjunto. Generalmente, el RAID 5 se implementa con soporte
hardware para el cálculo de la paridad.
RAID Francesc Pérez Fdez.
7. 2. Niveles RAID
RAID5
En el gráfico anterior, una petición de lectura del bloque «A1» sería servida por el disco
0. Una petición de lectura simultánea del bloque «B1» tendría que esperar, pero una
petición de lectura de «B2» podría atenderse concurrentemente ya que seria servida
por el disco 1. Cada vez que un bloque de datos se escribe en un RAID 5, se genera un
bloque de paridad. El disco utilizado por el bloque de paridad está escalonado de una
división a la siguiente, de ahí el término «bloques de paridad distribuidos». Las
escrituras en un RAID 5 son costosas en términos de operaciones de disco y tráfico
entre los discos y la controladora. Los bloques de paridad no se leen en las operaciones
de lectura de datos, ya que esto sería una sobrecarga innecesaria y disminuiría el
RAID Francesc Pérez Fdez.
de lectura de datos, ya que esto sería una sobrecarga innecesaria y disminuiría el
rendimiento. Si falla un disco del conjunto, los bloques de paridad de los restantes
discos son combinados matemáticamente con los bloques de datos de los restantes
discos para reconstruir los datos del disco que ha fallado «al vuelo». El RAID 5 requiere
al menos tres unidades de disco para ser implementado. El fallo de un segundo disco
provoca la pérdida completa de los datos.
A medida que el número de discos en un conjunto RAID 5 crece, el MTBF (tiempo
medio entre fallos) puede ser más bajo que el de un único disco. Es decir la
probabilidad de fallo incrementa. Esto sucede cuando la probabilidad de que falle un
segundo disco en los N-1 discos restantes de un conjunto en el que ha fallado un disco
en el tiempo necesario para detectar, reemplazar y recrear dicho disco es mayor que la
probabilidad de fallo de un único disco.