| Artículos | 01 MAR 2002

RAID

Tags: Histórico
Daniel Avila.
Las empresas y usuarios que emplean sistemas de almacenamiento masivo necesitan 3 cualidades: rapidez, seguridad en la preservación de datos y buen precio. Todo esto y más ofrecen los subsistemas RAID, tanto usando la típica configuración con discos SCSI como con IDE.

Las necesidades de almacenamiento de las empresas informáticas actuales se están incrementando a un ritmo mayor que la propia velocidad de los microprocesadores (regida por la ley de Moore), y se espera que en los próximos 10 años siga subiendo. Esta demanda de capacidad de almacenamiento se debe en gran medida al auge de los portales de Internet, que necesitan de grandes bases de datos.
No obstante, el aumento de la capacidad de los discos duros u otros sistemas de almacenamiento y su constante bajada de precios no es condición suficiente para la mayoría de necesidades, ya que cada vez se demanda mayor disponibilidad. No hay duda de que los discos duros actuales ofrecen unas tasas de errores (MTBF, Mean Time Between Failures) mucho mejores que las de hace unos años, pero si se produce un error mecánico del disco todos los datos se perderán irremediablemente. Por ello, es necesario decantarse por alternativas como RAID, que ofrecen la tolerancia a fallos de un disco duro al usar un grupo de ellos como una sola unidad.

Cómo funciona
El término RAID es un acrónimo del inglés Redundant Array of Inexpensive Disks (en algunos textos usan Redundant Array of Independent Disks). Significa matriz redundante de discos de bajo coste (o independientes, según la segunda definición). RAID es un método de combinación de varios discos duros para formar una única unidad lógica en la que se almacenan los datos de forma conjunta.
Ofrece mayor tolerancia a fallos y más altos niveles de rendimiento que un solo disco duro o un grupo de discos duros independientes.
Una matriz consta de dos o más discos duros que ante el sistema principal funcionan como un único dispositivo. Un RAID, para el sistema operativo, aparenta ser un solo disco duro lógico (LUN). Los datos se desglosan en fragmentos que se escriben en varias unidades de forma simultánea. En este método, la información se reparte entre varios discos, usando técnicas como el entrelazado de bloques (RAID nivel 0) o la duplicación de discos (RAID nivel 1) para proporcionar redundancia, reducir el tiempo de acceso, y/u obtener mayor ancho de banda para leer y/o escribir, así como la posibilidad de recuperar un sistema tras la avería de uno de los discos.
La tecnología RAID protege los datos contra el fallo de una unidad de disco duro. Si se produce un fallo, RAID mantiene el servidor activo y en funcionamiento hasta que se sustituya la unidad defectuosa.
La tecnología RAID se utiliza también con mucha frecuencia para mejorar el rendimiento de servidores y estaciones de trabajo. Estos dos objetivos, protección de datos y mejora del rendimiento, no se excluyen entre sí.
Los sistemas RAID profesionales deben incluir los elementos críticos por duplicado: fuentes de alimentación y ventiladores redundantes con cambio en caliente o Hot Swap. De poco sirve disponer de un sistema tolerante al fallo de un disco si después falla, por ejemplo, una fuente de alimentación que provoca la caída del sistema.
También cada vez es más recomendable, sobre todo en instalaciones de cluster, configuraciones de dos controladoras redundantes y Hot Swap, de manera que en caso de fallo de una de ellas se puede proceder a su sustitución sin detener el funcionamiento del sistema. Además, esta configuración con controladoras redundantes nos permite conectar el sistema RAID a diferentes servidores simultáneamente.

Niveles de RAID
La elección de los diferentes niveles de RAID va a depender de las necesidades del usuario en lo que respecta a factores como seguridad, velocidad, capacidad, coste, etc. Cada nivel de RAID ofrece una combinación específica de tolerancia a fallos (redundancia), rendimiento y coste, diseñadas para satisfacer las diferentes necesidades de almacenamiento.
La mayoría de los niveles RAID pueden satisfacer de manera efectiva sólo uno o dos de estos criterios. No hay un nivel de RAID mejor que otro; cada uno es apropiado para determinadas aplicaciones y entornos informáticos. De hecho, resulta frecuente el uso de varios niveles RAID para distintas aplicaciones en el mismo servidor. Oficialmente existen siete niveles diferentes de RAID (0-6), definidos y aprobados por el RAID Advisory Board (www.raid-advisory.com). Luego existen las posibles combinaciones de estos niveles (los niveles RAID 0, 1, 0+1 y 5 son los más populares).

Hablando matemáticamente
Si el tiempo medio entre fallos (MTBF) para cada unidad de discos de un subsistema no RAID de cuatro unidades es de 150.000 horas, entonces el MTBF es de 37.500 horas. Y, como las unidades son independientes y no-redundantes, el tiempo medio entre pérdidas de datos (MTBDL, Mean Time Between Data Loss) es igual al MTBF. Un conjunto RAID 5 de cinco unidades ofrece la misma cantidad de almacenamiento utilizable y, con la unidad adicional, su MTBF disminuye a 30.000 horas. Sin embargo, debido a la redundancia de las unidades, el MTBDL del conjunto RAID es de 46.875.000 horas. Esto indica claramente que los sistemas RAID son mucho más fiables que los discos duros independientes -ya sean IDE o SCSI- convencionales.

RAID IDE o RAID SCSI
Habitualmente los discos duros usados en las controladoras RAID han sido siempre SCSI (en cualquiera de sus formatos), pero últimamente parece que están de moda los sistemas de almacenamiento RAID que usan discos IDE como la gama Snap de Quantum.
Éste es un tema que siempre genera polémica: si los discos duros IDE son mejores o peores que los SCSI. Pues bien, para dejar zanjado esto de una vez, vamos a clarificar la cuestión desde un punto de vista pragmático.
Definitivamente un disco duro SCSI no tiene por qué ser mejor que uno IDE, en contra de la creencia popular, pero lo que sí es cierto es que los fabricantes suelen fabricar los discos duros SCSI sometiéndolos a pruebas de calidad más duras y normalmente incluyendo más memoria caché, haciendo que la mayoría de los discos duros SCSI sean mejores que sus equivalentes IDE. No cabe duda de que esto podría cambiar en el futuro si los principales consumidores de discos duros SCSI (las empresas) optaran por usar discos IDE; en este caso, los fabricantes crearían discos IDE con características similares o incluso mejores que sus homónimos SCSI. Como prueba de ello, la gama Barracuda de Seagate se encuentra tanto en versión IDE como SCSI ofreciendo unas características similares (a excepción de su interfaz).
Otro punto que hay que señalar es la superioridad de la interfaz (fíjese en que decimos de la interfaz y no de la mecánica) SCSI sobre IDE. Aunque éste no es el artículo adecuado para tratar este tema con profundidad, simplemente vamos a reseñar que la interfaz IDE se creó únicamente con los discos duros en mente en entornos domésticos. En cambio, la interfaz SCSI es polivalente (existen virtualmente centenares de productos SCSI que no son discos duros) y permite unas opciones de conectividad mejores (además de mayor rendimiento) que el IDE.
Como recomendación podemos decir que si necesita un sistema RAID para manejar grandes archivos de datos de forma secuencial, como puede ser la edición de vídeo, un sistema con discos duros IDE se comportará perfectamente; pero, si necesita almacenamiento par

Contenidos recomendados...

Comentar
Para comentar, es necesario iniciar sesión
Se muestran 0 comentarios
X

Uso de cookies

Esta web utiliza cookies técnicas, de personalización y análisis, propias y de terceros, para facilitarle la navegación de forma anónima y analizar estadísticas del uso de la web. Consideramos que si continúa navegando, acepta su uso. Obtener más información