Seguramente todos hayamos oído hablar de la configuración de discos en RAID y la hayamos relacionado con las grandes empresas, en donde la necesidad de tener los datos replicados y disponibles es primordial. Pero a día de hoy, prácticamente todas nuestras placas base para PC de escritorio cuentan con la posibilidad de crear nuestros propios RAID.
Índice de contenidos
En el día de hoy vamos a ver qué es la tecnología RAID, que además de ser una marca de espray anti mosquitos de muy buena eficacia, también tiene que ver con una tecnología del mundo de la informática. Veremos en qué consiste su funcionamiento y que podemos hacer con ella y sus distintas configuraciones. En ella cobrarán protagonismo nuestros discos duros mecánicos o SSD, sean cuales sean, los cuales nos permiten almacenar enormes cantidades de información gracias a las unidades de más de 10 TB que podemos encontrar actualmente.
También habrás oído hablar del almacenamiento en la nube y de sus ventajas respecto al almacenamiento en nuestro propio equipo, pero lo cierto es que está más orientado a empresas. Éstas pagan un precio para disponer de este tipo de servicio que se proporciona a través de internet y en servidores remotos que cuentan con avanzados sistemas de seguridad y configuraciones RAID propietarias con gran redundancia de datos.
¿Qué es la tecnología RAID?
El término RAID proviene de “Redundant Array of Independent Disks” o dicho en español, matriz redundante de discos independientes. Por su nombre ya tenemos una buena idea de qué lo pretende hacer esta tecnología. Que no es otra cosa que crear un sistema para el almacenamiento de datos utilizando múltiples unidades de almacenamiento entre las que se distribuyen los datos o se replican éstos. Estas unidades de almacenamiento pueden ser, tanto discos duros HDD o mecánicos, como unidades SSD o de estado sólido.
La tecnología RAID, se divide en configuraciones llamadas niveles, mediante las cuales podremos obtener diferentes resultados en cuanto a posibilidades de almacenamiento de información. A efectos prácticos, nosotros vamos a ver un RAID como un almacén único de datos, como si fuera una sola unidad lógica, aunque dentro de él existan varios discos duros físicamente independientes.
El objetivo final de RAID es ofrecer al usuario una mayor capacidad de almacenamiento, redundancia de datos para evitar la pérdida de estos y proporcionar mayor velocidad de lectura y escritura de datos que si solamente tuviéramos un disco duro. Evidentemente estas características se verán potenciadas de forma independiente en función de qué nivel de RAID queramos implementar.
Otra de las ventajas de utilizar un RAID es que podremos utilizar discos duros antiguos que tengamos por nuestra casa y que podamos conectarlos mediante interfaz SATA a nuestra placa base. De esta forma, con unidades de bajo coste, podremos montar un sistema de almacenamiento en donde nuestros datos estarán seguros frente a fallos.
Dónde se utilizan los RAID
De forma general, los RAID han sido utilizados desde hace muchos años por empresas, debido a la especial importancia de sus datos y de la necesidad de preservarlos y asegurar su redundancia. Éstas cuentan con uno o varios servidores que se dedican específicamente a gestionar este almacén de información, con hardware específicamente diseñado para este uso y con un escudo de protección frente a amenazas externas que evitarán el acceso indebido a ellos. Normalmente, en estos almacenes se utilizan discos duros idénticos en prestaciones y tecnología de fabricación, para que su escalabilidad sea óptima.
Pero en la actualidad, casi todos nosotros podremos utilizar un sistema RAID si tenemos una placa base relativamente nueva y con un chipset que implemente este tipo de instrucciones internas. Tan solo necesitaremos varios discos conectados a nuestra paca base para empezar a configurar un RAID desde Linux, Mac o Windows.
En caso de que nuestro equipo no implemente esta tecnología, necesitaremos una controladora RAID para gestionar el almacén directamente desde hardware, aunque en este caso el sistema será susceptible a fallos de esta controladora, algo que por ejemplo no ocurre si lo gestionamos mediante software.
Qué puede y qué no puede hacer un RAID
Ya sabemos qué es un RAID y dónde es posible utilizarlo, pero ahora debemos de saber qué ventajas vamos a obtener implementando un sistema de este tipo y que otras coas no podremos hacer con él. De esta forma no caeremos en el error de suponer cosas cuando realmente no lo son.
Ventajas de un RAID
- Alta tolerancia a fallos: Con un RAID podremos obtener una tolerancia a fallos mucho mejor que si solamente tenemos un disco duro. Esto estará condicionado por las configuraciones de RAID que adoptemos, ya que algunas están orientadas a proporcionar redundancia y otra simplemente a conseguir velocidad de acceso.
- Mejoras de rendimiento de lectura y escritura: Al igual que en el anterior caso, hay sistemas orientados a mejorar las prestaciones, mediante la división de bloques de datos en varias unidades, para hacerlos funciona en paralelo.
- Posibilidad de combinar las dos propiedades anteriores: los niveles de RAID se pueden combinar, como a continuación veremos. De esta forma podremos aprovechar la velocidad de acceso de unos y la redundancia de datos de otro.
- Buena escalabilidad y capacidad de almacenamiento: otra de sus ventajas es que son sistemas, por lo general, fácilmente escalables, dependiendo de la configuración que adoptemos. Además, podremos utilizar discos de distinta naturaleza, arquitectura, capacidad y edad.
Qué no puede hacer un RAID
- Un RAID no es un medio de protección de datos: RAID va a replicar los datos, no a protegerlos, son dos conceptos muy distintos. El mismo daño hará un virus en un disco duro independiente, que si entra en un RAID. Si no tenemos un sistema de seguridad que lo proteja, los datos estarán igualmente expuestos.
- Una mejor velocidad de acceso no está asegurada: hay configuraciones que nosotros mismos podemos hacer, pero no todas las aplicaciones ni juegos son capaces de trabajar bien en un RAID. Muchas veces no vamos a obtener beneficios al utilizar dos discos duros en lugar de uno para almacenar datos de forma dividida.
Desventajas de un RAID
- Un RAID no asegura el recuperarnos de un desastre: como sabemos, hay aplicaciones que pueden recuperar archivos de un disco duro dañado. En el caso de los RAID se necesitan controladores distintos y más específicos que no necesariamente son compatibles con estas aplicaciones. Así que ante un fallo en cadena o de varios discos, podríamos tener datos irrecuperables.
- La migración de datos es más complicada: clonar un disco con un sistema operativo es bastante simple, pero hacerlo con un RAID completo a otro, es bastante más complicado si no tenemos las herramientas correctas. Es por esto que migrar archivos de un sistema a otro para actualizarlo, se hace una tarea a veces insalvable.
- Alto coste inicial: implementar un RAID con dos discos es sencillo, pero si queremos conjuntos más complejos y con redundancia, la cosa se complica. Mientras más discos, mayor coste, y mientras más complejo sea el sistema, más de ellos necesitaremos.
Qué niveles de RAID existen
Pues podemos encontrar bastantes tipos de RAID en la actualidad, aunque estos estarán divididos en RAID estándar, niveles anidados y niveles propietarios. Los de más frecuente uso para usuarios particulares y pequeñas empresas, son por supuesto los niveles estándar y anidados, ya que la mayoría de equipos de gama alta tienen posibilidad de hacerlo sin instalar nada extra.
Por el contrario, los niveles propietarios solamente son utilizados pos las propias creadoras o que venden este servicio. Son variantes de los considerados básicos, y no creemos necesaria su explicación.
Veamos en qué consisten cada uno de ellos.
RAID 0
El primer de RAID que tenemos es el denominado Nivel 0 o conjunto dividido. En este caso, no tenemos redundancia de datos, ya que la función de este nivel es la de distribuir los datos que se almacenan entre los distintos discos duros que están conectados al equipo.
El objetivo de implementar un RAID 0 es la de proporcionar buenas velocidades de acceso a los datos que estén guardados en los discos duros, ya que la información esta equitativamente repartida en ellos para tener acceso simultáneo a mayor cantidad de datos con sus discos funcionando en paralelo.
RAID 0 no tiene información de paridad ni redundancia de datos, por lo que, si se rompe una de las unidades de almacenamiento, perderemos todos los datos que había en su interior, a menos que tengamos realizadas copias de seguridad externas a esta configuración.
Para realizar un RAID 0 debemos de prestar atención al tamaño de los discos duro que lo forman. En este caso será el disco duro de menor tamaño el que determine el espacio añadido en el RAID. Si tenemos un disco duro de 1 TB y otro de 500 GB en la configuración, el tamaño del conjunto funcional será de 1 TB, cogiendo el disco duro de 500 GB y otros 500 GB del disco de 1 TB. Es por esto que lo ideal será utilizar discos duros de igual tamaño para poder utilizar todo el espacio disponible en el conjunto diseñado.
RAID 1
Esta configuración también es llamada espejo o “mirroring” y es una de las más comúnmente utilizadas para proporcionar redundancia de datos y buena tolerancia a fallos. En este caso, lo que estamos haciendo es crear un almacén con información duplicada en dos discos duros, o dos conjuntos de discos duros. Cuando almacenamos un dato, este se replica inmediatamente en su unidad espejo para así tener dos veces el mismo dato almacenado.
A ojos del sistema operativo, solamente tenemos una unidad de almacenamiento, a la que accedemos para leer los datos de su interior. Pero en caso de que esta falle, automáticamente se buscará el dato en la unidad replicada. También es interesante para aumentar la velocidad de lectura de datos, ya que podremos leer la información de forma simultánea de las dos unidades en espejo.
RAID 2
Este nivel de RAID es poco utilizado, ya que básicamente se basa realizar un almacenamiento de forma distribuida en varios discos a nivel de bit. A su vez se crea un código de error de esta distribución de datos y se almacena en unidades exclusivamente destinadas a este propósito. De esta forma todos los discos del almacén podrán ser monitorizados y sincronizados para leer y escribir datos. Debido a que los discos actualmente ya traen consigo un sistema de detección de errores, esta configuración es contraproducente y se utiliza el sistema de paridad.
RAID 3
Esta configuración tampoco es utilizada actualmente. Consiste en dividir los datos a nivel de byte en las distintas unidades que forma el RAID, excepto una, en donde se almacena información de paridad para poder unir estos datos al ser leídos. De esta forma cada byte almacenado tiene un bit extra de paridad para identificar errores y poder recuperar datos en caso de pérdida de una unidad.
La ventaja de esta configuración es que los datos, están divididos en varios discos y el acceso a la información es muy rápido, tanto como discos en paralelo haya. Para configurar este tipo de RAID es necesario como mínimo 3 discos duros.
RAID 4
También se trata de almacenar los datos de forma dividida en bloques entre los discos del almacén, dejando uno de ellos para almacenar los bits de paridad. La diferencia fundamental respecto a RAID 3 es que, si perdemos una unidad, los datos pueden ser reconstruidos en tiempo real gracias a los bits de paridad calculados. Está orientado al almacenamiento de archivos de gran tamaño sin necesidad de tener redundancia de ellos, pero la grabación de datos es más lenta debido precisamente a la necesidad de hacer éste cálculo de paridad cada vez que se grabe algo.
RAID 5
También llamado sistema distribuido con paridad. Éste sí que se utiliza con más frecuencia en la actualidad que los niveles 2, 3 y 4, concretamente en dispositivos NAS. En este caso la información es almacenada de forma dividida en bloques que se reparten entre los discos duros que formen el RAID. Pero además se genera un bloque de paridad para asegurar la redundancia y poder reconstruir la información en caso de que un disco duro se corrompa. Este bloque de paridad se almacenará en una unidad distinta a los bloques de datos que están implicados en el bloque calculado, de esta forma la información de paridad estará almacenada en un disco distinto a donde están los bloques de datos implicados.
En este caso, también necesitaremos al menos tres unidades de almacenamiento para asegurad la redundancia de datos con paridad, y solamente se tolerará el fallo en una unidad a la vez. En caso de romperse dos de forma simultánea, perderemos la información de paridad, y al menos uno de los bloques de datos implicados. Existe una variante RAID 5E en donde se introduce un disco duro de reserva para minimizar el tiempo de reconstrucción de datos, si uno de los principales falla.
RAID 6
El RAID es básicamente una ampliación del RAID 5, en el que se añade otro bloque de paridad para hacer un total de dos. Los bloques de información se repartirán nuevamente en unidades distintas y de igual forma los bloques de paridad también están almacenados en dos unidades distintas. De esta forma el sistema será tolerante al fallo de hasta dos unidades de almacenamiento, pero, en consecuencia, necesitaremos hasta cuatro unidades para poder formar un RAID 6E. En este caso también existe una variante RAID 6e con el mismo objetivo que la del RAID 5E.
Niveles de RAID anidados
Dejamos atrás los 6 niveles básicos de RAID para entrar en los niveles anidados. Como podremos suponer, estos niveles son básicamente sistemas que cuentan con un nivel principal de RAID, pero que a su vez contienen otros subniveles que funcionan en otra configuración distinta.
De esta forma existen distintas capas de RAID que son capaces de realizar de forma simultánea las funciones propias de los niveles básicos, y así poder combinar por ejemplo la capacidad de acceso de lectura más rápido con un RAID 0 y la redundancia de un RAID 1.
Veamos pues cuáles son los más utilizados a día de hoy.
RAID 0+1
También se puede encontrar con el nombre de RAID 01 o espejo de divisiones. Consiste básicamente en un nivel principal de tipo RAID 1 que hace las funciones de replicar los datos que se encuentran en un primer subnivel en un segundo. A su vez existirá un subnivel RAID 0 que hará las funciones propias de éste, es decir, almacenar los datos de forma distribuida entre las unidades que en él se encuentran.
De esta forma tenemos un nivel principal que hace la función de espejo y subniveles que hacen la función de división de datos. De esta forma cuando un disco duro falla, los datos estarán perfectamente guardados en el otro RAID 0 de espejo.
La desventaja que tiene este sistema es la escalabilidad, cuando añadimos un disco adicional en un subnivel, también tendremos que hacer lo propio en el otro. Además, la tolerancia a fallos nos permitirá la rotura de un disco distinto en cada subnivel, o la rotura de dos en un mismo subnivel, pero no otras combinaciones, porque estaríamos perdiendo datos.
RAID 1+0
Pues ahora estaríamos en el caso contrario, también se le llamada RAID 10 o división de espejos. Ahora tendremos un nivel principal de tipo 0 que divide los datos almacenados entre los distintos subniveles. A su vez tendremos varios subniveles de tipo 1 que se encargarán de replicar los datos en los discos duros que tengan en su interior.
En este caso la tolerancia a fallos nos va a permitir que se puedan romper todos los discos de un subnivel a excepción de uno, y será necesario que al menos quede un disco sano en cada uno de los subniveles para no perder información.
RAID 50
Por supuesto así podemos estar un rato haciendo posibles combinaciones de RAID a cuál más enrevesada para conseguir la máxima redundancia, fiabilidad y velocidad. Veremos también la RAID 50, que se trata de un nivel principal en RAID 0 que divide los datos de los subniveles configurados como RAID 5, con sus respectivos tres discos duros.
En cada bloque RAID 5 tendremos una serie de datos con su correspondiente paridad. En este caso, un disco duro puede fallar en cada RAID 5, y nos asegurará la integridad de los datos, pero si fallan más, perderemos los datos que haya ahí almacenados.
RAID 100 y RAID 101
Pero no solamente podremos tener un árbol de dos niveles, sino de tres, y éste es el caso del RAID 100 o 1+0+0. Consiste en dos subniveles de RAID 1+0 divididos a su vez por un nivel principal también en RAID 0.
De igual forma podremos tener un RAID 1+0+1, formado por varios subniveles de RAID 1+0 reflejados por un RAID 1 como principal. Su velocidad de acceso y redundancia son muy buenos, y ofrecen buena tolerancia a fallos, aunque la cantidad de disco a utilizar es considerable frente a la disponibilidad de espacio.
Pues esto es todo acerca de la tecnología RAID y de sus aplicaciones y características. Ahora os dejamos con unos cuantos tutoriales que os serán también de utilidad
Esperamos que esta información te haya sido de utilidad para entender mejor lo que es un sistema de almacenamiento RAID. Si tienen alguna pregunta o sugerencia, déjanosla en la caja de comentarios.