Una guía para la tecnología de almacenamiento RAID

Sección 1


Descripción general de RAID

¿Qué es RAID??

La matriz redundante de discos independientes (RAID) es una tecnología de almacenamiento que combina varios discos duros físicos para crear una unidad lógica con mejor rendimiento y confiabilidad que las unidades individuales. Aumenta la velocidad de almacenamiento y acceso a datos mientras evita la pérdida de datos y los tiempos de inactividad.

La tecnología RAID, originalmente conocida como una matriz redundante de discos económicos, fue desarrollada por Randy Katz, David Patterson y Garth Gibson y en 1987. Los tres científicos de la Universidad de California, Berkeley, estaban tratando de abordar los desafíos que a menudo daban lugar a datos pérdidas. Hoy en día, su creación, que se ha mejorado y mejorado, permite organizar los datos en múltiples discos y reconstruir la información faltante en caso de falla del hardware de uno o más discos..

Aunque está diseñado tradicionalmente para servidores, RAID también se usa en estaciones de trabajo, computadoras que requieren mucho almacenamiento y otras aplicaciones que requieren seguridad de datos, altas velocidades de transferencia y grandes capacidades de almacenamiento. Las aplicaciones típicas donde las operaciones rápidas de lectura y escritura para archivos grandes son importantes incluyen edición de video, CAD, diseño gráfico, etc..

Una configuración RAID logra uno o una combinación de los siguientes beneficios.

Mejora el rendimiento de lectura / escritura de datos, lo que proporciona transferencias más rápidas.

Replicar datos en dos o más discos para aumentar la redundancia y evitar la pérdida de datos en caso de falla del disco.

Combinando múltiples unidades de disco para proporcionar una mayor capacidad.

¿Cómo funciona RAID??

RAID es una tecnología para configurar y admitir varias combinaciones de discos duros físicos, con el objetivo de mejorar la confiabilidad, el rendimiento y la capacidad. Consiste en múltiples discos físicos y un controlador para configurarlos y administrarlos..

Existen diferentes esquemas RAID para difundir o replicar datos en diferentes discos miembros. Cada una de las configuraciones proporciona un equilibrio único entre capacidad, rendimiento y resistencia. Generalmente, los tres conceptos principales son rayas, reflejo y paridad. Cada uno de estos tiene sus méritos y limitaciones, pero se pueden combinar para un mejor rendimiento..

La división de datos distribuye los datos de manera uniforme a través de múltiples discos físicos, reflejando los datos replicados en dos o más discos, mientras que la paridad usa datos sin procesar para calcular y almacenar información de paridad para la corrección de errores. Al escribir o acceder a la información simultáneamente en bandas, el RAID mejora el rendimiento, mientras que la duplicación permite acceder a los datos de las unidades restantes en caso de una falla del disco.

¿Cuándo debo usar RAID?

RAID es ideal para aplicaciones de alta confiabilidad y aquellas que requieren mayor almacenamiento o altas velocidades de transferencia de datos. Todos los sitios web y las aplicaciones críticas en línea y fuera de línea deben usar RAID para mejorar el rendimiento, evitar la pérdida de datos o los tiempos de inactividad.

La mayoría de los servidores modernos utilizan unidades SSD rápidas, por lo tanto, es posible que no requieran más mejoras de rendimiento. Sin embargo, es necesario agregar redundancia para garantizar la confiabilidad y disponibilidad del sitio web en caso de falla del disco. Para los servidores que usan discos lentos más antiguos, puede ser necesario usar un nivel RAID que combine la mejora del rendimiento y la redundancia de datos. Para obtener más información sobre HDD y SSD, lea nuestra guía de alojamiento SSD vs. HDD.

Casi todos los servidores físicos en alojamiento compartido, VPS o servidores dedicados tienen unidades de disco que funcionan en una configuración RAID. Por lo general, al menos una de las unidades está configurada para paridad y todos los datos copiados aquí tienen un bit adicional que ayuda a recuperar datos en caso de falla en uno de los discos..

RAID en servidores dedicados, VPS o compartidos aumenta el rendimiento del servidor y la redundancia de datos. Sin embargo, no elimina la necesidad de una copia de seguridad de datos fuera del sitio, solo en caso de un ataque de virus o desastre.

En general, la mayoría de los proveedores usan el RAID tanto para los servidores como para los sistemas de respaldo. Esto aumenta el nivel de protección de datos y la velocidad de recuperación de datos en caso de que surjan problemas con los discos del servidor o el almacenamiento de respaldo..

Aunque RAID se diseñó inicialmente para servidores, las personas y los usuarios intensivos en datos, como los editores de video y audio, pueden usarlo para mejorar las operaciones de lectura y escritura.

Uso de RAID con un controlador RAID

Un controlador RAID es un dispositivo de hardware o controlador de software para configurar y administrar discos duros en una matriz. Proporciona una interfaz para combinar los discos físicos y presentarlos al sistema operativo como una sola unidad lógica..

Un controlador RAID de hardware es un dispositivo físico que está integrado en la placa base o está disponible como una tarjeta de extensión PCI o PCI Express adicional. Para RAID de hardware, el controlador ejecuta todo y tiene su CPU y memoria. Los controladores están diseñados para admitir interfaces específicas del disco duro y niveles de incursión. Por ejemplo, hay controladores únicos para unidades SCSI, SATA, SAS o SSD y no son intercambiables.

Algunos controladores de hardware tienen una memoria caché adicional para evitar la pérdida de datos en caso de un corte de energía, además de aumentar las operaciones de lectura y escritura. Las ventajas de una incursión de hardware son un mejor rendimiento, que admite el arranque desde la matriz y proporciona una mejor abstracción. Sin embargo, son más caros y existen riesgos de bloqueo del proveedor, ya que la mayoría de estos usan firmware patentado.

Un RAID basado en software utiliza el sistema operativo y el hardware existente, como la CPU de la computadora y los controladores estándar SAS, IDE o SATA. Esto es más flexible, menos costoso y está disponible en la mayoría de los sistemas operativos de servidor y escritorio. Sin embargo, la instalación a menudo está vinculada a un sistema operativo específico y puede no ser compatible con otros tipos. Como usa la potencia de procesamiento de la computadora y la memoria, esto puede degradar el rendimiento del servidor. Otras limitaciones incluyen la imposibilidad de iniciar desde la matriz RAID y la falta de soporte para el intercambio en caliente a menos que se use un controlador de hardware compatible.

Sección 2

Niveles de incursión

¿Qué son los niveles RAID??

Un nivel RAID se refiere a la técnica de distribución, organización y administración de datos a través de múltiples discos en una matriz. Cada nivel tiene una tolerancia a fallos, redundancia de datos y propiedades de rendimiento diferentes, y la elección depende de los requisitos u objetivos, así como del costo. Algunos niveles proporcionan más protección de datos, mientras que otros ofrecen una mejor mejora del rendimiento que otros métodos..

En general, todas las matrices RAID se clasifican en niveles estándar, no estándar o anidados, según la configuración, el tipo y el nivel de mejoras que ofrece..

Los niveles estándar de RAID se basan en configuraciones básicas y simples. Estos incluyen los niveles originales, del uno al cinco, más otros dos (0 y 6) que se agregaron más tarde. Otros niveles más allá de estos se definen como no estándar. Sin embargo, el nivel 0 a veces no se considera como RAID ya que no ofrece redundancia.

Un RAID anidado o híbrido combina un nivel RAID estándar que proporciona redundancia con un RAID 0 para mejorar el rendimiento de la transferencia de datos. Este nivel requiere más controladores, controladores de hardware de mayor calidad y computadoras más potentes. Algunos controladores de bajo costo y controladores de software no admiten RAID anidado. Esto hace que su implementación sea más costosa y, a menudo, ideal para grandes empresas y empresas..

Los niveles RAID no estándar son aquellos que no dependen de arquitecturas básicas o métodos utilizados en los niveles RAID tradicionales. Algunos de estos son propietarios y solo se usan para ciertas aplicaciones. Estos proporcionan niveles más altos de rendimiento y generalmente son adecuados para aplicaciones específicas.

Niveles RAID estándar

Los niveles RAID estándar se basan en configuraciones de hardware simples y básicas, y son ideales para una amplia gama de empresas y particulares. El nivel estándar típico es RAID 0, 1, 2,3,4,5 y 6. Cada uno de estos proporciona una combinación única de redundancia y rendimiento.

Mientras que los niveles 1, 5 y 6 proporcionan cierto grado de tolerancia a fallas, el nivel 0 no ofrece el rendimiento más rápido. RAID 1 es el más confiable en seguridad de datos, mientras que el nivel 5 proporciona el mejor equilibrio entre rendimiento, tolerancia a fallas y confiabilidad.

RAID 0

Un nivel RAID 0 utiliza la creación de bandas de bloques para distribuir los datos en múltiples discos físicos. Tiene el rendimiento de E / S más rápido, ya que escribe o copia pequeñas partes diferentes de un archivo en, o desde, varios discos simultáneamente.

Requiere un mínimo de dos unidades físicas y proporciona el espacio de disco máximo, que es el total de las capacidades individuales del dispositivo. Sin embargo, no ofrece redundancia de datos ni tolerancia a fallas, y es lo mejor para las organizaciones que buscan rendimiento. Una falla en cualquiera de los discos en una matriz RAID 0 da como resultado la pérdida completa de datos, incluidos los datos guardados en las unidades en buen estado.

El nivel RAID 0 es el mejor para aplicaciones que procesan datos no críticos, pero requiere un alto rendimiento.

Diagrama de una configuración RAID 0

RAID 1

RAID 1 refleja los datos en dos o más discos sin paridad. El nivel requiere al menos dos unidades y el espacio total utilizable es igual al tamaño de un solo disco.

Todos los discos tienen copias idénticas de datos. En caso de falla del disco, el sistema continúa usando el disco o discos existentes en buenas condiciones de funcionamiento.

El nivel RAID 1 proporciona una mejor redundancia de datos y es ideal para aplicaciones donde la disponibilidad de datos es crítica. Esta es una tecnología simple con tolerancia básica a fallas pero sin mejoras de rendimiento ya que debe escribir los datos dos veces.

Esto es ideal para aplicaciones donde la disponibilidad de datos y la redundancia son importantes.

Diagrama de una configuración RAID 1

RAID 2

RAID 2 utiliza el trazado de bandas a nivel de bit con paridad en comparación con el trazado de bloques en RAID 0. Además, utiliza el código de Hamming para la detección de errores y, por lo tanto, requiere discos sin la opción de comprobación de errores de auto-disco. Como la mayoría de los discos modernos tienen esta característica, el nivel rara vez se usa. Además, requiere un disco adicional para almacenar información de paridad con fines de detección de errores. La capacidad efectiva del disco es n-1 donde n es el número de discos.

RAID 2 funciona como RAID 0, pero utiliza una división de nivel de bits junto con un mecanismo de protección contra errores para proteger la pérdida de datos debido a la corrupción. Este es un recurso extenso y no es ampliamente utilizado.

Diagrama de una configuración RAID 2

RAID 3

RAID 3 utiliza bandas de nivel de byte con paridad para reconstruir datos. Requiere un mínimo de tres unidades, de las cuales una almacena la información de paridad. El nivel tiene tasas de transferencia de datos de alto nivel para archivos grandes ya que se accede a los datos en paralelo pero más lento en archivos pequeños.

Este nivel funciona mejor para transferencias de datos secuenciales largas como video pero no en aplicaciones donde hay muchas solicitudes como una base de datos. En caso de que el disco con paridad se bloquee, no hay forma de reconstruir los datos. El nivel no se usa mucho y, al igual que RAID 2, su capacidad útil es n-1.

Diagrama de una configuración RAID 3

RAID 4

RAID 4 es casi similar a RAID 3, pero utiliza una división de nivel de bloque. Combina la creación de bandas a nivel de bloque en varios discos con un disco de paridad dedicado. El nivel requiere un mínimo de tres discos donde uno está reservado para información de paridad. Se accede a los datos de cada unidad de forma independiente en un solo bloque a la vez, por lo tanto, operaciones lentas. Además, las operaciones de escritura son más lentas ya que el sistema debe escribir la información de paridad.

Esto es ideal para el acceso secuencial a datos. Sin embargo, el disco de paridad puede ralentizar las aplicaciones de escritura. El nivel rara vez se usa.

Diagrama de una configuración RAID 4

RAID 5

RAID 5 tiene franjas de nivel de bloque junto con paridad distribuida. Esta es una configuración rentable y completa que equilibra la redundancia, el rendimiento y la capacidad de almacenamiento..

La creación de bandas mejora el rendimiento de E / S de lectura, mientras que la paridad es importante para reconstruir datos en caso de falla del disco. Sin embargo, no puede sobrevivir a múltiples fallas de disco y lleva más tiempo reconstruir los datos, ya que el proceso implica calcular la paridad de cada una de las unidades disponibles. Requiere un mínimo de tres discos pero tiene un espacio utilizable de disco n-1.

El nivel RAID 5 es adecuado para aplicaciones y servidores de archivos con dispositivos de almacenamiento limitados.

Diagrama de una configuración RAID 5

RAID 6

RAID 6 utiliza la creación de bandas de bloques como RAID 5 pero con una paridad distribuida dual. Los dos bloques de información de paridad proporcionan redundancia adicional y tolerancia a fallas. Este nivel puede sobrevivir a dos fallas de disco concurrentes. Sin embargo, es costoso; requiere al menos cuatro unidades mientras se proporciona un espacio utilizable para discos n-2.

Es más confiable y común en entornos SATA y aplicaciones tales como copias de seguridad basadas en disco y archivos de datos donde existe la necesidad de una retención de datos prolongada. También es adecuado para entornos donde la disponibilidad de datos es más importante que el rendimiento.

Los inconvenientes del nivel 6 incluyen el disco adicional para la información de doble paridad, además de ser complejo de implementar en comparación con el nivel 5. Debido a la doble paridad, las velocidades de escritura y restauración son más lentas.

Diagrama de una configuración RAID 6

Niveles RAID anidados (híbridos)

Un RAID anidado es una combinación de un nivel que proporciona redundancia y un RAID 0 que aumenta el rendimiento. Esto puede usar matrices RAID o discos individuales. Por lo general, la mejor combinación es tener RAID 0 sobre una matriz redundante, ya que será necesario regenerar menos discos en caso de falla del disco.

Los niveles anidados proporcionan un mejor rendimiento y una mayor tolerancia. Sin embargo, requieren configuraciones complejas y más unidades, mientras que la capacidad efectiva se reduce a la mitad el espacio en disco instalado. También son caros y tienen una escalabilidad limitada..

Los niveles comunes incluyen 0 + 1, 1 + 0 (10), 0 + 3, 3 + 0 (30), 0 + 5, 5 + 0 (50) y 6 + 0 (60)

RAID 0 + 1

RAID 0 + 1 combina RAID 0 y 1 para proporcionar redundancia y mejorar el rendimiento. El proceso comienza mediante la separación de los datos en varios discos, lo que aumenta el rendimiento, seguido de la duplicación para la redundancia de datos..

RAID 0 + 1 requiere un mínimo de cuatro discos duros físicos y es una configuración compleja que proporciona un alto rendimiento y tolerancia a fallas. Puede sobrevivir a más de una falla de disco en el mismo conjunto duplicado, siempre que no haya una falla concurrente de dos discos duplicados.

Este nivel requiere discos en múltiplos de dos, pero la capacidad total utilizable suele ser la mitad del espacio total en disco. Además, es más costoso y no es fácilmente escalable.

Una configuración RAID 01 anidada

Configuración RAID 01 anidada

Una configuración híbrida RAID 01

Configuración RAID 01 híbrida

REDADA 1 + 0

RAID 1 + 0 o RAID 10 comienza con la duplicación de datos antes de eliminarlos en las matrices duplicadas. El enfoque lo hace más redundante, confiable y eficiente que RAID 0 + 1, y puede sobrevivir a múltiples fallas de la unidad. Requiere un mínimo de cuatro unidades y puede sobrevivir a múltiples fallas concurrentes de disco siempre que ninguno de los espejos pierda todos los discos.

RAID 1 + 0 tiene mejor tolerancia a fallas, redundancia de datos y reconstrucción en comparación con RAID 0 + 1. Sin embargo, es muy costoso y al igual que el 0 + 1 tiene una escalabilidad limitada. El nivel es ideal para organizaciones que buscan alto rendimiento y seguridad de datos. La capacidad útil es la mitad del espacio total en disco instalado.

Diagrama de una configuración RAID 1 + 0

RAID 0 + 3

Esto también se conoce como RAID 53 y consiste en una matriz Raid 0 dividida en una matriz RAID 3. Además, tiene una matriz de paridad dedicada que se divide en discos.

El nivel tiene altas tasas de transferencia de datos y tolerancia a fallas ofrecidas por los segmentos RAID 3. Este nivel proporciona una alta tolerancia y tiene un excelente rendimiento con lecturas y escrituras secuenciales y aleatorias. Sin embargo, es más complejo y costoso ya que requiere más unidades.

Desafortunadamente, el nivel es costoso y requiere discos con cabezales que deben sincronizarse juntos. Esto podría limitar la elección de discos para usar.

Diagrama de una configuración RAID 0 + 3

RAID 5 + 0

RAID 5 +0 o RAID 50 combina la paridad distribuida de RAID 5 con el trazado de bandas de RAID 0. Consiste en dos o más matrices RAID 5 en las que los datos y la información de paridad en las matrices se divide en los discos. Al requerir un mínimo de seis discos físicos, ha mejorado la protección de datos, el rendimiento de escritura y las reconstrucciones más rápidas en comparación con RAID 5. Por lo tanto, es ideal para aplicaciones donde la alta disponibilidad es importante.

Una sola falla en la unidad solo afectará esa matriz y no degradará el rendimiento como sucede en RAID 5. Además, puede soportar hasta cuatro fallas en la unidad siempre que cada una esté en una matriz RAID 5 diferente. Sin embargo, requiere un controlador RAID sofisticado.

Diagrama de una configuración RAID 0 + 5

RAID JBOD N + N

JBOD (Just a Bunch Of Disks) combina varios discos que representa para el sistema operativo como un solo disco con mayor capacidad pero sin redundancia. A diferencia de otros niveles RAID, esta disposición permite acceder a unidades individuales por separado. Esto no es realmente un nivel RAID sino simplemente un arreglo.

El JBOD consta de varios discos estándar que pueden tener diferentes tamaños. La capacidad total es la suma de los discos individuales y se puede aumentar simplemente agregando una unidad adicional. Al igual que el RAID 0, proporciona el mejor rendimiento ya que tampoco tiene paridad que agregaría más sobrecarga. Sin embargo, no tiene protección de datos y cada disco es un punto potencial de falla. Por lo tanto, es ideal para aplicaciones intensivas de E / S y aquellas que requieren un mayor almacenamiento.

Diagrama de una configuración de disco JBOD

Niveles RAID no estándar

Los niveles RAID no estándar se basan en arquitecturas o algoritmos diferentes de los de un RAID estándar. Algunos se basan en sistemas de código abierto, mientras que otros se basan en tecnologías patentadas y solo son ofrecidos por ciertos proveedores para aplicaciones específicas..

Aquellos que usan hardware y software patentados y pueden no ser compatibles con otros sistemas de diferentes fabricantes. Los ejemplos incluyen RAID-3D de Pure Storage y XtremIO Data Protection (XDP) de Dell EMC.

Los niveles RAID no estándar proporcionan un mejor rendimiento y tolerancia a fallas que los niveles estándar. Se utilizan para aplicaciones especializadas que requieren más disponibilidad y confiabilidad que lo que puede ofrecer el nivel estándar.

RAID 3D

Este es RAID patentado desarrollado por Pure Storage y utiliza unidades flash en lugar de discos duros. Esto generalmente se usa para evitar la pérdida de datos en caso de falla de componentes en el almacenamiento flash. Debido a las velocidades de transferencia más rápidas en unidades de estado sólido, la matriz tiene un alto rendimiento de E / S. Si el RAID 3d detecta una falla del dispositivo que a menudo causa demoras de E / S, reconstruye los datos de los otros dispositivos dentro del mismo grupo de paridad.

RAID 1E mejorado

RAID 1 mejorado (RAID 1E) combina la duplicación y la división de datos en varios discos. Es casi similar a RAID 1 pero tiene bandas y requiere un número impar de discos, de los cuales el mínimo es de 3 unidades. El RAID 1E mejorado refleja la franja completa de datos en una franja diferente dentro del conjunto de discos, y en ocasiones se denomina franja reflejada. Debido a la duplicación, este nivel tiene una buena redundancia de datos.

Diagrama de una configuración RAID 1E

RAID 5 E mejorado

RAID 5 E es una variante de RAID 5 pero con una unidad de repuesto dinámico adicional. El repuesto dinámico suele estar activo esperando que falle otra unidad. Una vez que ocurre una falla, el repuesto dinámico está disponible para la reconstrucción de datos. RAID 5E requiere un mínimo de cuatro discos y tiene un mejor rendimiento que el RAID 5. Sin embargo, no es posible compartir la unidad de repuesto entre los arreglos. Además, sufre de reconstrucciones lentas.

Diagrama de una configuración RAID 5E

Seccion 3

Pros y contras de RAID

Beneficios del uso de RAID

Los beneficios de un sistema RAID varían según el nivel. Una matriz puede aumentar el rendimiento, la resistencia o la redundancia de datos, pero el nivel de mejora varía según el tipo de configuración y la cantidad de discos. Generalmente, una matriz proporcionará uno o más beneficios, pero no todos los máximos al mismo tiempo.

  • Prevención de pérdida de datos en caso de falla del disco: Un RAID con redundancia de datos proporciona una mejor continuidad de las operaciones comerciales. En tal sistema, una falla de disco no interfiere con las aplicaciones o el acceso a datos ya que el servidor usará los discos buenos restantes. Además, la sustitución de un disco defectuoso en una matriz RAID intercambiable en caliente no requiere apagar o interrumpir las operaciones. Más discos proporcionan un mejor nivel de tolerancia a fallas.
  • Mejora de las velocidades de lectura / escritura de ahí el rendimiento de los servidores o la computadora, como estaciones de trabajo para edición de video y otras aplicaciones intensivas en datos. Sin embargo, esto dependerá del nivel RAID y del número de unidades físicas..
  • Aumento de la capacidad de almacenamiento utilizando discos simples y más baratos.: Esto es más rentable que comprar una unidad individual grande.
  • Incremento de la tolerancia a fallas mediante el uso de múltiples discos.

Costos reducidos y confiabilidad mejorada: Al usar varios discos más pequeños y menos costosos, la matriz permite aumentar la capacidad a un costo menor que adquirir una sola unidad de alta capacidad.

Desventajas de usar RAID

Aunque existen diferentes niveles de RAID para abordar diversas necesidades de almacenamiento de datos, la tecnología es vulnerable a una serie de fallas que pueden provocar pérdidas de datos o tiempos de inactividad. Las desventajas incluyen:

  • Dado que las unidades RAID generalmente están dentro de un servidor dentro del mismo centro de datos, un desastre puede dañar las unidades o la matriz completa, por lo tanto, potencialmente destruyendo todos los datos. Otros sistemas, como el CDP, almacenan los datos en unidades remotas y, por lo tanto, agregan una capa de protección adicional en caso de desastre..
  • El almacenamiento RAID contiene la versión actual de los datos, lo que garantiza una reconstrucción más fácil en caso de falla. Sin embargo, no es posible recuperar una versión anterior del archivo, especialmente si hubo un ataque de virus, alteración errónea de archivos o ediciones maliciosas.
  • Con capacidades de disco más grandes, RAID sufre largos tiempos de reconstrucción cada vez que falla uno o más discos. Se tarda más en reconstruir un volumen RAID cuando se produce un error y en caso de que otros discos fallen antes de que se complete una reconstrucción, todos los datos serán irrecuperables. Esto también aumentará el tiempo de inactividad..
  • La implementación de una matriz RAID es costosa ya que requiere varios discos. Para RAID que ofrece redundancia, no es posible utilizar la capacidad total. El espacio utilizable suele ser menor que la capacidad instalada total.
  • Complejo e intransferible. Aunque las cajas RAID o controladas por hardware son transferibles, las matrices RAID basadas en software no son.
  • Requiere habilidades de TI y familiaridad con las tecnologías. Como tales organizaciones pueden requerir gastar más dinero para capacitar a su personal o contratar proveedores de servicios externos, especialmente para reconstruir datos o solucionar problemas de funcionamiento.

Conclusión

RAID continuará ofreciendo beneficios de rendimiento y protección de datos durante varios años más. Sin embargo, requiere nuevas estrategias para hacerlo más efectivo y compatible con las tecnologías y necesidades emergentes. Actualmente, existen requisitos críticos de almacenamiento que van más allá de las tecnologías RAID existentes.

Algunos fabricantes ya están utilizando nuevos enfoques para satisfacer las crecientes y cambiantes necesidades, y también abordan las tecnologías y limitaciones modernas de los discos. Por ejemplo, en lugar de utilizar RAID 0 para mejorar el rendimiento, los sistemas modernos pueden utilizar DRAM, memorias caché flash, almacenamiento en niveles automatizado (AST) y otras tecnologías, como la creación de bandas anchas.

Los discos de hoy, como los SSD, son más grandes y rápidos. Esto elimina la necesidad de dividir datos para mejorar el rendimiento. Sin embargo, las unidades más grandes tienen el desafío de tiempos de reconstrucción más largos que pueden variar de 4 horas a varios días para un disco duro de 2TB.

Como tal, las organizaciones que manejan grandes cantidades de datos, como en la escala de petabytes, requerirán diferentes estrategias. Estos deben apuntar a hacer que RAID sea más efectivo mientras le permite competir con las alternativas existentes y futuras, como la codificación de borrado y la protección continua de datos (CDP).

La codificación de borrado comienza dividiendo los datos en fragmentos; luego los expande y los codifica con datos redundantes. Estos se almacenan en diferentes medios de almacenamiento y ubicaciones. La tecnología tiene pocos gastos generales en comparación con el RAID tradicional. Requiere menos tiempo y sobrecarga para reconstruir los datos. Sin embargo, es un procesador intensivo y tiene una latencia más alta en comparación con RAID.

En el futuro, un enfoque es retener la protección de datos proporcionada por un almacenamiento físico basado en RAID y luego virtualizar esto. Tal disposición creará un volumen virtual que no depende de la configuración específica del hardware. La replicación de tales volúmenes en diferentes ubicaciones disminuye el riesgo potencial de una falla completa en caso de desastre u otra falla crítica.

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me