Redundancia de tres copias de DSS
¿Qué es la redundancia de tres copias?
El sistema de almacenamiento de backend de DSS emplea redundancia de tres copias para garantizar la confiabilidad de los datos. Con este mecanismo, una pieza de datos se divide por defecto en múltiples bloques de datos de 1 MB. Cada bloque de datos se guarda en tres copias, y estas copias se almacenan en diferentes nodos en el sistema de acuerdo con los algoritmos distribuidos.
- El sistema de almacenamiento guarda las copias de datos en diferentes discos de diferentes servidores a través de gabinetes, asegurando que los servicios no se interrumpan si falla un dispositivo físico.
- El sistema de almacenamiento garantiza una fuerte coherencia entre las copias de datos.
Por ejemplo, para el bloque de datos P1 en el disco físico A del servidor A, el sistema de almacenamiento realiza una copia de respaldo de sus datos en P1'' en el disco físico B del servidor B y en P1' en el disco físico C del servidor C. Los bloques de datos P1, P1' y P1'' son las tres copias del mismo bloque de datos. Si el disco físico A donde reside P1 es defectuoso, P1' y P1'' pueden continuar proporcionando servicios de almacenamiento, asegurando la continuidad del servicio.
¿Cómo mantiene la redundancia de tres copias la coherencia de los datos?
La coherencia de los datos incluye los dos aspectos siguientes: Cuando una aplicación escribe un fragmento de datos en el sistema, las tres copias de los datos en el sistema de almacenamiento deben ser coherentes. Cuando cualquiera de las tres copias es leída por la aplicación más tarde, los datos de esta copia son consistentes con los datos previamente escritos a la misma.
La redundancia de tres copias de DSS mantiene la coherencia de los datos de las siguientes maneras:
- Los datos se escriben simultáneamente en las tres copias de los datos.
Cuando una aplicación escribe datos, el sistema de almacenamiento los escribe en las tres copias de los datos simultáneamente. Además, el sistema devuelve la respuesta de escritura exitosa a la aplicación solo después de que los datos se hayan escrito en las tres copias.
- El sistema de almacenamiento restaura automáticamente la copia dañada en caso de fallo de lectura de datos.
Cuando una aplicación no puede leer datos, el sistema identifica automáticamente la causa del error. Si los datos no se pueden leer de un sector de disco físico, el sistema lee los datos de otra copia de los datos en otro nodo y los escribe de nuevo en el sector de disco original. Esto garantiza el número correcto de copias de datos y la coherencia de los datos entre las copias de datos.
¿Cómo la redundancia de tres copias reconstruye rápidamente los datos?
Cada disco físico en el sistema de almacenamiento almacena múltiples bloques de datos, cuyas copias están dispersas en los nodos en el sistema de acuerdo con ciertas reglas de distribución. Cuando se detecta una falla en el servidor físico o en el disco, el sistema de almacenamiento reconstruye automáticamente los datos. Dado que las copias de los bloques de datos están dispersas en diferentes nodos, el sistema de almacenamiento iniciará la reconstrucción de datos en múltiples nodos simultáneamente durante una restauración de datos, con solo una pequeña cantidad de datos en cada nodo. De esta manera, el sistema elimina los cuellos de botella potenciales de rendimiento que pueden ocurrir cuando se necesita reconstruir una gran cantidad de datos en un solo nodo, y por lo tanto minimiza los impactos adversos ejercidos en aplicaciones de capa superior.
Figura 2 muestra el proceso de reconstrucción de datos.
Figura 3 muestra el principio de reconstrucción de datos. Por ejemplo, si los discos físicos en el servidor F son defectuosos, los bloques de datos en estos discos físicos se reconstruirán en los discos físicos de otros servidores.
¿Cuáles son las diferencias entre la redundancia de tres copias y la copia de respaldo en disco?
La redundancia de tres copias mejora la confiabilidad de los datos almacenados en los discos de DSS. Se utiliza para hacer frente a la pérdida de datos o incoherencia causada por fallas del dispositivo físico.
Mientras que, las copias de respaldo se utilizan para evitar la pérdida de datos o incoherencia causada por un mal funcionamiento, virus o ataques de piratas informáticos. Por lo tanto, se recomienda crear copias de seguridad para realizar copias de respaldo de los datos del disco DSS en el momento oportuno.