Redundância de três cópias do DSS
O que é redundância de três cópias?
O sistema de armazenamento de back-end do DSS utiliza redundância de três cópias para garantir a confiabilidade dos dados. Com este mecanismo, uma parte dos dados é dividida por padrão em vários blocos de dados de 1 MB. Cada bloco é salvo em três cópias, e essas cópias são armazenadas em diferentes nós no sistema conforme os algoritmos de distribuição.
- O sistema de armazenamento salva as cópias dos dados em discos diferentes entre servidores localizados em gabinetes diferentes, garantindo que os serviços não sejam interrompidos se um dispositivo físico falhar.
- O sistema de armazenamento garante forte consistência entre as cópias dos dados.
Por exemplo, para o bloco de dados P1 no disco físico A do servidor A, o sistema de armazenamento faz backup de seus dados em P1'' no disco físico B do servidor B e em P1' no disco físico C do servidor C. Os blocos de dados P1, P1' e P1'' são as três cópias do mesmo bloco de dados. Se o disco físico A onde reside P1 estiver com defeito, P1' e P1'' podem continuar fornecendo serviços de armazenamento, garantindo a continuidade do serviço.
Como a redundância de três cópias mantém a consistência dos dados?
A consistência dos dados inclui os dois aspectos seguintes: quando uma aplicação grava um dado no sistema, as três cópias dos dados no sistema de armazenamento devem ser consistentes. Quando qualquer uma das três cópias é lida posteriormente pela aplicação, os dados nessa cópia são consistentes com os dados gravados anteriormente nela.
A redundância de três cópias de DSS mantém a consistência dos dados das seguintes maneiras:
- Os dados são gravados simultaneamente nas três cópias dos dados.
Quando uma aplicação grava dados, o sistema de armazenamento grava-os nas três cópias dos dados simultaneamente. Além disso, o sistema retorna a resposta de sucesso de gravação para a aplicação somente após os dados terem sido gravados em todas as três cópias.
- O sistema de armazenamento restaura automaticamente a cópia danificada no caso de uma falha de leitura de dados.
Quando uma aplicação não consegue ler dados, o sistema identifica automaticamente a causa da falha. Se os dados não puderem ser lidos de um setor de disco físico, o sistema lerá os dados de outra cópia dos dados em outro nó e os gravará de volta no setor de disco original. Isso garante o número correto de cópias de dados e a consistência dos dados entre as cópias de dados.
Como a redundância de três cópias reconstrói dados rapidamente?
Cada disco físico no sistema de armazenamento armazena vários blocos de dados, cujas cópias são espalhadas nos nós do sistema de acordo com determinadas regras de distribuição. Quando um servidor físico ou falha de disco é detectado, o sistema de armazenamento recria automaticamente os dados. Como as cópias dos blocos de dados são espalhadas em diferentes nós, o sistema de armazenamento iniciará a reconstrução de dados em vários nós simultaneamente durante uma restauração de dados, com apenas uma pequena quantidade de dados em cada nó. Desta forma, o sistema elimina os possíveis gargalos de desempenho que podem ocorrer quando uma grande quantidade de dados precisa ser reconstruída em um único nó e, portanto, minimiza os impactos adversos exercidos em aplicativos de camada superior.
Figura 2 mostra o processo de solicitação de dados.
Figura 3 mostra o princípio de reconstrução de dados. Por exemplo, se os discos físicos no servidor F estiverem com defeito, os blocos de dados nesses discos físicos serão reconstruídos nos discos físicos de outros servidores.
Quais são as diferenças entre redundância de três cópias e backup em disco?
A redundância de três cópias melhora a confiabilidade dos dados armazenados em discos do DSS. Ela é usada para combater a perda de dados ou inconsistência causada por falhas físicas do dispositivo.
Considerando que, os backups são usados para evitar a perda de dados ou inconsistência causada por mau funcionamento, vírus ou ataques de hackers. Portanto, é aconselhável criar backups para fazer backup dos dados do disco DSS em tempo hábil.