Blog Agility

MetroCluster de A a Z (8 de 12): Operação da Funcionalidade de Takeover

MetroCluster de A a Z (8 de 12): Operação da Funcionalidade de Takeover

Esse artigo da série discute comandos para operar as funcionalidades de HA do par de storage em MetroCluster.


Comandos para Realizar Takeover Manual

Pode ser necessário iniciar um takeover de forma manual para manutenção não-disruptiva no storage. Os comandos para realizar um takeover de forma manual estão descritos a seguir.

Para iniciar o takeover manual do nó remoto digitar no nó local o comando a seguir. O takeover ocorre após a controladora suspender suas operações com sucesso ou depois de um tempo de timeout. Com esse comando, se um core dump está ocorrendo no nó remoto (no caso da opção cf.takeover.on_panic option estar em off) o takeover não irá ocorrer:

cf takeover

O comando a seguir inicia o takeover do nó remoto independente de estar ocorrendo um core dump na controladora (esta não pode terminar suas operações de forma normal):

cf takeover –f

O comando seguinte informa ao software de HA para ignorar determinados problemas de configuração que impossibilitariam o takeover do nó remoto (tais como NVRAM não sincronizada devido à falha da interconexão de HA) e força o takeover:

cf forcetakeover

O comando a seguir só é utilizado para as configurações de MetroCluster (não sendo permitido em configurações tradicionais de HA sem MetroCluster). O comando inicializa o takeover mesmo sem a presença do quórum de discos do lado que falhou. Esse comando deve ser utilizado somente em casos de declaração de desastre após a verificação de que o nó principal não está operacional:

cf forcetakeover –d

O comando a seguir serve para realizar um takeover para upgrade de sistema operacional de forma não-diruptiva pois permite que o takeover ocorra mesmo com as controladoras rodando SOs de versões diferentes. Maiores informações sobre essa opção podem ser encontradas na documentação Data ONTAP Upgrade and Revert/Downgrade Guide for 7-Mode:

cf takeover -n

O comando para retornar a operação para o nó original é o cf giveback. O artigo MetroCluster de A a Z (10 de 11): Teste de Disaster Recovery discute questões relacionadas ao giveback.

Suspender a operação de um nó sem takeover

Pode ser necessário suspender a operação de um dos nós sem que ocorra takeover pelo nó remoto para, por exemplo, realizar algum tipo de manutenção. Um caso seria uma manutenção tanto na controladora quanto nos discos de um lado do storage, assim a suspensão ou reboot evitaria que houvesse escrita nos discos do storage suspenso.

Para suspender a operação de um nó local sem que o nó remoto realize o takeover, utilizar o comando abaixo:

halt -f

Para reinicializar um nó local sem que o nó remoto realize o takeover, utilizar o comando abaixo:

reboot -f

Para desabilitar o takeover automático durante uma manutenção que causaria o takeover automático (nesse caso, o comando pode ser digitado tanto no nó local quanto no remoto):

cf disable

Para reabilitar o takeover automático após a manutenção ter sido finalizada (nesse caso, o comando pode ser digitado tanto no nó local quanto no remoto):

cf enable

Próximo artigo da série: MetroCluster de A a Z (9 de 12): Gerenciamento do Par de HA em Modo de Takeover

Referências

Esta série de artigos utiliza como referências testes realizados no laboratório do Agility Tech Center e os seguintes documentos da Netapp:

  • System Administration Guide for 7-Mode (versão 8.2 do Data ONTAP)
  • High Availability and MetroCluster Configuration Guide for 7-Mode (versão 8.2 do Data ONTAP)
  • Network Management Guide For 7-Mode (versão 8.2 do Data ONTAP)
  • Best Practices for MetroCluster Design and Implementation (TR-3548)