Blog Agility

Análise de Problemas com o vCenter Operations Manager

Análise de Problemas com o vCenter Operations Manager

O Operations Manager coloca uma lupa sobre a estrutura de virtualização: hosts, VMs, storage, estrutura do vCenter e, através da integração de ferramentas como o Configuration Manager e Infrastructure Navigator) até das aplicações e das políticas de compliance de determinados sistemas.


Com visibilidade detalhada do ambiente, o Operations Manager se torna uma ferramenta poderosa para analisar problemas em uma infraestrutura virtualizada. Seus formatos de distribuição permitem seu uso desde em estruturas menores de virtualização até em estruturas robustas como de cloud.

A forma como o Operations Manage mostra as interrelações entre os diversos componentes (máquinas virtuais, hosts, clusters, storage) torna possível apontar precisamente a causa raiz de um problema de contenção de performance e observar as possíveis soluções (por exemplo, migrar a VM de host ou storage ou acrescentar mais recursos).

Possíveis usos do Operations Manager na análise de problemas estão descritos abaixo:

  • Permite identificar um problema geral relacionado à saúde do ambiente virtualizado.
  • Permite identificar objetos sob estresse de performance ou capacidade
  • Permite identificar hosts ou clusters sob estresse para prover balanceamento de recursos
  • Ajuda a determinar a porcentagem de utilização e os recursos restantes necessários para o funcionamento do ambiente.
  • Permite determinar se o ambiente está operando conforme esperado
  • Permite identificar a causa de uma degradação no ambiente virtualizado
  • Identifica problemas de recursos de memória para VMs, hosts e clusters
  • Identifica os principais utilizadores de recursos
  • Identifica os eventos que ocorreram quando um objeto sofreu degradação de performance.
  • Permite determinar a extensão da degradação de performance de um objeto.
  • Permite identificar o tempo de ocorrência e a natureza de um problema relacionado à saúde do ambiente virtualizado ou de um de seus objetos.
  • Permite determinar a causa de um problema de um objeto específico.

Um exemplo de uma dessas funcionalidades é demonstrado a seguir.

Exemplo: Identificando o estresse a que um objeto está submetido

Para verificar o estresse (uma das métricas que compoem o risco ao qual objeto está submetido), selecionar o objeto no menu do vCenter e clicar no badge “Stress”. No exemplo a seguir, a máquina virtual ATC-VCS-A foi selecionada e o painel mostra os gráficos referentes ao objeto:

06_Operations_Manager_Stress_01

Através desse elemento é possível verificar quais máquinas virtuais, hosts ou clusters requerem maior capacidade ou em que períodos o objeto possui maior utilização de recursos.

Para ver maiores detalhes sobre o nível de estresse do objeto, clicar no badge “Stress” para entrar na tela “Views” da aba “Planning”. Essa visão mostra gráficos com plotagem de tendência para utilização de memória, CPU e tempo ocioso ou desligado.

07_Operations_Manager_Stress_02

Com essa análise seria possível, por exemplo, encontrar um ponto de contenção na estrutura  e provisionar mais recursos antes que uma degradação de performance ocorresse no ambiente, utilizando a ferramenta de forma proativa para gerenciamento do ambiente de virtualização, cumprimento de SLA, análise de riscos do ambiente, dentre outros.

Referências

Este artigo utiliza como referências testes realizados no laboratório do Agility Tech Center e os seguintes documentos da VMware:

  • VMware vCenter Operations Manager Getting Started Guide (versão 5.7)
  • vApp Deployment and Configuration Guide (vCenter Operations Manager 5.7)