Linux Kernel Watchdog explicou

Linux Kernel Watchdog explicou

Linux Kernel Watchdog

O cão de guarda Linux Kernel é usado para monitorar se um sistema estiver em execução. É suposto reiniciar automaticamente os sistemas enforcados devido a erros de software irrecuperáveis. O módulo Watchdog é específico para o hardware ou chip sendo usado. Os usuários de computador pessoal não precisam de cão de guarda, pois podem redefinir o sistema manualmente. No entanto, é útil para sistemas que são críticos e precisam da capacidade de se reiniciar sem intervenção humana. Por exemplo, servidores em um local remoto ou equipamento incorporado em uma espaçonave que precisa de recursos automáticos de redefinição de hardware.

Aviso: prossiga com cautela

Configurações erradas de um cão de guarda em seu sistema podem causar problemas como:

  • Loop de reinicialização sem fim
  • Corrupção de arquivo devido a uma redefinição rígida
  • Reinicializações aleatórias imprevisíveis

Portanto, evite o uso de servidores ao vivo para testar o Watchdog do kernel Linux.

Módulo Watchdog

Funcionalidade de Watchdog no lado do hardware define um cronômetro que se destaca após um período predeterminado. O software Watchdog atualiza periodicamente o cronômetro de hardware. Se o software parar de refrescar, após o período predeterminado, o timer executa uma redefinição de hardware do dispositivo. Para que um cronômetro de vigilância seja funcional, o fabricante da placa -mãe precisa usar a funcionalidade de vigilância do chip. Muitas vezes, a documentação do fabricante não está clara sobre se a funcionalidade foi implementada. Nesse caso, você tem que testá -lo.

Além disso, você precisa do módulo de kernel de vigilância certo para ser carregado no seu sistema Linux. Chips diferentes usam módulos diferentes. Por exemplo:

  • Os chipsets Intel podem usar o módulo "itco_wdt"
  • Hardware HP pode usar "hpwdt"
  • Os mainframes da IBM podem usar "vmwatchdog"
  • Xen VM pode usar "xen_wdt"

Depois que o módulo é carregado, você pode verificar /dev /watchdog no sistema Linux. Se este arquivo estiver presente, isso significa que o driver ou módulo do dispositivo do kernel do cão de guarda foi carregado. O sistema continua escrevendo periodicamente para /dev /watchdog. Também é chamado de “chutar ou alimentar o cão de guarda”. Se o sistema não conseguir chutar ou alimentar o cão de guarda, depois de um tempo o sistema é reiniciado difícil.

Daemon Watchdog

O daemon do watchdog abre o dispositivo e fornece a atualização necessária para impedir que o sistema seja redefinido. Ele pode testar o espaço da tabela de processos, uso de memória, acessibilidade do arquivo, sobrecarga de trabalho, estouro de tabela de arquivos, ping em endereço IP, tráfego de interface de rede, temperatura, processos de execução e mais. Se os testes falharem, o cão de guarda causará um desligamento.

Iniciando e parando de vigilância

O daemon de vigilância deve começar na hora da inicialização e se colocar em segundo plano. Você pode verificar se está em execução:

ps -af | relógio Grep*

Se o kernel não for compilado com config_watchdog_nowayout, se você fechar o /dev /watchdog corretamente, ele não causará uma reinicialização. Você pode escrever o personagem V em /dev /watchdog e depois fechar o arquivo. Isso deve parar o cão de guarda.

Testando o cão de guarda

Se você deseja testar se o órgão de guarda de hardware está funcionando, você pode fazer o seguinte no seu prompt de comando do administrador:

gato >> /dev /watchdog

E pressione “Enter” duas vezes e espere. O prompt não voltará. Depois de um tempo, dependendo do cenário do seu kernel, o sistema deve executar a reinicialização difícil.

Referências:

  • http: // www.Madore.org/~ David/Linux/Itco-WDT-Test.html
  • http: // www.sentado.Dundee.AC.UK/PSC/Watchdog/Watchdog-Background.html
  • http: // www.sentado.Dundee.AC.UK/PSC/Watchdog/Watchdog-Install.html
  • http: // www.sentado.Dundee.AC.Reino Unido/PSC/Watchdog/Watchdog-Testing.html
  • https: // incorporado.WordPress.com/2010/08/33/Howto-use-linux-watchdog/
  • https: // Launchpad.net/ubuntu/confiaby/+package/watchdog
  • https: // Stackoverflow.com/questões/2020468/who-is-refreshing-hardware-watchdog-som-linux
  • https: // www.Intel.com/content/dam/www/public/US/en/documents/application-notes/habilitando e configurando-watchdog-timer-app-note.pdf
  • https: // www.SUSE.com/suporte/kb/doc/?id = 7016880
  • https: // www.Systators.com/docs/linux/man/8-watchdog/