如何检测远程机器上的内核panic

How to detect a kernel panic on a remote machine?

本文关键字:机器 内核 panic 何检测 检测 程机器      更新时间:2023-10-16

我有一个软件可以监视本地网络上几台linux机器的运行状况。它所做的一项检查是定期ping所有机器以确保它们是响应的。

最近我注意到一个或多个机器可能处于内核恐慌状态,但仍然响应ping。我想知道是否有某种检查,我可以在c++中做,当返回true:

a)远程机器无响应(当前使用ping语句执行此操作)。b)远程机器响应,但处于内核恐慌状态。

问题是,我不知道在内核恐慌期间什么能工作,什么不能。

这是在RHEL 5.7如果有帮助的话。提前感谢!

答案是:视情况而定。有时内核恐慌甚至会停止ping响应。"无响应"的定义将取决于机器的用例。如果有一种方法可以确定机器的主要目的仍然可以在本地实现,您可以使用SNMP和/或web(或其他一些网络协议)来确保它响应。

一种常见的监控方法(有许多针对各种向量和服务的预制插件)是使用nagios、icinga或其他类似的工具。