问题描述:
xxx生产数据库rac 集群节点实例出现了反复重启,故障期间出现私网不通,cpu内存爆满
的情况。
问题分析:
通过集群alert 日志发现心跳超时错误并重启节点。
dc1节点crs 日志显示:09-09 10:30 分集群重启
dc2集群crs 日志显示09-09 10:23 分开始心跳超时,dc1被驱逐
dc2集群crs 日志显示dc1 主机集群重启后10:31 重新注册到集群
并且故障期间发现私网网络不通。
top发现主机负载超高,cpu主要在sys 78.5%,ocssd.bin进程cpu 1112%,系统空闲内存
低,并且有大量换页内存使用的情况:
文档被以下合辑收录
评论