在ceph集群中执行ceph -s检查集群服务状态时候,容易出现 health HEALTH_WARN clock skew detected on mon.ceph-XX,Monitor clock skew detected 的问题,如果执行ceph health detail出现HEALTH_WARN clock skew detected on mon.X mon.X addr x.x.x.x:6789/0 clock skew 8.37274s > max 0.05s (latency 0.004945s)这说明几个节点之间的时间同步出现了问题,是mon节点服务器,时间偏差比较大导致。通过修改ceph的时间偏差阀值,可以规避告警信息,线上业务环境,注意排查服务器时间同步问题。
一个简单的解决办法就是:
1.停掉所有节点的ntpd服务,如果有的话
#/etc/init.d/ntpd stop
2.同步国际时间或者时钟服务器
#/sbin/ntpdate time.nist.gov 或者 #/sbin/ntpdate IP地址(这个内网地址是时钟同步服务器,并且可以从公网上面同步时钟或者用本机时间)
3.如果执行完以上两步仍有报错,则需要重启所有monitor
#/etc/init.d/ceph restart mon
另外一个办法就是重新配置ntp服务。