今天遇到zabbix报错: More than 100 items having missing data for more than 10 minutes
。
意思是超过了100项数据丢失了超过十分钟
查看zabbix
–Administration
–Queue
–Overview by proxy
发现大量的等待item
原因分析:
- server端与proxy端时间不同步
- server端分配的缓存不够
- server端分配的线程不够
- server端负载比较大{CPU,IO,MEM}
解决方法:
1.查看服务器资源负载状态,排除服务器本身原因
htop iotop iostat
2.查看zabbix_server有没有出现 Zabbix poller processes more than 75% busy
告警
修改配置文件增大线程数和缓存
vim /usr/local/zabbix/etc/zabbix_server.conf
StartPollers=500
StartPollersUnreachable=50
StartTrappers=30
StartDiscoverers=6
CacheSize=1G
CacheUpdateFrequency=300
StartDBSyncers=20
HistoryCacheSize=512M
TrendCacheSize=256M
HistoryTextCacheSize=80M
ValueCacheSize=1G
3.查看服务端与代理端的时间是不是同步的
crontab -e
*/3 */1 * * * /usr/sbin/ntpdate -u ntp.aliyun.com &> /dev/null
4.重启server端与proxy端服务
问题排除