構築時は普通に稼働していたzabbix-serverですが、
監視対象を追加していくと、ある時からzabbixが落ちる→起動失敗が連続していた。
手動でzabbix-serverを起動しようとしても無理なので対処。
環境はこんな感じ
# cat /etc/redhat-release
CentOS Linux release 8.1.1911 (Core)
# rpm -qa | grep zabbix
zabbix-server-mysql-4.4.8-1.el8.x86_64
zabbix-web-4.4.8-1.el8.noarch
zabbix-web-japanese-4.4.8-1.el8.noarch
zabbix-web-mysql-4.4.8-1.el8.noarch
zabbix-agent2-4.4.8-1.el8.x86_64
zabbix-release-4.4-1.el8.noarch
ログを見ると
May 7 16:21:19 hogehoge1 systemd[1]: zabbix-server.service: Control process exited, code=exited status=1
May 7 16:21:19 hogehoge1 systemd[1]: zabbix-server.service: Failed with result ‘exit-code’.
May 7 16:21:29 hogehoge1 systemd[1]: zabbix-server.service: Service RestartSec=10s expired, scheduling restart.
May 7 16:21:29 hogehoge1 systemd[1]: zabbix-server.service: Scheduled restart job, restart counter is at 6.
May 7 16:21:29 hogehoge1 systemd[1]: Stopped Zabbix Server.
May 7 16:21:29 hogehoge1 systemd[1]: Starting Zabbix Server…
May 7 16:21:29 hogehoge1 systemd[1]: zabbix-server.service: Can’t open PID file /run/zabbix/zabbix_server.pid (yet?) after start: No such file or directory
May 7 16:21:29 hogehoge1 systemd[1]: zabbix-server.service: Supervising process 120150 which is not our child. We’ll most likely not notice when it exits.
May 7 16:21:29 hogehoge1 systemd[1]: Started Zabbix Server.
May 7 16:21:29 hogehoge1 kill[120153]: kill: 十分な引数がありません
May 7 16:21:29 hogehoge1 systemd[1]: zabbix-server.service: Control process exited, code=exited status=1
May 7 16:21:29 hogehoge1 systemd[1]: zabbix-server.service: Failed with result ‘exit-code’.
こんな感じでsystemdの自動再起動が走ってコケてを繰り返しています。
監視対象追加が起因していると思われますのでzabbixの設定を見てみます。
/etc/zabbix/zabbix_server.conf
のCacheSizeが
デフォルトのままでしたので32Mに増やします。
### Option: CacheSize
# Size of configuration cache, in bytes.
# Shared memory size for storing host, item and trigger data.
#
# Mandatory: no
# Range: 128K-8G
# Default:
# CacheSize=8M
CacheSize=32M
これで、zabbix-serverの起動が出来るようになりました。