突然ですが、自分たちで管理しているサーバーの稼働状況を把握していますか?
利用者からの問い合わせで「〇〇システムが使えないです!」や「なんか操作が遅いです!」などといった問い合わせがあると、焦りますよね。
しかし、良くないことほど自分たちで把握して対応したいものです。
弊社でも昔は利用者からの問い合わせで、サーバーのダウンや高負荷に気付くことがありました。
そこで、どうしたか?
現在では、サーバーの稼働状況を可視化してくれるオープンソースのGrafanaを導入しています。
Grafanaを使えば、自分だけのダッシュボードを作成して、サーバーの稼働状況を可視化できます。
さらに、以下のようなこともできます。
・サーバーとの疎通が取れなくなったらアラートを出す
・CPU使用率が80%以上になったらアラートを出す
・空き容量が20%以下になったらアラートを出す
これらの設定により、利用者からの問い合わせの前に問題に気付くことができます。
ダッシュボードでサーバーの稼働状況を見ることができるため、状況を把握しやすくなり、閾値を超えそうな場合は事前に対応することもできます。
サーバーの稼働状況を把握して、問題を未然に防いだり、予測できない問題にもすぐに対応することができるようになりました。
Grafana以外にも類似のサービスがあるので、自分たちに合ったサービスの導入を検討してみてはいかがでしょうか?