For Want Of A Better Word

nagiosってなにができるんだっけ① 画面の見方 メニュー説明 自分メモ

      2015/04/18

nagiosのwebインターフェースで見られる情報っていったい何があるのっていうのを、ちょっと整理。何となく見ていた。意外にドキュメントがない。本来下記のような本が欲しいけど、自前で推測交えながらメモ。

んでは、本論。
★が付いているのは、個人的によくアクセスしそうな奴。

左ナビキャプチャ

f:id:fz6:20140616172347p:plain

①General (総合)

1-1 Home ホーム Nagiosプロジェクトのトップ。リソース情報は無し。
1-2 Documantation 文書 公式ページへのリンクページ。リソース情報は無し。

②Current Status (現在の状況)

★2-1 Tactical Overview 概要 ステータス監視の概要
2-2 MAP 関連図 監視対象をビジュアライズ表示。親子関係等複雑だとわかりやすい。
★2-3 Services サービス ホスト、サービスの監視結果一覧。 危ないのは赤!!
2-4 Host Groups ホストグループ 自分で設定したホストグループ単位で状況を確認できる。
★2-4-1 Summary サマリー ホストグループ単位での死活監視結果
2-4-2 Grid グリッド グループで区切った、ホスト-サービス単位での死活監視結果
★2-5 Service Groups サービスグループ 自分で設定したサービスグループ単位で状況を確認できる。
2-5-1 Service Groups>Summary サマリー サービスグループ単位での死活監視結果
2-5-2 Service Groups>Grid グリッド グループで区切った、ホスト-サービス単位での死活監視結果
2-6 Problems 問題 通知のあるアラートの一覧。
2-6-1 Services(unhandled) サービス サービス単位のアラート一覧
2-6-2 Hosts(unhandled) ホスト ホスト単位のアラート一覧
2-6-3 Network Outages ネットワーク障害 ネットワーク障害の有無

③Reports (報告書 レポート)

※ 3つのステップレポートの種類(サービス、ホスト 各グループ単位 >対象の選択>期間等詳細)を指定し一覧表示する。(各項目は要調査)

3-1 Availability 可用性 可用性についてのレポートを作成。<% Time Up(起動時間)、% Time Down(停止時間)、% Time Unreachable(非到達時間)、% Time Undetermined(不明時間)>
3-2 Trends 傾向 ホスト毎に起動、停止、等の時間を積み上げグラフで表示。
3-3 Alerts アラート アラートの履歴。Nagiosログファイルから取得している。ファイルのローテートはnagiosの設定。世代管理はlogrotateの設定で。
3-3-1 Alerts>History ヒストリー 過去ログをひたすら見て行く
3-3-2 Alerts>Summarry サマリー レポート詳細を指定して、表形式の一覧を表示。
3-3-3 Alerts>Histogram ヒストグラム ホスト、レポート詳細を指定して、Event発生数をグラフで表示。
3-4 Notifications 通知 ?? 不明要確認
3-5 Eventlog イベントログ イベントの履歴。Nagiosログファイルから取得している。アラートに加え、インフォメーションなども含む。

④system (システム)

4-1 Commnets コメント 任意のメモ・コメントを記載出来る。備忘替わりか。
★4-2 downtime ダウンタイム ダウンタイムの設定。メンテナンス時などに監視を停止する必要があるが、ここでその期間を設定すれば、該当時間帯は自動で無視してくれる。んで復活も。
4-3 Process Info プロセスインフォ 現在稼働しているnagiosの設定情報。バージョンは起動時間、ログローテンションをした時間なども確認できる。ここから、停止や起動も出来るみたい。
4-4 Performance Info パフォーマンスインフォ nagiosの監視にあたってのパフォーマンス統計を見られる。チェックするのにかかった平均時間等。
4-5 Scheduling Queue スケジューリング キュー 監視キューの一覧を参照できる。ホスト サービス、前回監視実行時間、次回監視実行時間
4-6 Configuration 設定 監視設定の一覧を参照できる。ホストとか、コマンドとか。Nagios/object以下の監視設定ファイルを見やすい感じで表示。ここから編集は出来ない。

調べたこと

UnreachableとDownの違い

あるホストが応答が無いというときに、nagiosとしては二つのステータスを持っている。
downとunreachable。
どっちも、繋がらないのは同じ。unreachableと判断されるのは、設定上そのホストの親ホスト(通信経路として存在するホスト)が全部死んでいて、そのホストに到達できない場合のこと。
ルートが生きているのに、応答が無い場合にホストがdownと判断される。

Flap Detection 「ばたつき」の検知

ばたつきとは…⇒ ホスト・サービスのステータス(up,down等)が頻繁に変化する状態。たとえばサーバー起動時など、変化の度に通知がいっては煩わしい、ということでnagiosさんがうまいことしてくれるらしい。細かいことは、勉強不足。。

個人メモ

以上が基本的な設定で見られるものっぽい。Nagiosが死活監視ツールというのがよく分かる。
エージェントを入れての、サーバー情報取得部分は、プラグインを追加すれば画面に出てくるのかな。それはこれから。。

なにが見れて、どんな設定が出来てというのがなんと無くわかったので、今度はインストールして、プラグイン使ってとかやってみる。。。

 - nagios, インフラ

  関連記事

lgi01a201309210900
【セキュリティ】ファイアーウォールのパケットフィルタリングのチェック対象

ファイアーウォールのパケットフィルタリングは、基本パケットのヘッダしか見ないと& …

027
linux(centos)でのpingの疎通元IPの確認

ちょっと仕事で必要になったので確認。   pingloggerとかいう …

027
Vmware Player5.0でNat + ポートフォワードで外部から接続可能にする。

最初はwindowsに仮想サーバーを立てたかっただけ。 windowsVirtu …

027
ルーティングテーブル

ルータで利用される。IPアドレスと経路の管理表。ルータはパケットの宛先IPアドレ …

027
ハウジング・ホスティング・レンタル・VPS・クラウド違い

ハウジングサービス 顧客の通信機器や情報発信用のコンピュータ(サーバ)などを、自 …