Pandora:Documentation ja:Other Monitoring

From Pandora FMS Wiki

Jump to: navigation, search

Pandora FMS ドキュメント一覧に戻る

他の種類のモニタリング

概要

リモートモニタリング、エージェントベースのモニタリング、ウェブモニタリングなどに加えて、Pandora FMS には他の拡張モニタリングがあります。これにより、保存しているデータからモジュールの値を予測したり、あるモジュールの値を元に数値計算した結果を返す新たなモジュールを作成することができます。

統合モジュールによるモニタリング

これは、エンタープライズ版の機能です。統合モジュールは、他のモジュールにすでに存在するデータを取得するモジュールです。例を以下に示します。

- "Traffic sum" というモジュールは、ルータの入力および出力トラフィックの値を合計します。インタフェースのトラフィックの合計を出す新たなモジュールです。

- "Total users" というモジュールは、5つのサーバで "Connected users" という接続しているユーザ数をモニタしている 10個のモジュールの値を合計します。

統合モジュールは、他のモジュールのデータから生成されます。それは同じエージェントからでも他のエージェントからでも可能です。モジュールの値から数値計算操作(足し算、引き算、掛け算、割り算)が可能です。

統合モジュールを作成するには、最初にモジュールタブのエージェントの管理セクションへ行きます。そこで、予測サーバモジュールタイプで、新たなモジュールを作成します。



Synth 1.png

最初の例では、異なる 2つのエージェントから 2つのモジュールの値 (CPUUse (Sancho-XP) および cpu user (garfio)) から、平均を計算する架空のモジュールを作成します。それぞれのマシンのモジュールは CPU の使用率を計測しますが、一方は Windows でもう一方は Linux のマシンです。最終的な結果は、エージェント Sancho-XP に双方の平均を計算したモジュールに保存されます。



Synth 2.png

2つ目の例では、Sancho-XP および Sancho-XP_2 という異なる 2つのエージェントの "Apache_accesses" というモジュールの平均を計算する "Total accesses" という新たなモジュールが作成されています。



Synth 3.png

簡単な別の例として、Sancho-XP_2 に "Total accesses" モジュールが作成されています。これは、単純に Sancho-XP の同様の名前のモジュールの値を "コピー" しています。



Synth 4.png

他の論理操作 (掛け算、引き算、割り算) をする時は、計算順序にのみ注意してください。異なるモジュール間で、どのように他の計算操作が動作するのかを確認してください。また、論理計算に固定の値を使うこともできます。(画面ショット参照)

左側のボックスから複数のエージェントを選択することができます。中央のボックスでは、選択したエージェントの "共通の" モジュールが表示されます。これは、サーバグループにおいて共通のモジュールから "平均" を求めるのに便利です。(例: CPU やディスク使用量)

予測モニタリング

予測モジュールでモニタできるようにするには、予測を有効にする必要があります。このモジュールの利用は、システムのディスクの使用量やメモリの空き容量に適しています。なぜなら、それらの状況によっては、パフォーマンス劣化を起こす可能性があるためです。そのほかでは、Pandora FMS サーバと Google などインターネット上のサーバの間に存在する遅延に利用できます。この場合、エージェントを作成し、予測モジュールは Google との間の遅延をモニタします。これを行う場合は、ネットワークモジュールの作成に関する章を確認してください。予測が動作するためには、予測するための何らかのパターンを持った情報が必要です。できれば、時間、日毎、週ごとに繰り返されるような情報です。

予測サーバ (prediction server) は、次の 2つに基づいて動作します。

  • 予測値は、5〜10分の時間マージンで有効です(より多くのマージンもとれますが、未来のデータを表してしまい良くありません)。
  • 値が正常かどうかを判断するために、オリジナルモジュールで収集したデータを分析に利用します。

予測モジュールをどのように設定するか見ていきましょう。

Pandora FMS コンソールの リソース(Resources) にて、エージェント管理 (Manage Agents)をクリックします。



Administration agents.png


次の画面で エージェントの作成 (Create agent) をクリックします。



Mariposa2.jpg


新たなエージェントのデータを入力し、エージェントの作成 (Create agent) をクリックします。



Mariposa3.jpg



エージェントを作成したら、上の方のモジュールの作成を行います。予測サーバモジュールの新規作成を選択し、作成 (Create) をクリックします。



Mariposa4.jpg



作成 (Create) をクリックすると、フォームが表示されます。予測モジュールを作成するためにフィールドに必要事項を入力します。



Latencia.jpg



以下にフィールドの詳細を示します。

  • 名前(Name): モジュール名を設定します。
  • 無効(Disabled): モジュールを無効にする場合にチェックします。
  • 種類(Type): モニタするモジュールの種類を選択します。ブーリアンもしくは数値が選択可能です。選択する種類により、異常状態の検出(ブーリアンのモジュール)または、将来の値の予測(数値のモジュール)として動作します。
  • モジュールグループ(Module Group): モジュールのグループを設定します。
  • 対象モジュール(Source module): データをモニタしているモジュールを設定します。グループの指定はフィルタリングに便利です。エージェントとモジュールを選択する必要があります。
  • 間隔(Interval) (拡張オプション): データを取得する秒間隔を指定します (異常検出ではなく、数値予測で利用できます)。

以下の例では、Googleという名前で作成したエージェントから、Host Latency というモジュールを選択しています。これらは、Google エージェントのデータです。



Dido.jpg



また、2つのモジュールのある時点のデータは、以下の通りです。



Dido1.jpg



Latency データを確認するには、Raw DataD をクリックすることにより最新の値が表示されます。



Dido2.jpg



あまり多くのデータはありませんが、この場合、13 から 15秒の間のデータが見られます。この範囲からはずれると、予測モジュールは警告をあげます。予測が動作するためには、少なくとも 1週間のデータ必要です。

次に、モジュールがどのように動作するかを説明します。

Pandora FMS の人工知能の予測サーバは、過去のデータを元にしたデータ予測を行う実装になっています (最大 30日間の 4つのリファレンスを利用します)。

予測データモデルは、Pandora FMS 1.3.x から実装しています。このモジュールは実際のデータを元にした予測データを持ちます。予測モジュールの処理はサーバで行われ、予測データのみを扱います。そのため、ニューラルネットワークおよびベイジアンネットワークをベースにした、予測を行う異なる処理エンジンの実装が非常に簡単になっています。

現在、予測には 2種類のモジュールがあります。一つは、数値予測で、時間間隔 (予測モジュールで定義される間隔) を元にしたもので、もう一つは、定義された時間間隔の 1/2 の間隔において「正常」状態からの変化を検出するものです。時間間隔が長いと、考慮する値の範囲が広くなり、予測は不正確になります。 これらのモジュールは、数値(インクリメンタル含む)モジュールと、ブーリアンモジュールとして実装されています。前者の数値予測は数値モジュールで、後者の状態変化はブーリアンモジュールです。

予測を動作させるためには、少なくとも一週間のデータが必要です。逆に、そのデータが無いと予測ができません。予測は、t1、t2、t3、t4 という 4つの特定の間隔における平均値の計算によって行われます。t1 は 1週間前の値、t2 は 2週間前の値で、t3、t4も同様のルールの値となっています。

異常値判断の計算では、サンプルデータの標準偏差を計算し、実際の値が計算した標準偏差に収まるかの比較を行います。

サンプル数は調整可能です (ただし、Pandora FMS は、通常一ヶ月より古いデータは扱いません)。

予測に不可欠なパラメータは、モジュールの拡張オプションで設定する、それの間隔 (Interval) です。



Riro.jpg



その他の拡張オプションフィールドは、他のモジュールと同じです。

Netflow モニタリング

これは、予測サーバの特別なモニタリングケースで、エンタープライズ版にのみある機能です。

Netflow モジュールは、Netflow フィルターで定義されたパターンの間隔の平均トラフィックを計算します。平均は、bps で計算されます。

最初にフィルターを定義します。例えば、10分ごとにウェブのトラフィックを返すモジュールを設定するには、リソース(Resources) > Netflow > フィルタ(Filters) (以前のバージョンでは システム管理 > Netflow)をクリックし、次の設定でフィルタを作成します。



Netflow module filter.png



Aggregated by および Output format は、Netflow のグラフにのみ影響し、モジュール自体には影響しないという点に注意してください。

そして、'リソース(Resources)' と 'エージェント管理(Manage agents)' でモジュールを作成します。エージェントを選択しモジュールをクリックしてください。



Netflow module edit.png



予測サーバモジュールの新規作成(Create a new prediction server module) を選択し、作成(Create) をクリックします。



Netflow module create.png



最後にソースとして Netflow を設定します。また間隔を 600秒(10分)に設定します。



Netflow module.png



Pandora FMS ドキュメント一覧に戻る