Pandora: Documentation ja: Virtual environment monitoring

From Pandora FMS Wiki
Jump to: navigation, search

Pandora FMS ドキュメント一覧に戻る

Contents

1 仮想環境モニタリング

1.1 Amazon EC2

ここでは、Amazon EC2 のインスタンスをモニタリングするために CloudWatch API を利用します。インスタンスにおいて、cloudwatch を有効にする必要があります。pandorafms.com のモジュールライブラリに、フリーのプラグインがあります。(EC2 で検索)

このリモートサーバプラグインの基本的な考え方は、ネットワークプラグインサーバを使ってインスタンスから情報を取得するものです。つまり、サーバにプラグインを登録し、EC2 サーバの情報を異なるモジュールとして取得します。

以下に実行例を示します。

/home/slerena/ec2_plugin.sh -A AKIAILTVCAS26GTKLD4A -S CgmQ6DxUWES05txju+alJLoM57acDudHogkLotWk -i i-9d0b4af1 -n AWS/EC2 -m CPUUtilization

これは、インスタンス i-9d0b4af1 において、"CPUUtilization" の値を返します。

インストールは次のようにします。

  1. JAVA が動作するようにし、JAVA のホームディレクトリを設定します。Pandora FMS アプライアンス(Vmwareイメージ)では、/usr/ です。
  2. プラグインを上記ディレクトリにコピーし、パーミッションを 755 にします。また、プラグインの最初の行に定義されている AWS_CLOUDWATCH_HOME 変数を設定します。プラグインの最初の行を編集する必要があります。

プラグインには、いくつかのファイルがあります。

/ec2_plugin.sh - プラグイン本体です。 /bin/* - Amazon CloudWatch (モニタリング) コマンドラインツールのコンポーネントで、プラグインの配布ファイルに含まれています。このスクリプトは、Apache ライセンスに基づいて配布されています。

全てのファイルをサーバに展開します。例えば以下の場所です。

/usr/share/pandora_server/plugin/ec2 

そして、AWS_CLOUDWATCH_HOME を /usr/share/pandora_server/plugin/ec2 に設定します。

正しくインストールできたか確認するには、以下のコマンドを実行します。

/usr/share/pandora_server/plugin/ec2/mon-cmd --version 

以下のように表示されます。

Amazon CloudWatch CLI version 1.0.9.5 (API 2010-08-01) 

同様に表示されれば、プラグインは利用可能です。

そうでなければ、おそらく、Amazon CloudWatch (モニタリング) コマンドラインツールのインストールと設定が必要です。以下のステップを実行してください。


1.1.1 インストール

手順:

  1. システムに、JAVA のバージョン 1.5 もしくはそれ以上がインストールされている必要があります。(java -version)
  2. zip ファイルを展開します。
  3. 以下の環境変数を設定します。
    • AWS_CLOUDWATCH_HOME - ファイルを展開したディレクトリです。確認は以下のようにします。
      Unix: ls ${AWS_CLOUDWATCH_HOME}/bin で、mon-list-metrics ... が表示されます。)
      Windows: dir %AWS_CLOUDWATCH_HOME%\bin で、mon-list-metrics ... が表示されます。)
    • JAVA_HOME - Java をインストールしたホームディレクトリです。
    • パスに、${AWS_CLOUDWATCH_HOME}/bin (Windows の場合は %AWS_CLOUDWATCH_HOME%\bin) を追加します。

1.1.2 設定

AWS ユーザ権限でコマンドラインツールを利用できるようにします。権限を与えるには 2つの方法があります。

  1. AWS キーの利用
  2. X.509 証明書の利用

1.1.3 AWS キーの利用

1. 認証ファイルを作成します。テンプレートファイルが、${AWS_CLOUDWATCH_HOME}/credential-file-path.template にあります。

  1. . あなたの情報を追加するために、このファイルのコピーを編集します。
  2. . UNIX では、認証ファイルのオーナーにパーミッションを限定します。$ chmod 600 <上記で作成したファイル>

2. あなたの認証情報を設定するにはいくつかの方法があります。

  1. . 次の環境変数を設定します。AWS_CREDENTIAL_FILE=<1で作成したファイル>
  2. . 違う方法としては、それぞれのコマンド実行に次のようなオプションを設定します。--aws-credential-file <1で作成したファイル>
  3. . コマンドラインで明示的に認証情報を指定します。--I ACCESS_KEY --S SECRET_KEY

1.1.4 X.509 Certs の利用

1. 公開鍵と秘密鍵をファイルに保存します。例えば、my-cert.pem および1 my-pk.pem

2. コマンドラインツールに認証情報を提供するには 2種類の方法があります。

  1. . 次の環境変数を設定します。
       EC2_CERT=/path/to/cert/file
       EC2_PRIVATE_KEY=/path/to/key/file
  1. . 各コマンドのコマンドラインでファイルを指定します。
       <コマンド> --ec2-cert-file-path=/path/to/cert/file --ec2-private-key-file-path=/path/to/key/file

1.1.5 カスタム JVM プロパティの設定

環境変数 SERVICE_JVM_ARGS を設定することにより、コマンドラインに任意の JVM プロパティを渡すことができます。例えば、以下では Linux/UNIX においてプロキシサーバのプロパティを設定します。export SERVICE_JVM_ARGS="-Dhttp.proxyHost=http://my.proxy.com -Dhttp.proxyPort=8080"

1.1.6 実行

1. 設定が正しくできたか確認するために、次のコマンドを実行します。

  $ mon-cmd --help

全てのモニタリングコマンドで利用方法を表示します。

  $ mon-list-metrics --headers

ヘッダーが表示されます。何らかの特別な定義をしていたなら、それも確認してください。

1.2 VMware

IT アーキテクチャにとって仮想環境はとても重要です。そのため、これらの環境を監視することは、あなたの会社のシステムの適切なパフォーマンスを確認するために必要です。Pandora FMS Enterprise では VMware Monitoring Plugin を利用でき、VMware アーキテクチャを簡単に操作することができます。

1.2.1 モニタする WMware アーキテクチャ

このシステムでは、以下のようなアーキテクチャをモニタすることができます。



Esq arq vmware.png



Pandora FMS は、ESXi サーバ、データストアおよび、仮想マシンを監視します。Pandora FMS は、データ収集のために VMware が提供する Web API を利用します。

1.2.2 VMware モニタリングプラグインを利用したモニタリング

WMware のモニタリング環境は、以下のいくつかのコンポーネントをベースにしています。

  1. エージェントプラグインは、対象となる環境のすべてのエンティティを検出し監視する情報を収集します。Pandora FMS 5.0 またはそれ以上のバージョンでは、プラグインは拡張が必要とするいくつかのエージェントのパラメータも更新できます。さらに、VMware vCenter からのイベントを Pandora FMS コンソールにコピーできます。
  2. Pandora FMS 4.0.3 およびそれ以前のバージョンにおいては、自動検出タスク が拡張が必要とするパラメータを更新します。また、VMware vCenter からのイベントを Pandora コンソールへコピーします。
  3. VMware View および VMware Manager 拡張は、仮想マシンを簡単に管理したり全体の環境を参照できるようにします。

このシステムでは、データセンターのエージェントと同様に、ESXi ホスト、データストアや検出した仮想マシンをリモートエージェントとして扱います。これらは仮想システム内の関係を考慮する必要なく、独0立して管理することが可能です。また、それぞれのエージェントには、VMware のエンティティのタイプに応じたモジュールが設定されます。

1.2.2.1 プラグインの内部処理

バージョン 5.0 またはそれ以降では、エージェントプラグインは、エンティティの検出、データ収集、イベントコピー、カスタムフィールド設定の、全機能を実行します。

それぞれ検出されたエンティティごとに、プラグインは処理のための XML ファイルを Pandora サーバへ送ります。このエンティティは、Pandora 内ではエージェントになります。コンソールにコピーされたイベントは、イベントビューに表示され、システムから生成されたイベントとして管理されます。

プラグインには、監視の設定に関連するいくつかの補助ファイルや情報があります。ログ、監視対象エンティティ、イベント監視のポインタなどです。

Template warning.png

監視性能に影響を与える可能性があるため、これらのファイルは削除してはいけません。

 


1.2.3 プラグインの要件

VMware プラグインが適切に機能するための要件は次の通りです。

  • Pandora FMS 4.0.3 またはそれ以上。 (拡張は、Pandora FMS 4.0.3 Patch 130310 以降で動作します)
  • Pandora FMS エージェントがインストールされている必要があります。
  • Linux / Unix または Windows システム。
  • Curl コマンド。 (バージョン 5.0 以上の Pandora FMS Windows エージェントには、curl コマンドが組み込まれています)
  • Ping コマンドが必要です。
  • Perl 用 VMware SDK がインストールされている必要があります。

注意: プラグインの最新バージョンでは、curl は perl-LWP に置き換えられています。

1.2.4 監視のための vCenter 設定

プラグインは、vCenter パフォーマンカウンタを利用します。パフォーマンスカウンターの収集データは、vCenter で設定した収集レベルに依存します。

これらのレベルは、Statistics オプションの vCenter Server Settings メニューにて変更できます。vCenter で、それぞれの時間オプションとレベルで、どのカウンタを収集するかを参照することができます。Pandora FMS モニタリングプラグインが利用する最低レベルは Level 2 です。



Niveles vmware.png



vCenter の設定によっては、いくつかのモジュールは、Pandora FMS へデータを送信しません。 それには、以下の 3つの理由があります。

  • vCenter 内でプラグインに問題がある
  • エンティティに VMware エージェントがインストールされている必要がある
  • エンティティ(または ESXi の仮想マシン)が単に電源 off 状態

これらの問題可決には、VMware のドキュメントを確認してください。

ハードウエア状態監視などのようないくつかの解決には、vCenter および ESX がサポートするホストの両方の設定が必要になるかもしれません。

1.2.5 Perl 用 VMware vSphere SDK のインストール

VMware ソフトウエアは、ダウンロードセンターからダウンロードできます。

http://communities.vmware.com/community/developer/downloads

1.2.5.1 openSUSE 12.2 での SDK のインストール

Info.png

この手順は、SDK バージョン 4.1 および 5.1 でテストしています

 


Template warning.png

VMware バージョン 4.1 では、SDK 4.1 を利用する必要があります。VMware バージョン 5.1 では、SDK 5.1 を利用する必要があります。

 


最初に、次のコマンドで SDK パッケージを展開します。

# tar -xzvf VMware-vSphere-Perl-SDK-x.x.x-xxxxxx.i386.tar.gz

その後、次のコマンドで SDK をコンパイルし、インストールします。

# perl Makefile.PL
# make
# make install

SDK のインストールが成功しエラーが表示されなければ、次のコマンドで vCenter に接続することができます。

# /usr/lib/vmware-viperl/apps/general/connect.pl --server <vcenter_ip> --username <vcenter_user> --password <vcenter_pass>

コマンドの実行結果は次のようになります。

Connection Successful
Server Time : 2013-02-21T16:24:05.213672Z

1.2.5.2 Windows での SDK 設定

The version of Perl shipped with the vSphere SDK does not work with VMware's PERL libraries. To fix this issue follow these steps:

  • Install the VMware vSphere SDK.
  • Install Strawberry PERL version 5.12 from http://strawberryperl.com/releases.html.
  • Copy the directory C:\Program Files\VMware\VMware vSphere CLI\Perl\lib\VMware to C:\strawberry\perl\lib.
  • Uninstall the VMware vSphere SDK.

1.2.6 VMware 設定拡張によるプラグインのインストール


Info.png

この拡張は、バージョン 5.1 の Enterprise 版 ISO イメージではデフォルトでインストールされています。

 


VMware 設定拡張により、Pandora FMS コンソールから直接 VMware プラグインを設定することができます。 この拡張は、'システム管理(Administration)' -> '設定(Setup)' および 'VMware' にあります。

その中で、プラグインのパス、設定ファイルパスおよび、'V-Center IP'、データセンター名、'username'、'password' のパラメータ、プラグイン実行タイミングを設定できます。



Vmware settings.png



プラグインの実行は、5分、10分、15分などの間隔での Cron ジョブのとして追加されます。Pandora FMS の cron 拡張の実行には、'/etc/crontab' に次の設定が必要です。

*/1 * * * * root wget -q -O - http//localhost/pandora_console/enterprise/extensions/cron/cron.php >> /var/www/html/pandora_console/pandora_console.log



Template warning.png

この拡張は Pandora FMS 5.1 のインストールと、Pandora FMS cron ジョブが 1分間隔で実行されるように設定されている必要があります。これらの条件を満たさないと、拡張は正しく動作しません。

 


プラグインの設定後は、次のような内容で cron ジョブ内に新たなタスクが追加されています。



500px‎



Template warning.png

この特別な cron ジョブは、VMware 設定(VMware Settings)拡張からのみ設定できます。他の場所での変更や cron ジョブのツールでの変更は、プラグインの誤動作を引き起こします。

 


1.2.7 プラグインの手動インストール

1. VMware プラグインファイルを展開したディレクトリへ行きます。

2. extensions を pandora_console/enterprise/extensions/ へコピーします。

sudo -u apache cp -R extensions/vmware* /var/www/html/pandora_console/enterprise/extensions/

3. vmware-plugin.{pl,conf} を適切なディレクトリへコピーします。

sudo cp vmware-plugin.pl vmware-plugin.conf /usr/share/pandora_server/util/plugin/
sudo chown pandora:apache /usr/share/pandora_server/util/plugin/vmware-plugin.{pl,conf}
sudo chmod g+w /usr/share/pandora_server/util/plugin/vmware-plugin.conf


4. vmware-plugin.conf を編集します。

tentacle_ip: IP address of monitoring server    
pandora_url: "http://127.0.0.1/pandora_console" 
server: IP address of vCenter              
datacenter: Center Name                   
user: account for vCenter                
pass: password for vCenter               

server, datacenter, user, pass は、Pandora コンソールで設定できます。

5. Pandora コンソールの "設定" 画面へ行き、API パスワードを設定します。

例:

APIパスワード: 1234

6. vmware-plugin.{pl,conf} を Pandora エージェント用にコピーします。

sudo cp /usr/share/pandora_server/util/plugin/vmware-plugin.{pl,conf} /etc/pandora/plugins/

tar ファイルには vmware-plugin-events.conf はありませんが、vmware-plugin.conf をコピーし 'event_mode' を 1 に編集することで作成できます。

1.2.8 エージェントプラグインの設定と確認

プラグインエージェントをインストールするには、'vmware-plugin.pl' と 'vmware-plugin.conf' ファイルを '/etc/pandora/plugins' ディレクトリに次のようにコピーします。

cp vmware-plugin.pl vmware-plugin.conf /etc/pandora/plugins

そして、次のように、新たなモジュールプラグインをエージェント設定ファイルに追加します。

module_plugin /etc/pandora/plugins/vmware-plugin.pl /etc/pandora/plugins/vmware-plugin.conf

イベントもコピーしたい場合は、異なる設定ファイルでイベントコピーを有効にする別のプラグインモジュールを作成します。コマンドは次のようになります。

module_plugin /etc/pandora/plugins/vmware-plugin.pl /etc/pandora/plugins/vmware-plugin-events.conf

Windows システムでは、利用するインタープリターを指定する必要があります。例えば、次のようにします。

module_plugin perl "C:\Program Files\pandora_agent\util\vmware-plugin.pl" "C:\Program Files\pandora_agent\util\vmware-plugin.conf"

以降の章では、プラグイン設定のパラメータ詳細について説明します。

Template warning.png

VMware プラグインは重い SOAP API を使うため、タスクの実行に時間がかかります。監視項目が大量にあるシステムでは、複数の Pandora FMS エージェントで負荷分散する必要があります。関連する情報は、以降の章で説明します。

 


Info.png

Pandora FMS 5.0 またはそれ以上のバージョンを利用し、プラグイン拡張やイベント監視を意図している場合は、Pandora API を正しく設定する必要があります。API パスワードとアクセス許可リストを正しく設定する必要があります。これらの設定は、Pandora FMS コンソールの全体の設定にあります。

 


1.2.9 VMware 仮想アーキテクチャのモニタリング

プラグインの実行結果を見るには、'モニタリング(Monitoring)' -> 'エージェント詳細(Agent Detail)' へ行きます。



Menu monitoring.png



以下では、他の Pandora FMS エージェントと一緒にプラグインにより作成されたエージェントが表示されます。

Vmware agent detail.jpg



エージェント名をクリックすると、Pandroa FMS エージェント表示で VMware プラグインで監視されているモジュールを見ることができます。



Agent detail screen.jpg



デフォルトでは、プラグインは各 VMware の要素ごとに基本的な監視項目を表示します。これらのデフォルトのエンティティ設定を以降に示します。

1.2.9.1 データセンターのデフォルトモジュール

  • Ping
  • Check 443 port

1.2.9.2 データストアのデフォルトモジュール

  • Capacity
  • Free Space
  • Disk Overallocation
  • Free Space Bytes

1.2.9.3 ESXi のデフォルトモジュール

  • CPU Usage
  • Memory Usage
  • Data received
  • Data transmitted
  • Disk Read Latency
  • Disk Write Latency
  • Host Alive

1.2.9.4 仮想マシンのデフォルトモジュール

  • CPU Usage
  • Memory Usage
  • Tools Running Status
  • Host Alive
  • Disk Free
  • Disk Read Latency
  • Disk Write Latency
  • Data received
  • Data transmitted


以降の章では、それぞれのモジュールの情報の詳細について説明します。

1.2.10 VMware 仮想アーキテクチャエージェントモジュール

VMware のバージョンおよび環境設定により、いくつかのモジュールが存在しない場合もあります。以下に示す表では、存在するモージュールとその機能を説明します。

Info.png

プラグインは、' ESX ホストおよび仮想マシンのパフォーマンスカウンタ' の設定をすることができます。その方法については、設定ファイルの説明の章にて説明しています。

 


1.2.10.1 データセンターモジュール

モジュール 説明 API バージョン 存在性
Ping vCenter をサポートするマシンに対して ping の監視をします すべて 常時
Check 443 port vCenter をサポートするマシンに対して 443 番ポートの応答を監視します すべて 常時

1.2.10.2 データストアエージェントモジュール

モジュール 説明 API バージョン 存在性
Capacity バイト単位のデータストアの最大容量 すべて 常時
Free Space データストアの空き率 すべて 常時
Disk Overallocation ディスクのオーバーロケーション率 ≥v4.0 常時
Free Space Bytes バイト単位での空き容量 すべて 常時

1.2.10.3 ESXi ホストエージェントモジュール

モジュール 説明 API バージョン 存在性
Boot Time ホストが起動した時間 すべて 常時
CPU Info [x] CPU の一般情報 (ESXi CPU ごとに一つのモジュールです) すべて 接続されている場合
Memory Size バイト単位でのホストの物理メモリ容量 すべて 接続されている場合
Overall CPU Usage Mhz 単位での全 CPU の利用状況 すべて 接続されている場合
Overall Memory Usage MB 単位でのホストでの利用物理メモリ量 すべて 接続されている場合
Power State ホストの電源状態 ≥v2.5 常時
SSL Thumbprint ホストの SSL print ≥v4.0 接続されている場合
Uptime 秒単位でのホストの uptime ≥v4.1 接続されている場合
VNIC Info [x] ホストの仮想ネットワークインタフェースの情報 すべて 接続され、設定されている場合
Host Alive ESX が接続されている場合に 1、そうでない場合に 0 になるキープアライブモジュール すべて 常時
Connection State ホストの接続状態 すべて 常時
Disk Read Kbps 単位でのディスクの読み出し速度 すべて 状態レベルが ≥2 の場合
Disk Write Kbps 単位でのディスクの書き込み速度 すべて 状態レベルが ≥2 の場合
Disk Read Latency ミリ秒単位でのディスク読み出し遅延 すべて 状態レベルが ≥2 の場合
Disk Write Latency ミリ秒単位でのディスク書き込み遅延 すべて 状態レベルが ≥2 の場合
Data received Kbps 単位でのホストが受け取ったデータ量 すべて 状態レベルが ≥2 の場合
Data transmitted Kbps 単位でのホストが送信したデータ量 すべて 状態レベルが ≥2 の場合
Packages Received 一定間隔内で受け取ったパケット数 すべて 状態レベルが ≥2 の場合
Packages Transmitted 一定間隔内で送信したパケット数 すべて 状態レベルが ≥2 の場合
CPU Usage CPU 利用率(%) すべて 状態レベルが ≥2 の場合
Memory Usage メモリ利用率(%) すべて 状態レベルが ≥2 の場合
Net Usage 全 NIC での送受信データ量 すべて 状態レベルが ≥2 の場合
Disk Rate KB/sec 単位でのトータル I/O 量 すべて 状態レベルが ≥2 の場合
Max. Disk Latency 全ディスクの最大遅延 すべて 状態レベルが ≥2 の場合
HA Status ホストの HA 状態 ≥v5.0 設定されている場合
Sensor* ハードウエアセンサーの状態 (sensor ごとに一つのモジュールです) すべて ESXi >= 3.5

1.2.10.4 仮想マシンエージェントモジュール

これらのモジュールは、VMware アーキテクチャ視点からの情報を提供します。仮想マシンに関する他のパラメータをモニタしたい場合は、ソフトウエアエージェントを使ったモニタリングリモートモニタリングに示した手法を考慮する必要があります。



モジュール 説明 API バージョン 存在性
Boot Time 仮想マシンが起動した時間 すべて 接続されている場合
Connection State 接続状態 すべて 常時
Consumed Overhead Memory MB 単位での仮想マシンが利用するメモリ量 ≥v4.0 接続されている場合
CPU Allocation 仮想マシンの CPU に割り当てられているリソースに関する情報 すべて 接続されている場合
Disk Free [x] 仮想マシンのディスク空き率(%) (仮想マシンのディスクごとに一つのモジュールになります) すべて 接続されている場合
Guest State ホストOSの動作状況 すべて 接続されている場合
Host Info VMware ホストに関する情報 すべて 設定されている場合
Host Alive 仮想マシンが実行されている場合は 1、そうでなければ 0 を返す、キープアライブモジュール すべて 常時
Host Memory Usage MB 単位での仮想マシンが利用しているメモリ量 すべて 接続されている場合
Host Name ホスト OS の名前 すべて 設定されている場合
IP Address [x] システムの IP アドレス (ネットワークインタフェースごとに 1つです) ≥v4.1 設定されている場合
MAC Address [x] システムの MAC アドレス (ネットワークインタフェースごとに 1つです) すべて 設定されている場合
Max CPU Usage 仮想マシンの CPU 使用率最大上限値 すべて 設定されている場合
Max Memory Usage 仮想マシンのメモリ使用率最大上限値 すべて 設定されている場合
Memory Allocation メモリのリソース制限 すべて 設定されている場合
Memory Overhead バイト単位での、ホストのメモリを超えて仮想マシンが使っているメモリ量 すべて 設定されている場合
Overall CPU Demand Mhz 単位での CPU パフォーマンスの基本統計情報 ≥v4.0 接続されている場合
Overall CPU Usage Mhz 単位での CPU 使用率の基本統計情報 すべて 接続されている場合
Power State 仮想マシンの現在の電源状態 すべて 常時
Private Memory MB 単位の共有せずに仮想マシンに割り当てられているメモリ容量 ≥v4.0 接続されている場合
Shared Memory MB 単位の共有して仮想マシンに割り当てられているメモリ容量 ≥v4.0 接続されている場合
Tools Running Status ホスト OS にインストールされている VMWare Tools の実行状況 ≥v4.0 設定されている場合
Trigger Alarm State VMware アラームの状態 すべて 設定されている場合
Uptime Seconds 秒単位での仮想マシンの uptime ≥v4.1 接続されている場合
Virtual Image Path 仮想マシンの設定ファイル(.vmx)パス すべて 常時
Disk Read Kbps 単位でのディスク読み出し速度 すべて 状態レベルが ≥2 の場合
Disk Write Kbps 単位でのディスク書き込み速度 すべて 状態レベルが ≥2 の場合
Disk Read Latency ミリ秒単位でのディスク読み出し遅延 すべて 状態レベルが ≥2 の場合
Disk Write Latency ミリ秒単位でのディスク書き込み遅延 すべて 状態レベルが ≥2 の場合
Data received Kbps 単位でのホストが受け取ったデータ すべて 状態レベルが ≥2 の場合
Data transmitted Kbps 単位でのホストが送信したデータ すべて 状態レベルが ≥2 の場合
Packages Received 一定間隔において受け取ったパケット数 すべて 状態レベルが ≥2 の場合
Packages Transmitted 一定時間において送信したパケット数 すべて 状態レベルが ≥2 の場合
CPU Usage CPU 利用率(%) すべて 状態レベルが ≥2 の場合
Memory Usage メモリ使用率(%) すべて 状態レベルが ≥2 の場合
Net Usage すべてのNICでの送受信データ量 すべて 状態レベルが ≥2 の場合
Disk Rate KB/sec 単位での全ディスク I/O 量 すべて 状態レベルが ≥2 の場合
Max. Disk Latency 全ディスクにおける最大遅延 すべて 状態レベルが ≥2 の場合
HeartBeat 仮想マシン heartbeat の数 すべて 状態レベルが ≥2 の場合
CPU Ready マシンの準備ができていて物理 CPU のスケジューリングができなかった時間の割合 すべて 状態レベルが ≥2 の場合
Number Snapshots 仮想マシンのスナップショット数 (このモジュールは監視のパフォーマンスに影響します。 そのため、1時間ごとなど実行間隔をあけることを強くお勧めします。) すべて 設定されている場合
HA Status 仮想マシンの HA 状態 ≥v5.0 設定されている場合

Template warning.png

いくつかのモジュールは、VMware tools のインストールが必要です。

 


1.2.11 VMware のイベント監視

この機能は、VMWare vCenter から Pandora FMS へイベント情報をコピーするために作成されました。

これらのイベントは、Pandora FMS イベント管理フローにのっとり、自動的に vCenter エージェントに割り当てられます。次の画面は、自動検出タスクで生成されたイベントの例です。



Evnetos vmware plugin.png



コピー処理は、VMware が生成したイベントの情報や重要度を引き継ぎます。イベントにおける、障害、警告、情報といった重要度のレベルを Pandora に渡します。次の画面は Pandora FMS での詳細情報の例です。



Detalle evento vmware plugin.png



Pandora FMS でのすべてのイベントは、イベント管理のアクションを実行できます。たとえば、アラーと生成、フィルタ設定、インシデント作成などです。

1.2.12 VMware 仮想アーキテクチャの管理と表示

VMWare プラグインと一緒に、VMware Manager および VMware View という 2つの拡張を配布しています。VMware View は、VMware アーキテクチャのコンポーネントを簡単に表示することができます。また、VMware Manager は、Pandora FMS コンソールから仮想マシンの停止、起動、再起動、稼働の中止など、仮想マシンを管理することができます。これらの拡張は、Pandora FMS 4.0 以降でのみ動作するオプションです。

バージョン 4.1 以降のプラグインから、これらの拡張は一つにまとめられました。拡張は VMware Settings と呼びます。この新しい拡張は、Pandora FMS 5.1 以降でサポートされています。

1.2.12.1 VMware View 拡張の利用

VMware アーキテクチャ表示を使うには、エージェント参照の VMware View をクリックします。



Vmware view menu.png



VMware View 拡張は、自動検出タスクで見つけた全 VMware アーキテクチャを含んだ以下のようなマップを表示します。



Vmware view map.png



マップには、VMware アーキテクチャの要素(仮想マシン、ESX、データストアおよび、データセンター)が、それぞれを区別できる異なるアイコンで表示されています。また、Pandora FMS エージェントの状態がそれぞれの要素の状態を表します。さらに、仮想マシン、ESX および データセンター間の関係を表示しています。これにより、簡単にすばやく VMware アーキテクチャの状態を見ることができます。

この拡張には、要素を隠したり、文字を大きくしたり、要素を拡大したりといった、アーキテクチャの表示の改善を手助けしてくれるいくつかのオプションがあります。



Vmware view map options.png



上記のオプションを使って、フォントサイズ 14、2倍のズームで、データセンターと ESX だけを見ることができます。



Vmware view map options example.png



1.2.12.2 VMware 設定拡張の利用

VMware 設定拡張により、Pandora FMS コンソールから VMware プラグイン実行ディレクトリを設定することができます。 この拡張は、'システム管理(Administration)' -> '設定(Setup)' および 'VMware' にあります。

ここでは、プラグインのパス、設定ファイルパスおよび、vCenter の IP、データセンターの名前、ユーザ名、パスワードのパラメータ、ランタイムプラグインを設定できます。



Vmware settings.png



プラグインの実行は、5,10,15分ごとに実行される新たな Cron ジョブとして追加されます。Pandora FMS cron 拡張の実行には、次に示す設定を '/etc/crontab' ファイルに追加する必要があります。

*/1 * * * * root wget -q -O http//localhost/pandora_console/enterprise/extensions/cron/cron.php >> /var/www/html/pandora_console/pandora_console.log



Template warning.png

この拡張は、1分間隔で設定された Pandora FMS cron ジョブの実装のために、Pandora FMS 5.1 のインストールが必要です。この条件を満たさないと、拡張は正しく動作しません

 





プラグイン設定後、次のような設定で cron ジョブに新たなタスクが追加されます。



Vmware cron.png



Template warning.png

この特別な cron ジョブは、VMware 設定拡張からのみ設定できます。別の場所やツールからの cron ジョブの変更は、プラグインの誤動作の原因となります。

 


1.2.12.3 VMware ビューダッシュボード (バージョン 5.0 以上)

Pandora FMS バージョン 5.0 以上では、VMware ビュー拡張により、仮想アーキテクチャトポロジを表示する 2つの追加マップビューがあります。新たなタブでは、VMware ビュー拡張の異なる表示を切り替えることができます。

Vmware tabs 50.png



最初のビューは、一目で、仮想マシン、データストアや、ESXi ホスト問題が発生しているかをわかるようにした、一般的な仮想アーキテクチャを表示するダッシュボードです。さらに、グラフにより仮想アーキテクチャ全体の中で、5つの仮想マシンが使っている、メモリ、CPU、ディスク、ネットワークがわかります。一般的なパフォーマンスパラメータも簡単に確認することができます。

Vmware general dashboard.png



2つ目のビューでは、ESX ホストのパフォーマンスパラメータを確認することができます。このビューでは、ホストおよび仮想マシンの状態を確認したい ESX ホストを選択することができます。ESXi ホストにおける CPU、メモリ、ディスク、ネットワーク利用状況が表示されます。さらに、仮想マシンのほとんどのリソース情報 (CPU、メモリ、ディスク、ネットワーク) もグラフィカルに参照することができます。

Vmware esx detail dashboard.png



1.2.12.4 VMware Manager 拡張の利用

VMware Manager 拡張を利用するには、VMware アーキテクチャ内の仮想マシンエージェントの操作画面へ行きます。そこに、拡張にリンクした VMware のアイコンがあります。



Vmware manager icon.png



VMware Manager 拡張では、仮想マシンを Pandora FMS コンソールから管理できます。拡張は仮想マシンの現在の状態を色で表示(緑=on、オレンジ=off、グレー=停止中)します。さらにコンボボックスにとりうる状態が表示され、選択して Change Status ボタンをクリックすることにより仮想マシンの状態を変更することができます。



Vmware manager options.png



この拡張で、次のように Stop を選択することにより仮想マシンを停止することができます。



Vmware manager example stop.png



これによりマシンが停止し、VMware Manage 拡張での表示が変ります。次のようにマシンが停止状態であると表示されます。



Vmware manager example stopped.png



Template warning.png

この拡張を利用するには、Pandora を動作させるのと同じマシンに Perl 用 VMware SDK がインストールされている必要があります。 Perl 用 VMware SDK がインストールされていないと拡張は動きません。

 


1.2.13 プラグインの設定

デフォルトでは、VMware 自動検出スクリプトは前述の通り見つけたもの全てを追加します。追加したいものとしたくないものを選択するには、自動検出スクリプトが設定ファイルを読み込むようにします。自動検出スクリプトに設定ファイルを与えるには、Pandora FMS で作成された設定に -reconconf <ファイル> というパラメータを追加します。

Info.png

設定ファイルに関する全エラーは、Pandora サーバのエラーログに出力され、かつ、Pandora のイベントビューワに表示されます。これらから設定ファイルに何らかの問題があるかどうかを確認できます。

 


1.2.13.1 設定ファイル

1.2.13.1.1 全体設定

全般的な設定は、Configuration トークンで定義します。次のようなパラメータがあります。

  • server: vCenter の IP アドレス。
  • user: vCenter ユーザ。
  • pass: vCenter パスワード。
  • datacenter: 監視するデータセンター。
  • temporal: テンポラリディレクトリ。
  • logfile: ログファイルの場所。
  • entities_list: 監視対象エンティティ一覧のファイルの場所。
  • transfer_mode: XML の転送モード。tentacle または local が指定できます。
    • tentacle: Pandora FMS サーバへ Tentacle プロトコルを用いて XML を送信します。
    • local: ファイルをローカルのホルダにコピーします。指定したローカルホルダがあるのと同じマシンでエージェントを動かす必要があります。
  • tentacle_ip: 情報を送信する Pandora サーバの IP アドレス。
  • tentacle_port: 情報を送信する先のポート番号。デフォルトは 41121。
  • tentacle_opts: Tentacle で送信する場合の追加オプション。(デフォルトはなし)
  • local_folder: local モードの場合の XML のコピー先ディレクトリ。
  • pandora_url: Pandora FMS コンソール URL。(例: http://192.168.70.81/pandora_console).
  • api_pass: Pandora FMS API パスワード。
  • api_user: Pandora FMS コンソールユーザ。
  • api_user_pass: Pandora FMS コンソールユーザのパスワード。
  • retry_send: .data ファイルの再送の有効化(1)/無効化(0)。
  • event_mode: イベント収集モードを有効にするためのフラグ。1 の場合はイベント収集モードが有効となり、0 の場合は無効となります。
  • event_pointer_file: イベントを収集するためのポインタを保存するためのテンポラリファイルの場所。
  • verbosity: ログレベル。(0 ではプラグインの実行エラー出力を抑制し、1 ではすべてのエラーを出力します。)
  • threads: プラグインスレッドの数。(デフォルトは 1)
  • interval: VMware エンティティを表すエージェントインターバル。

このセクションの設定例を以下に示します。

Configuration
server 192.168.70.249
user Administrator
pass S1stemas
datacenter artica
temporal /tmp
logfile /tmp/vmware_plugin.log
entities_list /tmp/vmware_entities_list.txt
transfer_mode tentacle
tentacle_ip 192.168.70.81
tentacle_port 41121
tentacle_opts
local_folder /var/spool/pandora/data_in
pandora_url http://192.168.70.81/pandora_console
api_pass 1234
api_user admin
api_user_pass pandora
event_mode 0
event_pointer_file /tmp/vmware_events_pointer.txt

Info.png

Windows のプラグインを利用している場合は、パスの表記を Windows に合わせてください。

 


1.2.13.1.2 エンティティの名前変更

Rename トークンは、プラグインが見つけたエンティティの名前を変更するのに利用します。この機能を利用することにより、Pandora に作成されるエージェントが指定した新しい名前になります。このセクションの書式は次の通りです。

<現在の名前> TO <新しい名前>

設定例を以下に示します。

#Rename entities
Rename
Debian 11 TO Virtual Machine 1
RedHat 12 TO Web server 
ESX Workstation TO Host Work Sales
1.2.13.1.3 エンティティの除外

プラグインは、タイプまたは個別にエンティティを除外できます。両方のオプションを以下に説明します。

エンティティの除外には、Reject トークンを利用します。このセクションでは、タイプによってエンティティを除外します。例えば、全仮想マシンや全 ESX ホストです。ここで設定可能な値は、all_datastore, all_datacenter, all_esx, all_vm のいずれかです。

このセクションで、すべてのエンティティを除外する設定は次の通りです。

#Dismissed entities
Reject
all_datastore
all_datacenter
all_esx
all_vm

個別のエンティティを除外するには、プラグインにより作成されたエンティティファイルを削除する必要があります。プラグインは、このファイルを entities_list パラメータに示された場所 (デフォルトは /tmp/vmware_entities_list.txt) に作成します。プラグインは、検出した全エンティティのリストを書いたファイルを最初の実行時(ファイルが存在しない場合)に生成します。このファイルの例を以下に示します。

Datacenter
artica
Datastore
datastore_1
datastore2
ESX
192.168.70.252
VM
Pandora FMS 4.0.3
Debian2
Debian3
Debian4
Redhat
debian5
Debian6
Debian8
Debian7
Debian11
Debian10
Debian9
NSM
Pandora
vcenter
suse11.2

設定ファイルは、異なるエンティティがリストアップされた Datacenter, Datastore, ESX, VM といったいくつかのトークンで分かれています。設定ファイルが作成されると、プラグインは監視するエンティティを読み込みます。特定のエンティティを除外したい場合は、フォルダーからそのファイルを削除します。例えば、Debian2, datastore2, NSM, suse11.2 および 192.168.70.252 のエンティティを監視したくない場合は、設定ファイルは次のようになります。

Datacenter
artica
Datastore
datastore_1
ESX
VM
Pandora FMS 4.0.3
Debian3
Debian4
Redhat
debian5
Debian6
Debian8
Debian7
Debian11
Debian10
Debian9
Pandora
vcenter

この機能により、各プラグインの実行における監視対象のエンティティを制限し監視の負荷を分散させることができます。以下に、より詳しい負荷分散のテクニックを説明します。

1.2.13.1.4 監視設定

次のセクションは、すべてのタイプのエンティティにおいて作成されたモジュールの設定です。これらのセクションでは、Datacenter, Datastore, ESX および VM を使います。監視するモジュールの有効・無効を設定できます。以下の例は、ESX および仮想マシンのモジュールに関する設定です。

...
#ESX Modules
ESX
cpuUsagePercent disabled
diskRead enabled
diskWrite enabled

#VM Modules
VM
diskReadLatency disabled
diskWriteLatency disabled
diskRate enabled
...

各設定行がモジュールです。上記の例ではすべてのモジュールがデフォルトの値で作成されていますが、名前、説明、警告および障害状態の閾値は、設定変更することができます。この設定例を以下に示します。

...
#VM Modules
VM
diskReadLatency disabled
diskWriteLatency disabled
diskRate name = Disk Rate; desc = Lec Rate/Esc disk; limits_warn = 5 10; limits_crit = 0 4
...

モジュール設定のオプションは、次の通りです。

  • <モジュール名> disabled: モジュールは作成されません
  • <モジュール名> enabled: (デフォルト値で)モジュールが作成されます。
  • <モジュール名> name = <名前>; desc = <説明>; limits_warn <警告閾値>; limits_crit <障害閾値>: 指定した名前および説明でモジュールが作成されます。障害と警告の最大・最小閾値を定義します。

設定ファイルの行の構造を尊重することが非常に重要であり、とりわけ、 ";" 文字がモジュールの名前と説明に付加されていることが重要です。これらの 2行は 等しくないです(";" 文字の前の空白を確認してください)。

diskRate name = Disk Rate; desc = Lec Rate/Esc Disk; limits_warn = 5 10; limits_crit = 0 4
diskRate name = Disk Rate    ; desc = Lec Rate/Esc disk    ; limits_warn = 5 10; limits_crit    = 0    4

モジュールは、コマンドラインで記述する場合は、その短い名前または簡単な名前で参照されます。短い名前と長い名前のマッピングは、次の節で説明します。

上記設定例を確認してみましょう。次に示す値で作成される Disk Rate モジュールを設定しています。

* 名前: Disk Rate
* 説明: Lec Rate/Esc disk
* 警告の最小値: 5
* 警告の最大値: 10
* 障害の最小値: 0
* 障害の最大値: 4

動的に生成されるモジュールがあります。例えば、ディスクやネットワークインタフェースのモジュールです。これらのメトリックでは、プラグインは検出したそれぞれのエレメントごとにモジュールを作成します。これらのモジュールは、Pandora FMS 内で特別な名前を持ちます。例えば次の通りです。

Disk Free [0]
Disk Free [1]
Disk Free [2]
...

これらの場合、名前に動的な部分があり、%s マクロを使ってモジュール名の数値部分を置き換えることができます。動的モジュールの設定例を以下に示します。

diskfree name = Disk (% s) free space; desc = Free space for disk; limits_warn = 0 0; limits_crit = 0 0

この場合、デフォルトのモジュール名は次の通りですが、

 Free Disk [0]

次のように変更されます。

 Disk (0) free space

バージョン 5.0 からは、モジュールの警告および障害状態判断に文字列を利用することができます。次のような設定になります。

 PowerState operation name = State; desc = VM operating state; limits_warn =. * suspended. *; limits_crit =. * poweredOff. *

判定基準を定義するのに自由度の高い正規表現を利用することができます。

1.2.13.1.5 カスタムパフォーマンス測定

この節では、仮想マシンと ESX のパフォーマンスカウンタのための新たなモジュールを設定します。新たなパフォーマンスモジュールを設定するには、次の構造を利用します。

custom_performance type = mem; metric = swapinRate; module_type = generic_data; name = Swap In Rate; desc = Swap In Rate for host; limits_warn = 0 0; limits_crit = 0 0

設定パラメータは次の通りです。

  • Type: 監視するメトリックのタイプ。指定可能なタイプは次の通りです。
    • 'Cpu' CPU
    • 'Mem': メモリ
    • 'Disk': ディスク
    • 'Net' ネットワーク
    • 'Sys': システム
  • Metric: 監視するメトリック。(メトリックの表示にて後述します)
  • Module_type: Pandora のモジュールタイプ。(例 generic_data).
  • Name: モジュール名。
  • Desc: モジュールの説明。
  • Limits_warn: 警告閾値
  • Limits_crit: 障害閾値

それぞれのエンティティの Performance セクションのそれぞれのタイプに存在するメトリックを確認できます。以下では、VMware プラグインで vCenter 内より監視できるパフォーマンスメトリックを表示しています。例えば、以下の例では、ESX ホストの Performance view を表示しています。

Vmware perf view.png



タイプごとのすべてのメトリックの一覧を参照するには、Advanced ボタンをクリックし、Char オプションボタンをクリックします。以下のように、メトリックの全タイプの一覧と、それぞれのタイプのメトリックのウインドウが表示されます。

Vmware perf metrics list.png



メトリックの各タイプには、カウンタ番号(Pandoraで監視できる値)があります。値を監視するには、内部の Name を利用する必要があります。さらに、(vCenterで設定されている)状態レベルをメトリックの Collection Level と比較検索して確認する必要があります。

Vmware perf metrics counter.png



例えば、ESX ホストの CPU 使用率を見たい場合は、ESX の CPU タイプの値を探し、utilization を選択します。この場合、設定ファイルに追加する必要がある設定は、次のようになります。

custom_performance type = cpu; metric = utilization; module_type = generic_data, name = CPU Utilization, desc = CPU Utilization for ESX; limits_warn = 0 0; limits_crit = 0 0


1.2.13.2 同一エージェントでの複数データセンターの監視

エージェントに設定したそれぞれのプラグインモジュールが、データセンターを監視します。複数のデータセンターを一つの Pandora FMS ソフトウエアエージェントで監視したい場合は、次の事に注意してください。

  • 監視するそれぞれのデータセンター用に module_plugin を追加する必要があります。例えば、次の通りです。
module_plugin /etc/pandora/plugins/vmware-plugin.pl /etc/pandora/plugins/vmware-plugin-datacenter1.conf
module_plugin /etc/pandora/plugins/vmware-plugin.pl /etc/pandora/plugins/vmware-plugin-datacenter2.conf
  • それぞれの設定ファイルで、logfileentities_listevent_pointer_file パラメータを変更する必要があります。設定ファイルは次のようになります。

vmware-plugin-datacenter1.conf

 ...
 logfile / tmp/vmware_plugin_datacenter1.log
 entities_list / tmp/vmware_entities_list_datacenter1.txt
 event_pointer_file / tmp/vmware_events_pointer_datacenter1.txt
 ...

vmware-plugin-datacenter2.conf

 ...
 logfile / tmp/vmware_plugin_datacenter2.log
 entities_list / tmp/vmware_entities_list_datacenter2.txt
 event_pointer_file / tmp/vmware_events_pointer_datacenter2.txt
 ...
  • また、イベントをコピーしたい場合は、2つ以上のプラグインモジュールを設定ファイルに追加し、event_mode フラグを有効にします。module_plugin の設定は次のようになります。
module_plugin /etc/pandora/plugins/vmware-plugin.pl /etc/pandora/plugins/vmware-plugin-datacenter1.conf
module_plugin /etc/pandora/plugins/vmware-plugin.pl /etc/pandora/plugins/vmware-plugin-datacenter1-events.conf
module_plugin /etc/pandora/plugins/vmware-plugin.pl /etc/pandora/plugins/vmware-plugin-datacenter2.conf
module_plugin /etc/pandora/plugins/vmware-plugin.pl /etc/pandora/plugins/vmware-plugin-datacenter2-events.conf

1.2.13.3 複数の Pandora サーバ間での監視の負荷分散

プラグイン設定ファイルのオプションで、Pandora FMS サーバ間で監視の負荷分散ができます。

たとえば、仮想環境が次のような構成だとします。

DC
|
|- Datastore_1
|- DataStore_2
|
|- ESX_1
      |- mv1.1
      |- mv1.2
      |- mv1.3

|- ESX_2
      |- mv2.1
      |- mv2.2
      |- mv2.3

この環境において、監視のための 2つの Pandora FMS サーバがあります。負荷を分散する簡単な方法としては、データセンター、データストア、ESX を 1台目のサーバで監視し、仮想サーバを 2台目のサーバで監視します。自動検出スクリプトの設定ファイルは、次のようになります。

サーバ 1:

Reject
all_vm

サーバ 2:

Reject
all_datacenter
all_datastore
all_esx

サーバ 1 は、仮想マシン以外のすべてを監視し、サーバ 2 は、仮想マシンのみを監視します。

他の分散方法としては、ESX サーバごとに監視を分ける方法です。1台目の Pandora サーバが、1台目の ESX サーバに関するすべてを監視し、2台目が 2台目の ESX を監視します。設定ファイルは次のようになります。

サーバ 1:

Datacenter
DC
Datastore
Datastore_1
ESX
ESX_1
VM
mv1.1
mv1.2
mv1.3

サーバ 1 は、2つ目の VMware グループに関連するすべてを無視します。それにより、1つ目の環境のみ監視します。

サーバ 2:

Datastore
DataStore_2
ESX
ESX_2
VM
mv2.1
mv2.2
mv2.3

サーバ 2 は、1つ目の VMware グループに関連するすべてとデータセンターを無視します。データセンターは、サーバ 1 で監視されるエンティティのためです。

エンティティを対象外にする機能はとても柔軟で、それぞれの Pandora FMS エージェントに少ないエンティティを割り当てることにより、負荷を分散することができます。

1.2.13.4 設定ファイル例

1.2.13.4.1 すべてのモジュールを無効にするファイル
#These lines are comments

#Datastore Modules
Datastore
capacity disabled
freeSpace disabled 
overallocation disabled

#ESX Modules
ESX
bootTime disabled
cpuInfo disabled
memorySize disabled
overallCpuUsage disabled
overallMemoryUsage disabled
powerState disabled
sslThumbprint disabled
uptime disabled
vnicInfo disabled
hostAlive disabled
connectionState disabled
diskRead disabled
diskWrite disabled
diskReadLatency disabled
diskWriteLatency disabled
netReceived disabled
netTransmitted disabled
netPkgRx disabled
netPkgTx disabled
cpuStatus disabled
storageStatus disabled
memStatus disabled
memoryAllocation disabled 

#VM Modules
VM
bootTime disabled
connectionState disabled
consumedOverheadMemory disabled 
cpuAllocation disabled
diskFree disabled
guestState disabled
host disabled
hostAlive disabled
hostMemoryUsage disabled
hostName disabled
ipAddress disabled
macAddress disabled
maxCpuUsage disabled
memoryAllocation disabled
memoryOverhead disabled
overallCpuDemand disabled
overallCpuUsage disabled
powerState disabled
privateMemory disabled
sharedMemory disabled
toolsRunningStatus disabled
triggeredAlarmState disabled
uptimeSeconds disabled
virtualImagePath disabled
uptimeSeconds disabled
diskRead disabled
diskWrite disabled
diskReadLatency disabled
diskWriteLatency disabled
netReceived disabled
netTransmitted disabled
netPkgRx disabled
netPkgTx  disabled

1.2.13.5 短い名前の関係表

1.2.13.5.1 データセンター
長い名前 短い名前
Ping ping
Check 443 port check443
1.2.13.5.2 データストア
長い名前 短い名前
Capacity capacity
Free Space freeSpace
Disk Overallocation overallocation
Free Space Bytes freeSpaceBytes
1.2.13.5.3 ESX
長い名前 短い名前
Boot Time bootTime
CPU Info cpuInfo
Memory Size memorySize
Overall CPU Usage overallCpuUsage
Overall Memory Usage overallMemoryUsage
Power State powerState
SSL Thumbprint sslThumbprint
Uptime uptime
VNIC Info vnicInfo
Host Alive hostAlive
Connection State connectionState
Disk Read diskRead
Disk Write diskWrite
Disk Read Latency diskReadLatency
Disk Write Latency diskWriteLatency
Data received netReceived
Data transmitted netTransmitted
Packages Received netPkgRx
Packages Transmitted netPkgTx
CPU Usage cpuUsagePercent
Memory Usage memoryUsagePercent
Net Usage netUsage
Disk Rate diskRate
Max Disk Latency maxDiskLatency
HA Status haStatus
Sensor* haStatus
1.2.13.5.4 仮想マシン
長い名前 短い名前
Boot Time bootTime
Connection State connectionState
Consumed Overhead Memory consumedOverheadMemory
CPU Allocation cpuAllocation
Disk Free diskFree
Guest State guestState
Host Info host
Host Alive hostAlive
Host Memory Usage hostMemoryUsage
Host Name hostName
IP Address ipAddress
MAC Address macAddress
Max CPU Usage maxCpuUsage
Max Memory Usage maxMemoryUsage
Memory Allocation memoryAllocation
Memory Overhead memoryOverhead
Overall CPU Demand overallCpuDemand
Overall CPU Usage overallCpuUsage
Power State powerState
Private Memory privateMemory
Shared Memory sharedMemory
Tools Running Status toolsRunningStatus
Trigger Alarm State triggeredAlarmState
Uptime Seconds uptimeSeconds
Virtual Image Path virtualImagePath
Disk Read diskRead
Disk Write diskWrite
Disk Read Latency diskReadLatency
Disk Write Latency diskWriteLatency
Data received netReceived
Data transmitted netTransmitted
Packages Received netPkgRx
Packages Transmitted netPkgTx
CPU Usage cpuUsagePercent
Memory Usage memoryUsagePercent
Net Usage netUsage
Disk Rate diskRate
Max Disk Latency maxDiskLatency
HeartBeat heartbeat
CPU Ready cpuReady
Number Snapshots snapshotCounter
HA Status haStatus

1.2.13.6 イベントテーブル

Info.png

このイベント一覧は、Pandora FMS でイベントのアラートを設定するのに役立ちます。正しい最新のイベント一覧は、VMware のドキュメントを確認してください。

 


イベント 重要度 イベントタイプ グループ
An account was created on host {host.name} Informational System All
Account {account} was removed on host {host.name} Informational System All
An account was updated on host {host.name} Informational System All
The default password for the root user on the host {host.name} has not been changed Informational System All
Alarm '{alarm.name}' on {entity.name} triggered an action Informational System All
Created alarm '{alarm.name}' on {entity.name} Informational System All
Alarm '{alarm.name}' on {entity.name} sent email to {to} Informational System All
Alarm '{alarm.name}' on {entity.name} cannot send email to {to} Critical System All
Reconfigured alarm '{alarm.name}' on {entity.name} Informational System All
Removed alarm '{alarm.name}' on {entity.name} Informational System All
Alarm '{alarm.name}' on {entity.name} ran script {script} Informational System All
Alarm '{alarm.name}' on {entity.name} did not complete script: {reason.msg} Critical System All
Alarm '{alarm.name}': an SNMP trap for entity {entity.name} was sent Informational System All
Alarm '{alarm.name}' on entity {entity.name} did not send SNMP trap: {reason.msg} Critical System All
Alarm '{alarm.name}' on {entity.name} changed from {[email protected]} to {[email protected]} Informational System All
All running virtual machines are licensed Informational System All
User cannot logon since the user is already logged on Informational System All
Cannot login {userName}@{ipAddress} Critical System All
The operation performed on host {host.name} in {datacenter.name} was canceled Informational System All
Changed ownership of file name {filename} from {oldOwner} to {newOwner} on {host.name} in {datacenter.name}. Informational System All
Cannot change ownership of file name {filename} from {owner} to {attemptedOwner} on {host.name} in {datacenter.name}. Critical System All
Checked cluster for compliance Informational System All
Created cluster {computeResource.name} in {datacenter.name} Informational System All
Removed cluster {computeResource.name} in datacenter {datacenter.name} Informational System All
Insufficient capacity in cluster {computeResource.name} to satisfy resource configuration in {datacenter.name} Critical System All
Reconfigured cluster {computeResource.name} in datacenter {datacenter.name} Informational System All
Configuration status on cluster {computeResource.name} changed from {[email protected]} to {[email protected]} in {datacenter.name} Informational System All
Created new custom field definition {name} Informational System All
Removed field definition {name} Informational System All
Renamed field definition from {name} to {newName} Informational System All
Changed custom field {name} on {entity.name} in {datacenter.name} to {value} Informational System All
Cannot complete customization of VM {vm.name}. See customization log at {logLocation} on the guest OS for details. Informational System All
An error occurred while setting up Linux identity. See log file '{logLocation}' on guest OS for details. Critical System All
An error occurred while setting up network properties of the guest OS. See the log file {logLocation} in the guest OS for details. Critical System All
Started customization of VM {vm.name}. Customization log located at {logLocation} in the guest OS. Informational System All
Customization of VM {vm.name} succeeded. Customization log located at {logLocation} in the guest OS. Informational System All
The version of Sysprep {sysprepVersion} provided for customizing VM {vm.name} does not match the version of guest OS {systemVersion}. See the log file {logLocation} in the guest OS for more information. Critical System All
An error occurred while customizing VM {vm.name}. For details reference the log file {logLocation} in the guest OS. Critical System All
dvPort group {net.name} in {datacenter.name} was added to switch {dvs.name}. Informational System All
dvPort group {net.name} in {datacenter.name} was deleted. Informational System All
Informational System All
dvPort group {net.name} in {datacenter.name} was reconfigured. Informational System All
dvPort group {oldName} in {datacenter.name} was renamed to {newName} Informational System All
HA admission control disabled on cluster {computeResource.name} in {datacenter.name} Informational System All
HA admission control enabled on cluster {computeResource.name} in {datacenter.name} Informational System All
Re-established contact with a primary host in this HA cluster Informational System All
Unable to contact a primary HA agent in cluster {computeResource.name} in {datacenter.name} Critical System All
All hosts in the HA cluster {computeResource.name} in {datacenter.name} were isolated from the network. Check the network configuration for proper network redundancy in the management network. Critical System All
HA disabled on cluster {computeResource.name} in {datacenter.name} Informational System All
HA enabled on cluster {computeResource.name} in {datacenter.name} Informational System All
A possible host failure has been detected by HA on {failedHost.name} in cluster {computeResource.name} in {datacenter.name} Critical System All
Host {isolatedHost.name} has been isolated from cluster {computeResource.name} in {datacenter.name} Warning System All
Created datacenter {datacenter.name} in folder {parent.name} Informational System All
Renamed datacenter from {oldName} to {newName} Informational System All
Datastore {datastore.name} increased in capacity from {oldCapacity} bytes to {newCapacity} bytes in {datacenter.name} Informational System All
Removed unconfigured datastore {datastore.name} Informational System All
Discovered datastore {datastore.name} on {host.name} in {datacenter.name} Informational System All
Multiple datastores named {datastore} detected on host {host.name} in {datacenter.name} Critical System All
<internal> Informational System All
File or directory {sourceFile} copied from {sourceDatastore.name} to {datastore.name} as {targetFile} Informational System All
File or directory {targetFile} deleted from {datastore.name} Informational System All
File or directory {sourceFile} moved from {sourceDatastore.name} to {datastore.name} as {targetFile} Informational System All
Reconfigured Storage I/O Control on datastore {datastore.name} Informational System All
Configured datastore principal {datastorePrincipal} on host {host.name} in {datacenter.name} Informational System All
Removed datastore {datastore.name} from {host.name} in {datacenter.name} Informational System All
Renamed datastore from {oldName} to {newName} in {datacenter.name} Informational System All
Renamed datastore from {oldName} to {newName} in {datacenter.name} Informational System All
Disabled DRS on cluster {computeResource.name} in datacenter {datacenter.name} Informational System All
Enabled DRS on {computeResource.name} with automation level {behavior} in {datacenter.name} Informational System All
DRS put {host.name} into standby mode Informational System All
DRS is putting {host.name} into standby mode Informational System All
DRS cannot move {host.name} out of standby mode Critical System All
DRS moved {host.name} out of standby mode Informational System All
DRS is moving {host.name} out of standby mode Informational System All
DRS invocation not completed Critical System All
DRS has recovered from the failure Informational System All
Unable to apply DRS resource settings on host {host.name} in {datacenter.name}. {reason.msg}. This can significantly reduce the effectiveness of DRS. Critical System All
Resource configuration specification returns to synchronization from previous failure on host '{host.name}' in {datacenter.name} Informational System All
{vm.name} on {host.name} in {datacenter.name} is now compliant with DRS VM-Host affinity rules Informational System All
{vm.name} on {host.name} in {datacenter.name} is violating a DRS VM-Host affinity rule Informational System All
DRS migrated {vm.name} from {sourceHost.name} to {host.name} in cluster {computeResource.name} in {datacenter.name} Informational System All
DRS powered On {vm.name} on {host.name} in {datacenter.name} Informational System All
Virtual machine {macAddress} on host {host.name} has a duplicate IP {duplicateIP} Informational System All
A vNetwork Distributed Switch {dvs.name} was created in {datacenter.name}. Informational System All
vNetwork Distributed Switch {dvs.name} in {datacenter.name} was deleted. Informational System All
vNetwork Distributed Switch event Informational System All
The vNetwork Distributed Switch {dvs.name} configuration on the host was synchronized with that of the vCenter Server. Informational System All
The host {hostJoined.name} joined the vNetwork Distributed Switch {dvs.name} in {datacenter.name}. Informational System All
The host {hostLeft.name} left the vNetwork Distributed Switch {dvs.name} in {datacenter.name}. Informational System All
The host {hostMember.name} changed status on the vNetwork Distributed Switch {dvs.name} in {datacenter.name}. Informational System All
The vNetwork Distributed Switch {dvs.name} configuration on the host differed from that of the vCenter Server. Warning System All
vNetwork Distributed Switch {srcDvs.name} was merged into {dstDvs.name} in {datacenter.name}. Informational System All
dvPort {portKey} was blocked in the vNetwork Distributed Switch {dvs.name} in {datacenter.name}. Informational System All
The port {portKey} was connected in the vNetwork Distributed Switch {dvs.name} in {datacenter.name} Informational System All
New ports were created in the vNetwork Distributed Switch {dvs.name} in {datacenter.name}. Informational System All
Deleted ports in the vNetwork Distributed Switch {dvs.name} in {datacenter.name}. Informational System All
The dvPort {portKey} was disconnected in the vNetwork Distributed Switch {dvs.name} in {datacenter.name}. Informational System All
dvPort {portKey} entered passthrough mode in the vNetwork Distributed Switch {dvs.name} in {datacenter.name}. Informational System All
dvPort {portKey} exited passthrough mode in the vNetwork Distributed Switch {dvs.name} in {datacenter.name}. Informational System All
dvPort {portKey} was moved into the dvPort group {portgroupName} in {datacenter.name}. Informational System All
dvPort {portKey} was moved out of the dvPort group {portgroupName} in {datacenter.name}. Informational System All
The port {portKey} link was down in the vNetwork Distributed Switch {dvs.name} in {datacenter.name} Informational System All
The port {portKey} link was up in the vNetwork Distributed Switch {dvs.name} in {datacenter.name} Informational System All
Reconfigured ports in the vNetwork Distributed Switch {dvs.name} in {datacenter.name}. Informational System All
dvPort {portKey} was unblocked in the vNetwork Distributed Switch {dvs.name} in {datacenter.name}. Informational System All
The vNetwork Distributed Switch {dvs.name} in {datacenter.name} was reconfigured. Informational System All
The vNetwork Distributed Switch {oldName} in {datacenter.name} was renamed to {newName}. Informational System All
An upgrade for the vNetwork Distributed Switch {dvs.name} in datacenter {datacenter.name} is available. Informational System All
An upgrade for the vNetwork Distributed Switch {dvs.name} in datacenter {datacenter.name} is in progress. Informational System All
Cannot complete an upgrade for the vNetwork Distributed Switch {dvs.name} in datacenter {datacenter.name} Informational System All
vNetwork Distributed Switch {dvs.name} in datacenter {datacenter.name} was upgraded. Informational System All
Host {host.name} in {datacenter.name} has entered maintenance mode Informational System All
The host {host.name} is in standby mode Informational System All
Host {host.name} in {datacenter.name} has started to enter maintenance mode Informational System All
The host {host.name} is entering standby mode Informational System All
{message} Critical System All
Host {host.name} in {datacenter.name} has exited maintenance mode Informational System All
The host {host.name} could not exit standby mode Critical System All
The host {host.name} is no longer in standby mode Informational System All
The host {host.name} is exiting standby mode Informational System All
Sufficient resources are available to satisfy HA failover level in cluster {computeResource.name} in {datacenter.name} Informational System All
General event: {message} Informational System All
Error detected on {host.name} in {datacenter.name}: {message} Critical System All
Issue detected on {host.name} in {datacenter.name}: {message} Informational System All
Issue detected on {host.name} in {datacenter.name}: {message} Warning System All
User logged event: {message} Informational System All
Error detected for {vm.name} on {host.name} in {datacenter.name}: {message} Critical System All
Issue detected for {vm.name} on {host.name} in {datacenter.name}: {message} Informational System All
Issue detected for {vm.name} on {host.name} in {datacenter.name}: {message} Warning System All
The vNetwork Distributed Switch corresponding to the proxy switches {switchUuid} on the host {host.name} does not exist in vCenter Server or does not contain this host. Informational System All
A ghost proxy switch {switchUuid} on the host {host.name} was resolved. Informational System All
The message changed: {message} Informational System All
{componentName} status changed from {oldStatus} to {newStatus} Informational System All
Cannot add host {hostname} to datacenter {datacenter.name} Critical System All
Added host {host.name} to datacenter {datacenter.name} Informational System All
Administrator access to the host {host.name} is disabled Warning System All
Administrator access to the host {host.name} has been restored Warning System All
Cannot connect {host.name} in {datacenter.name}: cannot configure management account Critical System All
Cannot connect {host.name} in {datacenter.name}: already managed by {serverName} Critical System All
Cannot connect host {host.name} in {datacenter.name} : server agent is not responding Critical System All
Cannot connect {host.name} in {datacenter.name}: incorrect user name or password Critical System All
Cannot connect {host.name} in {datacenter.name}: incompatible version Critical System All
Cannot connect host {host.name} in {datacenter.name}. Did not install or upgrade vCenter agent service. Critical System All
Cannot connect {host.name} in {datacenter.name}: error connecting to host Critical System All
Cannot connect {host.name} in {datacenter.name}: network error Critical System All
Cannot connect host {host.name} in {datacenter.name}: account has insufficient privileges Critical System All
Cannot connect host {host.name} in {datacenter.name} Critical System All
Cannot connect {host.name} in {datacenter.name}: not enough CPU licenses Critical System All
Cannot connect {host.name} in {datacenter.name}: incorrect host name Critical System All
Cannot connect {host.name} in {datacenter.name}: time-out waiting for host response Critical System All
Host {host.name} checked for compliance. Informational System All
Host {host.name} is in compliance with the attached profile Informational System All
Host configuration changes applied. Informational System All
Connected to {host.name} in {datacenter.name} Informational System All
Host {host.name} in {datacenter.name} is not responding Critical System All
dvPort connected to host {host.name} in {datacenter.name} changed status Informational System All
HA agent disabled on {host.name} in cluster {computeResource.name} in {datacenter.name} Informational System All
HA is being disabled on {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} Informational System All
HA agent enabled on {host.name} in cluster {computeResource.name} in {datacenter.name} Informational System All
Enabling HA agent on {host.name} in cluster {computeResource.name} in {datacenter.name} Warning System All
HA agent on {host.name} in cluster {computeResource.name} in {datacenter.name} has an error {message}: {[email protected]} Critical System All
HA agent on host {host.name} in cluster {computeResource.name} in {datacenter.name} is configured correctly Informational System All
Disconnected from {host.name} in {datacenter.name}. Reason: {[email protected]} Informational System All
Cannot restore some administrator permissions to the host {host.name} Critical System All
Host {host.name} has the following extra networks not used by other hosts for HA communication:{ips}. Consider using HA advanced option das.allowNetwork to control network usage Critical System All
Cannot complete command 'hostname -s' on host {host.name} or returned incorrect name format Critical System All
Maximum ({capacity}) number of hosts allowed for this edition of vCenter Server has been reached Critical System All
The virtual machine inventory file on host {host.name} is damaged or unreadable. Informational System All
IP address of the host {host.name} changed from {oldIP} to {newIP} Informational System All
Configuration of host IP address is inconsistent on host {host.name}: address resolved to {ipAddress} and {ipAddress2} Critical System All
Cannot resolve IP address to short name on host {host.name} Critical System All
Host {host.name} could not reach isolation address: {isolationIp} Critical System All
A host license for {host.name} has expired Critical System All
Host {host.name} does not have the following networks used by other hosts for HA communication:{ips}. Consider using HA advanced option das.allowNetwork to control network usage Critical System All
Host monitoring state in {computeResource.name} in {datacenter.name} changed to {[email protected]} Informational System All
Host {host.name} currently has no available networks for HA Communication. The following networks are currently used by HA: {ips} Critical System All
Host {host.name} has no port groups enabled for HA communication. Critical System All
Host {host.name} currently has no management network redundancy Critical System All
Host {host.name} is not in compliance with the attached profile Critical System All
Host {host.name} is not a cluster member in {datacenter.name} Critical System All
Insufficient capacity in host {computeResource.name} to satisfy resource configuration in {datacenter.name} Critical System All
Primary agent {primaryAgent} was not specified as a short name to host {host.name} Critical System All
Profile is applied on the host {host.name} Informational System All
Cannot reconnect to {host.name} in {datacenter.name} Critical System All
Removed host {host.name} in {datacenter.name} Informational System All
Host names {shortName} and {shortName2} both resolved to the same IP address. Check the host's network configuration and DNS entries Critical System All
Cannot resolve short name {shortName} to IP address on host {host.name} Critical System All
Shut down of {host.name} in {datacenter.name}: {reason} Informational System All
Configuration status on host {computeResource.name} changed from {[email protected]} to {[email protected]} in {datacenter.name} Informational System All
Cannot synchronize host {host.name}. {reason.msg} Critical System All
Cannot install or upgrade vCenter agent service on {host.name} in {datacenter.name} Critical System All
The userworld swap is not enabled on the host {host.name} Warning System All
Host {host.name} vNIC {vnic.vnic} was reconfigured to use dvPort {vnic.port.portKey} with port level configuration, which might be different from the dvPort group. Informational System All
WWNs are changed for {host.name} Warning System All
The WWN ({wwn}) of {host.name} conflicts with the currently registered WWN Critical System All
Host {host.name} did not provide the information needed to acquire the correct set of licenses Critical System All
{message} Informational System All
Insufficient resources to satisfy HA failover level on cluster {computeResource.name} in {datacenter.name} Critical System All
The license edition '{feature}' is invalid Critical System All
License {feature.featureName} has expired Critical System All
License inventory is not compliant. Licenses are overused Critical System All
Unable to acquire licenses due to a restriction in the option file on the license server. Critical System All
License server {licenseServer} is available Informational System All
License server {licenseServer} is unavailable Critical System All
Created local datastore {datastore.name} on {host.name} in {datacenter.name} Informational System All
The Local Tech Support Mode for the host {host.name} has been enabled Informational System All
Datastore {datastore} which is configured to back the locker does not exist Warning System All
Locker was reconfigured from {oldDatastore} to {newDatastore} datastore Informational System All
Unable to migrate {vm.name} from {host.name} in {datacenter.name}: {fault.msg} Critical System All
Unable to migrate {vm.name} from {host.name} to {dstHost.name} in {datacenter.name}: {fault.msg} Critical System All
Migration of {vm.name} from {host.name} to {dstHost.name} in {datacenter.name}: {fault.msg} Warning System All
Cannot migrate {vm.name} from {host.name} to {dstHost.name} and resource pool {dstPool.name} in {datacenter.name}: {fault.msg} Critical System All
Migration of {vm.name} from {host.name} to {dstHost.name} and resource pool {dstPool.name} in {datacenter.name}: {fault.msg} Warning System All
Migration of {vm.name} from {host.name} in {datacenter.name}: {fault.msg} Warning System All
Created NAS datastore {datastore.name} on {host.name} in {datacenter.name} Informational System All
Cannot login user {userName}@{ipAddress}: no permission Critical System All
No datastores have been configured on the host {host.name} Informational System All
A required license {feature.featureName} is not reserved Critical System All
Unable to automatically migrate {vm.name} from {host.name} Informational System All
Non-VI workload detected on datastore {datastore.name} Critical System All
Not enough resources to failover {vm.name} in {computeResource.name} in {datacenter.name} Informational System All
The vNetwork Distributed Switch configuration on some hosts differed from that of the vCenter Server. Warning System All
Permission created for {principal} on {entity.name}, role is {role.name}, propagation is {[email protected]} Informational System All
Permission rule removed for {principal} on {entity.name} Informational System All
Permission changed for {principal} on {entity.name}, role is {role.name}, propagation is {[email protected]} Informational System All
Profile {profile.name} attached. Informational System All
Profile {profile.name} was changed. Informational System All
Profile is created. Informational System All
Profile {profile.name} detached. Informational System All
Profile {profile.name} reference host changed. Informational System All
Profile was removed. Informational System All
Remote Tech Support Mode (SSH) for the host {host.name} has been enabled Informational System All
Created resource pool {resourcePool.name} in compute-resource {computeResource.name} in {datacenter.name} Informational System All
Removed resource pool {resourcePool.name} on {computeResource.name} in {datacenter.name} Informational System All
Moved resource pool {resourcePool.name} from {oldParent.name} to {newParent.name} on {computeResource.name} in {datacenter.name} Informational System All
Updated configuration for {resourcePool.name} in compute-resource {computeResource.name} in {datacenter.name} Informational System All
Resource usage exceeds configuration for resource pool {resourcePool.name} in compute-resource {computeResource.name} in {datacenter.name} Critical System All
New role {role.name} created Informational System All
Role {role.name} removed Informational System All
Modifed role {role.name} Informational System All
Task {scheduledTask.name} on {entity.name} in {datacenter.name} completed successfully Informational System All
Created task {scheduledTask.name} on {entity.name} in {datacenter.name} Informational System All
Task {scheduledTask.name} on {entity.name} in {datacenter.name} sent email to {to} Informational System All
Task {scheduledTask.name} on {entity.name} in {datacenter.name} cannot send email to {to}: {reason.msg} Critical System All
Task {scheduledTask.name} on {entity.name} in {datacenter.name} cannot be completed: {reason.msg} Critical System All
Reconfigured task {scheduledTask.name} on {entity.name} in {datacenter.name} Informational System All
Removed task {scheduledTask.name} on {entity.name} in {datacenter.name} Informational System All
Running task {scheduledTask.name} on {entity.name} in {datacenter.name} Informational System All
A vCenter Server license has expired Critical System All
vCenter started Informational System All
A session for user '{terminatedUsername}' has stopped Informational System All
Task: {info.descriptionId} Informational System All
Task: {info.descriptionId} time-out Informational System All
Upgrading template {legacyTemplate} Informational System All
Cannot upgrade template {legacyTemplate} due to: {reason.msg} Informational System All
Template {legacyTemplate} upgrade completed Informational System All
The operation performed on {host.name} in {datacenter.name} timed out Warning System All
There are {unlicensed} unlicensed virtual machines on host {host} - there are only {available} licenses available Informational System All
{unlicensed} unlicensed virtual machines found on host {host} Informational System All
The agent on host {host.name} is updated and will soon restart Informational System All
User {userLogin} was added to group {group} Informational System All
User {userName}@{ipAddress} logged in Informational System All
User {userName} logged out Informational System All
Password was changed for account {userLogin} on host {host.name} Informational System All
User {userLogin} removed from group {group} Informational System All
{message} Informational System All
Created VMFS datastore {datastore.name} on {host.name} in {datacenter.name} Informational System All
Expanded VMFS datastore {datastore.name} on {host.name} in {datacenter.name} Informational System All
Extended VMFS datastore {datastore.name} on {host.name} in {datacenter.name} Informational System All
A vMotion license for {host.name} has expired Critical System All
Cannot uninstall vCenter agent from {host.name} in {datacenter.name}. {[email protected]} Critical System All
vCenter agent has been uninstalled from {host.name} in {datacenter.name} Informational System All
Cannot upgrade vCenter agent on {host.name} in {datacenter.name}. {[email protected]} Critical System All
vCenter agent has been upgraded on {host.name} in {datacenter.name} Informational System All
VIM account password was changed on host {host.name} Informational System All
Remote console to {vm.name} on {host.name} in {datacenter.name} has been opened Informational System All
A ticket for {vm.name} of type {ticketType} on {host.name} in {datacenter.name} has been acquired Informational System All
Invalid name for {vm.name} on {host.name} in {datacenter.name}. Renamed from {oldName} to {newName} Informational System All
Cloning {vm.name} on host {host.name} in {datacenter.name} to {destName} on host {destHost.name} Informational System All
Cloning {vm.name} on host {host.name} in {datacenter.name} to {destName} on host {destHost.name} Informational System All
Creating {vm.name} on host {host.name} in {datacenter.name} Informational System All
Deploying {vm.name} on host {host.name} in {datacenter.name} from template {srcTemplate.name} Informational System All
Migrating {vm.name} from {host.name} to {destHost.name} in {datacenter.name} Informational System All
Relocating {vm.name} from {host.name} to {destHost.name} in {datacenter.name} Informational System All
Relocating {vm.name} in {datacenter.name} from {host.name} to {destHost.name} Informational System All
Cannot clone {vm.name}: {reason.msg} Critical System All
Clone of {sourceVm.name} completed Informational System All
Configuration file for {vm.name} on {host.name} in {datacenter.name} cannot be found Informational System All
Virtual machine {vm.name} is connected Informational System All
Created virtual machine {vm.name} on {host.name} in {datacenter.name} Informational System All
dvPort connected to VM {vm.name} on {host.name} in {datacenter.name} changed status Informational System All
{vm.name} on {host.name} in cluster {computeResource.name} in {datacenter.name} reset by HA. Reason: {[email protected]} Informational System All
{vm.name} on {host.name} in cluster {computeResource.name} in {datacenter.name} reset by HA. Reason: {[email protected]}. A screenshot is saved at {screenshotFilePath}. Informational System All
Cannot reset {vm.name} on {host.name} in cluster {computeResource.name} in {datacenter.name} Warning System All
Unable to update HA agents given the state of {vm.name} Critical System All
HA agents have been updated with the current state of the virtual machine Informational System All
Disconnecting all hosts as the date of virtual machine {vm.name} has been rolled back Critical System All
Cannot deploy template: {reason.msg} Critical System All
Template {srcTemplate.name} deployed on host {host.name} Informational System All
{vm.name} on host {host.name} in {datacenter.name} is disconnected Informational System All
Discovered {vm.name} on {host.name} in {datacenter.name} Informational System All
Cannot create virtual disk {disk} Critical System All
Migrating {vm.name} off host {host.name} in {datacenter.name} Informational System All
End a recording session on {vm.name} Informational System All
End a replay session on {vm.name} Informational System All
Cannot migrate {vm.name} from {host.name} to {destHost.name} in {datacenter.name} Critical System All
Cannot complete relayout {vm.name} on {host.name} in {datacenter.name}: {reason.msg} Critical System All
Cannot complete relayout for virtual machine {vm.name} which has disks on a VMFS2 volume. Critical System All
vCenter cannot start the Secondary VM {vm.name}. Reason: {[email protected]} Critical System All
Cannot power Off {vm.name} on {host.name} in {datacenter.name}: {reason.msg} Critical System All
Cannot power On {vm.name} on {host.name} in {datacenter.name}. {reason.msg} Critical System All
Cannot reboot the guest OS for {vm.name} on {host.name} in {datacenter.name}. {reason.msg} Critical System All
Cannot suspend {vm.name} on {host.name} in {datacenter.name}: {reason.msg} Critical System All
{vm.name} cannot shut down the guest OS on {host.name} in {datacenter.name}: {reason.msg} Critical System All
{vm.name} cannot standby the guest OS on {host.name} in {datacenter.name}: {reason.msg} Critical System All
Cannot suspend {vm.name} on {host.name} in {datacenter.name}: {reason.msg} Critical System All
vCenter cannot update the Secondary VM {vm.name} configuration Critical System All
Failover unsuccessful for {vm.name} on {host.name} in cluster {computeResource.name} in {datacenter.name}. Reason: {reason.msg} Warning System All
Fault Tolerance state on {vm.name} changed from {[email protected]} to {[email protected]} Informational System All
Fault Tolerance protection has been turned off for {vm.name} Informational System All
The Fault Tolerance VM ({vm.name}) has been terminated. {[email protected]} Informational System All
Guest OS reboot for {vm.name} on {host.name} in {datacenter.name} Informational System All
Guest OS shut down for {vm.name} on {host.name} in {datacenter.name} Informational System All
Guest OS standby for {vm.name} on {host.name} in {datacenter.name} Informational System All
VM monitoring state in {computeResource.name} in {datacenter.name} changed to {[email protected]} Informational System All
Assign a new instance UUID ({instanceUuid}) to {vm.name} Informational System All
The instance UUID of {vm.name} has been changed from ({oldInstanceUuid}) to ({newInstanceUuid}) Informational System All
The instance UUID ({instanceUuid}) of {vm.name} conflicts with the instance UUID assigned to {conflictedVm.name} Critical System All
New MAC address ({mac}) assigned to adapter {adapter} for {vm.name} Informational System All
Changed MAC address from {oldMac} to {newMac} for adapter {adapter} for {vm.name} Warning System All
The MAC address ({mac}) of {vm.name} conflicts with MAC assigned to {conflictedVm.name} Critical System All
Reached maximum Secondary VM (with FT turned On) restart count for {vm.name} on {host.name} in cluster {computeResource.name} in {datacenter.name}. Warning System All
Reached maximum VM restart count for {vm.name} on {host.name} in cluster {computeResource.name} in {datacenter.name}. Warning System All
Error message on {vm.name} on {host.name} in {datacenter.name}: {message} Critical System All
Message on {vm.name} on {host.name} in {datacenter.name}: {message} Informational System All
Warning message on {vm.name} on {host.name} in {datacenter.name}: {message} Warning System All
Migration of virtual machine {vm.name} from {sourceHost.name} to {host.name} completed Informational System All
No compatible host for the Secondary VM {vm.name} Critical System All
Not all networks for {vm.name} are accessible by {destHost.name} Warning System All
{vm.name} does not exist on {host.name} in {datacenter.name} Warning System All
{vm.name} was powered Off on the isolated host {isolatedHost.name} in cluster {computeResource.name} in {datacenter.name} Informational System All
{vm.name} on {host.name} in {datacenter.name} is powered off Informational System All
{vm.name} on {host.name} in {datacenter.name} is powered on Informational System All
Virtual machine {vm.name} powered On with vNICs connected to dvPorts that have a port level configuration, which might be different from the dvPort group configuration. Informational System All
VM ({vm.name}) failed over to {host.name}. {[email protected]} Critical System All
Reconfigured {vm.name} on {host.name} in {datacenter.name} Informational System All
Registered {vm.name} on {host.name} in {datacenter.name} Informational System All
Relayout of {vm.name} on {host.name} in {datacenter.name} completed Informational System All
{vm.name} on {host.name} in {datacenter.name} is in the correct format and relayout is not necessary Informational System All
{vm.name} on {host.name} reloaded from new configuration {configPath}. Informational System All
{vm.name} on {host.name} could not be reloaded from {configPath}. Critical System All
Cannot relocate virtual machine '{vm.name}' in {datacenter.name} Critical System All
Completed the relocation of the virtual machine Informational System All
Remote console connected to {vm.name} on host {host.name} Informational System All
Remote console disconnected from {vm.name} on host {host.name} Informational System All
Removed {vm.name} on {host.name} from {datacenter.name} Informational System All
Renamed {vm.name} from {oldName} to {newName} in {datacenter.name} Warning System All
{vm.name} on {host.name} in {datacenter.name} is reset Informational System All
Moved {vm.name} from resource pool {oldParent.name} to {newParent.name} in {datacenter.name} Informational System All
Changed resource allocation for {vm.name} Informational System All
Virtual machine {vm.name} was restarted on {host.name} since {sourceHost.name} failed Informational System All
{vm.name} on {host.name} in {datacenter.name} is resumed Informational System All
A Secondary VM has been added for {vm.name} Informational System All
vCenter disabled Fault Tolerance on VM '{vm.name}' because the Secondary VM could not be powered On. Critical System All
Disabled Secondary VM for {vm.name} Informational System All
Enabled Secondary VM for {vm.name} Informational System All
Started Secondary VM for {vm.name} Informational System All
{vm.name} was shut down on the isolated host {isolatedHost.name} in cluster {computeResource.name} in {datacenter.name}: {[email protected]} Informational System All
Start a recording session on {vm.name} Informational System All
Start a replay session on {vm.name} Informational System All
{vm.name} on host {host.name} in {datacenter.name} is starting Informational System All
Starting Secondary VM for {vm.name} Informational System All
The static MAC address ({mac}) of {vm.name} conflicts with MAC assigned to {conflictedVm.name} Critical System All
{vm.name} on {host.name} in {datacenter.name} is stopping Informational System All
{vm.name} on {host.name} in {datacenter.name} is suspended Informational System All
{vm.name} on {host.name} in {datacenter.name} is being suspended Informational System All
Starting the Secondary VM {vm.name} timed out within {timeout} ms Critical System All
Unsupported guest OS {guestId} for {vm.name} on {host.name} in {datacenter.name} Warning System All
Virtual hardware upgraded to version {version} Informational System All
Cannot upgrade virtual hardware Critical System All
Upgrading virtual hardware on {vm.name} in {datacenter.name} to version {version} Informational System All
Assigned new BIOS UUID ({uuid}) to {vm.name} on {host.name} in {datacenter.name} Informational System All
Changed BIOS UUID from {oldUuid} to {newUuid} for {vm.name} on {host.name} in {datacenter.name} Warning System All
BIOS ID ({uuid}) of {vm.name} conflicts with that of {conflictedVm.name} Critical System All
New WWNs assigned to {vm.name} Informational System All
WWNs are changed for {vm.name} Warning System All
The WWN ({wwn}) of {vm.name} conflicts with the currently registered WWN Critical System All
{message} Warning System All
Booting from iSCSI failed with an error. See the VMware Knowledge Base for information on configuring iBFT networking. Warning System All
com.vmware.license.AddLicenseEvent|License {licenseKey} added to VirtualCenter Informational System All
com.vmware.license.AssignLicenseEvent|License {licenseKey} assigned to asset {entityName} with id {entityId} Informational System All
com.vmware.license.DLFDownloadFailedEvent|Failed to download license information from the host {hostname} due to {[email protected]ownloadFailedReason} Warning System All
com.vmware.license.LicenseAssignFailedEvent|License assignment on the host fails. Reasons: {[email protected]}. Informational System All
com.vmware.license.LicenseExpiryEvent|Your host license will expire in {remainingDays} days. The host will be disconnected from VC when its license expires. Warning System All
com.vmware.license.LicenseUserThresholdExceededEvent|Current license usage ({currentUsage} {costUnitText}) for {edition} exceeded the user-defined threshold ({threshold} {costUnitText}) Warning System All
com.vmware.license.RemoveLicenseEvent|License {licenseKey} removed from VirtualCenter Informational System All
com.vmware.license.UnassignLicenseEvent|License unassigned from asset {entityName} with id {entityId} Informational System All
com.vmware.vc.HA.ClusterFailoverActionCompletedEvent|HA completed a failover action in cluster {computeResource.name} in datacenter {datacenter.name} Informational System All
com.vmware.vc.HA.ClusterFailoverActionInitiatedEvent|HA initiated a failover action in cluster {computeResource.name} in datacenter {datacenter.name} Warning System All
com.vmware.vc.HA.DasAgentRunningEvent|HA Agent on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} is running Informational System All
com.vmware.vc.HA.DasFailoverHostFailedEvent|HA failover host {host.name} in cluster {computeResource.name} in {datacenter.name} has failed Critical System All
com.vmware.vc.HA.DasHostCompleteDatastoreFailureEvent|All shared datastores failed on the host {hostName} in cluster {computeResource.name} in {datacenter.name} Critical System All
com.vmware.vc.HA.DasHostCompleteNetworkFailureEvent|All VM networks failed on the host {hostName} in cluster {computeResource.name} in {datacenter.name} Critical System All
com.vmware.vc.HA.DasHostFailedEvent|A possible host failure has been detected by HA on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} Critical System All
com.vmware.vc.HA.DasHostMonitoringDisabledEvent|No virtual machine failover will occur until Host Monitoring is enabled in cluster {computeResource.name} in {datacenter.name} Warning System All
com.vmware.vc.HA.DasTotalClusterFailureEvent|HA recovered from a total cluster failure in cluster {computeResource.name} in datacenter {datacenter.name} Warning System All
com.vmware.vc.HA.HostDasAgentHealthyEvent|HA Agent on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} is healthy Informational System All
com.vmware.vc.HA.HostDasErrorEvent|HA agent on {host.name} in cluster {computeResource.name} in {datacenter.name} has an error: {[email protected]} Critical System All
com.vmware.vc.VCHealthStateChangedEvent|vCenter Service overall health changed from '{oldState}' to '{newState}' Informational System All
com.vmware.vc.cim.CIMGroupHealthStateChanged|Health of [data.group] changed from [data.oldState] to [data.newState]. Informational System All
com.vmware.vc.datastore.UpdateVmFilesFailedEvent|Failed to update VM files on datastore {ds.name} using host {hostName} Critical System All
com.vmware.vc.datastore.UpdatedVmFilesEvent|Updated VM files on datastore {ds.name} using host {hostName} Informational System All
com.vmware.vc.datastore.UpdatingVmFilesEvent|Updating VM files on datastore {ds.name} using host {hostName} Informational System All
com.vmware.vc.ft.VmAffectedByDasDisabledEvent|VMware HA has been disabled in cluster {computeResource.name} of datacenter {datacenter.name}. HA will not restart VM {vm.name} or its Secondary VM after a failure. Warning System All
com.vmware.vc.npt.VmAdapterEnteredPassthroughEvent|Network passthrough is active on adapter {deviceLabel} of virtual machine {vm.name} on host {host.name} in {datacenter.name} Informational System All
com.vmware.vc.npt.VmAdapterExitedPassthroughEvent|Network passthrough is inactive on adapter {deviceLabel} of virtual machine {vm.name} on host {host.name} in {datacenter.name} Informational System All
com.vmware.vc.vcp.FtDisabledVmTreatAsNonFtEvent|HA VM Component Protection protects virtual machine {vm.name} on {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} as non-FT virtual machine because the FT state is disabled Informational System All
com.vmware.vc.vcp.FtFailoverEvent|FT Primary VM {vm.name} on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} is going to fail over to Secondary VM due to component failure Informational System All
com.vmware.vc.vcp.FtFailoverFailedEvent|FT virtual machine {vm.name} on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} failed to failover to secondary Critical System All
com.vmware.vc.vcp.FtSecondaryRestartEvent|HA VM Component Protection is restarting FT secondary virtual machine {vm.name} on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} due to component failure Informational System All
com.vmware.vc.vcp.FtSecondaryRestartFailedEvent|FT Secondary VM {vm.name} on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} failed to restart Critical System All
com.vmware.vc.vcp.NeedSecondaryFtVmTreatAsNonFtEvent|HA VM Component Protection protects virtual machine {vm.name} on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} as non-FT virtual machine because it has been in the needSecondary state too long Informational System All
com.vmware.vc.vcp.TestEndEvent|VM Component Protection test ends on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} Informational System All
com.vmware.vc.vcp.TestStartEvent|VM Component Protection test starts on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} Informational System All
com.vmware.vc.vcp.VcpNoActionEvent|HA VM Component Protection did not take action on virtual machine {vm.name} on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} due to the feature configuration setting Informational System All
com.vmware.vc.vcp.VmDatastoreFailedEvent|Virtual machine {vm.name} on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} lost access to {datastore} Critical System All
com.vmware.vc.vcp.VmNetworkFailedEvent|Virtual machine {vm.name} on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} lost access to {network} Critical System All
com.vmware.vc.vcp.VmPowerOffHangEvent|HA VM Component Protection could not power off virtual machine {vm.name} on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} successfully after trying {numTimes} times and will keep trying Critical System All
com.vmware.vc.vcp.VmRestartEvent|HA VM Component Protection is restarting virtual machine {vm.name} due to component failure on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} Informational System All
com.vmware.vc.vcp.VmRestartFailedEvent|Virtual machine {vm.name} affected by component failure on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} failed to restart Critical System All
com.vmware.vc.vcp.VmWaitForCandidateHostEvent|HA VM Component Protection could not find a destination host for virtual machine {vm.name} on host {host.name} in cluster {computeResource.name} in datacenter {datacenter.name} after waiting {numSecWait} seconds and will keep trying Critical System All
com.vmware.vc.vmam.AppMonitoringNotSupported|Application monitoring is not supported on {host.name} in cluster {computeResource.name} in {datacenter.name} Warning System All
com.vmware.vc.vmam.VmAppHealthMonitoringStateChangedEvent|Application heartbeat status changed to {status} for {vm.name} on {host.name} in cluster {computeResource.name} in {datacenter.name} Warning System All
com.vmware.vc.vmam.VmDasAppHeartbeatFailedEvent|Application heartbeat failed for {vm.name} on {host.name} in cluster {computeResource.name} in {datacenter.name} Warning System All
esx.clear.net.connectivity.restored|Network connectivity restored on virtual switch {1}, portgroups: {2}. Physical NIC {3} is up. Informational System All
esx.clear.net.dvport.connectivity.restored|Network connectivity restored on DVPorts: {1}. Physical NIC {2} is up. Informational System All
esx.clear.net.dvport.redundancy.restored|Uplink redundancy restored on DVPorts: {1}. Physical NIC {2} is up. Informational System All
esx.clear.net.redundancy.restored|Uplink redundancy restored on virtual switch {1}, portgroups: {2}. Physical NIC {3} is up. Informational System All
esx.clear.net.vmnic.linkstate.up|Physical NIC {1} linkstate is up. Informational System All
esx.clear.storage.connectivity.restored|Connectivity to storage device {1} (Datastores: {2}) restored. Path {3} is active again. Informational System All
esx.clear.storage.redundancy.restored|Path redundancy to storage device {1} (Datastores: {2}) restored. Path {3} is active again. Informational System All
esx.problem.apei.bert.memory.error.corrected|A corrected memory error occurred in last boot. The following details were reported. Physical Addr: {1}, Physical Addr Mask: {2}, Node: {3}, Card: {4}, Module: {5}, Bank: {6}, Device: {7}, Row: {8}, Column: {9} Error type: {10} Critical System All
esx.problem.apei.bert.memory.error.fatal|A fatal memory error occurred in the last boot. The following details were reported. Physical Addr: {1}, Physical Addr Mask: {2}, Node: {3}, Card: {4}, Module: {5}, Bank: {6}, Device: {7}, Row: {8}, Column: {9} Error type: {10} Critical System All
esx.problem.apei.bert.memory.error.recoverable|A recoverable memory error occurred in last boot. The following details were reported. Physical Addr: {1}, Physical Addr Mask: {2}, Node: {3}, Card: {4}, Module: {5}, Bank: {6}, Device: {7}, Row: {8}, Column: {9} Error type: {10} Critical System All
esx.problem.apei.bert.pcie.error.corrected|A corrected PCIe error occurred in last boot. The following details were reported. Port Type: {1}, Device: {2}, Bus #: {3}, Function: {4}, Slot: {5}, Device Vendor: {6}, Version: {7}, Command Register: {8}, Status Register: {9}. Critical System All
esx.problem.apei.bert.pcie.error.fatal|Platform encounterd a fatal PCIe error in last boot. The following details were reported. Port Type: {1}, Device: {2}, Bus #: {3}, Function: {4}, Slot: {5}, Device Vendor: {6}, Version: {7}, Command Register: {8}, Status Register: {9}. Critical System All
esx.problem.apei.bert.pcie.error.recoverable|A recoverable PCIe error occurred in last boot. The following details were reported. Port Type: {1}, Device: {2}, Bus #: {3}, Function: {4}, Slot: {5}, Device Vendor: {6}, Version: {7}, Command Register: {8}, Status Register: {9}. Critical System All
esx.problem.iorm.nonviworkload|An external I/O activity is detected on datastore {1}, this is an unsupported configuration. Consult the Resource Management Guide or follow the Ask VMware link for more information. Informational System All
esx.problem.net.connectivity.lost|Lost network connectivity on virtual switch {1}. Physical NIC {2} is down. Affected portgroups:{3}. Critical System All
esx.problem.net.dvport.connectivity.lost|Lost network connectivity on DVPorts: {1}. Physical NIC {2} is down. Critical System All
esx.problem.net.dvport.redundancy.degraded|Uplink redundancy degraded on DVPorts: {1}. Physical NIC {2} is down. Warning System All
esx.problem.net.dvport.redundancy.lost|Lost uplink redundancy on DVPorts: {1}. Physical NIC {2} is down. Warning System All
esx.problem.net.e1000.tso6.notsupported|Guest-initiated IPv6 TCP Segmentation Offload (TSO) packets ignored. Manually disable TSO inside the guest operating system in virtual machine {1}, or use a different virtual adapter. Critical System All
esx.problem.net.migrate.bindtovmk|The ESX advanced configuration option /Migrate/Vmknic is set to an invalid vmknic: {1}. /Migrate/Vmknic specifies a vmknic that vMotion binds to for improved performance. Update the configuration option with a valid vmknic. Alternatively, if you do not want vMotion to bind to a specific vmknic, remove the invalid vmknic and leave the option blank. Warning System All
esx.problem.net.proxyswitch.port.unavailable|Virtual NIC with hardware address {1} failed to connect to distributed virtual port {2} on switch {3}. There are no more ports available on the host proxy switch. Warning System All
esx.problem.net.redundancy.degraded|Uplink redundancy degraded on virtual switch {1}. Physical NIC {2} is down. Affected portgroups:{3}. Warning System All
esx.problem.net.redundancy.lost|Lost uplink redundancy on virtual switch {1}. Physical NIC {2} is down. Affected portgroups:{3}. Warning System All
esx.problem.net.uplink.mtu.failed|VMkernel failed to set the MTU value {1} on the uplink {2}. Warning System All
esx.problem.net.vmknic.ip.duplicate|A duplicate IP address was detected for {1} on the interface {2}. The current owner is {3}. Warning System All
esx.problem.net.vmnic.linkstate.down|Physical NIC {1} linkstate is down. Informational System All
esx.problem.net.vmnic.watchdog.reset|Uplink {1} has recovered from a transient failure due to watchdog timeout Informational System All
esx.problem.scsi.device.limitreached|The maximum number of supported devices of {1} has been reached. A device from plugin {2} could not be created. Critical System All
esx.problem.scsi.device.thinprov.atquota|Space utilization on thin-provisioned device {1} exceeded configured threshold. Affected datastores (if any): {2}. Warning System All
esx.problem.scsi.scsipath.limitreached|The maximum number of supported paths of {1} has been reached. Path {2} could not be added. Critical System All
esx.problem.storage.connectivity.devicepor|Frequent PowerOn Reset Unit Attentions are occurring on device {1}. This might indicate a storage problem. Affected datastores: {2} Warning System All
esx.problem.storage.connectivity.lost|Lost connectivity to storage device {1}. Path {2} is down. Affected datastores: {3}. Critical System All
esx.problem.storage.connectivity.pathpor|Frequent PowerOn Reset Unit Attentions are occurring on path {1}. This might indicate a storage problem. Affected device: {2}. Affected datastores: {3} Warning System All
esx.problem.storage.connectivity.pathstatechanges|Frequent path state changes are occurring for path {1}. This might indicate a storage problem. Affected device: {2}. Affected datastores: {3} Warning System All
esx.problem.storage.redundancy.degraded|Path redundancy to storage device {1} degraded. Path {2} is down. Affected datastores: {3}. Warning System All
esx.problem.storage.redundancy.lost|Lost path redundancy to storage device {1}. Path {2} is down. Affected datastores: {3}. Warning System All
esx.problem.vmfs.heartbeat.recovered|Successfully restored access to volume {1} ({2}) following connectivity issues. Informational System All
esx.problem.vmfs.heartbeat.timedout|Lost access to volume {1} ({2}) due to connectivity issues. Recovery attempt is in progress and outcome will be reported shortly. Informational System All
esx.problem.vmfs.heartbeat.unrecoverable|Lost connectivity to volume {1} ({2}) and subsequent recovery attempts have failed. Critical System All
esx.problem.vmfs.journal.createfailed|No space for journal on volume {1} ({2}). Opening volume in read-only metadata mode with limited write support. Critical System All
esx.problem.vmfs.lock.corruptondisk|At least one corrupt on-disk lock was detected on volume {1} ({2}). Other regions of the volume might be damaged too. Critical System All
esx.problem.vmfs.nfs.mount.connect.failed|Failed to mount to the server {1} mount point {2}. {3} Critical System All
esx.problem.vmfs.nfs.mount.limit.exceeded|Failed to mount to the server {1} mount point {2}. {3} Critical System All
esx.problem.vmfs.nfs.server.disconnect|Lost connection to server {1} mount point {2} mounted as {3} ({4}). Critical System All
esx.problem.vmfs.nfs.server.restored|Restored connection to server {1} mount point {2} mounted as {3} ({4}). Informational System All
esx.problem.vmfs.resource.corruptondisk|At least one corrupt resource metadata region was detected on volume {1} ({2}). Other regions of the volume might be damaged too. Critical System All
esx.problem.vmfs.volume.locked|Volume on device {1} locked, possibly because remote host {2} encountered an error during a volume operation and could not recover. Critical System All
vim.event.LicenseDowngradedEvent|License downgrade: {licenseKey} removes the following features: {lostFeatures} Warning System All
vprob.net.connectivity.lost|Lost network connectivity on virtual switch {1}. Physical NIC {2} is down. Affected portgroups:{3}. Critical System All
vprob.net.e1000.tso6.notsupported|Guest-initiated IPv6 TCP Segmentation Offload (TSO) packets ignored. Manually disable TSO inside the guest operating system in virtual machine {1}, or use a different virtual adapter. Critical System All
vprob.net.migrate.bindtovmk|The ESX advanced config option /Migrate/Vmknic is set to an invalid vmknic: {1}. /Migrate/Vmknic specifies a vmknic that vMotion binds to for improved performance. Please update the config option with a valid vmknic or, if you do not want vMotion to bind to a specific vmknic, remove the invalid vmknic and leave the option blank. Warning System All
vprob.net.proxyswitch.port.unavailable|Virtual NIC with hardware address {1} failed to connect to distributed virtual port {2} on switch {3}. There are no more ports available on the host proxy switch. Warning System All
vprob.net.redundancy.degraded|Uplink redundancy degraded on virtual switch {1}. Physical NIC {2} is down. {3} uplinks still up. Affected portgroups:{4}. Warning System All
vprob.net.redundancy.lost|Lost uplink redundancy on virtual switch {1}. Physical NIC {2} is down. Affected portgroups:{3}. Warning System All
vprob.scsi.device.thinprov.atquota|Space utilization on thin-provisioned device {1} exceeded configured threshold. Warning System All
vprob.storage.connectivity.lost|Lost connectivity to storage device {1}. Path {2} is down. Affected datastores: {3}. Critical System All
vprob.storage.redundancy.degraded|Path redundancy to storage device {1} degraded. Path {2} is down. {3} remaining active paths. Affected datastores: {4}. Warning System All
vprob.storage.redundancy.lost|Lost path redundancy to storage device {1}. Path {2} is down. Affected datastores: {3}. Warning System All
vprob.vmfs.heartbeat.recovered|Successfully restored access to volume {1} ({2}) following connectivity issues. Informational System All
vprob.vmfs.heartbeat.timedout|Lost access to volume {1} ({2}) due to connectivity issues. Recovery attempt is in progress and outcome will be reported shortly. Informational System All
vprob.vmfs.heartbeat.unrecoverable|Lost connectivity to volume {1} ({2}) and subsequent recovery attempts have failed. Critical System All
vprob.vmfs.journal.createfailed|No space for journal on volume {1} ({2}). Opening volume in read-only metadata mode with limited write support. Critical System All
vprob.vmfs.lock.corruptondisk|At least one corrupt on-disk lock was detected on volume {1} ({2}). Other regions of the volume may be damaged too. Critical System All
vprob.vmfs.nfs.server.disconnect|Lost connection to server {1} mount point {2} mounted as {3} ({4}). Critical System All
vprob.vmfs.nfs.server.restored|Restored connection to server {1} mount point {2} mounted as {3} ({4}). Informational System All
vprob.vmfs.resource.corruptondisk|At least one corrupt resource metadata region was detected on volume {1} ({2}). Other regions of the volume might be damaged too. Critical System All
vprob.vmfs.volume.locked|Volume on device {1} locked, possibly because remote host {2} encountered an error during a volume operation and could not recover. Critical System All

1.3 RHEV

Red Hat Enterprise Virtualization (RHEV) は、RedHat を利用するデータセンター企業で使われている仮想化技術の一つです。Pandora FMS は、RHEV Monitoring Plugin というプラグインを通してRHEV を使った仮想アーキテクチャをモニタすることができます。これは、簡単に RHEV の仮想アーキテクチャに関連するすべての値を制御することができます。

1.3.1 モニタする RHEV アーキテクチャ

このプラグインで、データセンター、ホストクラスタ、ストレージドメイン、ネットワーク、ホストおよび、仮想マシンといった、RHEV アーキテクチャの全体をモニタすることができ、仮想環境の全体の状態を確認することができます。

これを実現するために、Pandora では RHEV 仮想化システムによって公式に提供されている API を利用しています。

1.3.2 RHEV モニタリングプラグインでのモニタリング

RHEV 環境のモニタリングは、2つのコンポーネントに基づいています。

  1. 自動検出動作を行うエージェントプラグインとデータ収集タスク。このエージェントプラグインは、Pandora FMS へ情報を送信します。
  2. 検出したいくつかのパラメータを更新する自動検出スクリプト。このスクリプトは、「拡張」のために必要です。
  3. RHEV View および RHEV Manager 拡張。これらは、プラグインに機能追加し、Pandora FMS のコンソールからインフラのモニタリングおよび仮想マシンの管理 (電源ON/OFF) ができるようにした「拡張」です。

Template warning.png

自動検出スクリプトを利用するには、自動検出サーバを有効にする必要があります。

 


Template warning.png

仮想マシンで収集するデータを API で返すようにするには、RHEV エージェントをインストールする必要があります。詳細については、RHEV のドキュメントを参照してください。

 


Info.png

仮想マシンにインストールされた OS をモニタするには、RHEV API ではなくPandora FMS エージェントが必要です。

 


1.3.2.1 プラグイン動作の仕組

RHEV モニタリングプラグインは、RHEV 仮想環境の web API を通して情報を展開します。

モニタしたいだけであれば、この処理を実行するソフトウエアエージェントプラグインを設定します。

エージェントプラグインは、デバイスの自動検出を行い、検出したデバイスごとにモジュールを定義し XML を生成します。プラグインの設定では、どの要素をモニタリングしたいかを選択しモジュールを設定することができます。プラグインで作成されたモジュールの設定は変更が可能です。モジュールの、名前、説明、警告や障害状態の最小値、最大値を変更できます。

Template warning.png

Pandora FMS 4.0 以降では XML を通して警告および障害状態の値(閾値)を更新することができますが、それより前のバージョンでは、ウェブコンソールから変更します。

 


XML が生成されると、エージェントプラグインは転送手法の設定に従って tentacle またはローカルでのファイルコピーにより、そのファイルを送信します。

また、RHEV View および RHEV Manager 拡張を利用する場合は、自動検出スクリプトを利用する必要があります。

自動検出スクリプトは、RHEV 仮想環境のそれぞれの Pandora FMS エージェントの値を更新します。これらの値は、RHEV View 拡張で状態を正しく表示したり、RHEV Manager 拡張で仮想マシンを正しく管理するために必要な値です。

1.3.3 インストール要件

エージェントプラグインは、次のソフトウエアが必要です。

  • curl
  • perl-XML-Simple
  • Pandora FMS ソフトウエアエージェント
  • tentacle_client (ファイルの送信に tentacle を利用したい場合。tentacle_client は、Pandora FMS ソフトウエアエージェントと共に配布されています。)

1.3.3.1 Red Hat

RedHat システムでは、次のように依存ファイルをインストールします。

yum install perl-XML-Simple curl

1.3.3.2 SLES

SUSE システムでは、次のように依存ファイルをインストールします。

zypper install perl-XML-Simple curl

1.3.3.3 Debian/Ubuntu

Debian/Ubuntu システムでは、次のように依存ファイルをインストールします。

apt-get install libxml-simple-perl curl

1.3.3.4 Pandora FMS ソフトウエアエージェントのインストール

Pandora FMS ソフトウエアエージェントのインストールは、Pandora FMSのインストールにて説明しています。ここに、エージェントをインストールためのドキュメントがそろっています。

1.3.4 RHEV 証明書のダウンロード

プラグインを実行する前に、RHEV API に HTTPS で接続するための証明書をダウンロードする必要があります。証明書をダウンロードするには、次のコマンドを実行します。

curl -o rhevm.cer http://[RHEVM-HOST]:8080/ca.crt

ここで、[RHEV-HOST] は、RHEV API サーバのサーバ名です。例えば次の通りです。

curl -o rhevm.cer http://rhevm.server:8080/ca.crt

証明書をダウンロードしたら、次のコマンドで API に接続することができます。

curl -X GET -H "Accept: application/xml" -u [USER:PASS] --cacert [CERT] https://[RHEVM-HOST]:8443/api

次の値を指定してください。

  • USER: API へ接続する [email protected]
  • PASS: API へ接続するためのユーザのパスワード
  • CERT: ダウンロードした証明書のパス
  • RHEVM-HOST: API ホストのアドレス

実際の実行例は次の通りです。

curl -X GET -H "Accept: application/xml" -u [[email protected]:12345] --cacert /home/user/ca.crt https://rhevm.server:8443/api

すべて成功すると、コマンドが XML フォーマットで RHEV API の一般情報を出力します。

1.3.5 RHEV 設定時に考慮すべき点

RHEV の仮想化環境は、同じ名前で複数のエンティティを持つことができます。この機能では、Pandora FMS において複数のエージェントが同じ名前でデータを送信してしまうという問題があります。この問題に加えて、API が出力する XML のパースにおいて次のようなエラーが出る問題があります。

Warning: <data_center> element has non-unique value in 'name' key attribute: Default at ./plugin-rhev.pl line 199

この問題の解決のためには、RHEV 仮想環境のエンティティの名前付けポリシーを、同一名にならないようにする必要があります。

1.3.6 エージェントプラグインのインストール

エージェントプラグインをインストールするには、rhev-plugin.pl および rhev-plugin.conf をプラグインを実行させたいマシンにインストールした pandora エージェントがアクセスできるフォルダにコピーするだけです。プラグインは、Pandora FMS サーバと同じマシンまたは他のマシンにインストールされたエージェントより実行できます。

プラグインを実行するには、エージェントの設定ファイル(デフォルトでは /etc/pandora/pandora_agent.conf です)に次のような行を追加します。

module_plugin /root/rhev-plugin.pl /root/rhev-plugin.conf

この行を追加することにより、エージェントの実行間隔でエージェントプラグインが実行されます。

1.3.7 RHEV 仮想アーキテクチャのモニタリング

プラグインの実行結果を見るには、モニタリング(Monitoring) > 表示(Views) > エージェント詳細(Agent Detail) をクリックします。

Menu monitoring.png



見ての通り、プラグインが Pandora FMS 内に、RHEV アーキテクチャで検出したエンティティごとに一つのエージェントを作成しています。

List agents rhev.png



エージェント名をクリックすると、プラグインにより作成されたモジュールを見ることができます。加えて、エージェントに関連したその他データを次のように見ることができます。

Rhev agent vm.png



それぞれのエンティティで、それぞれ重要な情報をモニタリングするための複数のモジュールが自動的に作成されます。例えば、次の例では仮想マシンをモニタするために作成された複数のモジュールが表示されています。

Rhev vm modules.png



仮想マシンではなくホストに関連づけられたエージェントを選択した場合は、モニタリングモジュールは異なります。次の例は、ホストエンティティのモジュールの例を表示しています。

Rhev host modules.png



RHEV プラグインは、仮想アーキテクチャ内で発生したイベントもモニタリングできます。プラグインは、次の画面のように、それぞれのエージェントにイベントをモニタするモジュールを作成します。

Event module.png



イベントに基づいたこれらのモジュールのデータは、イベントが発生した時間とイベントの説明です。以下にデータの例を示します。

Datos modulo eventos rhev.png



RHEV アーキテクチャに関連したエージェントおよびモジュールに加え、プラグインを実行するエージェントで生成されたモジュールもあります。このモジュールは、デフォルトではRHEV Pluginという名前で、このモジュールの実行結果例は次の通りです。

Result modulo plugin agente rhev.png



このプラグインの内容はプラグインの実行結果であり、実行が正常にできた場合は OK で、エラーが発生した場合は、エラー文字列を表示します。この情報は、ログファイルにも書かれます。

1.3.7.1 エンティティ状態のモニタリング

エンティティの状態モジュールは、RHEV アーキテクチャで事前に定義された値を返します。これは、モニタするエンティティの状態に応じて、値が up, down, error, maintenance, non_operational などの文字列であることを意味します。

警告や障害状態を定義するには、モジュール設定にて正規表現を利用する必要があります。例えば、値が errordownnon_operational の時に障害状態とするには、そのモジュールの障害の場合の文字列(Str.)フィールドに、次の正規表現を設定します。

error|down|non_operational

Pandora FMS 4.0 の初期バージョンではこのオプションは利用できませんが、同一の場合の条件を利用して設定することができます。上記の例でアラーとテンプレートを作成するには、次の手順を実施します。

  1. 優先度が障害のアラートテンプレートを作成し、'条件種別(Condition Type) フィールドを 正規表現(Regular expresion) に設定します。
  2. error|down|non_operational という正規表現をフィールドに入力します。これは、モジュールの値が errordownnon_operational のいずれかになった場合にアラートを実行するという意味になります。
  3. 以降は通常の設定を行います。

テンプレートを定義すると、イベント作成、メールや SMS 送信など、アラートが発生したときの実行アクションを選択することができます。

1.3.8 RHEV アーキテクチャのためのエージェントモジュール

以下に、RHEV アーキテクチャのそれぞれの要素のためのモジュールの詳細について示します。

1.3.8.1 データセンター

  • Status: データセンターの状態

1.3.8.2 ストレージドメイン

  • Available Space: ストレージドメインの空き容量
  • Committed Space: ストレージドメインのコミット容量
  • Used Space: ストレージドメインの利用容量
  • Percent Free Space: ストレージドメインの空き容量率

1.3.8.3 ネットワーク

  • Status: 仮想ネットワークの状態
  • STP Status: スパニングツリープロトコルの状態

1.3.8.4 クラスタ

  • Overcommit Percent: クラスタのオーバーコミット率
  • Transparent HugePages: Transparent HugePage の状態
  • High threshold: ポリシープランニングのための上位閾値
  • Low threshold: ポリシープランニングのための下位閾値
  • Threshold duration: ポリシープランニングのための閾値期間

1.3.8.5 ホスト

  • Status: ホストの状態
  • Buffers size: バッファサイズ
  • Cache size: キャッシュサイズ
  • Cached swap: キャッシュスワップのためのメモリ量 (バイト単位)
  • Free memory: 空きメモリ量 (バイト単位)
  • Percent free memory: 空きメモリ率
  • Swap cached percent: キャッシュスワップメモリ率
  • Swap free: スワップの空き容量 (バイト単位)
  • Swap free percent: 空きスワップメモリ率
  • Total Memory: このホストのトータルメモリ容量 (バイト単位)
  • Total Swap: スワップメモリ容量 (バイト単位)
  • Used memory: 利用メモリ量 (バイト単位)
  • Used Swap: 利用スワップメモリ量 (バイト単位)
  • Nic [x] TX: nic x の送信速度 (バイト/秒) インタフェースごとにモジュールが生成されます。
  • Nic [x] RX: nic x の受信速度 (バイト/秒) インタフェースごとにモジュールが生成されます。
  • Nic [x] erros TX: nic x の送信エラー数。インタフェースごとにモジュールが生成されます。
  • Nic [x] erros RX: nic x の受信エラー数。インタフェースごとにモジュールが生成されます。
  • User CPU: user CPU 使用率
  • System CPU: system CPU 使用率
  • CPU Idle: idle CPU 使用率
  • CPU Load: 5分間のロードアベレージ
  • KSM CPU: KSM の CPU 使用率
  • Active VM: ホスト内の稼働中の仮想マシン数
  • Migrating VM: ホスト内でマイグレーション処理中の仮想マシン数
  • Total VM: このホストにおける全仮想マシン数
  • Fence Status: ホストフェンスの状態

1.3.8.6 仮想マシン

  • Status: 仮想マシンの状態
  • Disk [x] read: ディスク x の読み込み速度 (バイト/秒)。ディスクごとにモジュールが生成されます。
  • Disk [x] write: ディスク x の書き込み速度 (バイト/秒)。ディスクごとにモジュールが生成されます。
  • Disk [x] size: disk x のディスクサイズ。ディスクごとにモジュールが生成されます。
  • Disk [x] status: disk x の状態。ディスクごとにモジュールが生成されます。
  • Nic [x] TX: nic x の送信速度 (バイト/秒)。nic ごとにモジュールが生成されます。
  • Nic [x] RX: nic x の受信速度 (バイト/秒)。nic ごとにモジュールが生成されます。
  • Nic [x] erros TX: nic x の送信エラー数。nic ごとにモジュールが生成されます。
  • Nic [x] erros RX: nic x の受信エラー数。nic ごとにモジュールが生成されます。
  • Installed memory: 設定されたメモリ容量 (バイト単位)
  • Percent free memory: 空きメモリ率
  • Used memory: 利用メモリ量 (バイト単位)
  • Stateless: ステートレス機能の状態
  • HA Status: HA 機能の状態
  • Total CPU: この仮想マシン全体の CPU 使用率
  • Hypervisor CPU: 仮想マシンによって使われている、ハイパーバイザーの CPU 使用率
  • Guest CPU: 仮想マシンの CPU 使用率

1.3.8.7 イベント

  • Event [x]: システム内で発生したイベント x の説明。それぞれのエージェント内に、検出されたイベントごとにモジュールが作成されます。

1.3.9 RHEV アーキテクチャの管理と参照

この節では、インストール、設定、および、どのように RHEV View および RHEV Manager 拡張が動作するかを説明します。

Template warning.png

RHEV View および RHEV Manager 拡張は、Pandora FMS 4.0.2 以上 でのみ動作します。

 


1.3.9.1 自動検出タスクのインストール

以下に、自動検出スクリプトのインストールと、拡張で使われている値を更新する自動検出タスク作成の詳細を示します。

1.3.9.1.1 自動検出スクリプトのインストール

自動検出タスクを作成する前に、拡張が要求する値を更新するための自動検出スクリプトを登録する必要があります。そのためには、サーバ管理(Manage Servers)内の自動検出スクリプト管理(Manage recon script)サブメニューをクリックします。

Recon script menu.jpg

自動検出スクリプト管理(Manage recon script)のメイン画面へ行ったら、追加(Add)ボタンをクリックします。

Recon script screen.jpg

新たな自動検出スクリプトのデータを入力するためのフォームが表示されたら、次のようにすべてのフォームに入力します。スクリプトのフルパス(Script fullpath)にはスクリプトを実行するプログラム(この例ではperl)と、スクリプトのフルパスを入力します。フォームへの入力が完了したら、作成(Create)をクリックします。

800px‎‎‎‎‎‎

自動検出スクリプトが登録されたら、リストにスクリプトが登録され処理が正常に完了した画面が表示されます。

Recon script rhev2.png
1.3.9.1.2 自動検出タスクの作成

拡張が必要とする定期的に更新される値を得るには、指定した時間間隔で実行される自動検出タスクを作成する必要があります。自動検出タスクを作成するには、サーバ管理(Manage Servers)内の自動検出タスク(Recon Task)サブメニューをクリックします。

Recon task menu.jpg

次のような自動検出タスクのメイン画面が表示されます。新規作成のために作成(Create)をクリックします。

Recon task screen.jpg

作成(Create)をクリックすると、次のようなフォームが表示されます。モード(Mode)フィールドでは、カスタムスクリプト(Custom Script)を選択することがとても重要です。なぜなら、先の登録しておいたスクリプト(この例では RHEV 自動検出スクリプトです)を選択できるようにするためです。

Recon creation rhev.png

スクリプトフィールド(Script field)というフィールドは、自動検出スクリプトのパラメータのために予約されています。この自動検出スクリプトでは、以下のパラメータが必要です。

  • server: API を実行するホストのアドレス
  • user: API へアクセスするユーザ(書式は "[email protected]" です)
  • pass: API アクセスのためのパスワード
  • cert: API 証明書のパス
  • pandoraconf: Pandora FMS 設定ファイルが置かれているパス

Template warning.png

certパラメータは、自動検出タスクおよび、RHEV Manager拡張で利用されます。Pandora FMS サーバおよびウェブサーバがAPIにアクセスできるようにするためにとても重要です。

 


最後に、新たな自動検出タスクを作成するために追加(Add)をクリックします。

処理が正常に完了し、新たな自動検出タスクがリストに登録され、次のような画面が表示されます。新たな自動検出タスクが一覧に表示されます。

Recon creation rhev2.png

これで、指定した間隔で実行される一つの自動検出タスクが登録されたことになります。このタスクにより RHEV 仮想アーキテクチャをモニタリングするエージェントのデータが更新されます。

1.3.9.2 RHEV View および RHEV Manager 拡張のインストール

拡張のインストールは、extensions フォルダの中身をコピーするだけです。つぎのようなコマンドで、プラグインを展開したものを Pandora FMS コンソールの enterprise の中へコピーします。

cp -R extensions/* <pandora_console_dir>/enterprise/extensions/

これで、RHEV モニタリング拡張が使えるようになります。

1.3.9.3 RHEV View 拡張の利用

RHEV View 拡張を利用するには、モニタリング(Monitoring) メニューの中の RHEV View をクリックします。

Rhev view menu.png

拡張は、プラグインで検出した RHEV アーキテクチャの全コンポーネントを次のようにマップ表示します。

Rhev view map.png

マップ内には、RHEV アーキテクチャの異なる要素(データセンター、ストレージドメイン、クラスタ、ネットワーク、ホスト、仮想マシン)が表示されます。それぞれの要素はアイコン表示され、それぞれの要素ごとに異なります。アイコン間の関係は、RHEV アーキテクチャの要素間の関係として表示します。この画面では、一目で要素の関係と状態を見ることができます。

拡張には、表示を設定するためのメニューがあります。エンティティを隠したり表示したり、テキストのサイズを変更したり、詳細画像の拡大・縮小ができます。

Rhev view options menu.png

以下の画像の例では、ネットワーク、ホスト、仮想マシンのエレメントは隠れています。なぜなら、データセンターで、クラスタとストレージドメインの関係の詳細を見たいからです。

Rhev filter map.png

1.3.9.4 RHEV Manager 拡張の利用

RHEV Manager 拡張は、Pandora FMS 内で RHEV 仮想マシンを表示するエージェント操作画面にあります。

Template warning.png

この拡張は、curlコマンドを利用します。このコマンドがインストールされ、Pandora FMS コンソールを実行する web サーバプロセスのユーザ権限で利用できる必要があります。

 


拡張にアクセスするには、エージェントのタブにある Red Hat ロゴのアイコンをクリックします。

Rhev icon operation agent.png

拡張では、RHEV 管理コンソールを使わずに仮想マシンを管理(電源 on/off、サスペンド)することができます。拡張は、色で仮想マシンの現在の状態を表示(緑=電源on、オレンジ=サスペンド、グレー=電源off)します。また、状態を選択し、状態変更(Change Status) ボタンをクリックして状態を変更することができます。

Rhev combo options.png

仮想マシンを停止するために停止(Stop)状態を選択すると、拡張は RHEV API に接続しコマンドを送信します。結果、仮想マシンの状態が変化し、選択オプションが次のようになります。

Rhev status down.png

いくつかの状態の間の変更には、いくつかのステップがあります。例えば、停止(Stop) から 開始(Start) への変更です。この場合、拡張はそれぞれのステップで仮想マシンの状態を表示します。停止から開始への変更では、仮想マシンの状態は次のように変化します。

Rhev status down.png
Rhev waiting for launch.png
Rhev powering up.png
Rhev vm up.png

1.3.10 エージェントプラグイン設定

エージェントプラグイン設定は、デフォルトで rhev-plugin.conf という設定ファイル使って行います。

デフォルトでは、エージェントプラグインは全エンティティを選択し、名前と説明をデフォルトの値で全モジュールを作成します。これらのパラメータはすべて設定ファイルを通してカスタマイズできます。

1.3.10.1 設定ファイル

設定ファイルは、全体の設定と個々の監視の設定の 2つの部分から成ります。

全体の設定の部分では、Configuration という記述から始まり、プラグイン設定に関する情報があります。この部分で設定可能なパラメータは次の通りです。

  • module_name: プラグインを実行するエージェントから報告されるモジュール名です。
  • server: RHEV API を実行するホスト名です。
  • user: API に接続するユーザです。[email protected] という書式です。
  • pass: API へ接続するパスワードです。
  • cert: API 証明書のパスです。
  • temporal: テンポラリフォルダです。
  • logfile: ログファイル名です。
  • transfer_mode: 転送モードです。local または tentacle です。
  • tentacle_ip: 情報の送信先の tentacle サーバの IP です。一般的に Pandora サーバと同じマシンです。転送モードに tentacle を利用した場合に利用できます。
  • tentacle_port: tentacle サーバのポート番号です。転送モードに tentacle を利用した場合に利用できます。
  • tentacle_opts: tentacle サーバの拡張オプションです。転送モードに tentacle を利用した場合に利用できます。

監視設定部分には、いくつかのサブセクションがあります。一つ目は、Reject というトークンがあり、除外する仮想環境のエンティティの名前のリストを作成することができます。エンティティを除外するには、次のように名前のリストを記載する必要があります。

#Dismissed entities
Reject
mv1
mv_WindowsXP
mv_WebServer1
...

全ホスト、全仮想マシンなど、一つの種類のすべてのエンティティを除外することもできます。それぞれのエンティティのトークンは、all_dc (データセンタ)、all_host (ホスト)、all_network (ネットワーク)、all_storage (ストレージドメイン)、all_cluster (クラスタ)、all_vm (仮想マシン)です。これらのトークンの利用例を以下に示します。

#Dismissed entities
Reject
all_dc
all_host
all_network
all_storage
all_cluster
all_vm

2つ目のセクションは、Rename というトークンで定義され、エンティティの名前を変更できます。この機能は、Pandora FMS の同一エージェント内でソフトウエアエージェントと API 情報を結びつけるのにとても便利です。このセクションの設定は、古い名前、新しい名前の順にスペースを入れて次のように記述します。

#Rename entities
Rename
mv_WebServer1 WebServer1
mv_WindowsXP WindowsXP Test
...

次のサブセクションは、エンティティのモニタリング設定に関するものです。それぞれのエンティティには、それぞれ DataCenter, StorageDomain, Network, Cluster, Host および VM というトークンがあります。各エンティティで、モジュールの有効・無効、警告や障害状態となる最小値や最大値を定義することができます。例を以下に示します。

#VM Modules
VM
status disabled
errors_total_tx name = TX Error Net [%s]; desc = Total error TX net; limits = 60 70 71 100
memory_used name = Used Mem; desc = Memory used by the virtual machine; limits = 256 1024 1025 2048
...

それぞれの行はモニタリングモジュールに関連していて、次の 2つのオプションがあります。

  • <モジュール> disabled: モジュールは、作成されません
  • <モジュール> name = <名前>; desc = <説明>; limits = <警告の最小値> <警告の最大値> <障害の最小値> <障害の最大値>: モジュールは、指定した名前と説明で作成されます。また、警告および障害の最大・最小の閾値を指定します。

設定ファイルの行構造に注意し、特にモジュール名とモジュールの説明の近くの; 文字に注意することがとても重要です。これらの行は、同じではありません。(; 文字の前のスペースを確認してください)

errors_total_tx name = TX Error Net [%s]; desc = Total error TX net; limits = 60 70 71 100 #OK
errors_total_tx name = TX Error Net [%s]    ; desc = Total error TX net    ; limits = 60 70 71 100 #Wrong

モジュールは、コマンドラインで入力しやすい短い名前で参照されます。フルネームと短い名前の関連付けした表を次の章に示します。

仮想マシンの設定例 (VM セクション) を見てみましょう。

仮想マシンをモニタするには、設定ファイルの VM セクションで、モジュールを有効化・無効化するかの一覧を定義します。status モジュールは無効化されており、errors_total_tx および memory_used モジュールはカスタム値を持っています。リストに無い残りのモジュールは、デフォルトの値で作成されます。この設定で、memory_used モジュールは次の値になります。

  • Name: Used Memory
  • Description: Memory used by the virtual machine
  • Min Warning: 256
  • Max Warning: 1024
  • Min Critical: 1025
  • Max Critical: 2048

ディスクやネットワークインタフェースに関連するモジュールは動的に生成されます。それぞれの要素ごとにモジュールが作成され、次のようにモジュール名は特別な書式になっています。

errors_total_tx name = Errores TX Net [%s]; desc = Errores totales TX de red; limits = 60 70 71 100

この場合、名前は動的に決まる部分があり、% マクロを利用することができます。これはプラグインによりモジュール名で動的に変わるものに置き換えられます。

例えば、errors_total_tx モジュールのデフォルトの名前は次の通りです。

Nic [nic1] errors TX 

この設定での名前は次の通りです。

TX Error Net [nic1] 

nic1 がモジュール名で動的に決まる部分です。

Template warning.png

設定ファイルに関連する全てのエラーはログファイルに出力されます。また、Pandora FMS のプラグインを実行するエージェント内部の非同期モジュールへ送信されます。

 


それぞれの要素に関連したセクションに加え、設定ファイルにはイベント設定のための共通セクションがあります。このセクションは、EventCodes というトークンで定義され、モニタするすべてのイベントコード一覧を次のように定義します。

EventCodes
30
920
980
509
956

このセクションを定義しないと、イベントモニタリングは動作しません。

1.3.10.2 複数のソフトウエアエージェントでのモニタリング負荷の分散

設定ファイルを通して、RHEV 仮想環境のモニタリング負荷を分散することができます。

そのためには、モニタするエンティティをエージェント間で分割する必要があります。この例では、次のようなアーキテクチャを想定します。

DC1
 |
 |- Cluster 1.1
       |- c1.1mv1
       |- c1.1mv2
       |- c1.1mv3

 |- Cluster 1.2
       |- c1.2mv1
       |- c1.2mv2
       |- c1.2mv3

DC2
 |
 |- Cluster 2.1
       |- c2.1mv1
       |- c2.1mv2
       |- c2.1mv3

 |- Cluster 2.2
       |- c2.2mv1
       |- c2.2mv2
       |- c2.2mv3

負荷を分散する方法として、一つのデータセンタをそれぞれ違うエージェントに割り当てます。そのためには、エンティティを除外する機能 (Rejectトークン) を利用します。

最初のエージェントはデータセンター DC1 のみをモニタし、DC2 のエンティティは除外します。

Reject
DC2
Cluster 2.1
Cluster 2.2
c2.1mv1
c2.1mv2
c2.1mv3
c2.2mv1
c2.2mv2
c2.2mv3

2つ目のソフトウエアエージェントは、データセンター DC2 をモニタし、DC1 は除外します。

Reject
DC1
Cluster 1.1
Cluster 1.2
c1.1mv1
c1.1mv2
c1.1mv3
c1.2mv1
c1.2mv2
c1.2mv3

また、クラスタをベースに負荷を分散することもできます。例えば、4つのソフトウエアエージェントがあり、それぞれ異なるクラスタをモニタします。

ソフトウエアエージェント1 ではクラスタ 1.1 をモニタし、他のエンティティを除外します。

Reject
DC1
Cluster 1.2
c1.2mv1
c1.2mv2
c1.2mv3
DC2
Cluster 2.1
Cluster 2.2
c2.1mv1
c2.1mv2
c2.1mv3
c2.2mv1
c2.2mv2
c2.2mv3

ソフトウエアエージェント2 ではクラスタ 1.2 をモニタし、他のエンティティを除外します。

Reject
DC1
Cluster 1.1
c1.1mv1
c1.1mv2
c1.1mv3
DC2
Cluster 2.1
Cluster 2.2
c2.1mv1
c2.1mv2
c2.1mv3
c2.2mv1
c2.2mv2
c2.2mv3

ソフトウエアエージェント3ではクラスタ 2.1 をモニタし、他のエンティティを除外します。

Reject
DC1
Cluster 1.1
Cluster 1.2
c1.1mv1
c1.1mv2
c1.1mv3
c1.2mv1
c1.2mv2
c1.2mv3
DC2
Cluster 2.2
c2.2mv1
c2.2mv2
c2.2mv3

ソフトウエアエージェント4ではクラスタ 2.2 をモニタし、他のエンティティを除外します。

Reject
DC1
Cluster 1.1
Cluster 1.2
c1.1mv1
c1.1mv2
c1.1mv3
c1.2mv1
c1.2mv2
c1.2mv3
DC2
Cluster 2.1
c2.1mv1
c2.1mv2
c2.1mv3

エンティティの除外設定はとても柔軟で、それぞれのソフトウエアエージェントで複数のエンティティのモニタリング負荷を分散させることができます。

1.3.10.3 設定ファイル例

1.3.10.3.1 全モジュール無効化の例
#These lines are comments

#Plugin configuration parameters
Configuration
server rhevm.server
user [email protected]
pass 12345
cert /home/user/rhevm.cer
temporal /tmp
logfile /tmp/plugin-rhev.log
transfer_mode local
tentacle_ip 127.0.0.1
tentacle_port 41121
tentacle_opts

#Dismissed entities
Reject

#Data Center modules
DataCenter
status disabled

#StorageDomain modules
StorageDomain
available disabled
used disabled
committed disabled
free_percent disabled 

#Networks modules
Network
status disabled
stp disabled

#Clusters modules
Cluster
overcommit disabled
hugepages disabled
threshold_low disabled
threshold_high disabled
threshold_duration disabled

#Host Modules
Host
status disabled 
vm_active disabled
vm_migrating disabled
vm_total disabled
data_current_rx disabled
data_current_tx disabled
errors_total_rx disabled
errors_total_tx disabled
memory_cached disabled
memory_total disabled
swap_free_percent disabled
swap_cached_percent disabled
swap_free disabled
cpu_current_idle disabled
cpu_current_user disabled
memory_used disabled
ksm_cpu_current disabled
memory_free_percent disabled
swap_total disabled
memory_buffers disabled
cpu_current_system disabled
cpu_load_avg_5m disabled
swap_cached disabled
swap_used disabled
memory_free disabled
fence_status disabled

#VM Modules
VM
status disabled
stateless disabled
ha disabled
cpu_current_guest disabled
cpu_current_hypervisor disabled
memory_free_percent disabled
memory_installed disabled
memory_used disabled
cpu_current_total disabled
data_current_read disabled
data_current_write disabled
size disabled
disk_status disabled
data_current_rx disabled 
data_current_tx disabled
errors_total_rx disabled
errors_total_tx disabled

1.3.10.4 モジュール名関係表

1.3.10.4.1 データセンター
長い名前 短い名前
Status status
1.3.10.4.2 ストレージドメイン
長い名前 短い名前
Available Space available
Used Space used
Committed Space committed
Percent Free Space free_percent
1.3.10.4.3 ネットワーク
長い名前 短い名前
Status status
STP Status stp
1.3.10.4.4 クラスタ
長い名前 短い名前
Overcommit Percent overcommit
Transparent HugePages hugepages
Low Threshold threshold_low
High Threshold threshold_high
Threshold duration threshold_duration
1.3.10.4.5 ホスト
長い名前 短い名前
Status status
Active VM vm_active
Migrating VM vm_migrating
Total VM vm_total
Nic [x] RX data_current_rx
Nic [x] TX data_current_tx
Nic [x] errors RX errors_total_rx
Nic [x] errors TX errors_total_tx
Cache size memory_cached
Total memory memory_total
Swap free percent swap_free_percent
Swap cached percent swap_cached_percent
Swap free swap_free
CPU Idle cpu_current_idle
User CPU cpu_current_user
Used memory memory_used
KSM CPU ksm_cpu_current
Percent free memory memory_free_percent
Total swap swap_total
Buffers size memory_buffers
System CPU cpu_current_system
CPU Load cpu_load_avg_5m
Cached swap swap_cached
Used swap swap_used
Free memory memory_free
Fence Status fence_status
1.3.10.4.6 仮想マシン
長い名前 短い名前
Status status
Stateless stateless
HA Status ha
Guest CPU cpu_current_guest
Hypervisor CPU cpu_current_hypervisor
Percent free memory memory_free_percent
Installed memory memory_installed
Used memory memory_used
Total CPU cpu_current_total
Disk [x] read data_current_read
Disk [x] write data_current_write
Disk [x] size size
Disk [x] status disk_status
Nic [x] RX data_current_rx
Nic [x] TX data_current_tx
Nic [x] errors RX errors_total_rx
Nic [x] errors TX errors_total_tx

1.4 Nutanix

Nutanix ハイパーコンバージドソリューションでは、ネットワーク、ディスク、処理、メモリリソースのすべてを一ヵ所で管理することができます。

Pandora FMS の Nutanix 監視プラグインにより、Nutaix ソリューションの状態を常に監視することができます。

Nutanix explained.png



1.4.1 プラグイン操作

Nutanix プラグインは、Perl で書かれたプログラムで、Nutanix PRISM の REST API へ接続します。以下の要素を監視するために必要なメトリックスを取得します。

  • Nutanix クラスタ
  • ストレージデバイス
  • コンテナ
  • 仮想マシン
  • ホスト
  • レプリケーションプロセスの状態


1.4.2 プラグインの必要条件

REST API から情報を取得するためには、以下が必要です。

  • ポータルの IPアドレス/FQDN
  • API の読み出し権限を持った ユーザ
  • ユーザの パスワード

監視結果を Pandora FMS へ反映させるために、以下が必要です。

  • ローカルまたは Tentacle での 情報の転送
    • ローカルであれば、結果を含む XML ファイルを置くディレクトリが必要です。またディレクトリには書き込み権限が必要です。
    • Tentacle を利用する場合は、Pandora サーバの IPアドレスまたは FQDN に Tentacle のポートで接続できる必要があります。tentacle クライアントの場所やオプションの定義も必要です。

1.4.3 プラグインのインストール

プラグインに必要なファイルを モジュールライブラリ からダウンロードします。

Nutanix インフラストラクチャを監視するリモートのコンピュータへファイルを転送し、プラグインファイルを展開します。

tar xvzf pandora_nutanix.tar.gz

1.4.4 プラグイン設定

次のフィールドがあります。

Nutanix API 設定

nx_fqdn
Prism メインサーバのアドレス
nx_port
REST API のポート番号(デフォルトは 9440)
nx_user
REST API の読み出し権限を持ったユーザ
nx_pass
上記ユーザのパスワード
use_https
https を利用する(1)かしないか(0)
nx_rest_version
API バージョン(デフォルトは 'v1')

Nutanix エージェント設定

agent_interval
プラグインで生成されるエージェントの間隔(デフォルトは 300)
agent_group
生成されるエージェントが所属するグループ(Pandora サーバの設定で 'autocreate_group' が無効化されている場合) デフォルトは、Nutanix です。
module_interval
生成されたエージェントのモジュールの間隔(倍率指定で、デフォルトは 1)
module_tags
生成されたエージェントの新規モジュールに関連付けるタグ
module_group
新たなモジュールが所属するグループ

Pandora サーバとの通信設定

mode
データ転送モード "local" または "tentacle"
tentacle_ip
Pandora サーバの IP アドレス。tentacle モードでのみ利用します。
tentacle_port
Tentacle の接続ポート番号
tentacle_opts
Tentacle の拡張オプション
tentacle_client
Tentacle クライアントのパス
temp
テンポラリディレクトリ
local_folder
"local" データ転送モード時のディレクトリパス

フィルタ

cluster_monitoring
クラスタ監視の有効化(1)または無効化(0)
storage_monitoring
ストレージデバイス監視の有効化(1)または無効化(0)
container_monitoring
ストレージコンテナ監視の有効化(1)または無効化(0)
vm_monitoring
仮想マシン監視の有効化(1)または無効化(0)
host_monitoring
仮想マシンサーバ(Nutanixノード)監視の有効化(1)または無効化(0)
pd_monitoring
プロテクションドメイン監視の有効化(1)または無効化(0)

カスタマイズ

cluster_agent_header
クラスタタイプデバイスエージェントのエージェント名ヘッダ
storage_agent_header
ストレージデバイスタイプエージェントのエージェント名ヘッダ
host_agent_header
仮想マシンサーバタイプデバイス(Nutanix ノード)エージェントのエージェント名ヘッダ
container_agent_header
ストレージコンテナタイプデバイスエージェントのエージェント名ヘッダ
vm_agent_header
仮想マシンタイプデバイスエージェントのエージェント名ヘッダ
pd_agent_header
プロテクションドメインタイプデバイスエージェントのエージェント名ヘッダ

モジュール生成ルール

vm_stat
仮想マシンを監視するためのモジュール追加集約ルールです。デフォルトは 'hypervisor_cpu_usage_ppm|hypervisor_memory_usage_ppm|.*avg.*' です。メトリックの名前がこのフィールドに示されている正規表現と一致した場合に、異常モジュールを生成します。すべてのメトリックを監視するには、".*" を追加します。
host_stat
仮想マシンサーバ(Nutanix ノード)を監視するためのモジュールを追加するルールです。デフォルトは、' hypervisor_cpu_usage_ppm|hypervisor_memory_usage_ppm|. *avg*' です。メトリックの名前がこのフィールドに示されている正規表現と一致した場合に、異常モジュールを生成します。すべてのメトリックを監視するには、".*" を追加します。
pd_stat
プロテクションドメインを監視するためのモジュールを追加するルールです。デフォルトは、'replication_transmitted_bandwidth_kBps|replication_total_transmitted_bytes' です。メトリックの名前がこのフィールドに示されている正規表現と一致した場合に、異常モジュールを生成します。すべてのメトリックを監視するには、".*" を追加します。

名前変更エンティティ

RENAME aaa TO bbb
エンティティの名前を変更するためのルールで、要素の名前を変更するのに必要な数のディレクティブを定義できます。

エンティティの除外

REJECT aaa
エンティティを監視から除外するルールで、除外したい数のディレクティブを定義できます。



1.4.5 プラグインの実行

プラグインを実行するサーバは、監視のために Pandora サーバおよび Nutanix インフラストラクチャの両方にアクセスできる必要があります。

手動実行:

./pandora_nutanix-linux-x64 pandora_nutanix.conf


/etc/crontab に以下の設定を追加することにより、cron でプラグインを自動実行できます。

*/5 * * * * root /path/to/plugin/pandora_nutanix-linux-x64 /path/to/plugin/pandora_nutanix.conf



1.4.6 プラグインの結果

プラグインが取得した結果は次のようになります。

Nutanix アーキテクチャマップの例:

Nutanix map.JPG




Nutanix アーキテクチャエージェント表示の例:

Nutanix agents.JPG




Nutanix エージェントのモジュール表示の例:

Nutanix host modules.JPG



1.5 XenServer

Xen は、ケンブリッジ大学で開発されたオープンソースの仮想環境です。

設計の目標は、すべての機能を備えたオペレーティングシステムのインスタンスを、単純なコンピュータで完全に機能させることです。

Xenは、安全な隔離、リソース管理、サービス品質の保証、仮想マシンのホットマイグレーションを提供します。 オペレーティングシステムは、Xen で実行するための変更を行います(ただし、ユーザアプリケーションとの互換性は維持されます)。 これにより、Xen は特別なハードウェアサポートなしで高性能仮想化を実現します。

インテルは、VT-X Vanderpool アーキテクチャ拡張をサポートするための複数の機能を Xen に提供しました。 この技術により、物理サーバが Intel または AMD の VT 拡張をサポートしていれば、オペレーティングシステムを変更することなく Xen の仮想マシンとして動作することが可能になります。

Xenserver logo original.png



1.5.1 プラグイン操作

Xen 環境監視のための Pandora FMS プラグインは、Python で書かれています。 必要な情報をすべて取得するには、XenAPI を使用します。 これにより、次のタイプの要素の監視が可能になります。

  • Xen 内の仮想化システム
  • ストレージリソース
  • Xen 自身のサーバ(ホスト)

Xen.PNG



1.5.2 プラグインに必要なもの

プラグインを実行するシステムには次のものが必要です。

  • Python のインストール
  • 以下の Python ライブラリ
    • XenAPI
    • xmltodict
  • XenServer API へのアクセス (プラグインを実行するマシンから、XenServer へのポート 443 または 80 での接続許可)
  • 利用できる情報が多いため、仮想マシンには Xen Server Tools のインストールを推奨します。

Info.png

プラグインは、XenServer 6.5 および 7.2 のシステムでテストしています。

 




1.5.3 プラグインのインストール

Pandora FMS の XenServer プラグインを、モジュールライブラリ からダウンロードします。

実行環境のマシン(Windows または Linux)で、Pandora FMS エージェントまたはシステム cron を使用して実行できるディレクトリにファイルを展開します。



1.5.4 プラグイン設定

Xen 用の Pandora FMS プラグイン設定は以下の通りです。

設定ブロック [CONF]

xen_server_ip
Xen Server の IP/FQDN アドレス
user
Xen API に対してクエリを出せるユーザ
password
ユーザのパスワード
temporal
テンポラリディレクトリ

設定ブロック [PANDORA]

tentacle_client
Tentacle クライアントの実行ファイルの場所
tentacle_ip
Tentacle の接続先 IP アドレス
tentacle_port
Tentacle の接続先ポート
logfile
ログファイルのパス
interval
生成したエージェントの間隔
group
生成したエージェントに割り当てるグループ

設定ブロック [TUNNING]

time_adjustment
プラグインを実行しているコンピュータと Xen server との間で許容可能な時間差を調整するパラメータ。(デフォルト =10, 秒単位)
scan_vm_ip
プラグインが Xen サーバーの VM の IP を取得するかどうかを定義するパラメータ。XenTools がインストールされた VM の IP のみ取得できます。有効化(scan_vm_ip=true)または、無効化(scan_vm_ip=false)の設定ができます。設定されていない場合は、有効になります。

設定ブロック [RENAME]

xen_element_name=pandora_agent_name
このブロックでは、以下のフォーマットで多くのエントリーを定義できます。XenServer 要素の名前を Pandora で使われるエージェント名に変更することができます。VMs、SR、Xen Server 自身を変更することができ、以下に例を示します。
[RENAME]
example-xen-server=Example Xen Server
Example Xen Server 2=example-xen-server-2
example-vm=Example VM
Example VM 2=example-vm-2
example-sr=Example SR
Example SR 2=example-sr-2
名前にスペースが含まれていても、クオートでくくる必要はありません。

1.5.5 プラグインの実行

Pandora FMS エージェントの設定に以下を追加することによって、プラグインの実行ができます。

module_plugin python "<ruta>\xen-plugin.py" "<ruta>\xen-plugin.conf"

システムの cron で設定する場合は、/etc/crontab に以下を追加します。

*/5 * * * * root python "<ruta>\xen-plugin.py" "<ruta>\xen-plugin.conf" > /dev/null 2>&1

プラグインを手動実行すると、出力は以下のようになります。

python "<ruta>\xen-plugin.py" "<ruta>\xen-plugin.conf"
<module>
<name><![CDATA[XenServer Plugin]]></name>
<type><![CDATA[async_string]]></type>
<description><![CDATA[Result of XenServer Plugin execution]]></description>
<data><![CDATA[OK]]></data>
</module>



1.5.6 プラグインの結果

プラグインが取得した結果か以下のようになります。

Xen アーキテクチャマップの例:

Xen map.PNG




Xen アーキテクチャエージェント表示の例:

Xen agents.PNG




Xen エージェントのモジュール表示の例:

Xen host modules.PNG



1.6 OpenNebula

OpenNebula は、分散型および異機種のデータセンターに焦点を当てたクラウドコンピューティングのプラットフォームであり、インフラストラクチャのプライベート、パブリック、およびハイブリッドのインプリメンテーションをサービス(IaaS)クラウドとして構築する仮想インフラストラクチャを提供します。

OpenNebula は、Apache 2 ライセンスのオープンソースソフトウエアです。

Opennebula-logo.png



1.6.1 プラグイン操作

OpenNebula 環境を監視するための Pandora FMS プラグインは Perl で書かれています。OpenNebula サーバのローカルで実行し、OpenNebula 自身の管理コマンドを使って必要な情報を取得します。

  • クラスタ
  • ホスト
  • 仮想マシン
  • ストレージリソース



1.6.2 プラグインに必要なもの

プラグインの実行には以下が必要です。

  • Perl のインストール
  • 以下のコマンドの実行権限
    • onehost
    • onecluster
    • onedatastore

Info.png

プラグインの実行は OpenNebula システム 5.X.X でテストしています。

 



1.6.3 プラグインのインストール

OpenNebula 用の Pandora FMS プラグインは、モジュールライブラリ からダウンロードします。

Pandora FMS エージェントまたはシステム cron を使用して実行できるディレクトリにファイルを展開します。

unzip pandora_OpenNebula.zip



1.6.4 プラグインの設定

OpenNebula 用の Pandora FMS プラグインには以下の設定があります。

Pandora サーバとの通信設定

mode
データ転送モード。"local" または "tentacle" です。
tentacle_ip
Pandora サーバの IP アドレス。tentacle モードの場合のみ。
tentacle_port
Tentacle サーバのポート番号
tentacle_opts
Tentacle の追加オプション
tentacle_client
Tentacle クライアントのパス
temp
テンポラリディレクトリ
local_folder
データ転送モードが "local" の場合のパス

エージェント設定

agent_interval
エージェント間隔。デフォルトは 300。
agent_group
エージェントグループ。デフォルトは OpenNebula。

モジュールカスタマイズ

MODULE_GROUP
モジュールグループ。デフォルトは、OpenNebula。
MODULE_INTERVAL
モジュール間隔(倍率)。デフォルトは 1
MODULE_TAGS
モジュールのタグ

名前のカスタマイズ

cluster_agent_header
クラスタタイプデバイスエージェントのエージェント名ヘッダ
host_agent_header
仮想マシンサーバタイプデバイスエージェントのエージェント名ヘッダ
storage_agent_header
ストレージデバイスタイプエージェントのエージェント名ヘッダ
vm_agent_header
仮想マシンタイプデバイスエージェントのエージェント名ヘッダ

フィルタ

cluster_monitoring
クラスタ監視の有効化(1)または無効化(0)
host_monitoring
仮想マシンサーバ監視の有効化(1)または無効化(0)
storage_monitoring
ストレージデバイス監視の有効化(1)または無効化(0)
vm_monitoring
仮想マシン監視の有効化(1)または無効化(0)

エンティティのリネーム

RENAME aaa TO bbb
エンティティのリネームルールで、必要なだけ定義することができます。

エンティティの除外

REJECT aaa
監視対象外エンティティのルールで、必要なだけ定義することができます。



1.6.5 プラグインの実行

システム cron で設定するには、次の行を /etc/crontab へ追加します。

*/5 * * * * root "<ruta>/pandora_opennebula" "<ruta>/pandora_opennebula.conf" > /dev/null 2>&1


プラグインを手動実行すると、出力は次のようになります。

[[email protected] ~]# ./pandora_opennebula pandora_opennebula.conf
[[email protected] ~]# echo $?
0



1.6.6 プラグインの実行結果

OpenNebula プラグインで生成されるモジュール一覧です。

ホスト:

  1. Available CPU
  2. Available Disk
  3. Available memory
  4. Error Error reported by OpenNebula
  5. State
  6. Total zombies
  7. VMs running


ストレージデバイス:

  1. Disk Free %


仮想マシン:

  1. Assigned CPU
  2. Assigned Memory
  3. Network RX
  4. Network TX
  5. State
  6. Time running

OpenNebula アーキテクチャマップの例:

Opennebula map.PNG





1.7 IBM HMC

このプラグインは、HMC ハードウエア管理コンソールを通して IBM AIX 仮想環境を監視できます。 このプラグインは、HMC システムによって AIX 環境に作成されたすべての論理パーティションから情報を収集します。各管理サーバ、論理パーティション、仮想 IO サーバごとに一つのエージェントを作成します。

SSH で情報を収集するために、プラグインは以下の 3つのモードを使えます。

  1. スクリプト ssh_launcher.sh の利用をもとにしたもの
  2. Net::SSH::Perl ライブラリをもとにしたもの
  3. Net::SSH::Expect ライブラリをもとにしたもの

キャプチャされた情報を補完するために、REST API に対してもクエリが実行されます。(デフォルトは https://fqdn:12443/rest/api/{root_element} です。)



1.7.1 必要条件

監視に必要なパラメータは次の通りです。

  • HMC システムの認証に必要なユーザ名(読み出し専用)
    • ユーザは REST API への接続権限および、HMC シェルへログインし(少なくとも)次のコマンドを実行する権限が必要です。
      • lssyscfg
      • lshwres
  • ユーザのパスワード
  • HMC の場所(FQDN/IP) (myhmc.mydomain など)
  • HMC REST API のベース URL (https://myhmc.mydomain:12443 など)



1.7.2 プラグインにより生成されるモジュール

プラグインによって監視されるパラメータは次の通りです。(エレメントタイプでグループ化されます)

  • Current logical partitions 展開されている現在の論理パーティション
  • Max logical partitions 最大論理パーティション数
  • Max memory available 未使用メモリ
  • Max memory installed 最大搭載メモリ
  • Proc pool DefaultPool current proc units
  • Proc pool DefaultPool max proc units
  • Proc pool DevelopmentPool current proc units
  • Proc pool DevelopmentPool max proc units
  • Proc pool ProductionPool current proc units
  • Proc pool ProductionPool max proc units
  • Proc pool TestPool current proc units
  • Proc pool TestPool max proc units
  • Proc pool VIOPool current proc units
  • Proc pool VIOPool max proc units
  • Processor pools configured 設定されているプロセッサプール
  • Processor units available 未使用プロセッサユニット
  • Processor units installed 搭載されているプロセッサユニット
  • State 管理システムの状態
  • UUID HMC API を照会するために使用されます
  • Virtual proc units max 論理パーティションの最大仮想プロセッサユニット

LPAR:

  • Auto start 自動起動設定の論理パーティション
  • LPAR type 論理パーティションタイプ
  • LPAR UUID HMC API を照会するために使用されます
  • Max memory 最大メモリ
  • Max memory current 未使用メモリ
  • Processor units available 未使用プロセッサユニット
  • Processor units current 搭載プロセッサユニット
  • RMC IP address RMC IP アドレス
  • RMC state LPAR の RMC の状態
  • State 論理パーティションの状態
  • Virtual proc units この LPAR に割り当てられた仮想プロセッサユニット

Virtual IO:

  • Auto start 自動起動設定の論理パーティション
  • LPAR type 論理パーティションタイプ
  • LPAR UUID HMC API を照会するために使用されます
  • Max memory 最大メモリ
  • Max memory current 未使用メモリ
  • Processor units available 未使用プロセッサユニット
  • Processor units current 搭載プロセッサユニット
  • RMC IP address RMC IP アドレス
  • RMC state LPAR の RMC の状態
  • State 論理パーティションの状態
  • Virtual proc units この LPAR へ割り当てられている仮想プロセッサユニット



1.7.3 プラグイン設定

プラグインのパラメータは次の通りです。(エレメントタイプごとにグループ化)

Pandora サーバとの通信設定

mode
データ転送モード。"local" または "tentacle"
tentacle_ip
Pandora サーバの IP アドレス。tentacle モードの場合のみ利用。
tentacle_port
Tentacle サーバのポート
tentacle_opts
Tentacle の追加パラメータ
tentacle_client
Tentacle クライアントのパス
temp
テンポラリディレクトリ
local_folder
データ転送モードが "local" の場合のパス

HMC へのアクセス設定

hmc_host
HMC の IP または FQDN
hmc_user
読み出し権限のユーザ
hmc_pass
パスワード
as_agent_plugin
Pandora FMS エージェントで実行する場合(as_agent_plugin = 1)、プラグインの出力は XML フォーマットで返されます。システムの cron で実行するかまたは、サーバプラグインとして実行する場合(as_agent_plugin = 0)は、標準出力に状態が返されます。

エージェント設定

agent_name
オプション。親エージェントの名前を設定します。デフォルトは 'hostname' です。
agent_interval
エージェントの間隔。デフォルトは 300。
agent_group
エージェントグループ。デフォルトは IBM。

モジュールカスタマイズ

module_group
モジュールグループ。デフォルトは IBM。
module_interval
モジュールの間隔(倍率)。デフォルトは 1。
module_tags
モジュールのタグ

その他エンティティ

名前変更エンティティ。rename というブロックを使います。

rename
MyLPAR_NAME TO my new name
MyLPAR_NAME2 TO my second new name
rename_end



1.7.4 プラグインの実行

IBM AIX システムを HMC を通して監視するための Pandora プラグインは次のように展開しますj。

as_agent_plugin パラメータを 1 に設定した場合(エージェントプラグインとしての実行):

module_plugin /usr/bin/perl pandora_hmc.pl pandora_hmc.conf


as_agent_plugin パラメータを 0 に設定した場合(サーバプラグインとしての実行):

# /etc/crontab
*/5 * * * * root /usr/bin/perl /root/hmc/pandora_hmc.pl /root/vmware/pandora_hmc .conf



1.8 HPVM

Hewlett-Packard が提供する仮想化で、HP-UX を実行する Itanium サーバ上で複数の仮想マシンを同時に実行することができます。サーバに最適化された製品です。



1.8.1 プラグイン設定

このプラグインは、HPVM 仮想化サーバを監視できます。エージェントプラグインとして起動し、監視対象システム内に起動している各仮想マシンごとに、エージェントを生成します。

情報を収集するためにローカルコマンドを利用します。



1.8.2 プラグインに必要なもの

  1. 監視対象のいコンピュータへの Pandora FMS エージェントのインストール
  2. プラグインの実行権限を持ったユーザ
  3. ユーザは、以下のように hpvvmstatus コマンドを実行する権限が必要です
    1. hpvmstatus
    2. hpvmstatus -X
    3. hpvmstatus -r -X



1.8.3 プラグインのインストール

Pandora FMS プラグインは、モジュールライブラリ からダウンロードします。

実行できる場所に展開します。

unzip pandora_HPVM.zip



1.8.4 プラグイン設定

HPVM 用の Pandora FMS プラグインの設定は以下の通りです。

Pandora サーバとの通信設定

mode
データ転送モード。"local" または "tentacle"
tentacle_ip
Pandora サーバの IP アドレス。データ転送モードが tentacle の場合のみ。
tentacle_port
Tentacle サーバのポート
tentacle_opts
Tentacle の拡張オプション
tentacle_client
Tentacle クライアントのパス
temp
テンポラリディレクトリ
local_folder
データ転送モードが "local" の場合のパス

エージェント設定

agent_name
オプション。エージェント名を設定します。デフォルトは 'hostname' です。
agent_interval
エージェント間隔。デフォルトは 300。
agent_group
エージェントグループ。デフォルトは HPVM。

モジュールカスタマイズ

MODULE_GROUP
モジュールグループ。
MODULE_INTERVAL
モジュールの間隔(倍率)。デフォルトは 1。
MODULE_TAGS
モジュールのタグ



1.8.5 プラグインの実行

Pandora FMS エージェントからのプラグイン実行では、エージェント設定ファイルに次の設定をします。

module_plugin /usr/bin/perl pandora_hpvm.pl pandora_hpvm.conf

手動でテストをするには、プラグインを設定し次のように起動します。

perl pandora_hpvm.pl pandora_hpvm.conf




1.8.6 プラグインの実行結果

プラグインで生成されるモジュールの一覧を要素ごとに示します。

サーバーエージェント (プラグインを起動するユーザ)

  • Available VMs
  • HPVM Plugin HPVM プラグイン実行ステータス
  • HPVM Service hpvmctrld の稼働状態 (X インスタンス)
  • HPVM Service CPU usage hpvmctrld の CPU 利用率 (X インスタンス)
  • HPVM Service RAM usage hpvmctrld のメモリ利用率 (X インスタンス)
  • hpvmapp hpvmapp の稼働状態 (X インスタンス)
  • hpvmapp CPU usage hpvmapp の CPU 利用率 (X インスタンス)
  • hpvmapp RAM usage hpvmapp のメモリ使用率 (X インスタンス)

仮想マシン

  • boot_type
  • console_type
  • CPU usage
  • device_number
  • direct_io_number
  • distributed
  • effective_serverid
  • guest_type
  • Host RAM available
  • Host RAM free
  • local_id
  • memory total
  • model_name
  • networks_number
  • run_pid
  • run_serverid
  • serial_number
  • uuid
  • vcpu_number
  • vm_condition
  • vm_config_label
  • vm_config_version
  • vm_state
  • vm_version
  • vm_version_label



Pandora FMS ドキュメント一覧に戻る