Cluster Server 8.0 管理者ガイド - Linux
- 第 I 部 クラスタ化の概念と用語
- Cluster Server の概要
- Cluster Server について
- クラスタ制御のガイドラインについて
- VCS の物理コンポーネントについて
- VCS の論理コンポーネント
- 各要素の組み合わせ
- クラスタトポロジーについて
- VCS 設定の概念
- Cluster Server の概要
- 第 II 部 管理 - VCS の利用方法
- VCS ユーザー権限モデルについて
- コマンドラインによるクラスタの管理
- コマンドラインでの VCS の管理について
- VCS ライセンスのインストールについて
- LLT の管理
- AMF カーネルドライバの管理
- VCS の起動
- VCS の停止
- サービスグループを退避させない VCS の停止
- VCS エンジンと関連プロセスの停止
- VCS へのログイン
- VCS 設定ファイルの管理について
- コマンドラインによる VCS ユーザーの管理について
- VCS のクエリーについて
- サービスグループの管理について
- エージェントの管理
- リソースの管理について
- リソースタイプの管理について
- システムの管理
- クラスタの管理について
- VCS コマンドを使ったスクリプトでの -wait オプションの使用
- HA ファイアドリルの実行
- コマンドラインによるシミュレートクラスタの管理について
- VCS でのアプリケーションとリソースの設定
- VCS Simulator を使った VCS の動作の予測
- 第 III 部 VCS 通信と操作
- クラスタの通信、メンバーシップ、データ保護について
- クラスタ通信について
- クラスタメンバーシップについて
- メンバーシップアービトレーションについて
- データ保護について
- I/O フェンシングの設定ファイルについて
- I/O フェンシングを使う VCS 操作の例
- I/O フェンシングを使わない、クラスタメンバーシップとデータ保護について
- I/O フェンシングを使わない VCS 動作の例
- クラスタ通信におけるベストプラクティスの概略
- I/O フェンシングの管理
- I/O フェンシングの管理について
- vxfentsthdw ユーティリティについて
- vxfentsthdw ユーティリティを使うための一般的なガイドライン
- vxfentsthdw コマンドのオプションについて
- vxfentsthdw の -c オプションを使ったコーディネータディスクグループのテスト
- -r オプションを使った、ディスク上での非破壊テストの実行
- vxfentsthdw -m オプションを使った、共有ディスクのテスト
- vxfentsthdw -f オプションを使った、ファイルにリストされた共有ディスクのテスト
- vxfentsthdw -g オプションを使った、ディスクグループ内の全ディスクのテスト
- 既存のキーによるディスクのテスト
- vxfentsthdw -o オプションを使ってディスクをテストする
- vxfenadm ユーティリティについて
- vxfenclearpre ユーティリティについて
- vxfenswap ユーティリティについて
- コーディネーションポイントサーバーの管理について
- CP サーバーの操作(cpsadm)
- CP サーバーのクローン作成
- CP サーバーデータベースからの VCS clusterエントリの追加と削除
- CP サーバーデータベースに対する VCS clusterノードの追加と削除
- CP サーバーユーザーの追加または削除
- CP サーバーユーザーのリスト表示
- すべての VCS clusterのノードのリスト表示
- VCS clusterのノードのメンバーシップのリスト表示
- ノードの獲得
- ノードの登録と登録解除
- VCS clusterへのユーザーのアクセスの有効化と無効化
- VCS 制御外での CP サーバーの起動と停止
- CP サーバーの接続性の確認
- 実行時における CP サーバーの仮想 IP アドレスとポートの追加と削除
- CP サーバーデータベースのスナップショットの取得
- オンラインクラスタでサーバーベースのフェンシングに使うコーディネーションポイントの置き換え
- サーバー型のフェンシングのコーディネーションポイントの登録キーの更新
- IPv6 またはデュアルスタックをサポートする CP サーバーの設定について
- CP サーバーの配備と移行のシナリオ
- ディスクベースとサーバーベースのフェンシング設定間の移行について
- 優先フェンシングポリシーの有効化と無効化
- I/O フェンシングのログファイルについて
- VCS の動作の制御
- リソース障害時の VCS の動作
- サービスグループレベルでの VCS 動作の制御について
- リソースレベルでの VCS 動作の制御について
- エージェントファイルパスとバイナリの変更
- ストレージ接続消失時の VCS 動作
- サービスグループワークロード管理
- ワークロード管理を示した設定例
- サービスグループの依存関係のロール
- クラスタの通信、メンバーシップ、データ保護について
- 第 IV 部 管理 - 高度な操作
- VCS イベント通知
- VCS イベントトリガ
- VCS イベントトリガについて
- イベントトリガのi使用
- イベントトリガの一覧
- dumptunables トリガについて
- globalcounter_not_updated トリガについて
- injeopardy イベントトリガについて
- loadwarning イベントトリガについて
- nofailover イベントトリガについて
- postoffline イベントトリガについて
- postonline イベントトリガについて
- preonline イベントトリガについて
- resadminwait イベントトリガについて
- resfault イベントトリガについて
- resnotoff イベントトリガについて
- resrestart イベントトリガについて
- resstatechange のイベントトリガについて
- sysoffline イベントトリガについて
- sysup トリガについて
- sysjoin トリガについて
- unable_to_restart_agent イベントトリガについて
- unable_to_restart_had イベントトリガについて
- violation イベントトリガについて
- Virtual Business Service
- 第 V 部 Veritas High Availability 設定ウィザード
- 第 VI 部 ディザスタリカバリ用のクラスタ設定
- クラスタの相互接続 - グローバルクラスタの作成
- コマンドラインによるグローバルクラスタの管理
- RDC の設定
- キャンパスクラスタの設定
- 第 VII 部 トラブルシューティングおよびパフォーマンス
- VCS パフォーマンスに関する注意事項
- クラスタコンポーネントの処理速度に対する影響
- クラスタ操作の処理速度に対する影響
- クラスタシステム起動時の VCS の処理速度に関する注意事項
- リソースがオンラインになるときの VCS の処理速度に関する注意事項
- リソースがオフラインになるときの VCS の処理速度に関する注意事項
- サービスグループがオンラインになるときの VCS の処理速度に関する注意事項
- サービスグループがオフラインになるときの VCS の処理速度に関する注意事項
- リソースで障害が発生したときの VCS の処理速度に関する注意事項
- システムで障害が発生したときの VCS の処理速度に関する注意事項
- ネットワークリンクで障害が発生したときの VCS の処理速度に関する注意事項
- システムパニックのときの VCS の処理速度に関する注意事項
- サービスグループが切り替わるときの VCS の処理速度に関する注意事項
- サービスグループがフェールオーバーするときの VCS の処理速度に関する注意事項
- スケジュールクラスと優先度の設定について
- VCS エージェントの統計機能
- VCS のチューニングパラメータについて
- VCS のトラブルシューティングおよびリカバリ
- VCS メッセージログ
- VCS エンジンのトラブルシューティング
- LLT(Low Latency Transport)のトラブルシューティング
- GAB(Group Membership Services/Atomic Broadcast)のトラブルシューティング
- VCS の起動に関するトラブルシューティング
- systemd ユニットサービスファイルの問題のトラブルシューティング
- IMF(Intelligent Monitoring Framework)のトラブルシューティング
- サービスグループに関するトラブルシューティング
- VCS はサービスグループを自動的に起動しない
- システムが RUNNING 状態にならない
- あるシステムでサービスグループがオンラインにならない
- サービスグループが自動起動しない
- サービスグループがフリーズしている
- フェールオーバーサービスグループが、別のシステムでオンラインになっている
- 重大なリソース障害が発生した
- サービスグループが自動無効化の状態になっている
- リソースがオンラインまたはオフラインになるまでサービスグループが待機している
- 依存関係が満たされるまでサービスグループが待機している
- サービスグループのプローブが完了していない
- サービスグループが予想されたシステムにフェールオーバーしない
- FailOverPolicy が BiggestAvailable に設定されているのに、サービスグループが BiggestAvailable システムにフェールオーバーしない
- VCS で作成されるバックアップからの測定データベースの復元
- 測定データベースの初期化の失敗
- サービスグループのフェールオーバーまたはスイッチ中にエラーメッセージが表示される
- リソースに関するトラブルシューティング
- サイトのトラブルシューティング
- I/O フェンシングのトラブルシューティング
- 他のノードが除外されている間、ノードはクラスタを参加させられない
- SCSI TEST UNIT READY コマンドが失敗すると、vxfentsthdw ユーティリティが失敗する
- SCSI-3 ディスクから手動で既存のキーを削除する
- システムパニックによって潜在的なデータ破損が防止される
- コーディネータディスクの I/O フェンシングキーのクラスタ ID がローカルクラスタの ID と一致しない
- フェンシングの起動時にすでに発生しているスプリットブレイン状態が報告される
- 登録済みのキーがコーディネータディスクから失われている
- クラスタがオフラインになっているときに不具合のあるディスクの置換
- rcp または scp コマンドが機能していないと vxfenswap ユーティリティが終了する
- CP サーバーのトラブルシューティング
- VCS クラスタノードでのサーバーベースのフェンシングのトラブルシューティング
- コーディネーションポイントのオンライン移行中の問題
- 通知に関するトラブルシューティング
- グローバルクラスタのトラブルシューティングとリカバリ
- Steward プロセスのトラブルシューティング
- ライセンスに関するトラブルシューティング
- ライセンスキーの検証
- ライセンスのエラーメッセージ
- [Licensing] Insufficient memory to perform operation
- [Licensing] No valid VCS license keys were found
- [Licensing] Unable to find a valid base VCS license key
- [Licensing] License key can not be used on this OS platform
- [Licensing] VCS evaluation period has expired
- [Licensing] License key can not be used on this system
- [Licensing] Unable to initialize the licensing framework
- [Licensing] QuickStart is not supported in this release
- [Licensing] Your evaluation period for the feature has expired.This feature will not be enabled the next time VCS starts
- セキュア設定のトラブルシューティング
- ウィザードベースの設定に関する問題のトラブルシューティング
- [Veritas High Availability]ビューの問題のトラブルシューティング
- VCS パフォーマンスに関する注意事項
- 第 VIII 部 付録
リソースタイプとエージェント設定の監視
デフォルトでは、VCS は、60 秒ごとに各リソースを監視、すなわち monitor エントリポイントを呼び出します。この間隔を変更するには、リソースタイプの MonitorInterval 属性を変更します。重要でないリソースやシステム全体の処理速度に影響がある監視操作を行うリソースに対しては、監視の頻度を減らすことができます。監視の頻度を減らすと、VCS がリソース障害を検出するのに時間がかかることに注意してください。
デフォルトでは、VCS は、オフライン状態のリソースも監視します。それによって、リソースが VCS 以外からの操作によってオンラインとなった場合、VCS はこのイベントを検出し、フェールオーバーグループに対して同時性違反のフラグを立てます。オフラインリソースの監視頻度を減らすには、そのリソースタイプの OfflineMonitorInterval 属性を変更します。
VCS エージェントフレームワークは、マルチスレッドを使って、同じタイプのリソースに対して複数のリソース操作を同時に実行できるようにします。たとえば、1 つの Mount エージェントがすべての Mount リソースを処理します。大部分のリソースタイプに対してエージェントのスレッド数は、デフォルトで 10 です。このデフォルト値を変更するには、該当するリソースタイプの NumThreads 属性を変更します。NumThreads 属性の最大値は 30 です。
前述の例の説明を続けると、Mount エージェントは、MonitorInterval 属性または OfflineMonitorInterval 属性に基づいて、すべての Mount リソースに対する monitor 機能を実行するスケジュールを設定します。Mount リソースの数が NumThreads の値を上回った場合、スレッドが解放されるまで、一部の Mount リソースに対する monitor 機能の実行が遅延する場合があります。
NumThreads 属性の変更に関しては、他にも次のような注意事項があります。
所定のタイプのリソースが 1 つか 2 つしかない場合は、NumThreads の値を小さくすることができます。
所定のタイプのリソースが数多く存在する場合は、monitor 機能の実行時間と、監視に使える CPU 処理能力を考慮してください。たとえば、50 のマウントポイントがある場合、NumThreads の値を大きくすることで、システム処理速度全体に影響を及ぼさずに Mount エージェントの理想的な処理速度を得ることができます。
また、関連する属性を変更することによって、VCS が各種の機能を監視する頻度を調整することができます。MonitorTimeout 属性、OnlineTimeout 属性および OfflineTimeout 属性は、monitor、online および offline 機能の処理がその時間内に完了する必要がある最大時間(秒数)を定義し、各機能がその時間内に完了しない場合には、終了します。MonitorTimeout 属性のデフォルト値は 60 秒です。OnlineTimeout 属性および OfflineTimeout 属性のデフォルト値は 300 秒です。最良の結果を得るため、デフォルトを変更する前に、リソースのオンライン化、オフライン化、監視にかかる時間を測定することをお勧めします。オンライン化またはオフライン化にかかる時間を測定するには、online コマンドまたは offline コマンドを実行します。リソースの監視にかかる時間を測定するには、リソースの障害を発生させてから probe コマンドを実行するか、リソースを VCS 以外の制御でオンラインにしてから probe コマンドを実行します。
エージェントは一般に、通常のプロセスと同じプライオリティで実行されます。エージェントを開発する際は、次の点を考慮してください。
エージェントを作成する場合は、C または C++ を使って monitor 機能を作成してください。スクリプトベースの monitor を作成すると、VCS は、monitor の実行ごとに新しいプロセスを生成してしまいます。この方法では、該当するタイプのリソースが数多く存在する場合にシステムリソースを消費します。
リソースの監視を実行すると負担が大きい場合、通常監視と、より広範囲な詳細監視に分割することができます。通常監視を使うか詳細監視を使うかは、各自の設定必要条件によって異なります。
エージェントに関する他の注意事項として、サービスグループの SystemList 属性を正しく設定してください。 たとえば、あるサービスグループを SystemA と SystemB でのみオンラインにできることがわかっている場合、SystemList にはその他のシステムを加えないでください。余分なエージェントプロセスや監視のオーバーヘッドを抑えることができます。