Veritas InfoScale™ 8.0.2 トラブルシューティングガイド - Linux
- はじめに
- 第 I 部 Veritas File System のトラブルシューティング
- 第 II 部 Veritas Volume Manager のトラブルシューティング
- ハードウェア障害からのリカバリ
- ハードウェア障害からのリカバリについて
- 起動不能なボリュームの一覧表示
- ボリュームとプレックスの状態の表示
- プレックスの状態遷移
- 起動不能なミラーボリュームのリカバリ
- RECOVER 状態の無効にされたプレックスが存在する起動不能なボリュームのリカバリ
- 起動不能なボリュームの強制的な再起動
- ディスクでの failing フラグのクリア
- 障害が発生したディスクの再接続
- 失敗したプレックスの接続操作または同期操作のリカバリ
- RAID 5 ボリュームの障害
- ディスクグループの不完全な移動のリカバリ
- クラスタ内の一部のノードが使用できない場合のリカバリ後のボリュームの再起動
- DCO ボリュームの障害からのリカバリ
- インスタントスナップショット障害からのリカバリ
- vxsnap prepare の障害からのリカバリ
- フルサイズインスタントスナップショット作成時の vxsnap make の失敗からのリカバリ
- ブレークオフインスタントスナップショット作成時の vxsnap make の失敗からのリカバリ
- 領域最適化インスタントスナップショット作成時の vxsnap make の失敗からのリカバリ
- vxsnap restore の障害からのリカバリ
- vxsnap refresh の障害からのリカバリ
- コピーオンライトの失敗からのリカバリ
- 再同期中に発生する I/O エラーからのリカバリ
- DCO ボリュームでの I/O エラーからのリカバリ
- インスタントスナップのデータ変更オブジェクト(DCO)の vxsnap アップグレードの障害からのリカバリ
- 失敗した vxresize 操作のリカバリ
- ブートディスク障害からのリカバリ
- コマンド、タスク、トランザクションの管理
- ディスクグループ設定データのバックアップとリストア
- ディスクグループのインポートを使った問題のトラブルシューティング
- CDS エラーからの回復
- ログおよびエラーメッセージ
- Veritas Volume Replicator のトラブルシューティング
- RLINK 接続問題のリカバリ
- 設定エラーのリカバリ
- プライマリまたはセカンダリでのリカバリ
- ハードウェア障害からのリカバリ
- 第 III 部 Dynamic Multi-Pathing のトラブルシューティング
- 第 IV 部 Storage Foundation Cluster File System High Availability のトラブルシューティングについて
- 第 V 部 Cluster Server のトラブルシューティング
- VCS のトラブルシューティングおよびリカバリ
- VCS メッセージログ
- VCS エンジンのトラブルシューティング
- LLT(Low Latency Transport)のトラブルシューティング
- GAB(Group Membership Services/Atomic Broadcast)のトラブルシューティング
- VCS の起動に関するトラブルシューティング
- systemd ユニットサービスファイルの問題のトラブルシューティング
- IMF(Intelligent Monitoring Framework)のトラブルシューティング
- サービスグループに関するトラブルシューティング
- VCS はサービスグループを自動的に起動しない
- システムが RUNNING 状態にならない
- あるシステムでサービスグループがオンラインにならない
- サービスグループが自動起動しない
- サービスグループがフリーズしている
- フェールオーバーサービスグループが、別のシステムでオンラインになっている
- 重大なリソース障害が発生した
- サービスグループが自動無効化の状態になっている
- リソースがオンラインまたはオフラインになるまでサービスグループが待機している
- 依存関係が満たされるまでサービスグループが待機している
- サービスグループのプローブが完了していない
- サービスグループが予想されたシステムにフェールオーバーしない
- FailOverPolicy が BiggestAvailable に設定されているのに、サービスグループが BiggestAvailable システムにフェールオーバーしない
- VCS で作成されるバックアップからの測定データベースの復元
- 測定データベースの初期化の失敗
- リソースに関するトラブルシューティング
- I/O フェンシングのトラブルシューティング
- 他のノードが除外されている間、ノードはクラスタを参加させられない
- SCSI TEST UNIT READY コマンドが失敗すると、vxfentsthdw ユーティリティが失敗する
- SCSI-3 ディスクから手動で既存のキーを削除する
- システムパニックによって潜在的なデータ破損が防止される
- コーディネータディスクの I/O フェンシングキーのクラスタ ID がローカルクラスタの ID と一致しない
- フェンシングの起動時にすでに発生しているスプリットブレイン状態が報告される
- 登録済みのキーがコーディネータディスクから失われている
- クラスタがオフラインになっているときに不具合のあるディスクの置換
- rcp または scp コマンドが機能していないと vxfenswap ユーティリティが終了する
- CP サーバーのトラブルシューティング
- Veritas InfoScale 製品 クラスタノードでのサーバーベースのフェンシングのトラブルシューティング
- コーディネーションポイントのオンライン移行中の問題
- 通知に関するトラブルシューティング
- グローバルクラスタのトラブルシューティングとリカバリ
- Steward プロセスのトラブルシューティング
- ライセンスに関するトラブルシューティング
- ライセンスキーの検証
- ライセンスのエラーメッセージ
- [Licensing] Insufficient memory to perform operation
- [Licensing] No valid VCS license keys were found
- [Licensing] Unable to find a valid base VCS license key
- [Licensing] License key can not be used on this OS platform
- [Licensing] VCS evaluation period has expired
- [Licensing] License key can not be used on this system
- [Licensing] Unable to initialize the licensing framework
- [Licensing] QuickStart is not supported in this release
- [Licensing] Your evaluation period for the feature has expired.This feature will not be enabled the next time VCS starts
- CPU、メモリ、スワップの計測または予測された値の確認
- VCS のトラブルシューティングおよびリカバリ
- 第 VI 部 SFDB のトラブルシューティング
フェンシングの起動時にすでに発生しているスプリットブレイン状態が報告される
vxfen ドライバは、プライベートネットワークリンクの障害が発生した後、プライベートネットワークリンクが修復されるまでの間、削除されたノードがクラスタに再参加することを防止するように機能します。
たとえば、システム 1 とシステム 2 によって形成されているクラスタが正常に機能しているときに、プライベートネットワークリンクが破損したとしましょう。システム 1 が削除されたシステムであるとしましょう。プライベートネットワークリンクが修復される前にシステム 1 が再起動した場合、システム 1 のメンバーシップ設定ではシステム 2 が表示されません。ただし、システム 1 がコーディネータディスクに登録を行おうとしたときに、システム 2 がコーディネータディスクにすでに登録されていることを検出します。システム 2 に関するこの競合情報が与えられた結果、システム 1 はクラスタに参加せず、vxfenconfig が実行されたときに次のようなエラーを返します。
vxfenconfig: ERROR: There exists the potential for a preexisting split-brain. The coordinator disks list no nodes which are in the current membership. However, they also list nodes which are not in the current membership. I/O Fencing Disabled!
また、コンソールには次の情報が表示されます。
<date> <system name> vxfen: WARNING: Potentially a preexisting <date> <system name> split-brain. <date> <system name> Dropping out of cluster. <date> <system name> Refer to user documentation for steps <date> <system name> required to clear preexisting split-brain. <date> <system name> <date> <system name> I/O Fencing DISABLED! <date> <system name> <date> <system name> gab: GAB:20032: Port b closed
ただし、プライベートネットワークリンクが動作していて、両方のシステムが停止し、システム 1 が再起動し、システム 2 が復帰に失敗した場合も、同じエラーが発生する可能性があります。 システム 1 からクラスタを見たときに、システム 2 はコーディネータポイント上で依然として登録されている可能性があります。
サーバーベースのフェンシングでの既存のスプリットブレインを理解するため、次の状況を考えてみます。
コーディネーションポイントとして機能する 3 つの CP サーバーがあるとします。3 つの CP サーバーの 1 つがアクセス不能になります。この状態で、1 つのクライアントノードがクラスタから除かれます。しかし、その登録はアクセス不能になった CP サーバーからは削除できません。アクセス不能な CP サーバーが再起動すると、このサーバーには VCSから切り離されたノードからの無効登録が含まれます。この場合、新しいノードはクラスタに参加できません。クラスタに参加しようとする各ノードは CP サーバーから登録のリストを取得します。1 つの CP サーバーは(先に切り離されたノードの)登録を余分に含んでいます。これにより、joiner ノードは、joiner ノードと無効登録によって表されるノードとの間にスプリットブレインが存在すると結論付けます。
すべてのクライアントノードのフェンシングキーが CP サーバーから消去されていないため、それらのクライアントノードは同時にクラッシュしました。その結果、ノードの再起動時に、vxfen 設定による既存のスプリットブレインの報告が失敗します。
これらの状況は、vxfenclearpre コマンドを実行して解決できる、コーディネータディスクとすでに発生しているスプリットブレインの状況に似ています。サーバーベースのフェンシングでも、cpsadm コマンドを使った同様の解決策が必要です。
すでに発生しているスプリットブレイン状態のクリアを参照してください。