Veritas InfoScale™ 8.0.2 トラブルシューティングガイド - Linux
- はじめに
- 第 I 部 Veritas File System のトラブルシューティング
- 第 II 部 Veritas Volume Manager のトラブルシューティング
- ハードウェア障害からのリカバリ
- ハードウェア障害からのリカバリについて
- 起動不能なボリュームの一覧表示
- ボリュームとプレックスの状態の表示
- プレックスの状態遷移
- 起動不能なミラーボリュームのリカバリ
- RECOVER 状態の無効にされたプレックスが存在する起動不能なボリュームのリカバリ
- 起動不能なボリュームの強制的な再起動
- ディスクでの failing フラグのクリア
- 障害が発生したディスクの再接続
- 失敗したプレックスの接続操作または同期操作のリカバリ
- RAID 5 ボリュームの障害
- ディスクグループの不完全な移動のリカバリ
- クラスタ内の一部のノードが使用できない場合のリカバリ後のボリュームの再起動
- DCO ボリュームの障害からのリカバリ
- インスタントスナップショット障害からのリカバリ
- vxsnap prepare の障害からのリカバリ
- フルサイズインスタントスナップショット作成時の vxsnap make の失敗からのリカバリ
- ブレークオフインスタントスナップショット作成時の vxsnap make の失敗からのリカバリ
- 領域最適化インスタントスナップショット作成時の vxsnap make の失敗からのリカバリ
- vxsnap restore の障害からのリカバリ
- vxsnap refresh の障害からのリカバリ
- コピーオンライトの失敗からのリカバリ
- 再同期中に発生する I/O エラーからのリカバリ
- DCO ボリュームでの I/O エラーからのリカバリ
- インスタントスナップのデータ変更オブジェクト(DCO)の vxsnap アップグレードの障害からのリカバリ
- 失敗した vxresize 操作のリカバリ
- ブートディスク障害からのリカバリ
- コマンド、タスク、トランザクションの管理
- ディスクグループ設定データのバックアップとリストア
- ディスクグループのインポートを使った問題のトラブルシューティング
- CDS エラーからの回復
- ログおよびエラーメッセージ
- Veritas Volume Replicator のトラブルシューティング
- RLINK 接続問題のリカバリ
- 設定エラーのリカバリ
- プライマリまたはセカンダリでのリカバリ
- ハードウェア障害からのリカバリ
- 第 III 部 Dynamic Multi-Pathing のトラブルシューティング
- 第 IV 部 Storage Foundation Cluster File System High Availability のトラブルシューティングについて
- 第 V 部 Cluster Server のトラブルシューティング
- VCS のトラブルシューティングおよびリカバリ
- VCS メッセージログ
- VCS エンジンのトラブルシューティング
- LLT(Low Latency Transport)のトラブルシューティング
- GAB(Group Membership Services/Atomic Broadcast)のトラブルシューティング
- VCS の起動に関するトラブルシューティング
- systemd ユニットサービスファイルの問題のトラブルシューティング
- IMF(Intelligent Monitoring Framework)のトラブルシューティング
- サービスグループに関するトラブルシューティング
- VCS はサービスグループを自動的に起動しない
- システムが RUNNING 状態にならない
- あるシステムでサービスグループがオンラインにならない
- サービスグループが自動起動しない
- サービスグループがフリーズしている
- フェールオーバーサービスグループが、別のシステムでオンラインになっている
- 重大なリソース障害が発生した
- サービスグループが自動無効化の状態になっている
- リソースがオンラインまたはオフラインになるまでサービスグループが待機している
- 依存関係が満たされるまでサービスグループが待機している
- サービスグループのプローブが完了していない
- サービスグループが予想されたシステムにフェールオーバーしない
- FailOverPolicy が BiggestAvailable に設定されているのに、サービスグループが BiggestAvailable システムにフェールオーバーしない
- VCS で作成されるバックアップからの測定データベースの復元
- 測定データベースの初期化の失敗
- リソースに関するトラブルシューティング
- I/O フェンシングのトラブルシューティング
- 他のノードが除外されている間、ノードはクラスタを参加させられない
- SCSI TEST UNIT READY コマンドが失敗すると、vxfentsthdw ユーティリティが失敗する
- SCSI-3 ディスクから手動で既存のキーを削除する
- システムパニックによって潜在的なデータ破損が防止される
- コーディネータディスクの I/O フェンシングキーのクラスタ ID がローカルクラスタの ID と一致しない
- フェンシングの起動時にすでに発生しているスプリットブレイン状態が報告される
- 登録済みのキーがコーディネータディスクから失われている
- クラスタがオフラインになっているときに不具合のあるディスクの置換
- rcp または scp コマンドが機能していないと vxfenswap ユーティリティが終了する
- CP サーバーのトラブルシューティング
- Veritas InfoScale 製品 クラスタノードでのサーバーベースのフェンシングのトラブルシューティング
- コーディネーションポイントのオンライン移行中の問題
- 通知に関するトラブルシューティング
- グローバルクラスタのトラブルシューティングとリカバリ
- Steward プロセスのトラブルシューティング
- ライセンスに関するトラブルシューティング
- ライセンスキーの検証
- ライセンスのエラーメッセージ
- [Licensing] Insufficient memory to perform operation
- [Licensing] No valid VCS license keys were found
- [Licensing] Unable to find a valid base VCS license key
- [Licensing] License key can not be used on this OS platform
- [Licensing] VCS evaluation period has expired
- [Licensing] License key can not be used on this system
- [Licensing] Unable to initialize the licensing framework
- [Licensing] QuickStart is not supported in this release
- [Licensing] Your evaluation period for the feature has expired.This feature will not be enabled the next time VCS starts
- CPU、メモリ、スワップの計測または予測された値の確認
- VCS のトラブルシューティングおよびリカバリ
- 第 VI 部 SFDB のトラブルシューティング
RAID 5 ボリューム上のパリティの再同期
ほとんどの場合、RAID 5 ボリュームに無効なパリティはありません。 無効なパリティが発生するのは、RAID 5 ボリュームのすべての RAID 5 ログプレックスに障害が発生した後に、システム障害が発生した場合のみです。 RAID 5 ボリュームに無効なパリティがある場合でも、通常はボリュームの起動プロセスの一部でリカバリされます。
有効な RAID 5 ログを持たないボリュームに対するこの起動プロセスがボリュームの再同期より前に強制終了された場合は、ACTIVE 状態のボリュームは無効なパリティを持つことがあります。
次の例は、無効な RAID 5 ボリュームの vxprint -ht による出力です。
V NAME RVG/VSET/COKSTATE STATE LENGTH READPOL PREFPLEX UTYPE PL NAME VOLUME KSTATE STATE LENGTH LAYOUT NCOL/WID MODE SD NAME PLEX DISK DISKOFFS LENGTH [COL/]OFF DEVICE MODE SV NAME PLEX VOLNAME NVOLLAYR LENGTH [COL/]OFF AM/NM MODE ... v r5vol - ENABLED NEEDSYNC 204800 RAID - raid5 pl r5vol-01 r5vol ENABLED ACTIVE 204800 RAID 3/16 RW sd disk01-01 r5vol-01 disk01 0 102400 0/0 sda ENA sd disk02-01 r5vol-01 disk02 0 102400 1/0 sdb dS sd disk03-01 r5vol-01 disk03 0 102400 2/0 sdc ENA ...
ここでは、ボリュームは NEEDSYNC 状態に遷移しています。これはパリティに再同期が必要なことを示します。ボリューム状態は SYNC 状態に遷移している可能性もあり、その場合は起動時に同期化が開始され、同期プロセスが処理中であることを示します。該当するプロセスが存在しない場合や、ボリュームが NEEDSYNC 状態である場合は、vxvol コマンドに resync キーワードを使って手動で同期を行うこともできます。
パリティは、VOL_R5_RESYNC ioctls を RAID 5 ボリュームに発行することにより再作成されます。 再同期のプロセスは RAID 5 ボリュームの先頭から始まり、-o iosize オプションで指定したセクタ数に等しい領域を再同期します。 -o iosize オプションを指定しない場合、デフォルトの最大 I/O サイズが指定されます。 続いて再同期処理は指定した領域単位で実行され、RAID 5 ボリューム全体の再同期が完了するまで繰り返されます。
ボリュームが大規模な場合は、パリティの再作成に時間がかかることがあります。 システムは、シャットダウンしたり、操作が完了する前にクラッシュしたりする可能性があります。 システムが停止した場合は、パリティ再作成の進行状況を再起動後も保持する必要があります。 保持されない場合は、パリティの再作成を最初から再度行う必要があります。
再生成プロセスを回避するため、パリティの再生成ではチェックポイントが設定されます。すなわち、パリティが再作成された箇所までのオフセットが設定データベースに保存されます。-o checkpt=size オプションでは、チェックポイントを保存する回数を制御します。このオプションを指定しない場合、デフォルトのチェックポイントサイズを使います。
チェックポイントのオフセットを保存するにはトランザクションが必要なため、チェックポイントサイズが小さすぎるとパリティの再作成にかかる時間が長くなります。システムの再起動後、ボリュームサイズよりも小さいチェックポイントオフセットを保有する RAID 5 ボリュームは、チェックポイントオフセットからパリティの再同期を開始します。
RAID 5 ボリューム上のパリティを再同期するには
- 次のようにコマンドを入力します。
# vxvol -g diskgroup resync r5vol