Veritas InfoScale™ 8.0.2 トラブルシューティングガイド - Linux
- はじめに
- 第 I 部 Veritas File System のトラブルシューティング
- 第 II 部 Veritas Volume Manager のトラブルシューティング
- ハードウェア障害からのリカバリ
- ハードウェア障害からのリカバリについて
- 起動不能なボリュームの一覧表示
- ボリュームとプレックスの状態の表示
- プレックスの状態遷移
- 起動不能なミラーボリュームのリカバリ
- RECOVER 状態の無効にされたプレックスが存在する起動不能なボリュームのリカバリ
- 起動不能なボリュームの強制的な再起動
- ディスクでの failing フラグのクリア
- 障害が発生したディスクの再接続
- 失敗したプレックスの接続操作または同期操作のリカバリ
- RAID 5 ボリュームの障害
- ディスクグループの不完全な移動のリカバリ
- クラスタ内の一部のノードが使用できない場合のリカバリ後のボリュームの再起動
- DCO ボリュームの障害からのリカバリ
- インスタントスナップショット障害からのリカバリ
- vxsnap prepare の障害からのリカバリ
- フルサイズインスタントスナップショット作成時の vxsnap make の失敗からのリカバリ
- ブレークオフインスタントスナップショット作成時の vxsnap make の失敗からのリカバリ
- 領域最適化インスタントスナップショット作成時の vxsnap make の失敗からのリカバリ
- vxsnap restore の障害からのリカバリ
- vxsnap refresh の障害からのリカバリ
- コピーオンライトの失敗からのリカバリ
- 再同期中に発生する I/O エラーからのリカバリ
- DCO ボリュームでの I/O エラーからのリカバリ
- インスタントスナップのデータ変更オブジェクト(DCO)の vxsnap アップグレードの障害からのリカバリ
- 失敗した vxresize 操作のリカバリ
- ブートディスク障害からのリカバリ
- コマンド、タスク、トランザクションの管理
- ディスクグループ設定データのバックアップとリストア
- ディスクグループのインポートを使った問題のトラブルシューティング
- CDS エラーからの回復
- ログおよびエラーメッセージ
- Veritas Volume Replicator のトラブルシューティング
- RLINK 接続問題のリカバリ
- 設定エラーのリカバリ
- プライマリまたはセカンダリでのリカバリ
- ハードウェア障害からのリカバリ
- 第 III 部 Dynamic Multi-Pathing のトラブルシューティング
- 第 IV 部 Storage Foundation Cluster File System High Availability のトラブルシューティングについて
- 第 V 部 Cluster Server のトラブルシューティング
- VCS のトラブルシューティングおよびリカバリ
- VCS メッセージログ
- VCS エンジンのトラブルシューティング
- LLT(Low Latency Transport)のトラブルシューティング
- GAB(Group Membership Services/Atomic Broadcast)のトラブルシューティング
- VCS の起動に関するトラブルシューティング
- systemd ユニットサービスファイルの問題のトラブルシューティング
- IMF(Intelligent Monitoring Framework)のトラブルシューティング
- サービスグループに関するトラブルシューティング
- VCS はサービスグループを自動的に起動しない
- システムが RUNNING 状態にならない
- あるシステムでサービスグループがオンラインにならない
- サービスグループが自動起動しない
- サービスグループがフリーズしている
- フェールオーバーサービスグループが、別のシステムでオンラインになっている
- 重大なリソース障害が発生した
- サービスグループが自動無効化の状態になっている
- リソースがオンラインまたはオフラインになるまでサービスグループが待機している
- 依存関係が満たされるまでサービスグループが待機している
- サービスグループのプローブが完了していない
- サービスグループが予想されたシステムにフェールオーバーしない
- FailOverPolicy が BiggestAvailable に設定されているのに、サービスグループが BiggestAvailable システムにフェールオーバーしない
- VCS で作成されるバックアップからの測定データベースの復元
- 測定データベースの初期化の失敗
- リソースに関するトラブルシューティング
- I/O フェンシングのトラブルシューティング
- 他のノードが除外されている間、ノードはクラスタを参加させられない
- SCSI TEST UNIT READY コマンドが失敗すると、vxfentsthdw ユーティリティが失敗する
- SCSI-3 ディスクから手動で既存のキーを削除する
- システムパニックによって潜在的なデータ破損が防止される
- コーディネータディスクの I/O フェンシングキーのクラスタ ID がローカルクラスタの ID と一致しない
- フェンシングの起動時にすでに発生しているスプリットブレイン状態が報告される
- 登録済みのキーがコーディネータディスクから失われている
- クラスタがオフラインになっているときに不具合のあるディスクの置換
- rcp または scp コマンドが機能していないと vxfenswap ユーティリティが終了する
- CP サーバーのトラブルシューティング
- Veritas InfoScale 製品 クラスタノードでのサーバーベースのフェンシングのトラブルシューティング
- コーディネーションポイントのオンライン移行中の問題
- 通知に関するトラブルシューティング
- グローバルクラスタのトラブルシューティングとリカバリ
- Steward プロセスのトラブルシューティング
- ライセンスに関するトラブルシューティング
- ライセンスキーの検証
- ライセンスのエラーメッセージ
- [Licensing] Insufficient memory to perform operation
- [Licensing] No valid VCS license keys were found
- [Licensing] Unable to find a valid base VCS license key
- [Licensing] License key can not be used on this OS platform
- [Licensing] VCS evaluation period has expired
- [Licensing] License key can not be used on this system
- [Licensing] Unable to initialize the licensing framework
- [Licensing] QuickStart is not supported in this release
- [Licensing] Your evaluation period for the feature has expired.This feature will not be enabled the next time VCS starts
- CPU、メモリ、スワップの計測または予測された値の確認
- VCS のトラブルシューティングおよびリカバリ
- 第 VI 部 SFDB のトラブルシューティング
スレーブから発行された CVM コマンドのマスターノードへの関連付け
共有ディスクグループの設定を変更するコマンドを CVM スレーブノードで実行すると、CVM はコマンドを CVM マスターノードに転送して実行します。
たとえば、スレーブノードで、共有ディスクグループ内にボリュームを作成する次のコマンドを実行します。CVM はコマンドをマスターノードに転送し、CVM はマスターノードでコマンドを実行します。
# vxassist -g shareddg make shared-vol1 200M
CVM スレーブノードで、次のコマンドを入力して、転送されたコマンドをトランザクションログ(translog)で特定します。
# egrep CMDSHIP_REQUEST translog
この例では、スレーブノードのトランザクションログには次のエントリが記録されていました。
Thu Jul 15 06:30:16 2010
Clid = 5302, PID = 589906, Part = 0, Status = 0, Abort Reason = 0
DG_SET_CURRENT_ID shareddg
DG_SET_CURRENT shareddg
DG_GETCFG_ID 0xdde49f shareddg
DG_GETCFG_NAME 0xdde49f shareddg
DG_SET_CURRENT_ID shareddg
DG_SET_CURRENT shareddg
DG_SET_CURRENT_ID shareddg
DG_SET_CURRENT shareddg
DG_GETCFG_ALL 0x420
DG_GETCFG_ALL 0x420
VOL_TRANS ds4700-0_7 ds4700-0_3 ds4700-0_
DG_GET_DEFAULT <no request data>
CMDSHIP_REQUEST Command Shipped = /usr/sbin/vxassist -g
shareddg make shared-vol1 200M
Default dg = nodg
DROPPED <no request data>スレーブノードでこの要求を発行したユーティリティを見つけるには、この構文を使います。
# egrep -n PID cmdlog | egrep Clid
この例では、次のコマンドを入力します。
# egrep -n 589906 cmdlog | egrep 5302 7310#: 5302, 589906, Thu Jul 15 06:30:14 2010 /usr/sbin/vxassist -g
この例の出力は、コマンドログの 7310 行に一致する記述があることを示しています。コマンドログの 7310 行と 7311 行を調べると、vxassist make コマンドが shareddg ディスクグループに対して実行されていたことがわかります。
# sed -e '7310,7311!d' cmdlog
# 5302, 589906, Thu Jul 15 06:30:14 2010 /usr/sbin/vxassist -g shareddg make shared-vol1 200M
コマンドでディスクアクセス(DA)名を使っている場合、転送されるコマンドでは、DA 名が重複のないディスク ID(UDID)またはディスクメディア(DM)名に変換されます。CVM マスターノードでは、vxconfigd ログに、受信されたコマンドのエントリが示されます。マスターでスレーブノードから受信したコマンドを特定するには、次のコマンドを入力します。
# egrep CMDSHIP_REQUEST /var/adm/messages
メモ:
vxconfigd メッセージが記録されるファイルは、メッセージがリダイレクトされる場所によって異なる場合があります。これらのメッセージはデフォルトでログに記録されます。vxconfigd デバッグレベルを設定する必要はありません。
この例では、受信された次のコマンドはマスターノード上の vxconfigd ログに記録されます。
07/15 06:29:02: V-5-1-0 receive_cmdship_message: CMDSHIP_REQUEST: Received command: Text - /usr/sbin/vxassist -g shareddg make shared-vol1 200M len = 53 CLID = 5302 SlaveID = 0 Defaultdg = nodg
上記のマスターノードの出力から、SlaveID に基づいてコマンドがトリガされるスレーブを判断できます。SlaveID はクラスタ内のノードの CM nid(クラスタモニタノード ID)です。
トリガされたコマンドからスレーブノードを判断するには、次のコマンドを入力し、一致する SlaveID を持つスレーブノードを見つけます。
# /etc/vx/bin/vxclustadm nidmap
次に例を示します。
bash-3.00# # /etc/vx/bin/vxclustadm nidmap Name CVM Nid CM Nid State pl9dom1 1 3 Joined: Master pl9dom2 0 1 Joined: Slave pl9dom3 2 2 Joined: Slave pl9dom4 3 0 Joined: Slave bash-3.00#
CVM マスターノードはコマンドを実行し、応答をスレーブノードに送信します。
マスターノードからスレーブノードに送信された応答を見つけるには、マスターノードで次のようなコマンドを入力します。
# egrep CMDSHIP_RESPONSE translog | egrep SlaveCLID
この例では、次のコマンドを入力して、マスターノードから送信された応答を見つけます。
# egrep CMDSHIP_RESPONSE translog | egrep 5302 Thu Jul 15 06:29:03 2010 Clid = 27741, PID = 475212, Part = 0, Status = 0, Abort Reason = 0 CMDSHIP_RESPONSE SlaveCLID = 5302 SlaveCMID = 0 ExitCode = 12 Flags = 1 stdoutlen = 0 stderrlen = 98 Response = VxVM vxassist ERROR V-5-1-10127 creating volume shared-vol1: Record already exists in disk group DROPPED <no request data>