Storage Foundation for Oracle® RAC 7.3.1 管理者ガイド - Solaris
- 第 I 部 SF Oracle RAC の概念と管理
- Storage Foundation for Oracle RAC の概要
- Storage Foundation for Oracle RAC について
- SF Oracle RAC のしくみ(概要)
- SF Oracle RAC のコンポーネント製品とプロセス
- SF Oracle RAC クラスタの状態の定期的評価
- Virtual Business Service について
- Veritas InfoScale Operations Manager について
- Veritas SORT (Services and Operations Readiness Tools) について
- SF Oracle RAC とそのコンポーネントの管理
- SF Oracle RAC の管理
- SF Oracle RAC の環境変数設定
- 各ノードの SF Oracle RAC の起動または停止
- SF Oracle RAC ノードへの Oracle パッチの適用
- コンテナデータベース (CDB) 間でのプラグ可能データベース (PDB) の移行
- Veritas Volume Manager、Veritas File System、または ODM のパッチの SF Oracle RAC ノードへのインストール
- SF Oracle RAC ノードへのオペレーティングシステムの更新の適用
- SF Oracle RAC クラスタへのストレージの追加
- ストレージ障害からのリカバリ
- Veritas NetBackup を使った Oracle データベースのバックアップとリストア
- SF Oracle RAC クラスタの処理効率の向上
- SmartIO の管理
- オフホスト処理のスナップショットの作成
- SmartTier による効率的なデータベースストレージ管理
- シンプロビジョニングと SmartMove によるデータベースストレージの最適化
- SF Oracle RAC クラスタの定期的診断のスケジュール設定
- VCSMM モジュールを起動および停止するための環境変数の使用
- SF Oracle RAC クラスタのノードの検証
- Solaris 11 システムでのプライマリ BE への復帰
- VCS の管理
- I/O フェンシングの管理
- CP サーバーの管理
- CFS の管理
- CVM の管理
- Flexible Storage Sharing の管理
- SF Oracle RAC のグローバルクラスタの管理
- SF Oracle RAC の管理
- Storage Foundation for Oracle RAC の概要
- 第 II 部 処理速度とトラブルシューティング
- SF Oracle RAC のトラブルシューティング
- SF Oracle RAC のトラブルシューティングについて
- ネットワーク接続に失敗した後のインストーラの再起動
- インストーラでクラスタの UUID を作成できない
- SF Oracle RAC インストール前検査の失敗のトラブルシューティング
- LLT 診断時のトラブルシューティングに対する警告メッセージ
- SF Oracle RAC クラスタの LMX と VCSMM 診断時の警告メッセージのトラブルシューティング
- I/O フェンシングのトラブルシューティング
- 起動時の SCSI 予約エラー
- SCSI TEST UNIT READY コマンドが失敗すると、vxfentsthdw ユーティリティが失敗する
- 他のノードが除外されている間、ノードはクラスタを参加させられない
- システムパニックによって潜在的なデータ破損が防止される
- コーディネータディスクの I/O フェンシングキーのクラスタ ID がローカルクラスタの ID と一致しない
- フェンシングの起動時にすでに発生しているスプリットブレイン状態が報告される
- 登録済みのキーがコーディネータディスクから失われている
- クラスタがオフラインになっているときに不具合のあるディスクの置換
- I/O フェンシング診断時のトラブルシューティングに対する警告メッセージ
- CP サーバーのトラブルシューティング
- SF Oracle RAC クラスタノードでのサーバーベースのフェンシングのトラブルシューティング
- コーディネーションポイントのオンライン移行中の問題
- SF Oracle RAC クラスタの Cluster Volume Manager のトラブルシューティング
- CFS のトラブルシューティング
- VCSIPC のトラブルシューティング
- Oracle のトラブルシューティング
- Oracle ログファイル
- Oracle Note
- Oracle Universal Installer が、Oracle Grid Infrastructure 11.2.0.4 のインストール中に突然終了する
- Oracle Clusterware のインストール中に OUI でクラスタ設定画面にノード名が表示されない
- SF Oracle RAC での Oracle インスタンスの起動時のエラー
- Oracle グループの障害のクリア
- 手動でシャットダウンしていないときでも Oracle ログファイルにシャットダウンの呼び出しがある
- Oracle Clusterware プロセスが起動に失敗する
- 再起動後に Oracle Clusterware が失敗
- SF Oracle RAC クラスタにおける VIP 設定のトラブルシューティング
- SF Oracle RAC クラスタ内の Oracle Clusterware 診断時の警告メッセージのトラブルシューティング
- SF Oracle RAC クラスタの ODM のトラブルシューティング
- SF Oracle RAC クラスタの Flex ASM のトラブルシューティング
- 防止と修復の戦略
- チューニングパラメータ
- SF Oracle RAC のトラブルシューティング
- 第 III 部 参照
フェンシングの起動時にすでに発生しているスプリットブレイン状態が報告される
vxfen ドライバは、プライベートネットワークリンクの障害が発生した後、プライベートネットワークリンクが修復されるまでの間、削除されたノードがクラスタに再参加することを防止するように機能します。
たとえば、システム 1 とシステム 2 によって形成されているクラスタが正常に機能しているときに、プライベートネットワークリンクが破損したとしましょう。システム 1 が削除されたシステムであるとしましょう。プライベートネットワークリンクが修復される前にシステム 1 が再起動した場合、システム 1 のメンバーシップ設定ではシステム 2 が表示されません。ただし、システム 1 がコーディネータディスクに登録を行おうとしたときに、システム 2 がコーディネータディスクにすでに登録されていることを検出します。システム 2 に関するこの競合情報が与えられた結果、システム 1 はクラスタに参加せず、vxfenconfig が実行されたときに次のようなエラーを返します。
vxfenconfig: ERROR: There exists the potential for a preexisting split-brain. The coordinator disks list no nodes which are in the current membership. However, they also list nodes which are not in the current membership. I/O Fencing Disabled!
また、コンソールには次の情報が表示されます。
<date> <system name> vxfen: WARNING: Potentially a preexisting <date> <system name> split-brain. <date> <system name> Dropping out of cluster. <date> <system name> Refer to user documentation for steps <date> <system name> required to clear preexisting split-brain. <date> <system name> <date> <system name> I/O Fencing DISABLED! <date> <system name> <date> <system name> gab: GAB:20032: Port b closed
ただし、プライベートネットワークリンクが動作していて、両方のシステムが停止し、システム 1 が再起動し、システム 2 が復帰に失敗した場合も、同じエラーが発生する可能性があります。 システム 1 からクラスタを見たときに、システム 2 はコーディネータポイント上で依然として登録されている可能性があります。
サーバーベースのフェンシングでの既存のスプリットブレインを理解するため、次の状況を考えてみます。
コーディネーションポイントとして機能する 3 つの CP サーバーがあるとします。3 つの CP サーバーの 1 つがアクセス不能になります。この状態で、1 つのクライアントノードがクラスタから除かれます。しかし、その登録はアクセス不能になった CP サーバーからは削除できません。アクセス不能な CP サーバーが再起動すると、このサーバーには SF Oracle RAC クラスタから切り離されたノードからの無効登録が含まれます。この場合、新しいノードはクラスタに参加できません。クラスタに参加しようとする各ノードは CP サーバーから登録のリストを取得します。1 つの CP サーバーは(先に切り離されたノードの)登録を余分に含んでいます。これにより、joiner ノードは、joiner ノードと無効登録によって表されるノードとの間にスプリットブレインが存在すると結論付けます。
すべてのクライアントノードのフェンシングキーが CP サーバーから消去されていないため、それらのクライアントノードは同時にクラッシュしました。その結果、ノードの再起動時に、vxfen 設定による既存のスプリットブレインの報告が失敗します。
これらの状況は、vxfenclearpre コマンドを実行して解決できる、コーディネータディスクとすでに発生しているスプリットブレインの状況に似ています。サーバーベースのフェンシングでも、cpsadm コマンドを使った同様の解決策が必要です。
すでに発生しているスプリットブレイン状態のクリアを参照してください。