<book_title> を検索 ...

Storage Foundation for Oracle® RAC 7.3.1 管理者ガイド - Solaris

Last Published: 2018-01-17

Product(s): InfoScale & Storage Foundation (7.3.1)

フェンシングの起動時にすでに発生しているスプリットブレイン状態が報告される

vxfen ドライバは、プライベートネットワークリンクの障害が発生した後、プライベートネットワークリンクが修復されるまでの間、削除されたノードがクラスタに再参加することを防止するように機能します。

たとえば、システム 1 とシステム 2 によって形成されているクラスタが正常に機能しているときに、プライベートネットワークリンクが破損したとしましょう。システム 1 が削除されたシステムであるとしましょう。プライベートネットワークリンクが修復される前にシステム 1 が再起動した場合、システム 1 のメンバーシップ設定ではシステム 2 が表示されません。ただし、システム 1 がコーディネータディスクに登録を行おうとしたときに、システム 2 がコーディネータディスクにすでに登録されていることを検出します。システム 2 に関するこの競合情報が与えられた結果、システム 1 はクラスタに参加せず、vxfenconfig が実行されたときに次のようなエラーを返します。

vxfenconfig: ERROR: There exists the potential for a preexisting 
split-brain. The coordinator disks list no nodes which are in 
the current membership. However, they also list nodes which are 
not in the current membership.

I/O Fencing Disabled!

また、コンソールには次の情報が表示されます。

<date> <system name> vxfen: WARNING: Potentially a preexisting
<date> <system name> split-brain.
<date> <system name> Dropping out of cluster.
<date> <system name> Refer to user documentation for steps
<date> <system name> required to clear preexisting split-brain.
<date> <system name>
<date> <system name> I/O Fencing DISABLED!
<date> <system name>
<date> <system name> gab: GAB:20032: Port b closed

ただし、プライベートネットワークリンクが動作していて、両方のシステムが停止し、システム 1 が再起動し、システム 2 が復帰に失敗した場合も、同じエラーが発生する可能性があります。システム 1 からクラスタを見たときに、システム 2 はコーディネータポイント上で依然として登録されている可能性があります。

サーバーベースのフェンシングでの既存のスプリットブレインを理解するため、次の状況を考えてみます。

コーディネーションポイントとして機能する 3 つの CP サーバーがあるとします。3 つの CP サーバーの 1 つがアクセス不能になります。この状態で、1 つのクライアントノードがクラスタから除かれます。しかし、その登録はアクセス不能になった CP サーバーからは削除できません。アクセス不能な CP サーバーが再起動すると、このサーバーには SF Oracle RAC クラスタから切り離されたノードからの無効登録が含まれます。この場合、新しいノードはクラスタに参加できません。クラスタに参加しようとする各ノードは CP サーバーから登録のリストを取得します。1 つの CP サーバーは（先に切り離されたノードの）登録を余分に含んでいます。これにより、joiner ノードは、joiner ノードと無効登録によって表されるノードとの間にスプリットブレインが存在すると結論付けます。
すべてのクライアントノードのフェンシングキーが CP サーバーから消去されていないため、それらのクライアントノードは同時にクラッシュしました。その結果、ノードの再起動時に、vxfen 設定による既存のスプリットブレインの報告が失敗します。

これらの状況は、vxfenclearpre コマンドを実行して解決できる、コーディネータディスクとすでに発生しているスプリットブレインの状況に似ています。サーバーベースのフェンシングでも、cpsadm コマンドを使った同様の解決策が必要です。

すでに発生しているスプリットブレイン状態のクリアを参照してください。