NetBackup™ Web UI Apache Cassandra 管理者ガイド

Last Published:
Product(s): NetBackup & Alta Data Protection (10.4)

Cassandra のバックアップとリカバリに関するコンポーネントと用語

次の表に、Cassandra のバックアップおよびリカバリソリューションに関連するさまざまなコンポーネントの目的と用語を示します。

表:

コンポーネントと用語

目的と定義

アプリケーションクラスタ

  • アプリケーションクラスタは Cassandra 実稼働クラスタの名前です。

  • クラスタ名は、空白なしの単語で、実稼働ノードの Cassandra.yaml ファイルで使用される実際のクラスタ名である必要があります。

保護計画

保護計画は、バックアップを実行するタイミング、バックアップの保持期間、使用するストレージ形式を定義します。

保護計画を設定したら、資産を保護計画にサブスクライブできます。

バックアップホスト

バックアップホストは、プロキシクライアントとして機能します。すべてのバックアップとリストア操作は、バックアップホストで実行されます。

Cassandra Backup Recovery (CBR) ソリューションは、アプリケーションの種類が cassandra の BigData ポリシーを使用します。

保護計画では、このバックアップホストを使用します。

CBR ソリューションのストレージサーバーを構成するために使用されるメディアサーバーをバックアップホストとして使用する必要があります。

メモ:

NetBackup クライアントをバックアップホストとして使用することもできます。

Cassandra クラスタ

保護する Cassandra 実稼働クラスタを表します。

Cassandra バックアップリカバリコンポーネント

バックアップ操作とリストア操作を支援するためにデータステージングサーバーと Cassandra クラスタに配備される NetBackup シンクライアント。

データステージングサーバー

NetBackup では、プライマリとバックアップホストに加えて、Cassandra クラスタをバックアップするための一連のサーバーが必要です。通常、これらのサーバーは Cassandra クラスタ内のサーバーの合計数の 20% にします。これらのサーバーは、バックアップ時に Cassandra クラスタのデータを重複排除し、バックアップ処理を最適化するために使用されます。

バックアップまたはリストア中に、Cassandra キースペースは Cassandra クラスタとデータステージングサーバー間で並列にストリームされます。

データステージングサーバーは、ステージングクラスタを表します。バックアップまたはリストアする必要があるデータのサイズに応じて使用されるノードを配備する必要があります。

データ削減

データ削減の一環として、次のタスクが実行されます。

  • 効率的な調整

    異なるノードの同じキーの効率的な調整データが、バックアップノードの同じノードに転送されます。

    調整は、ノード間通信なしで各データステージングサーバー内において並列で行われます。

  • レコード合成

    レコードの反復処理中に、異なる SStable の同じキーのカラムがマージされます。

  • セマンティック重複排除

    古いレコードと重複するレコード (レプリカ) が識別され、削除されます。

NetBackup プライマリサーバー

すべてのジョブは、NetBackup プライマリサーバーから実行されます。

並列ストリーム

NetBackup 並列ストリームフレームワークにより、複数のノードからのデータブロックを、複数のバックアップホストを同時に使用してバックアップできます。