NetBackup™ for Cassandra 管理者ガイド

Last Published:
Product(s): NetBackup & Alta Data Protection (10.0)

NetBackup を使用した Cassandra データの保護

NetBackup では、オンプレミスに配備された Cassandra クラスタを保護できます。

図: アーキテクチャの概要

アーキテクチャの概要

次の表に、Cassandra バックアップおよびリカバリソリューションのさまざまなコンポーネントの目的を示します。

表:

コンポーネント

目的

Cassandra クラスタ

保護する Cassandra 実稼働クラスタを表します。

データステージングサーバー

バックアップまたはリストア中に、Cassandra キースペースは Cassandra クラスタとデータステージングサーバー間で並列にストリームされます。

データステージングサーバーは、ステージングクラスタを表します。バックアップまたはリストアする必要があるデータのサイズに応じて使用されるノードをプロビジョニングする必要があります。

バックアップホスト

Cassandra Backup Recovery (CBR) ソリューションは、アプリケーションの種類が cassandra の BigData ポリシーを使用します。

BigData ポリシーは、このバックアップホストを使用します。

CBR ソリューションのストレージサーバーを構成するために使用されるメディアサーバーをバックアップホストとして使用する必要があります。

メモ:

NetBackup クライアントをバックアップホストとして使用することもできます。

NetBackup プライマリサーバー

すべてのジョブは、NetBackup プライマリサーバーから実行されます。

データ削減

データ削減の一環として、次のタスクが実行されます。

  • 効率的な調整

    異なるノードの同じキーのデータはバックアップノードの同じノードに転送されます。

    調整は、ノード間通信なしで各データステージングサーバー内において並列で行われます。

  • レコード合成

    レコードの反復処理中に、異なる SStable の同じキーのカラムがマージされます。

  • セマンティック重複排除

    古いレコードと重複するレコード (レプリカ) が識別され、削除されます。

  • データは並列ストリームでバックアップされ、データノードはバックアップ時にデータブロックを複数のデータステージングサーバーに同時にストリームし、そこから複数のバックアップホストにストリームします。ジョブの処理速度は、複数のバックアップホストと並列ストリームによって向上します。データステージングサーバーは、バックアップ対象のデータを最適化し、データ重複排除を実現するのに役立ちます。

  • Cassandra クラスタと NetBackup 間の通信は、データステージングサーバーと Cassandra クラスタに配備された Cassandra バックアップおよびリカバリコンポーネントを使用することで有効になります。

  • NetBackup 通信の場合、BigData ポリシーを構成し、関連するバックアップホストを追加する必要があります。

  • NetBackup のメディアサーバー、クライアント、またはプライマリサーバーをバックアップホストとして構成できます。また、Cassandra データのサイズに基づいて、バックアップホストとデータステージングサーバーを追加または削除できます。バックアップホストをさらに追加することで使用環境の規模を簡単に拡大できます。

  • Cassandra クラスタ、データステージングサーバー、バックアップホスト間の通信は SSH を介して行われます。

  • NetBackup 並列ストリームフレームワークにより、シンクライアントベースのエージェントレスバックアップが可能となり、バックアップとリストアの操作はバックアップホストで実行されます。NetBackup シンクライアントバイナリ (Cassandra バックアップおよびリカバリコンポーネント) は、バックアップおよびリカバリ操作中に、Cassandra クラスタに自動的にプッシュされます。この Cassandra バックアップおよびリカバリコンポーネントは、バックアップおよびリカバリ操作が完了した後に自動的に削除されます。

メモ:

エージェント管理は Cassandra クラスタノードでは必要ありません。