NetBackup™ Web UI Apache Cassandra 管理者ガイド
NetBackup での Apache Cassandra のサポートの概要
Apache Cassandra は、よく使用されているスケールアウト NoSQL データベースです。Cassandra は、直接接続されたストレージを備えた市販ハードウェアで動作します。一般的な Cassandra クラスタは、データを格納するノードで構成されます。Cassandra はノード間でデータをレプリケートすることで、ノードのダウンタイムに対する耐性を確保します。データのプライマリコピーという概念はなく、任意のノードにレプリカよりも新しいバージョンのデータレコードが存在する可能性があります。Cassandra の重要な特徴の 1 つは、一貫性よりも可用性を優先していることです。データのレプリカが必ずしも最新ではなくても、データベースは常に利用可能です。
NetBackup には、Cassandra クラスタを保護するための先進的なソリューションが用意されています。ソリューションには次の特徴があります。
エージェントレス: Cassandra クラスタノードには、バックアップエージェントを配置する必要がありません。事実上、高パフォーマンスの Cassandra クラスタを遅延させるコードはありません。
シングルパスデータコピー: バックアップ時に、シンクライアントを使用して Cassandra データファイル (sstables) を 1 回で渡すことにより、IO 占有域を最小限に抑えることができます。
オフホストデータの最適化: Cassandra のデータは耐性を高めるためにレプリケートされます。バックアップは、より長期間の保持に使用されます。NetBackup の Cassandra ソリューションでは、次の目的でデータ処理を行います。
特定の時点でのクラスタの一貫性を判断する。
レプリカレコードを削除する。
レコードの上書きに起因する古いデータを削除する。
バックアップ処理が高パフォーマンスの Cassandra クラスタに影響しないように、この処理はすべてデータステージングサーバーでオフホストで実行されます。
増分バックアップ: NetBackup では、完全バックアップ後のバックアップ時間が最適化されるように、Cassandra の増分バックアップがサポートされています。このソリューションでは、新しいキースペースまたはカラムファミリーが自動的に検出され、これらの新しい構造については完全バックアップが作成される一方、既存の構造については増分バックアップが実行されます。
拡張性に優れたバックアップ: Cassandra を使用すると、必要に応じてノードを追加することで Cassandra クラスタを簡単に拡張できます。クラスタがオンラインの間、既存のデータが自動的に新しいノードに再配布されます。NetBackup での Cassandra 保護は拡張性があり、バックアップ要件に合うようにデータステージングサーバーを追加できます。
データセンターの識別: NetBackup での Cassandra 保護では、特定のデータセンターのデータをバックアップするように構成できます。Cassandra クラスタに問い合わせを行い、さまざまなデータセンターに存在するノードを自動的に識別します。その後、データをバックアップする特定のデータセンターのノードのみに関与します。
データセンター対応リストア: リストア時に、NetBackup はリストアクラスタに接続し、現在のトポロジーを判断します。ソリューションによって、このトポロジーがバックアップ時のトポロジーとの間で調整されるため、トポロジーの変更や現在のトポロジーを考慮したリストアが可能になります。リストア要件をサポートするために、データセンターの変更、各データセンター内のレプリカの数、キースペースとカラムファミリー名の変更などに対応した多くのオプションが提供されています。
メモ:
インデックスは、カラムファミリー名の変更シナリオではリストアされません。そのため、名前を変更したカラムファミリーにインデックスを追加します。
個別リストア: NetBackup の Cassandra ソリューションでは、バックアップデータセットの一部をリストアできます。少数のキースペースまたは一部のカラムファミリーのみをリストアするオプションもあります。
修復なしのリストア: リストア処理では、データのリストア後に追加のリカバリ手順を実行する必要がないことが保証されます。リストアした後すぐに、高パフォーマンスの Cassandra クラスタでデータを利用できます。