NetBackup™ for Hadoop 管理者ガイド

Last Published:
Product(s): NetBackup & Alta Data Protection (11.0)
  1. 概要
    1.  
      NetBackup を使用した NetBackup for Hadoop データの保護
    2.  
      NetBackup for Hadoop データのバックアップ
    3.  
      NetBackup for Hadoop データのリストア
    4.  
      NetBackup for NetBackup for Hadoop の用語
    5.  
      制限事項
  2. NetBackup 用 NetBackup for Hadoop プラグインの前提条件およびベストプラクティス
    1.  
      Hadoop プラグインの配備について
    2. NetBackup for Hadoop プラグインの前提条件
      1.  
        オペレーティングシステムとプラットフォームの互換性
      2.  
        NetBackup の NetBackup for Hadoop プラグインのライセンス
    3.  
      NetBackup for Hadoop クラスタの準備
    4.  
      NetBackup for Hadoop プラグインを配備するためのベストプラクティス
  3. NetBackup for Hadoop の構成
    1.  
      NetBackup for NetBackup for Hadoop の構成について
    2. バックアップホストの管理
      1.  
        NetBackup プライマリサーバーの許可リストに NetBackup クライアントを含める
      2.  
        バックアップホストとしての NetBackup アプライアンスの設定
    3.  
      NetBackup での NetBackup for Hadoop クレデンシャルの追加
    4. NetBackup for Hadoop 構成ファイルを使用した NetBackup for Hadoop プラグインの構成
      1.  
        高可用性 NetBackup for Hadoop クラスタ用の NetBackup の構成
      2.  
        NetBackup for Hadoop クラスタのカスタムポートの設定
      3.  
        バックアップホストのスレッド数の設定
      4.  
        バックアップホストのストリーム数の構成
      5.  
        バックアップホストの分散アルゴリズムとゴールデン比率の構成
      6. NetBackup および Hadoop クラスタ間での SSL 対応 (HTTPS) 通信の設定
        1.  
          NetBackup サーバーとクライアントの ECA_TRUST_STORE_PATH
        2.  
          NetBackup サーバーとクライアントの ECA_CRL_PATH
        3.  
          サーバーとクライアントの HADOOP_SECURE_CONNECT_ENABLED
        4.  
          NetBackup サーバーとクライアントの HADOOP_CRL_CHECK
        5.  
          bp.conf ファイルのパラメータ値の例
    5.  
      Kerberos を使用する NetBackup for Hadoop クラスタの設定
    6.  
      並列リストアの hadoop.conf の構成
    7.  
      Hadoop クラスタ用の BigData ポリシーの作成
    8.  
      NetBackup for Hadoop クラスタのディザスタリカバリ
  4. Hadoop のバックアップとリストアの実行
    1. NetBackup for Hadoop クラスタのバックアップについて
      1.  
        Kerberos 認証を使用する NetBackup for Hadoop クラスタのバックアップおよびリストア操作実行の前提条件
      2.  
        NetBackup for Hadoop クラスタのバックアップを作成するためのベストプラクティス
      3.  
        NetBackup for Hadoop クラスタのバックアップ
    2. NetBackup for Hadoop クラスタのリストアについて
      1.  
        Hadoop クラスタをリストアするためのベストプラクティス
      2. 同じ Hadoop クラスタ上での Hadoop データのリストア
        1.  
          同じ Hadoop クラスタ上での Hadoop データのリストア
      3.  
        代替の Hadoop クラスタ上での Hadoop データのリストア
    3.  
      バックアップおよびリストア時のパフォーマンスを向上するためのベストプラクティス
  5. トラブルシューティング
    1.  
      NetBackup for NetBackup for Hadoop の問題のトラブルシューティングについて
    2.  
      NetBackup for Hadoop のデバッグログについて
    3. NetBackup for Hadoop データのバックアップ問題のトラブルシューティング
      1.  
        Hadoop クレデンシャルのバックアップ操作と検証が失敗する
      2.  
        バックアップ操作がエラー 6609 で失敗する
      3.  
        バックアップ操作がエラー 6618 で失敗した
      4.  
        バックアップ操作がエラー 6647 で失敗する
      5.  
        Hadoop で拡張属性 (xattrs) とアクセス制御リスト (ACL) がバックアップまたはリストアされない
      6.  
        バックアップ操作がエラー 6654 で失敗する
      7.  
        バックアップ操作が bpbrm エラー 8857 で失敗する
      8.  
        バックアップ操作がエラー 6617 で失敗する
      9.  
        バックアップ操作がエラー 6616 で失敗する
      10.  
        バックアップ操作がエラー 84 で失敗する
      11.  
        コンテナベースの NetBackup Appliance を再起動した後、NetBackup 構成ファイルおよび証明書ファイルが保持されない
      12.  
        バックアップイメージの選択でイメージが表示されているにもかかわらず、リストア時に増分バックアップイメージが表示されない
      13.  
        子バックアップジョブの 1 つがキューに投入された状態になる
    4. NetBackup for Hadoop データのリストア問題のトラブルシューティング
      1.  
        リストアが 2850 エラーコードで失敗する
      2.  
        NetBackup の NetBackup for Hadoop のリストアジョブが部分的に完了する
      3.  
        Hadoop で拡張属性 (xattrs) とアクセス制御リスト (ACL) がバックアップまたはリストアされない
      4.  
        Hadoop プラグインファイルがバックアップホスト上にない場合、リストア操作が失敗する
      5.  
        リストアが bpbrm エラー 54932 で失敗する
      6.  
        リストア操作が bpbrm エラー 21296 で失敗する
      7.  
        Kerberos を使用した Hadoop のリストアジョブがエラー 2850 で失敗する
      8.  
        ディザスタリカバリ後に構成ファイルがリカバリされない

NetBackup for NetBackup for Hadoop の用語

次の表では、NetBackup for Hadoop クラスタの保護に NetBackup を使用するときに使われる用語を定義しています。

表: NetBackup の用語

用語

定義

複合ジョブ

NetBackup for Hadoop データのバックアップジョブは複合ジョブです。

  • バックアップジョブは、バックアップするデータの情報を取得するための検出ジョブを実行します。

  • 子ジョブは、実際のデータ転送を実行する各バックアップホストに対して作成されます。

  • バックアップが完了すると、ジョブは NameNode 上のスナップショットをクリーンアップし、その後ジョブ自体に完了したというマークが付けられます。

検出ジョブ

バックアップジョブを実行すると、最初に検出ジョブが作成されます。検出ジョブは NameNode と通信し、バックアップする必要があるブロックの情報と、関連する DataNodes の情報を収集します。検出の最後に、ジョブは作業負荷検出ファイルにデータを入力します。ファイルはその後 NetBackup によってバックアップホスト間で作業負荷を分散させるために使用されます。

子ジョブ

バックアップの場合、ストレージメディアにデータを転送するバックアップホストごとに個別の子ジョブが作成されます。子ジョブは、複数の DataNodes からデータブロックを転送できます。

作業負荷検出ファイル

検出時のバックアップホストが NameNode と通信するときに、作業負荷検出ファイルが作成されます。このファイルには、バックアップするデータブロックと、関連付けられている DataNodes についての情報が含まれています。

作業負荷分散ファイル

検出が完了すると、NetBackup はバックアップホストごとに作業負荷配布ファイルを作成します。これらのファイルには、それぞれのバックアップホストで転送されるデータの情報が含まれます。

並列ストリーム

NetBackup 並列ストリームフレームワークにより、複数の DataNodes からのデータブロックを、複数のバックアップホストを同時に使用してバックアップできます。

バックアップホスト

バックアップホストは、プロキシクライアントとして機能します。すべてのバックアップとリストア操作は、バックアップホストで実行されます。

メディアサーバー、クライアント、またはプライマリサーバーを、バックアップホストとして構成できます。

バックアップホストは、リストア中に宛先クライアントとしても使用されます。

BigData ポリシー

BigData ポリシーは以下を実行するために導入されました。

  • アプリケーションの種類を指定します。

  • 分散マルチノード環境のバックアップを可能にします。

  • バックアップホストを関連付けます。

  • 作業負荷分散を実行します。

アプリケーションサーバー

Namenode は、NetBackup ではアプリケーションサーバーと呼ばれます。

プライマリ NameNode

高可用性シナリオでは、1 つの NameNode を BigData ポリシーと tpconfig コマンドで指定する必要があります。この NameNode はプライマリ NameNode と呼ばれます。

フェールオーバー NameNode

高可用性シナリオでは、hadoop.conf ファイル内で更新されるプライマリ NameNode 以外の NameNode は、フェールオーバー NameNode と呼ばれます。

表: NetBackup for Hadoop の用語

用語

定義

NameNode

NameNode は、リストア中にソースクライアントとしても使用されます。

DataNode

DataNode は、NetBackup for Hadoop で実際のデータを格納する役割を果たします。

スナップショット対応ディレクトリ (スナップショット可能)

スナップショットは、ディレクトリがスナップショット対応になれば、どのディレクトリでも実行できます。

  • 各スナップショット対応ディレクトリは、65,536 の同時スナップショットに対応できます。スナップショット対応ディレクトリの数に制限はありません。

  • 管理者は、どのディレクトリでもスナップショット対応に設定できます。

  • スナップショット対応ディレクトリは、その中にスナップショットがあると、それらすべてのスナップショットが削除されるまでは削除したり名前を変更したりできません。

  • 親または子のいずれかがスナップショット対応ディレクトリである場合、ディレクトリはスナップショット対応にできません。