Guide de l'administrateur NetBackup™ for Hadoop

Last Published:
Product(s): NetBackup & Alta Data Protection (11.0)
  1. Introduction
    1.  
      Protection des données NetBackup for Hadoop à l'aide de NetBackup
    2.  
      Sauvegarde des données NetBackup for Hadoop
    3.  
      Restauration des données NetBackup for Hadoop
    4.  
      Termes NetBackup pour NetBackup for Hadoop
    5.  
      Limitations
  2. Conditions préalables et pratiques d'excellence pour le plug-in NetBackup for Hadoop for NetBackup
    1.  
      À propos du déploiement du plug-in Hadoop
    2. Conditions préalables pour le plug-in NetBackup for Hadoop
      1.  
        Compatibilité des systèmes d'exploitation et des plates-formes
      2.  
        Licence pour le plug-in NetBackup for Hadoop for NetBackup
    3.  
      Préparation du cluster NetBackup for Hadoop
    4.  
      Meilleures pratiques de déploiement du plug-in NetBackup for Hadoop
  3. Configuration de NetBackup for Hadoop
    1.  
      À propos de la configuration de NetBackup for NetBackup for Hadoop
    2. Gestion des hôtes de sauvegarde
      1.  
        Ajout d'un client NetBackup à la liste autorisée du serveur principal NetBackup
      2.  
        Configurer une appliance NetBackup comme hôte de sauvegarde
    3.  
      Ajout des informations d'authentification NetBackup for Hadoop dans NetBackup
    4. Configuration du plug-in NetBackup for Hadoop en utilisant le fichier de configuration NetBackup for Hadoop
      1.  
        Configuration de NetBackup pour un cluster NetBackup for Hadoop hautement disponible
      2.  
        Configuration d'un port personnalisé pour le cluster NetBackup for Hadoop
      3.  
        Définition du nombre de threads pour les hôtes de sauvegarde
      4.  
        Configuration du nombre de flux pour les hôtes de sauvegarde
      5.  
        Configuration de l'algorithme de distribution et du nombre d'or pour les hôtes de sauvegarde
      6. Configuration de la communication entre les clusters NetBackup et Hadoop compatibles SSL (HTTPS)
        1.  
          ECA_TRUST_STORE_PATH pour les serveurs et les clients NetBackup
        2.  
          ECA_CRL_PATH pour les serveurs et les clients NetBackup
        3.  
          HADOOP_SECURE_CONNECT_ENABLED pour les serveurs et les clients
        4.  
          HADOOP_CRL_CHECK pour les serveurs et les clients NetBackup
        5.  
          Exemples de valeurs pour les paramètres dans le fichier bp.conf
    5.  
      Configuration pour un cluster NetBackup for Hadoop qui utilise Kerberos
    6.  
      Configuration de Hadoop.conf pour la restauration parallèle
    7.  
      Création d'une politique BigData pour les clusters Hadoop
    8.  
      Reprise après incident d'un cluster NetBackup for Hadoop
  4. Sauvegardes et restaurations de Hadoop
    1. À propos de la sauvegarde d'un cluster NetBackup for Hadoop
      1.  
        Conditions préalables à l'exécution d'opérations de sauvegarde et de restauration pour un cluster NetBackup for Hadoop avec l'authentification Kerberos
      2.  
        Pratiques d'excellence de sauvegarde d'un cluster NetBackup for Hadoop
      3.  
        Sauvegarde d'un cluster NetBackup for Hadoop
    2. À propos de la restauration d'un cluster NetBackup for Hadoop
      1.  
        Pratiques d'excellence de restauration d'un cluster Hadoop
      2. Restauration des données Hadoop dans le même cluster Hadoop
        1.  
          Restauration de données Hadoop dans le même cluster Hadoop
      3.  
        Restauration des données Hadoop sur un autre cluster Hadoop
    3.  
      Pratique d'excellence pour améliorer les performances lors de la sauvegarde et de la restauration
  5. Dépannage
    1.  
      À propos de la résolution des problèmes NetBackup for NetBackup for Hadoop
    2.  
      À propos de la consignation du débogage NetBackup for Hadoop
    3. Résolution des problèmes de sauvegarde des données NetBackup for Hadoop
      1.  
        L'opération de sauvegarde et la validation des informations d'authentification Hadoop échouent
      2.  
        L'opération de sauvegarde échoue avec l'erreur 6609
      3.  
        L'opération de sauvegarde a échoué avec l'erreur 6618
      4.  
        L'opération de sauvegarde échoue avec l'erreur 6647
      5.  
        Les attributs étendus (xattrs) et les listes de contrôle d'accès (LCA) ne sont pas sauvegardés ou restaurés pour Hadoop
      6.  
        L'opération de sauvegarde échoue avec l'erreur 6654
      7.  
        L'opération de sauvegarde échoue avec l'erreur 8857
      8.  
        L'opération de sauvegarde échoue avec l'erreur 6617
      9.  
        L'opération de sauvegarde échoue avec l'erreur 6616
      10.  
        L'opération de sauvegarde échoue avec l'erreur 84
      11.  
        Les fichiers de configuration et de certificats de NetBackup ne sont pas conservés après le redémarrage de l'appliance NetBackup basée sur les conteneurs
      12.  
        Impossible d'afficher les images de sauvegarde incrémentielle lors de la restauration, alors que les images sont visibles dans la sélection de l'image de sauvegarde
      13.  
        L'un des travaux de sauvegarde enfant est mis en file d'attente
    4. Résolution des problèmes de restauration des données NetBackup for Hadoop
      1.  
        Échec de la restauration avec le code d'erreur 2850
      2.  
        Le travail de restauration NetBackup pour NetBackup for Hadoop s'exécute partiellement
      3.  
        Les attributs étendus (xattrs) et les listes de contrôle d'accès (LCA) ne sont pas sauvegardés ou restaurés pour Hadoop
      4.  
        L'opération de restauration échoue quand les fichiers de plug-in Hadoop manquent sur l'hôte de sauvegarde
      5.  
        La restauration échoue avec l'erreur bpbrm 54932
      6.  
        L'opération de restauration échoue avec l'erreur bpbrm 21296
      7.  
        Échec du travail de restauration d'Hadoop avec Kerberos avec l'erreur 2850
      8.  
        Le fichier de configuration n'est pas récupéré après une reprise après incident

Sauvegarde des données NetBackup for Hadoop

Les données NetBackup for Hadoop sont sauvegardées dans des flux parallèles dans lesquels les DataNodes NetBackup for Hadoop transmettent les blocs de données simultanément à plusieurs hôtes de sauvegarde.

Remarque :

Les snapshots doivent être activés sur tous les répertoires spécifiés dans la sélection de sauvegarde NetBackup for Hadoop avant la sauvegarde.

Le diagramme suivant présente le flux de sauvegarde :

Figure : Flux de sauvegarde

Flux de sauvegarde

Comme illustré dans le diagramme suivant :

  1. Un travail de sauvegarde planifié est déclenché à partir du serveur principal.

  2. Le travail de sauvegarde pour les données NetBackup for Hadoop est un travail composé. Quand le travail de sauvegarde est déclenché, un travail de découverte est exécuté en premier.

  3. Pendant la découverte, le premier hôte de sauvegarde se connecte au NameNode et effectue une découverte pour obtenir des informations sur les données à sauvegarder.

  4. Un fichier de découverte de charge de travail est créé sur l'hôte de sauvegarde. Le fichier de découverte de charge de travail contient les informations des données à sauvegarder à partir des différents DataNodes.

  5. L'hôte de sauvegarde utilise le fichier de découverte de charge de travail et détermine la manière dont cette dernière est répartie entre les hôtes de sauvegarde. Des fichiers de distribution de la charge de travail sont créés pour chaque hôte de sauvegarde.

  6. Des travaux enfants individuels sont exécutés pour chaque hôte de sauvegarde. Comme spécifié dans les fichiers de distribution de la charge de travail, les données sont sauvegardées.

  7. Les blocs de données sont transmis simultanément à partir de différents DataNodes à plusieurs hôtes de sauvegarde.

Le travail de sauvegarde composé ne peut pas se terminer tant que des travaux enfants sont en cours. Une fois les travaux enfants terminés, NetBackup nettoie tous les snapshots du NameNode. Ce n'est qu'à la fin du nettoyage que le travail de sauvegarde composé est terminé.

Se reporter à À propos de la sauvegarde d'un cluster NetBackup for Hadoop.