Guide de l'administrateur Kubernetes sur l'interface utilisateur Web NetBackup™
- Présentation de NetBackup pour Kubernetes
- Déploiement et configuration de l'opérateur NetBackup Kubernetes
- Conditions préalables au déploiement de l'opérateur NetBackup Kubernetes
- Déploiement du package de service sur l'opérateur NetBackup Kubernetes
- Spécifications de port pour le déploiement de l'opérateur Kubernetes
- Mise à niveau de l'opérateur NetBackup Kubernetes
- Suppression de l'opérateur NetBackup Kubernetes
- Configuration du système de déplacement des données NetBackup Kubernetes
- Configuration automatisée de la protection NetBackup pour Kubernetes
- Configuration des paramètres pour l'opération de snapshot NetBackup
- Dépannage des serveurs NetBackup avec des noms courts
- Prise en charge du mécanisme de planification des pods du système de déplacement des données
- Déploiement de certificats sur l'opérateur NetBackup Kubernetes
- Gestion des biens Kubernetes
- Gestion des groupes intelligents Kubernetes
- Protection des biens Kubernetes
- Protection d'un groupe intelligent
- Suppression de la protection d'un groupe intelligent
- Configuration d'une planification de sauvegarde
- Configuration des options de sauvegardes
- Configuration des sauvegardes
- Configuration d'AIR (Auto Image Replication) et de la duplication
- Configuration des unités de stockage
- Prise en charge du mode volume
- Configuration d'une sauvegarde cohérente au niveau application
- Gestion des groupes d'images
- Protection des clusters gérés par Rancher dans NetBackup
- Récupération des biens Kubernetes
- Activation du mode FIPS dans Kubernetes
- Résolution des problèmes liés à Kubernetes
- Erreur lors de la mise à niveau du serveur principal : échec de NBCheck
- Erreur lors de la restauration d'une image ancienne : l'opération échoue
- Erreur de l'API de récupération de volume persistant
- Erreur lors de la restauration : l'état final du travail affiche un échec partiel
- Erreur lors de la restauration sur le même espace de noms
- Pods du datamover dépassant la limite de ressource Kubernetes
- Erreur lors de la restauration : le travail échoue sur le cluster hautement chargé
- Le rôle Kubernetes personnalisé créé pour des clusters spécifiques ne peut pas afficher les travaux
- Openshift crée des PVC vides non sélectionnés lors de la restauration des applications installées à partir d'OperatorHub
- L'opérateur NetBackup Kubernetes ne répond plus si la limite de PID est dépassée sur le nœud Kubernetes
- Échec lors de la modification du cluster dans NetBackup Kubernetes 10.1
- Échec de la restauration à partir d'un snapshot pour les demandes PVC volumineuses
- Échec partiel de la restauration des PVC de mode fichier de l'espace de noms sur un système de fichiers différent
- Échec de la restauration à partir de la copie de sauvegarde avec une erreur d'incohérence d'image
- Vérifications de connectivité entre les serveurs principal/de médias NetBackup et les serveurs Kubernetes
L'opérateur NetBackup Kubernetes ne répond plus si la limite de PID est dépassée sur le nœud Kubernetes
Les systèmes Linux comportent un processus initd ou système en cours d'exécution en tant que PID 1 pour récolter des processus zombies. Les conteneurs qui n'ont pas de processus initd continuent à générer des processus zombies.
Après une certaine période, ces processus zombies s'accumulent, puis atteignent la limite maximale de PID définie sur le nœud Kubernetes.
Dans l'opérateur NetBackup Kubernetes, nbcertcmdtool engendre des processus enfants pour effectuer des opérations liées aux certificats. Lorsque l'opération est terminée, les processus deviennent orphelins et ne sont pas récoltés. Par la suite, la limite maximale de PID est atteinte et l'opérateur NetBackup Kubernetes ne répond plus.
Error message: login pod/nbukops-controller-manager-67f5498bbb-gn9zw -c netbackupkops -n nbukops ERRO[0005] exec failed: container_linux.go:380: starting container process caused: read init-p: connection reset by peer a command that is terminated with exit code 1.
Actions recommandées :
Pour résoudre le problème de dépassement de limite de PID, vous pouvez utiliser le script Initd. Le script Initd est utilisé en tant que processus parent ou script de point d'entrée sur le pod de contrôleur.
En tant que processus parent, il s'attache le processus zombie une fois le processus enfant terminé pour mettre fin au processus zombie persistant. Il permet également d'arrêter le conteneur normalement. Le script Initd est disponible dans la version 10.0.1 de NBUKOPs.
Utilisez les étapes suivantes pour supprimer les processus zombies nbcertcmdtool existants :
Décrivez le pod de l'opérateur NetBackup et recherchez le nœud Kubernetes sur lequel le pod de contrôleur s'exécute. Exécutez la commande suivante :
kubectl describe -c netbackupkops <NB k8s operator pod name> -n <namespace>
Connectez-vous au nœud Kubernetes, exécutez la commande suivante :
kubectl debug node/nodename
Terminez les processus zombies nbcertcmdtool, exécutez la commande suivante :
ps -ef | grep "\[nbcertcmdtool\] <defunct>" | awk '{print $3}' | xargs kill -9
Remarque :
Ces étapes mettent fin à tous les processus zombies pour ce nœud de travail. Mais il ne résout le problème que temporairement. Pour une solution permanente, vous devez déployer une nouvelle build KOps avec le script Initd.