Recherche dans <book_title>…

Guide de déduplication VeritasNetBackup™

Last Published: 2019-07-25

Product(s): NetBackup & Alta Data Protection (8.2)

À propos du cache CloudCatalyst

L'administrateur configure un répertoire de cache local dans le cadre de la configuration d'un serveur de stockage CloudCatalyst. La fonction principale du répertoire de cache local (ou cache CloudCatalyst) est de permettre à CloudCatalyst de continuer à dédupliquer des données. La déduplication de données se produit même si le taux d'acquisition à partir des travaux de sauvegarde et de duplication ciblés dépasse temporairement le débit de chargement disponible vers le stockage en cloud de destination.

Par exemple, si des travaux de sauvegarde et de duplication transfèrent 10 To de données par heure vers le serveur de stockage CloudCatalyst et si CloudCatalyst déduplique les données selon un rapport de 10:1, les 1 To de données dédupliquées peuvent dépasser la capacité de chargement de 7 To par heure d'écriture sur le stockage en cloud. Le cache permet aux travaux de continuer à envoyer et à traiter les données, en supposant qu'à un moment donné, le taux de données entrantes ralentira. Le cache CloudCatalyst enregistre uniquement les données dédupliquées. Les travaux ne sont pas marqués comme terminés tant que toutes les données ne sont pas chargées dans le cloud.

Bien qu'un cache CloudCatalyst de 4 To soit recommandé, une taille de cache plus importante offre les avantages suivants :

Pour les restaurations :
Si les données sont présentes dans le cache CloudCatalyst, elles sont restaurées à partir du cache au lieu du cloud. Plus la taille du cache est importante, plus le nombre d'objets dédupliqués que ce dernier peut héberger est important.
Pour les données présentant un taux de déduplication faible :
Une taille de cache plus importante peut être nécessaire, car les faibles rapports de déduplication nécessitent de charger des quantités de données plus importantes dans le cloud.
Pour les périodes d'activité intense :
Une taille de cache plus importante peut être utile si vous planifiez des travaux fréquents sur le serveur de stockage CloudCatalyst dans un intervalle de temps réduit.

Un cache plus important présente des avantages, mais les travaux ne sont pas marqués comme terminés tant que toutes les données ne sont pas chargées dans le cloud. Les données sont chargées du cache vers le cloud quand un fichier de conteneur MSDP est plein. Cela ne se produit pas immédiatement, mais peu de temps après le début du travail de sauvegarde ou de duplication. La déduplication permet au second travail de sauvegarde et aux travaux de sauvegarde ultérieurs de transférer beaucoup moins de données dans le cloud, selon le taux de déduplication.

Par exemple, un cache de 4 To peut normalement gérer sans problème 1 Po de données dans le cloud.

Remarque :

Si vous lancez une restauration à partir de Glacier ou Glacier Deep Archive, NetBackup lance une étape de réchauffement. NetBackup ne poursuit pas la restauration avant que toutes les données ne soient disponibles dans le stockage S3 à lire.

L'étape de réchauffement s'effectue toujours si vous utilisez Amazon, même si les données sont dans le cache CloudCatalyst. Pour les classes de stockage autres que Glacier et Glacier Deep Archive, l'étape de réchauffement est presque immédiate, sans retard significatif. Pour Glacier et Glacier Deep Archive, l'étape de réchauffement peut être immédiate si les fichiers ont été préalablement réchauffés et sont toujours dans le stockage Standard S3. Cependant, cette étape peut prendre plusieurs minutes, heures ou jours selon les paramètres configurés.

Gestion du cache par CloudCatalyst

CloudCatalyst gère le cache en fonction des paramètres de configuration définis dans le fichier esfs.json. Une fois que la borne haute est atteinte, les données sont purgées lorsque l'espace utilisé atteint la moyenne des valeurs HighWatermark et LowWatermark(haute + basse)/2 et continue jusqu'à atteindre la valeur LowWatermark. Si le débit de données entrantes dépasse le débit auquel la borne peut être maintenue, les travaux commencent à échouer. Les administrateurs ne doivent pas supprimer ou purger manuellement les données gérées dans le stockage du cache, sauf s'ils sont invités à le faire par le support technique NetBackup.

Plus d'informations

La duplication optimisée est utilisée pour copier les données d'un serveur de stockage MSDP vers un serveur de stockage CloudCatalyst (cas d'utilisation préféré)

À propos du fichier de configuration CloudCatalyst esfs.json