NetBackup™ Web UI Kubernetes 管理指南

Last Published:
Product(s): NetBackup & Alta Data Protection (10.0)
  1. NetBackup Web 用户界面简介
    1.  
      关于 NetBackup Web UI
    2.  
      术语
    3.  
      登录到 NetBackup Web UI
    4.  
      注销 NetBackup Web UI
  2. 监控 NetBackup
    1.  
      NetBackup 控制板
    2.  
      作业监视
    3.  
      作业:取消、暂停、重新启动、继续、删除
    4.  
      在作业列表中搜索或过滤作业
  3. 适用于 Kubernetes 的 NetBackup 概述
    1.  
      概述
    2.  
      Kubernetes 支持的 NetBackup 功能
  4. 部署和配置 NetBackup Kubernetes Operator
    1.  
      在 NetBackup Kubernetes Operator 上部署服务软件包
    2.  
      Kubernetes Operator 部署的端口要求
    3.  
      升级 NetBackup Kubernetes Operator
    4.  
      删除 NetBackup Kubernetes Operator
    5.  
      配置 NetBackup Kubernetes datamover
    6.  
      配置 NetBackup 快照操作的设置
    7.  
      对具有短名称的 NetBackup 服务器进行故障排除
    8. 管理映像组
      1.  
        关于映像失效
      2.  
        关于映像副本
  5. 在 NetBackup Kubernetes Operator 上部署证书
    1.  
      在 Kubernetes Operator 上部署证书
    2.  
      执行基于主机 ID 的证书操作
    3.  
      执行 ECA 证书操作
    4.  
      标识证书类型
  6. 管理 Kubernetes 资产
    1.  
      添加 Kubernetes 群集
    2.  
      配置设置
    3.  
      为资产添加保护
  7. 管理 Kubernetes 智能组
    1.  
      关于智能组
    2.  
      创建智能组
    3.  
      删除智能组
    4.  
      编辑智能组
  8. 保护 Kubernetes 资产
    1.  
      保护智能组
    2.  
      从智能组中删除保护
    3.  
      配置备份计划
    4.  
      配置备份选项
    5.  
      配置备份
    6.  
      配置存储单元
  9. 恢复 Kubernetes 资产
    1.  
      浏览并验证恢复点
    2.  
      从快照还原
    3.  
      从备份副本还原
  10. 对 Kubernetes 问题进行故障排除
    1.  
      在 Kubernetes Operator 上部署证书期间出错
    2.  
      主服务器升级期间出错:NBCheck 失败
    3.  
      旧映像还原期间出错:操作失败
    4.  
      永久卷恢复 API 期间出错
    5.  
      还原期间出错:最终作业状态显示部分失败
    6.  
      在同一命名空间上进行还原时出错
    7.  
      datamover pod 超过 Kubernetes 资源限制
    8.  
      还原期间出错:高负载群集上的作业失败
    9.  
      为特定群集创建的自定义 Kubernetes 角色无法查看作业

配置 NetBackup 快照操作的设置

在实际执行从快照备份操作之前,需要在 Kubernetes Operator 部署上配置快照操作。

  1. 定义指向 CSI 插件的存储类。

  2. 定义包含 CSI 驱动程序详细信息的 VolumeSnapshotClass 类。

  3. 标记卷快照类以供 NetBackup 使用。添加以下标签 netbackup.veritas.com/default-csi-volume-snapshot-class=true

    注意:

    包含永久卷的命名空间的快照操作失败,并显示错误消息:Failed to create snapshot of the Kubernetes namespace

    快照操作可能会由于多种原因而失败,例如,找不到带有 volumesnapshotclass 标签的驱动程序的有效卷快照类。

  4. 需要调整元数据永久卷的大小。Kubernetes Operator 的默认永久卷大小为 10 Gi。永久卷大小是可配置的。

    在部署插件之前,可将存储的值从 10 Gi 更改为较大的值。这会导致 nbukops pod 具有在 pod 中装入的 PVC 的大小。

    永久卷声明如下所示:

    apiVersion: v1
    kind: PersistentVolumeClaim
    metadata:
      labels:
        component: netbackup
      name: {{ .Release.Namespace }}-netbackupkops
      namespace: {{ .Release.Namespace }}
    spec:
      accessModes:
      - ReadWriteOnce
      resources:
        requests:
          storage: 10Gi
    
    • 在配置 Helm Chart 时的全新安装过程中。可以在 netbackupkops-helm-chart 的 deployment.yaml 中修改 PVC 存储的大小,这将导致创建初始 PVC 大小。

    • 在安装后,少数存储供应商支持更新 PVC 大小(动态卷扩展)。有关更多信息,请参考 https://kubernetes.io/docs/concepts/storage/persistent-volumes

注意:

可将永久卷的默认大小调整为更大的值,而不会丢失数据。建议添加支持卷扩展的存储提供商。

注意:

要获取配置值,可以运行以下命令:kubectl get configmaps <namespace>-backup-operator-configuration -n <namespace> -o yaml > {local.file}

表:<namespace>-backup-operator-configuration 中受 Kubernetes Operator 支持的配置参数

配置

描述

默认值

可能的值

DaemonSets

Daemonset 是 Kubernetes 中的动态对象,由控制器管理。可以设置期望状态,该状态表示需要存在于每个节点上的特定 pod。控制循环中的 pod 调谐可将当前实际状态与期望状态进行比较。

true

true、false

Deployments

Kubernetes 工作负载的部署。

true

true、false

Pods

pod 是 Kubernetes 中最小的执行单元。

true

true、false

ReplicaSets

副本集可确保应运行的 pod 副本数。可以将其视为复制控制器的替代品。

true

true、false

Secrets

密钥是包含敏感数据(如密码、令牌和凭据)的对象。

true

true、false

Services

Kubernetes 中提供的服务。

true

true、false

namespace

Kubernetes Operator 是在命名空间中部署的。

为命名空间指定的任何名称。

NetBackup 命名空间。

cleanStaleCRDurationMinutes

调用 CR 作业以清理无效 CR 的持续时间。触发无效自定义资源清理作业的间隔。

24 小时

1440 分钟

ttlCRDurationMinutes

TTL CR 持续时间

分钟

30240 分钟

livesnessProbeInitialDelay

探测初始延迟期。

分钟

60 分钟

livenessProbePeriodSeconds

探测期限。

80 秒

checkNbcertdaemonStatusDurationMinutes

NB 证书后台驻留程序状态持续时间。

分钟

1440 分钟

collectDataMoverLogs

由于 datamover 日志收集的内存使用率很高,建议仅在调试、故障排除或重新启动 pod 时启用日志。

在为 datamover 启用日志之前,请确保将 NetBackup Kubernetes pod 的内存限制增加到至少 2 GB 或更多。调试或故障排除完成后,可以重置为之前的值或默认值。

true

true、false

maxRetentionDataMoverLogsInHours

datamover 日志的最大保留期限。

24 小时

72 小时

maxRetentionDataMoverInHours

它会删除超过指定时间的所有 datamover 资源。

24 小时

24 小时

cleanStaleCertFilesDurationMinutes

触发无效证书文件清理作业的间隔。

60 分钟

1440 分钟

maxRetentionInDiscoveryCacheHours

该时间(以小时为单位)决定了保留发现缓存的时间间隔。

24 小时

48 小时

pollingTimeoutInMinutes

轮询操作不断重试,超过该超时值后,操作失效并且失败。

15 分钟

15 分钟

pollingFrequencyInSecs

轮询频率。

5 秒

nbcertPrerequisteDirectoryAndFiles

NBCA 前提条件。

证书名称

证书名称

从快照备份和从备份还原操作的前提条件
  1. 标记有效的存储类以供 NetBackup 使用,添加以下标签:netbackup.veritas.com/default-csi-storage-class=true。如果未找到 NetBackup 标记的存储类,则元数据映像的从快照备份作业和还原作业将失败,并显示错误消息:No eligible storage classes found

  2. 标记有效的卷快照类以供 NetBackup 使用,添加以下标签:netbackup.veritas.com/default-csi-volume-snapshot-class=true。如果未找到 NetBackup 标记的 VolumeSnapshotClass 类,则元数据映像的从快照备份作业和还原作业将失败,并显示错误消息:Failed to create snapshot of the Kubernetes namespace

  3. 运行从快照备份和从备份副本还原操作的每个主服务器都需要使用主服务器的名称创建单独的 ConfigMap

    在以下 configmap.yaml 示例中,

    • backupserver.sample.domain.com 和 mediaserver.sample.domain.com 是 NetBackup 主服务器和介质服务器的主机名。

    • 10.20.12.13 和 10.21.12.13 这两个 IP 是 NetBackup 主服务器和介质服务器的 IP 地址。

    apiVersion: v1
    data: 
      datamover.hostaliases: "10.20.12.13=backupserver.sample.domain.com, 
    10.21.12.13=mediaserver.sample.domain.com"
      datamover.properties: "image=reg.domain.com/datamover/image:latest"
      version: "1"
    kind: ConfigMap
    metadata: 
      name: backupserver.sample.domain.com
      namespace: kops-ns
    
    • 复制 configmap.yaml 文件详细信息。

    • 打开文本编辑器并粘贴 yaml 文件详细信息。

    • 然后,使用 yaml 文件扩展名将其保存到可访问 Kubernetes 群集的主目录。

  4. 使用正确的 datamover 映像指定 datamover.properties: image=reg.domain.com/datamover/image:latest

  5. 如果主服务器和连接到主服务器的介质服务器具有短名称,并且从 datamover 进行主机解析失败,请指定 datamover.hostaliases。为主服务器和介质服务器提供所有主机名到 IP 的映射。

  6. 要创建 configmap.yaml 文件,请运行以下命令:kubectl create -f configmap.yaml

  7. 如果 Kubernetes Operator 无法根据短名称解析主服务器

    • 获取证书时,如果收到消息:EXIT STATUS 8500: Connection with the web service was not established。然后,从 nbcert 日志中,验证主机名解析状态。

    • 如果主机名解析失败,则执行以下操作:

      更新 kops deployment.yaml,并在部署中添加 hostAliases

    • 在以下 hostAliases 示例中,

      • backupserver.sample.domain.com 和 mediaserver.sample.domain.com 是 NetBackup 主服务器和介质服务器的主机名。

      • 10.20.12.13 和 10.21.12.13 这两个 IP 是 NetBackup 主服务器和介质服务器的 IP 地址。

      hostAliases:
      - hostnames:
        - backupserver.sample.domain.com
        ip: 10.20.12.13
      - hostnames:
        -  mediaserver.sample.domain.com
        ip: 10.21.12.13
      

      在文本编辑器中复制并粘贴 hostAliases 示例详细信息,并将其添加到部署中的 hostAliases。

  8. 使用指纹和授权令牌创建密钥。有关更多信息,请参考《NetBackup™ 安全和加密指南》

  9. 创建 backupservercert 请求以获取证书。有关更多信息,请参考《NetBackup™ 安全和加密指南》

Kubernetes 工作负载中支持的 DTE 客户端设置

Kubernetes 仅支持客户端 DTE 设置的自动模式。而 Kubernetes datamover 始终遵循全局 DTE 设置。