NetBackup™ Web UI Kubernetes 管理指南

Last Published:
Product(s): NetBackup & Alta Data Protection (10.1.1)
  1. 适用于 Kubernetes 的 NetBackup 概述
    1.  
      概述
    2.  
      Kubernetes 支持的 NetBackup 功能
  2. 部署和配置 NetBackup Kubernetes Operator
    1.  
      在 NetBackup Kubernetes Operator 上部署服务软件包
    2.  
      Kubernetes Operator 部署的端口要求
    3.  
      升级 NetBackup Kubernetes Operator
    4.  
      删除 NetBackup Kubernetes Operator
    5.  
      配置 NetBackup Kubernetes datamover
    6. 配置 NetBackup 快照操作的设置
      1.  
        受 Kubernetes Operator 支持的配置参数
      2.  
        从快照备份和从备份还原操作的前提条件
      3.  
        Kubernetes 中支持的 DTE 客户端设置
      4.  
        自定义 datamover 属性
    7.  
      对具有短名称的 NetBackup 服务器进行故障排除
  3. 管理映像组
    1. 关于映像组
      1.  
        映像失效
      2.  
        映像副本
  4. 在 NetBackup Kubernetes Operator 上部署证书
    1.  
      在 Kubernetes Operator 上部署证书
    2.  
      执行基于主机 ID 的证书操作
    3.  
      执行 ECA 证书操作
    4.  
      标识证书类型
  5. 管理 Kubernetes 资产
    1.  
      添加 Kubernetes 群集
    2. 配置设置
      1.  
        配置资源限制设置
      2.  
        配置自动发现频率
      3.  
        配置权限
    3.  
      为资产添加保护
    4.  
      文件模式卷支持
  6. 管理 Kubernetes 智能组
    1.  
      关于智能组
    2.  
      创建智能组
    3.  
      删除智能组
    4.  
      编辑智能组
  7. 保护 Kubernetes 资产
    1.  
      保护智能组
    2.  
      从智能组中删除保护
    3.  
      配置备份计划
    4.  
      配置备份选项
    5.  
      配置备份
    6.  
      配置自动映像复制 (AIR) 和复制
    7.  
      配置存储单元
    8.  
      文件模式卷支持
  8. 恢复 Kubernetes 资产
    1.  
      浏览并验证恢复点
    2.  
      从快照还原
    3.  
      从备份副本还原
  9. 对 Kubernetes 问题进行故障排除
    1.  
      主服务器升级期间出错:NBCheck 失败
    2.  
      旧映像还原期间出错:操作失败
    3.  
      永久卷恢复 API 期间出错
    4.  
      还原期间出错:最终作业状态显示部分失败
    5.  
      在同一命名空间上进行还原时出错
    6.  
      datamover pod 超过 Kubernetes 资源限制
    7.  
      还原期间出错:高负载群集上的作业失败
    8.  
      为特定群集创建的自定义 Kubernetes 角色无法查看作业
    9.  
      从 OperatorHub 还原安装的应用程序时,Openshift 会创建空白非选定的 PVC
    10.  
      从 OperatorHub 还原安装的应用程序时,Openshift 会创建空白非选定的 PVC
    11.  
      如果超过 Kubernetes 节点上的 PID 限制,NetBackup Kubernetes Operator 将变得无响应
    12.  
      在 NetBackup Kubernetes 10.1 中编辑群集时失败
    13.  
      对于大型 PVC,从快照还原失败
    14.  
      将命名空间文件模式 PVC 还原到不同文件系统时部分失败
    15.  
      从备份副本还原失败并显示映像不一致错误

datamover pod 超过 Kubernetes 资源限制

NetBackup 使用两个资源限制属性控制 Kubernetes 工作负载上正在进行的备份作业总数。在 NetBackup 10.0 版中,datamover pod 超出了为每个 Kubernetes 群集设置的“备份”“从快照备份”资源限制。

以下是资源限制问题的示例

情形 1

每个 Kubernetes 群集的从快照备份作业的资源限制设置为 1。

作业 ID 3020 和 3021 是从快照备份的父作业。datamover pod 创建及其清理过程是备份作业生命周期的一部分。

作业 ID 3022 是子作业,其中数据从群集移动到存储单元。

根据资源限制设置,当作业 ID 3022 处于正在运行状态时,作业 ID 3021 将继续处于排队状态。备份作业 ID 3022 完成后,父作业 ID 3021 将启动。

请注意,作业 ID 3020 仍在进行中,因为我们正在清理 datamover pod 并完成父作业 ID 3020 的生命周期。

情形 2

在此阶段,我们可能会遇到 2 个 datamover pod 在 NetBackup Kubernetes Operator 部署命名空间中同时运行。因为作为作业 ID 3020 的一部分创建的 datamover pod 仍未清理,但我们已经开始为作业 3021 创建 datamover pod。

在触发了多个从快照备份作业的繁忙环境中,较低的资源限制值设置可能会导致备份作业大部分时间处于排队状态。

但是,如果资源限制设置较高,我们可能会发现 datamover pod 可能会超过资源限制中指定的计数。这可能会导致 Kubernetes 群集中出现资源匮乏。

当数据移动作业(如 3022)并行运行时,会按顺序处理清理活动。数据移动所需的时间加上清理 datamover 资源所需的时间,如果比较接近备份 PVC/命名空间数据所需的时间,则将导致作业完成时产生较长的延迟。

如果数据移动和清理资源的总持续时间接近备份作业的时间。然后,永久卷或命名空间数据的备份作业可能会导致作业完成产生延迟。

推荐的操作:确保查看系统资源和性能,并相应地设置资源限制值。此措施将有助于所有备份作业实现最佳性能。