NetBackup™ Web UI Kubernetes 管理指南
- 适用于 Kubernetes 的 NetBackup 概述
- 部署和配置 NetBackup Kubernetes Operator
- NetBackup Kubernetes Operator 部署的前提条件
- 在 NetBackup Kubernetes Operator 上部署服务软件包
- Kubernetes Operator 部署的端口要求
- 升级 NetBackup Kubernetes Operator
- 删除 NetBackup Kubernetes Operator
- 配置 NetBackup Kubernetes 数据移动器
- 自动为 Kubernetes 配置 NetBackup 保护
- 配置 NetBackup 快照操作的设置
- 对具有短名称的 NetBackup 服务器进行故障排除
- datamover pod 调度机制支持
- 在 NetBackup Kubernetes Operator 上部署证书
- 管理 Kubernetes 资产
- 管理 Kubernetes 智能组
- 保护 Kubernetes 资产
- 管理映像组
- 在 NetBackup 中保护 Rancher 管理的群集
- 恢复 Kubernetes 资产
- 在 Kubernetes 中启用 FIPS 模式
- 对 Kubernetes 问题进行故障排除
- 主服务器升级期间出错:NBCheck 失败
- 旧映像还原期间出错:操作失败
- 永久卷恢复 API 期间出错
- 还原期间出错:最终作业状态显示部分失败
- 在同一命名空间上进行还原时出错
- datamover pod 超过 Kubernetes 资源限制
- 还原期间出错:高负载群集上的作业失败
- 为特定群集创建的自定义 Kubernetes 角色无法查看作业
- 从 OperatorHub 还原安装的应用程序时,Openshift 会创建空白非选定的 PVC
- 如果超过 Kubernetes 节点上的 PID 限制,NetBackup Kubernetes Operator 将变得无响应
- 在 NetBackup Kubernetes 10.1 中编辑群集时失败
- 对于大型 PVC,从快照还原失败
- 将命名空间文件模式 PVC 还原到不同文件系统时部分失败
- 从备份副本还原失败并显示映像不一致错误
- NetBackup 主服务器、介质服务器和 Kubernetes 服务器之间的连接检查。
datamover pod 超过 Kubernetes 资源限制
NetBackup 使用两个资源限制属性控制 Kubernetes 工作负载上正在进行的备份作业总数。在 NetBackup 10.0 版中,datamover pod 超出了为每个 Kubernetes 群集设置的和资源限制。
情形 1
每个 Kubernetes 群集的从快照备份作业的资源限制设置为 1。
作业 ID 3020 和 3021 是从快照备份的父作业。datamover pod 创建及其清理过程是备份作业生命周期的一部分。
作业 ID 3022 是子作业,其中数据从群集移动到存储单元。
根据资源限制设置,当作业 ID 3022 处于正在运行状态时,作业 ID 3021 将继续处于排队状态。备份作业 ID 3022 完成后,父作业 ID 3021 将启动。
请注意,作业 ID 3020 仍在进行中,因为我们正在清理 datamover pod 并完成父作业 ID 3020 的生命周期。
情形 2
在此阶段,我们可能会遇到 2 个 datamover pod 在 NetBackup Kubernetes Operator 部署命名空间中同时运行。因为作为作业 ID 3020 的一部分创建的 datamover pod 仍未清理,但我们已经开始为作业 3021 创建 datamover pod。
在触发了多个从快照备份作业的繁忙环境中,较低的资源限制值设置可能会导致备份作业大部分时间处于排队状态。
但是,如果资源限制设置较高,我们可能会发现 datamover pod 可能会超过资源限制中指定的计数。这可能会导致 Kubernetes 群集中出现资源匮乏。
当数据移动作业(如 3022)并行运行时,会按顺序处理清理活动。数据移动所需的时间加上清理 datamover 资源所需的时间,如果比较接近备份 PVC/命名空间数据所需的时间,则将导致作业完成时产生较长的延迟。
如果数据移动和清理资源的总持续时间接近备份作业的时间。然后,永久卷或命名空间数据的备份作业可能会导致作业完成产生延迟。
推荐的操作:确保查看系统资源和性能,并相应地设置资源限制值。此措施将有助于所有备份作业实现最佳性能。