Veritas NetBackup™ CloudPoint 安装和升级指南

Last Published:
Product(s): NetBackup & Alta Data Protection (9.1)
  1. 第 I 部分. CloudPoint 安装和配置
    1. 准备安装 CloudPoint
      1.  
        关于部署方法
      2.  
        确定运行 CloudPoint 的位置
      3.  
        关于在云中部署 CloudPoint
      4.  
        满足系统要求
      5. CloudPoint 主机规模建议
        1.  
          针对云平台的 CloudPoint 规模建议
      6.  
        CloudPoint 扩展规模建议
      7.  
        创建实例或准备主机以安装 CloudPoint
      8.  
        安装容器平台(Docker、Podman)
      9.  
        创建并装入卷以存储 CloudPoint 数据
      10.  
        验证是否已在实例或物理主机上打开特定端口
      11.  
        准备 CloudPoint 以从快照作业进行备份
    2. 使用容器映像部署 CloudPoint
      1.  
        开始安装 CloudPoint 前
      2.  
        在 Docker 环境中安装 CloudPoint
      3.  
        在 Podman 环境中安装 CloudPoint
      4.  
        验证是否已成功安装 CloudPoint
      5.  
        重新启动 CloudPoint
    3. 部署 CloudPoint 扩展
      1.  
        开始安装 CloudPoint 扩展前
      2.  
        准备在 VM 上安装扩展
      3.  
        在 VM 上安装 CloudPoint 扩展
      4.  
        准备在托管 Kubernetes 群集上安装扩展
      5.  
        下载 CloudPoint 扩展
      6.  
        在托管 Kubernetes 群集上安装 CloudPoint 扩展
      7.  
        管理扩展
    4. CloudPoint 云插件
      1.  
        如何配置 CloudPoint 云插件?
      2. AWS 插件配置说明
        1.  
          配置 AWS 插件的前提条件
        2.  
          为 CloudPoint 配置 AWS 权限
        3.  
          CloudPoint 需要的 AWS 权限
        4.  
          在创建跨帐户配置之前
      3. Google Cloud Platform 插件配置说明
        1.  
          CloudPoint 需要的 Google Cloud Platform 权限
        2.  
          为 CloudPoint 配置 GCP 服务帐户
        3.  
          为插件配置准备 GCP 服务帐户
      4. Microsoft Azure 插件配置说明
        1.  
          在 Microsoft Azure 上配置权限
        2.  
          关于 Azure 快照
      5. Microsoft Azure Stack Hub 插件配置说明
        1.  
          在 Microsoft Azure Stack Hub 上配置权限
        2.  
          配置 Azure Stack Hub VM 的暂存位置以从备份还原
    5. CloudPoint 存储阵列插件
      1.  
        如何配置 CloudPoint 存储阵列插件?
      2. NetApp 插件配置说明
        1.  
          NetApp 插件配置参数
        2.  
          配置专用 LIF 以进行 NetBackup 访问
        3.  
          NetApp 存储上支持的 CloudPoint 操作
      3.  
        NetApp 阵列上的 ACL 配置
      4. Nutanix Files 插件配置说明
        1.  
          Nutanix Files 插件配置前提条件
        2.  
          Nutanix Files 插件注意事项和限制
        3.  
          Nutanix Files 文件服务器上支持的 CloudPoint 操作
        4. 对 Nutanix Files 的 NetBackup 问题进行故障排除
          1.  
            由于快照导入和导出操作失败,Nutanix Files 的备份作业失败
          2.  
            如果 Nutanix Files 版本不受支持,插件配置可能会失败
      5.  
        为 Nutanix 阵列配置 ACL
      6. Dell EMC Unity 阵列插件配置说明
        1.  
          DELL EMC Unity 阵列插件配置参数
        2.  
          支持的 Dell EMC Unity 阵列
        3.  
          Dell EMC Unity 阵列上支持的 CloudPoint 操作
      7. Pure Storage FlashArray 插件配置说明
        1.  
          支持的 Pure Storage FlashArray 型号
        2.  
          Pure Storage FlashArray 型号上支持的 CloudPoint 操作
      8. HPE RMC 插件配置说明
        1.  
          RMC 插件配置参数
        2.  
          支持的 HPE 存储系统
        3.  
          HPE 存储阵列上支持的 CloudPoint 操作
      9. HPE XP 插件配置说明
        1.  
          HPE XP 插件配置参数
        2.  
          HPE XP 存储阵列上支持的 CloudPoint 操作
      10. Hitachi 插件配置说明
        1.  
          Hitachi 插件配置参数
        2.  
          支持的 Hitachi 存储阵列
        3.  
          Hitachi 阵列上支持的 CloudPoint 操作
      11. Hitachi (HDS VSP 5000) 插件配置说明
        1.  
          Hitachi (HDS VSP 5000) 插件配置参数
        2.  
          Hitachi (HDS VSP 5000) 阵列上支持的 CloudPoint 操作
      12. InfiniBox 插件配置说明
        1.  
          InfiniBox 插件配置参数
        2.  
          InfiniBox 阵列上支持的 CloudPoint 操作
      13. Dell EMC PowerScale (Isilon) 插件配置说明
        1.  
          Dell EMC PowerScale (Isilon) 插件配置前提条件
        2.  
          Dell EMC PowerScale (Isilon) 插件上支持的 CloudPoint 操作
      14. Dell EMC PowerMax 和 VMax 插件配置说明
        1.  
          Dell EMC PowerMax 和 VMax 插件配置前提条件
        2.  
          Dell EMC PowerMax 和 VMax 上支持的 CloudPoint 操作
      15. Qumulo 插件配置说明
        1.  
          Qumulo 插件配置前提条件
        2.  
          Qumulo 插件注意事项和限制
        3.  
          Qumulo 插件上支持的 CloudPoint 操作
    6. CloudPoint 应用程序代理和插件
      1.  
        Microsoft SQL 插件配置说明
      2. Oracle 插件配置说明
        1.  
          优化 Oracle 数据库数据和元数据文件
      3.  
        MongoDB 插件配置说明
      4.  
        关于安装和配置过程
      5.  
        准备安装基于 Linux 的代理
      6.  
        准备安装基于 Windows 的代理
      7.  
        下载并安装 CloudPoint 代理
      8.  
        注册基于 Linux 的代理
      9.  
        注册基于 Windows 的代理
      10.  
        配置 CloudPoint 应用程序插件
      11.  
        将 VSS 配置为在原始驱动器上存储卷影副本
      12.  
        为云资产创建 NetBackup 保护计划
      13.  
        为云资产订购 NetBackup 保护计划
      14. 关于快照还原
        1.  
          还原 SQL AG 数据库的过程
      15.  
        Microsoft SQL Server 的还原要求和限制
      16.  
        Oracle 的还原要求和限制
      17.  
        还原 Oracle 快照后需要执行的其他步骤
      18.  
        MongoDB 的还原要求和限制
      19.  
        还原 MongoDB 快照后需要执行的其他步骤
      20.  
        还原 SQL AG 数据库之前需要执行的步骤
      21.  
        将 SQL 数据库恢复到同一位置
      22.  
        将 SQL 数据库恢复到备用位置
      23. 还原 SQL Server 快照后需要执行的其他步骤
        1.  
          在 SQL Server 磁盘级别将快照还原到新位置后需要执行的步骤
      24.  
        还原 SQL AG 数据库之后需要执行的其他步骤
      25.  
        如果 Windows 实例与 CloudPoint 主机失去连接,SQL 快照或还原及粒度还原操作将失败
      26.  
        如果原始磁盘与实例分离,则磁盘级别快照还原将失败
      27.  
        还原 AWS RDS 数据库实例之后需要执行的其他步骤
    7. 使用 CloudPoint 无代理功能保护资产
      1.  
        关于无代理功能
      2. 无代理配置的前提条件
        1.  
          为 Windows 配置 SMB(可选)
        2.  
          为 Windows 配置 WMI 安全性(可选)
      3.  
        配置无代理功能
      4.  
        升级 CloudPoint 后配置无代理功能
    8. NetBackup CloudPoint 中的卷加密
      1.  
        关于 CloudPoint 中的卷加密支持
      2.  
        适用于 Azure 的卷加密
      3.  
        适用于 GCP 的卷加密
      4.  
        适用于 AWS 的卷加密
    9. CloudPoint 安全性
      1.  
        为 Azure 和 Azure Stack 配置安全性
      2.  
        为 Azure 和 Azure Stack 配置云连接器
      3.  
        Azure Stack 的 CA 配置
      4.  
        保护与 CloudPoint 的连接
  2. 第 II 部分. CloudPoint 维护
    1. CloudPoint 日志记录
      1.  
        关于 CloudPoint 日志记录机制
      2. 基于 Fluentd 的 CloudPoint 日志记录的工作原理
        1.  
          关于 CloudPoint fluentd 配置文件
        2.  
          修改 fluentd 配置文件
      3.  
        CloudPoint 日志
      4.  
        无代理日志
      5.  
        对 CloudPoint 日志记录进行故障排除
    2. 升级 CloudPoint
      1.  
        关于 CloudPoint 升级
      2.  
        支持的升级路径
      3.  
        升级方案
      4.  
        准备升级 CloudPoint
      5. 升级 CloudPoint
        1.  
          在 Docker 环境中升级
        2.  
          在 Podman 环境中升级
      6.  
        使用修补程序升级 CloudPoint
      7. 迁移和升级 CloudPoint
        1.  
          开始迁移 CloudPoint 前
        2.  
          在 RHEL 8.3 上迁移和升级 CloudPoint
      8.  
        升级后任务
    3. 卸载 CloudPoint
      1.  
        准备卸载 CloudPoint
      2.  
        备份 CloudPoint
      3.  
        取消配置 CloudPoint 插件
      4.  
        取消配置 CloudPoint 代理
      5.  
        删除 CloudPoint 代理
      6.  
        从独立 Docker 主机环境中删除 CloudPoint
      7.  
        删除 CloudPoint 扩展 - 基于 VM 或基于托管 Kubernetes 群集
      8.  
        还原 CloudPoint
    4. CloudPoint 故障排除
      1.  
        CloudPoint 故障排除

CloudPoint 故障排除

请参考以下故障排除场景:

  • 如果 CloudPoint 代理主机突然重新启动,代理将无法连接到 CloudPoint 服务器。

    如果安装 CloudPoint 代理的主机突然关闭,则可能发生此问题。即使在主机成功重新启动后,代理也无法与 CloudPoint 服务器建立连接,之后代理将进入脱机状态。

    代理日志文件包含以下错误:

    flexsnap-agent-onhost[4972] MainThread flexsnap.connectors.rabbitmq:
    ERROR - Channel 1 closed unexpectedly: 
    (405) RESOURCE_LOCKED - cannot obtain exclusive access to locked queue '
    flexsnap-agent.a1f2ac945cd844e393c9876f347bd817' in vhost '/'

    出现此问题的原因是,即使在突然关闭代理主机的情况下,代理和 CloudPoint 服务器之间的 RabbitMQ 连接也不会关闭。在代理主机错过心跳轮询之前,CloudPoint 服务器无法检测到代理不可用。在下一个心跳周期之前,RabbitMQ 连接保持打开状态。如果代理主机在触发下一个心跳轮询之前重新启动,则代理将尝试与 CloudPoint 服务器建立新连接。但是,由于之前的 RabbitMQ 连接已存在,新连接尝试将失败,并出现资源已锁定错误。

    由于此连接失败,代理将进入脱机状态,并导致在主机上执行的所有快照和还原操作失败。

    解决方法:

    在代理主机上重新启动 Veritas CloudPoint 代理服务。

    • 在 Linux 主机上,运行以下命令:

      # sudo systemctl restart flexsnap-agent.service

    • 在 Windows 主机上:

      从 Windows 服务控制台重新启动 Veritas CloudPoint™ Agent 服务。

  • Windows 主机上的 CloudPoint 代理注册可能会超时或失败。

    要保护 Windows 上的应用程序,需要在 Windows 主机上安装并注册 CloudPoint 代理。有时,代理注册所花费的时间可能比平时要长、可能超时或失败。

    解决方法:

    要解决此问题,请尝试执行以下步骤:

    • 使用新令牌在 Windows 主机上重新注册代理。

    • 如果注册过程再次失败,则在 CloudPoint 服务器上重新启动 CloudPoint 服务,然后尝试重新注册代理。

    有关更多信息,请参考以下内容:

    请参见注册基于 Windows 的代理

    请参见重新启动 CloudPoint

  • DR 软件包丢失或密码丢失时的灾难恢复。

    如果 DR 软件包丢失或密码丢失,可能会出现此问题。

    如果是目录库备份,则会创建 2 个备份软件包:

    • 包含所有证书的 DR 软件包

    • 包含数据库的目录库软件包

    DR 软件包包含 NetBackup UUID 证书,而目录库 DB 也具有 UUID。当使用 DR 软件包执行灾难恢复并随后执行目录库恢复时,将同时还原 UUID 证书和 UUID。这样 NetBackup 便可以与 CloudPoint 进行通信,因为未更改 UUID。

    但是,如果 DR 软件包丢失或密码丢失,则无法完成 DR 操作。没有 DR 软件包的情况下,只有重新安装 NetBackup 后才能恢复目录库。在这种情况下,将为 NetBackup 创建一个不被 CloudPoint 识别的新 UUID。NetBackup 与 CloudPoint 的一对一映射将丢失。

    解决方法:

    要解决此问题,必须在创建 NetBackup 主服务器后更新该新 NBU UUID 和版本号。

    • NetBackup 管理员必须登录 NetBackup Web 管理服务,才能执行此任务。使用以下命令登录:

      /usr/openv/netbackup/bin/bpnbat -login -loginType WEB

    • 在主服务器上执行以下命令获取 NBU UUID:

      /usr/openv/netbackup/bin/admincmd/nbhostmgmt -list -host <primary server host name> | grep "Host ID"

    • 执行以下命令获取版本号:

      /usr/openv/netbackup/bin/admincmd/bpgetconfig -g <primary Ssrver host name> -L

    获取 NBU UUID 和版本号后,请在 CloudPoint 主机上执行以下命令更新映射:

    /cloudpoint/scripts/cp_update_nbuuid.sh -i <NBU UUID> -v <Version Number>

  • 快照作业成功,但如果 CloudPoint 服务器的证书被吊销,从快照作业备份将失败并显示错误“证书验证失败”

    在“从快照备份”操作中,创建快照时 NetBackup 与 CloudPoint 服务器进行通信。

    在备份操作中,在 CloudPoint 服务器上的 datamover 容器和 NetBackup 介质/主服务器之间进行通信。应使用下列标志对相应服务器的证书强制执行吊销状态检查。

    • ECA_CRL_CHECK:默认情况下,备份操作期间已启用并验证该检查,而 VIRTUALIZATION_CRL_CHECK 默认已禁用,并在快照和云供应商操作期间进行验证。

    • VIRTUALIZATION_CRL_CHECK:如果已启用此标志,并且 CloudPoint 计算机证书已吊销,则快照作业将失败。

    请参见为 Azure 和 Azure Stack 配置安全性

  • CloudPoint 无法使用无代理连接到 Windows 云实例

    错误 1<Instance_name>: network connection timed out.

    案例 1:CloudPoint 服务器日志消息:

    WARNING - Cannot connect to the remote host. SMB Connection timeout
     <IP address> <user>
    
    …
    
    flexsnap.OperationFailed: Could not connect to the remote server 
    <IP address>

    解决方法

    要解决此问题,请尝试执行以下步骤:

    • 验证 SMB 端口 445 是否已添加到网络安全组中,以及是否可从 CloudPoint 服务器进行访问。

    • 验证是否允许 SMB 端口 445 通过云实例防火墙。

    案例 2:CloudPoint 服务器日志消息:

    WARNING - Cannot connect to the remote host. WMI Connection 
    timeout <IP address> <user>
    
    …
    
    flexsnap.OperationFailed: Could not connect to the remote 
    server <IP address>

    解决方法:

    要解决此问题,请尝试执行以下步骤:

    • 验证并在网络安全组中添加 DCOM 端口 (135),并确保可从 CloudPoint 服务器进行访问。

    • 验证是否允许端口 135 通过云实例防火墙。

    案例 3:CloudPoint 服务器日志消息:

    Exception while opening SMB connection, [Errno Connection error 
    (<IP address>:445)] [Errno 113] No route to host.

    解决办法:验证云实例是否已启动且正在运行,或者是否处于不一致状态。

    案例 4:CloudPoint 服务器日志消息:

    Error when closing dcom connection: 'Thread-xxxx'"

    其中,xxxx 是线程编号。

    解决方法

    要解决此问题,请尝试执行以下步骤:

    • 验证 WMI-IN 动态端口范围或配置的固定端口是否已添加到网络安全组中。

    • 从云实例防火墙验证并启用 WMI-IN 端口。

    错误 2<Instance_name>: Could not connect to the virtual machine.

    CloudPoint 服务器日志消息:

    Error: Cannot connect to the remote host. <IP address> Access denied. 

    解决方法

    要解决此问题,请尝试执行以下步骤:

    • 验证用户是否具有管理权限。

    • 验证是否为用户禁用了 UAC。

  • 如果禁用了防火墙,则 RHEL 系统上的 CloudPoint 云操作将失败

    如果运行 CloudPoint 服务时在该系统上禁用了防火墙,则 RHEL 系统上所有受支持的云插件的 CloudPoint 操作都会失败。这是网络配置问题,会阻止 CloudPoint 访问云提供商 REST API 端点。

    解决方法

    • 停止 CloudPoint

      # docker run --rm -it

      -v /var/run/docker.sock:/var/run/docker.sock

      -v /cloudpoint:/cloudpoint veritas/flexsnap-cloudpoint:<version> stop

    • 重新启动 Docker

      # systemctl restart docker

    • 重新启动 CloudPoint

      # docker run --rm -it

      -v /var/run/docker.sock:/var/run/docker.sock

      -v /cloudpoint:/cloudpoint veritas/flexsnap-cloudpoint:<version> start