Veritas NetBackup™ CloudPoint 安装和升级指南
- 第 I 部分. CloudPoint 安装和配置
- 准备安装 CloudPoint
- 使用容器映像部署 CloudPoint
- 部署 CloudPoint 扩展
- CloudPoint 云插件
- CloudPoint 存储阵列插件
- NetApp 插件配置说明
- Nutanix Files 插件配置说明
- Dell EMC Unity 阵列插件配置说明
- Pure Storage FlashArray 插件配置说明
- HPE RMC 插件配置说明
- HPE XP 插件配置说明
- Hitachi 插件配置说明
- Hitachi (HDS VSP 5000) 插件配置说明
- InfiniBox 插件配置说明
- Dell EMC PowerScale (Isilon) 插件配置说明
- Dell EMC PowerMax 和 VMax 插件配置说明
- Qumulo 插件配置说明
- CloudPoint 应用程序代理和插件
- Oracle 插件配置说明
- 关于快照还原
- 还原 SQL Server 快照后需要执行的其他步骤
- 使用 CloudPoint 无代理功能保护资产
- NetBackup CloudPoint 中的卷加密
- CloudPoint 安全性
- 第 II 部分. CloudPoint 维护
CloudPoint 故障排除
请参考以下故障排除场景:
如果 CloudPoint 代理主机突然重新启动,代理将无法连接到 CloudPoint 服务器。
如果安装 CloudPoint 代理的主机突然关闭,则可能发生此问题。即使在主机成功重新启动后,代理也无法与 CloudPoint 服务器建立连接,之后代理将进入脱机状态。
代理日志文件包含以下错误:
flexsnap-agent-onhost[4972] MainThread flexsnap.connectors.rabbitmq: ERROR - Channel 1 closed unexpectedly: (405) RESOURCE_LOCKED - cannot obtain exclusive access to locked queue ' flexsnap-agent.a1f2ac945cd844e393c9876f347bd817' in vhost '/'
出现此问题的原因是,即使在突然关闭代理主机的情况下,代理和 CloudPoint 服务器之间的 RabbitMQ 连接也不会关闭。在代理主机错过心跳轮询之前,CloudPoint 服务器无法检测到代理不可用。在下一个心跳周期之前,RabbitMQ 连接保持打开状态。如果代理主机在触发下一个心跳轮询之前重新启动,则代理将尝试与 CloudPoint 服务器建立新连接。但是,由于之前的 RabbitMQ 连接已存在,新连接尝试将失败,并出现资源已锁定错误。
由于此连接失败,代理将进入脱机状态,并导致在主机上执行的所有快照和还原操作失败。
解决方法:
在代理主机上重新启动 Veritas CloudPoint 代理服务。
在 Linux 主机上,运行以下命令:
# sudo systemctl restart flexsnap-agent.service
在 Windows 主机上:
从 Windows 服务控制台重新启动
Veritas CloudPoint™ Agent
服务。
Windows 主机上的 CloudPoint 代理注册可能会超时或失败。
要保护 Windows 上的应用程序,需要在 Windows 主机上安装并注册 CloudPoint 代理。有时,代理注册所花费的时间可能比平时要长、可能超时或失败。
解决方法:
要解决此问题,请尝试执行以下步骤:
使用新令牌在 Windows 主机上重新注册代理。
如果注册过程再次失败,则在 CloudPoint 服务器上重新启动 CloudPoint 服务,然后尝试重新注册代理。
有关更多信息,请参考以下内容:
请参见注册基于 Windows 的代理。
请参见重新启动 CloudPoint。
DR 软件包丢失或密码丢失时的灾难恢复。
如果 DR 软件包丢失或密码丢失,可能会出现此问题。
如果是目录库备份,则会创建 2 个备份软件包:
包含所有证书的 DR 软件包
包含数据库的目录库软件包
DR 软件包包含 NetBackup UUID 证书,而目录库 DB 也具有 UUID。当使用 DR 软件包执行灾难恢复并随后执行目录库恢复时,将同时还原 UUID 证书和 UUID。这样 NetBackup 便可以与 CloudPoint 进行通信,因为未更改 UUID。
但是,如果 DR 软件包丢失或密码丢失,则无法完成 DR 操作。没有 DR 软件包的情况下,只有重新安装 NetBackup 后才能恢复目录库。在这种情况下,将为 NetBackup 创建一个不被 CloudPoint 识别的新 UUID。NetBackup 与 CloudPoint 的一对一映射将丢失。
解决方法:
要解决此问题,必须在创建 NetBackup 主服务器后更新该新 NBU UUID 和版本号。
NetBackup 管理员必须登录 NetBackup Web 管理服务,才能执行此任务。使用以下命令登录:
/usr/openv/netbackup/bin/bpnbat -login -loginType WEB
在主服务器上执行以下命令获取 NBU UUID:
/usr/openv/netbackup/bin/admincmd/nbhostmgmt -list -host <primary server host name> | grep "Host ID"
执行以下命令获取版本号:
/usr/openv/netbackup/bin/admincmd/bpgetconfig -g <primary Ssrver host name> -L
获取 NBU UUID 和版本号后,请在 CloudPoint 主机上执行以下命令更新映射:
/cloudpoint/scripts/cp_update_nbuuid.sh -i <NBU UUID> -v <Version Number>
快照作业成功,但如果 CloudPoint 服务器的证书被吊销,从快照作业备份将失败并显示错误“证书验证失败”
在“从快照备份”操作中,创建快照时 NetBackup 与 CloudPoint 服务器进行通信。
在备份操作中,在 CloudPoint 服务器上的 datamover 容器和 NetBackup 介质/主服务器之间进行通信。应使用下列标志对相应服务器的证书强制执行吊销状态检查。
ECA_CRL_CHECK:默认情况下,备份操作期间已启用并验证该检查,而 VIRTUALIZATION_CRL_CHECK 默认已禁用,并在快照和云供应商操作期间进行验证。
VIRTUALIZATION_CRL_CHECK:如果已启用此标志,并且 CloudPoint 计算机证书已吊销,则快照作业将失败。
CloudPoint 无法使用无代理连接到 Windows 云实例
错误 1:<Instance_name>: network connection timed out.
案例 1:CloudPoint 服务器日志消息:
WARNING - Cannot connect to the remote host. SMB Connection timeout <IP address> <user> … flexsnap.OperationFailed: Could not connect to the remote server <IP address>
解决方法
要解决此问题,请尝试执行以下步骤:
验证 SMB 端口 445 是否已添加到网络安全组中,以及是否可从 CloudPoint 服务器进行访问。
验证是否允许 SMB 端口 445 通过云实例防火墙。
案例 2:CloudPoint 服务器日志消息:
WARNING - Cannot connect to the remote host. WMI Connection timeout <IP address> <user> … flexsnap.OperationFailed: Could not connect to the remote server <IP address>
解决方法:
要解决此问题,请尝试执行以下步骤:
验证并在网络安全组中添加 DCOM 端口 (135),并确保可从 CloudPoint 服务器进行访问。
验证是否允许端口 135 通过云实例防火墙。
案例 3:CloudPoint 服务器日志消息:
Exception while opening SMB connection, [Errno Connection error (<IP address>:445)] [Errno 113] No route to host.
解决办法:验证云实例是否已启动且正在运行,或者是否处于不一致状态。
案例 4:CloudPoint 服务器日志消息:
Error when closing dcom connection: 'Thread-xxxx'"
其中,xxxx 是线程编号。
解决方法:
要解决此问题,请尝试执行以下步骤:
验证 WMI-IN 动态端口范围或配置的固定端口是否已添加到网络安全组中。
从云实例防火墙验证并启用 WMI-IN 端口。
错误 2:<Instance_name>: Could not connect to the virtual machine.
CloudPoint 服务器日志消息:
Error: Cannot connect to the remote host. <IP address> Access denied.
解决方法:
要解决此问题,请尝试执行以下步骤:
验证用户是否具有管理权限。
验证是否为用户禁用了 UAC。
如果禁用了防火墙,则 RHEL 系统上的 CloudPoint 云操作将失败
如果运行 CloudPoint 服务时在该系统上禁用了防火墙,则 RHEL 系统上所有受支持的云插件的 CloudPoint 操作都会失败。这是网络配置问题,会阻止 CloudPoint 访问云提供商 REST API 端点。
解决方法
停止 CloudPoint
# docker run --rm -it
-v /var/run/docker.sock:/var/run/docker.sock
-v /cloudpoint:/cloudpoint veritas/flexsnap-cloudpoint:<version> stop
重新启动 Docker
# systemctl restart docker
重新启动 CloudPoint
# docker run --rm -it
-v /var/run/docker.sock:/var/run/docker.sock
-v /cloudpoint:/cloudpoint veritas/flexsnap-cloudpoint:<version> start