NetBackup™ 故障排除指南

Last Published:
Product(s): NetBackup (10.3)
  1. 介绍
    1.  
      NetBackup 日志记录和状态码信息
    2.  
      对问题进行故障排除
    3.  
      用于技术支持的问题报告
    4.  
      关于收集有关 NetBackup-Java 应用程序的信息
  2. 故障排除过程
    1.  
      关于故障排除过程
    2. 对 NetBackup 问题进行故障排除
      1.  
        在 UNIX 或 Linux 服务器上验证所有进程是否正在运行
      2.  
        在 Windows 服务器上验证是否所有进程正在运行
    3.  
      对安装问题进行故障排除
    4.  
      对配置问题进行故障排除
    5.  
      设备配置问题解决方法
    6.  
      测试主服务器和客户端
    7.  
      测试介质服务器和客户端
    8.  
      解决与 UNIX 客户端相关的网络通信问题
    9.  
      解决与 Windows 客户端相关的网络通信问题
    10. vnetd 代理连接故障排除
      1.  
        vnetd 代理连接要求
      2.  
        从何着手对 vnetd 代理连接进行故障排除
      3.  
        验证 vnetd 进程及其代理是否处于活动状态
      4.  
        验证主机连接是否已设置代理
      5.  
        测试 vnetd 代理连接
      6.  
        检查连接和接受进程的日志文件
      7.  
        查看 vnetd 代理日志文件
    11. 安全证书吊销故障排除
      1.  
        对云提供商的已吊销 SSL 证书问题进行故障排除
      2.  
        对云提供商的 CRL 下载问题进行故障排除
      3.  
        主机的 CRL 如何影响证书吊销故障排除
      4.  
        NetBackup 作业因证书已被吊销或 CRL 不可用而失败
      5.  
        NetBackup 作业由于明显的网络错误而失败
      6.  
        NetBackup 作业由于资源不可用而失败
      7.  
        主服务器安全证书已吊销
      8.  
        确定 NetBackup 主机的证书状态
      9.  
        外部 CA 签名证书吊销问题故障排除
    12.  
      关于网络和主机名故障排除
    13. 验证 NetBackup 中的主机名和服务条目
      1.  
        UNIX 主服务器和客户端上主机名和服务条目的示例
      2.  
        UNIX 主服务器和介质服务器上主机名和服务条目的示例
      3.  
        UNIX PC 客户端上主机名和服务条目的示例
      4.  
        连接到多个网络的 UNIX 服务器上主机名和服务条目的示例
    14.  
      关于 bpclntcmd 实用程序
    15.  
      使用主机属性访问配置设置
    16.  
      解决磁盘已满的问题
    17. 冻结的介质故障排除注意事项
      1.  
        对冻结的介质进行故障排除时可参考的日志
      2.  
        关于导致介质冻结的情况
    18. 对 NetBackup Web 服务问题进行故障排除
      1.  
        查看 NetBackup Web 服务日志
      2.  
        配置外部 CA 后的 Web 服务问题故障排除
    19.  
      对 NetBackup Web 服务器证书问题进行故障排除
    20. 解决 PBX 问题
      1.  
        检查 PBX 安装
      2.  
        检查 PBX 是否正在运行
      3.  
        检查 PBX 是否已正确设置
      4.  
        访问 PBX 日志
      5.  
        对 PBX 安全性进行故障排除
      6.  
        确定 PBX 后台驻留程序或服务是否可用
    21. 远程主机验证问题故障排除
      1.  
        查看与主机验证相关的日志
      2.  
        启用与 NetBackup 8.0 和更低版本主机的不安全通信
      3.  
        批准待定的主机 ID-主机名映射
      4.  
        清除主机缓存
    22. 自动映像复制故障排除
      1.  
        与自动映像同步复制和 SLP 一起使用的主服务器的规则
      2. 使用外部证书配置时,目标 A.I.R. 可信主服务器操作失败
        1.  
          添加或更新信任关系
        2.  
          删除信任关系
      3.  
        关于对 SLP 组件管理的自动导入作业进行故障排除
    23.  
      对网络接口卡性能进行故障排除
    24.  
      关于 bp.conf 文件中的 SERVER 条目
    25.  
      关于存储单元不可用的问题
    26.  
      解决 Windows 上的 NetBackup 管理操作失败
    27.  
      在 UNIX 计算机上解析 NetBackup 管理控制台中显示的乱码文本
    28.  
      对 NetBackup 管理控制台中的错误消息进行故障排除
    29.  
      “NetBackup 管理控制台”需要有额外的磁盘空间来存储日志和临时文件
    30.  
      在配置外部 CA 后,无法登录 NetBackup 管理控制台
    31.  
      基于文件的外部证书问题故障排除
    32.  
      Windows 证书存储库问题故障排除
    33.  
      备份失败故障排除
    34.  
      对 NAT 客户端或 NAT 服务器的备份失败问题进行故障排除
    35.  
      对 NetBackup Messaging Broker(或 nbmqbroker)服务问题进行故障排除
    36.  
      Windows 系统的电子邮件通知出现问题
    37.  
      KMS 配置问题
    38.  
      由于密钥较大而导致启动 NetBackup CA 迁移时出现的问题
    39.  
      非特权用户(服务用户)帐户的相关问题
    40.  
      auth.conf 文件中的组名称格式问题
    41.  
      VxUpdate 软件包添加过程故障排除
    42.  
      FIPS 模式的问题
    43.  
      恶意软件扫描问题
    44.  
      启用传输中数据加密的 NetBackup 作业问题
    45.  
      非结构化数据即时访问问题
    46.  
      对多重身份验证问题进行故障排除
    47.  
      对多人授权问题进行故障排除
  3. 使用 NetBackup 实用程序
    1.  
      关于 NetBackup 故障排除实用程序
    2.  
      关于 NetBackup 调试日志分析实用程序
    3.  
      关于日志记录助理
    4.  
      关于网络故障排除实用程序
    5. 关于 NetBackup 支持实用程序 (nbsu)
      1.  
        NetBackup 支持实用程序 (nbsu) 的输出
      2.  
        NetBackup 支持实用程序 (nbsu) 的进度显示示例
    6. 关于 NetBackup 一致性检查实用程序 (NBCC)
      1.  
        NetBackup 一致性检查实用程序 (NBCC) 的输出
      2.  
        NBCC 进度显示的示例
    7.  
      关于 NetBackup 一致性检查修复 (NBCC) 实用程序
    8.  
      关于 nbcplogs 实用程序
    9. 关于机械手测试实用程序
      1.  
        在 UNIX 环境下进行机械手测试
      2.  
        在 Windows 环境下进行机械手测试
    10. 关于 NetBackup 智能诊断 (nbsmartdiag) 实用程序
      1.  
        使用 nbsmartdiag 实用程序进行 NetBackup 主机通信的工作流程
    11.  
      关于按作业 ID 收集日志
  4. 灾难恢复
    1.  
      关于灾难恢复
    2.  
      关于灾难恢复要求
    3.  
      灾难恢复软件包
    4.  
      关于灾难恢复设置
    5.  
      推荐的备份方法
    6. 关于适用于 UNIX 和 Linux 的磁盘恢复过程
      1. 关于恢复 UNIX 和 Linux 的主服务器磁盘
        1.  
          在根文件系统完好无损的情况下恢复主服务器
        2.  
          在根分区丢失的情况下恢复主服务器
      2.  
        关于恢复 UNIX 的 NetBackup 介质服务器磁盘
      3.  
        在 UNIX 客户端工作站上恢复系统磁盘
    7. 关于 UNIX 和 Linux 上的群集 NetBackup 服务器恢复
      1.  
        替换 UNIX 或 Linux 群集上的故障节点
      2.  
        恢复整个 UNIX 或 Linux 群集
    8. 关于适用于 Windows 的磁盘恢复过程
      1. 关于恢复 Windows 的主服务器磁盘
        1.  
          在 Windows 完好无损的情况下恢复主服务器
        2.  
          恢复主服务器和 Windows
      2.  
        关于恢复 Windows 的 NetBackup 介质服务器磁盘
      3.  
        恢复 Windows 客户端磁盘
    9. 关于 Windows 上的群集 NetBackup 服务器恢复
      1.  
        替换 Windows VCS 群集上的故障节点
      2.  
        恢复 Windows VCS 群集上的共享磁盘
      3.  
        恢复整个 Windows VCS 群集
    10.  
      灾难恢复安装后在群集主服务器上生成证书
    11.  
      关于还原灾难恢复软件包
    12.  
      关于 DR_PKG_MARKER_FILE 环境变量
    13.  
      在 Windows 上还原灾难恢复软件包
    14.  
      在 UNIX 上还原灾难恢复软件包
    15. 关于恢复 NetBackup 目录库
      1.  
        关于目录库备份过程
      2.  
        恢复 NetBackup 目录库或 NetBackup 目录库映像文件的前提条件
      3.  
        关于在 Windows 计算机上执行 NetBackup 目录库恢复
      4.  
        关于从磁盘设备执行 NetBackup 目录库恢复
      5.  
        关于 NetBackup 目录库恢复和符号链接
      6. 关于 NetBackup 目录库恢复
        1.  
          在目录库恢复之后指定 NetBackup 作业 ID 编号
      7.  
        NetBackup 灾难恢复电子邮件示例
      8. 关于恢复整个 NetBackup 目录库
        1.  
          使用 NetBackup 目录库恢复向导恢复整个 NetBackup 目录库
        2.  
          使用 bprecover -wizard 恢复整个 NetBackup 目录库
      9.  
        在目录库恢复之前建立与 NAT 介质服务器的连接
      10. 关于恢复 NetBackup 目录库映像文件
        1.  
          使用 NetBackup 目录库恢复向导恢复 NetBackup 目录库映像文件
        2.  
          使用 bprecover -wizard 恢复 NetBackup 目录库映像文件
      11. 关于恢复 NetBackup 数据库
        1.  
          从备份恢复 NetBackup 数据库
        2.  
          从暂存目录恢复 NetBackup 数据库
        3.  
          关于在暂存目录中处理 NetBackup 数据库
        4.  
          终止数据库连接
      12.  
        在配置 NetBackup Access Control 时恢复 NetBackup 目录库
      13.  
        从目录库备份的非主副本恢复 NetBackup 目录库
      14.  
        不使用灾难恢复文件恢复 NetBackup 目录库
      15.  
        从命令行恢复 NetBackup 用户控制的联机目录库备份
      16.  
        从 NetBackup 联机目录库备份还原文件
      17.  
        取消冻结 NetBackup 联机目录库恢复介质
      18.  
        在目录库恢复期间出现退出状态 5988 时要执行的步骤

关于按作业 ID 收集日志

NetBackup 包括命令行界面和 API 选项,用于通过指定作业 ID 收集相关日志,然后上传收集的日志。使用指定的作业 ID 时,会从主服务器、介质服务器和客户端(如果可以访问)收集作业运行时间范围内的日志。

旧有日志和 try 文件日志可能包括作业运行时间范围之外的日志,因为这些日志不支持持续时间过滤器。可以收集某个作业层次结构中涉及的所有主机上的日志,方法是通过指定具有该层次结构的作业 ID。Veritas 建议使用时间同步来收集作业持续时间内包含的所有主机上的日志。活动监视器中必须存在有效作业 ID。默认情况下,作业 ID 会在作业完成一周后删除。如果 bpdbjobs 或活动监视器无法检索指定作业 ID 的作业详细信息,则 nblogadm 实用程序无法收集作业 ID 的日志。此外,日志收集命令行界面和 API 选项不支持“立即备份”作业。不会从二线支持介质服务器或客户端收集 VxUL 日志。

收集的日志包括 NetBackup 产品和 NetBackup 支持实用程序 (nbsu) 日志。日志收集支持一次一个记录 ID,不会从多个记录 ID 并行收集日志。

要避免在日志收集期间填满主服务器、介质服务器和客户端上的文件系统,Veritas 建议使用 KEEP_LOGS_SIZE_GB 选项。Veritas 建议在收集日志之前指定保留的 NetBackup 日志大小。有关更多信息,请参见《NetBackup 管理指南,第 I 卷》。

NetBackup 10.2 中引入了基于时间的日志清理过程。收集日志 7 天后,如果未删除日志,此过程将删除收集的日志和日志记录。要在主服务器或介质服务器上将日志保留期限缩短至 5 天,请使用 bpsetconfigLOG_RECORD_EXPIRY_DAYS 设置为 5。要在客户端上将日志保留期限缩短至 5 天,请使用 nbsetconfigLOG_RECORD_EXPIRY_DAYS 设置为 5。较小的数字优先。如果在日志清理过程中遇到错误,NetBackup 可能不会从二线支持介质服务器或客户端删除日志。遇到这种情况时,Veritas 建议手动删除遗留的日志。

为避免收集的日志填满主服务器上的文件系统,会使用预定义的 10 GB 可用空间标记。当可用磁盘空间低于标记大小与所收集日志估计大小之和时,NetBackup 可使用此标记进行检查并防止启动日志收集。此外,当主服务器上的可用空间低于标记大小与所收集日志估计大小之和时,日志收集过程将停止。在此版本中,可用空间检查将扩展到介质服务器和客户端。要将可用空间标记减少至 5 GB,请使用 bpsetconfig 命令设置 HIGH_WATERMARK_TRB_LOG_RECORDS = 5

有两个选项可以收集更详细的日志。可以手动启用日志记录并配置所需的日志记录级别,如《NetBackup 日志记录参考指南》中所述。或者,也可以使用命令行界面和 API 选项,在主服务器、介质服务器或客户端上收集日志和配置日志记录级别值。然后,重新启动作业并启动日志收集任务。该功能包括一个 API 选项,用于在重新启动最初指定的作业后检索新作业的作业 ID。

收集更详细的日志需要两个日志记录 ID。第一个日志记录 ID(记录 ID 1),用于启用日志记录并为具有作业 ID(作业 ID 1)的主机配置所需的日志记录级别。配置日志记录级别并重新启动原始作业(作业 ID 1)后,将生成新的作业 ID(作业 ID 2)。第二个日志记录 ID(记录 ID 2),用于在新的重新启动作业(作业 ID 2)运行时间范围内从主服务器、介质服务器和客户端(如果可访问)收集日志。在包含多个介质服务器和客户端的备份域中,具有记录 ID 1 和记录 ID 2 的介质服务器或客户端可能由于不同的作业计划算法而不同。

在 NetBackup 10.2 及更高版本中,所示目录的 Progress.txt 文件中包含每个已收集日志的 SHA256 校验和。校验和无法在安装了 NetBackup 的二线支持介质服务器或客户端上进行计算。

Progress.txt 文件的位置:

  • Linux 和 UNIX

    /usr/openv/netbackup/logs/nblastaging/record ID-timestamp: YYYYMMDD-HHMMSS

  • Windows

    install_path\Veritas\NetBackup\logs\nblastaging\record ID-timestamp: YYYYMMDD-HHMMSS

NetBackup 10.2 及更高版本包括对主服务器上所需日志存储空间的空间使用增强功能。从主服务器、介质服务器和客户端收集的日志文件不再存储在主服务器上。这些文件驻留在每个主机的所示目录中。

  • Linux 和 UNIX

    /usr/openv/netbackup/logs/nblaevidence/nbla-hash

  • Windows

    install_path\Veritas\NetBackup\logs\nblaevidence\nbla-hash

支持的作业类型:

  • 备份

  • 从快照备份

  • 快照

支持的工作负载类型:

  • 文件系统

  • Hadoop(仅从主服务器和介质服务器收集日志)

  • Microsoft Exchange(仅从主服务器和介质服务器收集日志)

  • Windows Server 故障转移群集 (WSFC)

  • Microsoft SQL Server 可用性组

  • NDMP(仅从主服务器和介质服务器收集日志)

  • Oracle

  • Snapshot Manager(仅从主服务器和介质服务器收集日志)

  • VMware

如果在主服务器上设置 disableIPResolution 选项,则指定 VMware 工作负载类型的作业 ID 时,不会收集受保护虚拟机上的日志。有关设置的更多详细信息,请参见 https://www.veritas.com/content/support/en_US/doc/21902280-158271263-0/​v38310204-158271263

此版本支持从包含多个客户端的分布式工作负载收集日志。分布式工作负载示例包括 Oracle RAC 和 MSSQL 可用性组。

可以使用命令行界面和 API 选项以及有效的支持案例 ID 将收集的日志上传到 Veritas 技术支持组织。有关更多详细信息,请参见 https://www.veritas.com/support/en_US/article.100038665

为上传日志而提供给 API 的密码以凭据对象的形式存储在“NetBackup 凭据管理”窗格中。在上传日志后,会将其删除。

由收集的日志组成的单个 tar 文件将上传到 Veritas 技术支持组织的 SFTP 服务器或指定的 SFTP 服务器。如果 Veritas 技术支持组织不管理 SFTP 服务器,当 SFTP 服务器上存在同名 tar 文件时,上传操作将失败。

按作业 ID 收集日志时,使用 nblogadm 日志进行调试或故障排除。将 nblogadm 日志用于命令行界面和 API 选项。要从 nblogadm 进程收集日志,请确认显示的目录存在:

  • Linux 和 UNIX

    /usr/openv/netbackup/logs/nblogadm

  • Windows

    install_path\Veritas\NetBackup\logs\nblogadm

表:nblogadm 实用程序引入了新的命令行界面标志

命令行界面

描述

nblogadm --action getactivecollections --json

获取进行中的记录数。(不会一次收集多个记录 ID 的日志)

nblogadm --action createrecord --jobid job ID --json

获取作业 ID、创建空日志记录并返回创建的记录 ID。

nblogadm --action collectlogsforjob --recid record ID --runnbsu --json

创建任务以收集指定记录 ID 的日志。

nblogadm --action startupload --recid record ID --sftp_host sftp host --sftp_port sftp port --supportcase support case ID --target_folder sftp host folder --fingerprint sftp host fingerprint, use comma as delimiter without spaces --passcredentials --json

创建任务以上传指定记录 ID 的日志和 SFTP 服务器访问信息。

nblogadm --action deleterecord --recid record ID --json

删除收集的指定记录 ID 的日志和记录。此操作还会终止任何正在进行的任务。

nblogadm --action casedetail --recid record ID --json

获取指定记录 ID 的日志收集和日志上传任务详细信息。

nblogadm --action getlogging --recid record ID --json

对于指定的记录 ID,获取主机、其组件以及相应日志记录级别值的列表。

nblogadm --action getlogging --recid record ID [--hostandlog MASTER|MEDIA|CLIENT:hostname] --json

指定 --hostandlog 参数时,对于指定的记录 ID,此命令将返回指定主机的组件日志记录级别值。如果不指定 --hostandlog 参数,对于指定的记录 ID,该命令将返回一系列主机的组件日志记录级别值。

nblogadm --action setlogging --recid record ID --hostandlog MASTER|MEDIA|CLIENT:hostname@legacy component1=legacy component1 level,vxul component1=debug level%diagnostic level,misc type=misc type value --json

对于指定的记录 ID,更新指定主机的组件日志记录级别设置。需要单独调用才能更新每个主机。

指定的旧版和 vxul 组件名称必须为小写。