NetBackup™ 故障排除指南

Last Published:
Product(s): NetBackup (10.3)
  1. 介绍
    1.  
      NetBackup 日志记录和状态码信息
    2.  
      对问题进行故障排除
    3.  
      用于技术支持的问题报告
    4.  
      关于收集有关 NetBackup-Java 应用程序的信息
  2. 故障排除过程
    1.  
      关于故障排除过程
    2. 对 NetBackup 问题进行故障排除
      1.  
        在 UNIX 或 Linux 服务器上验证所有进程是否正在运行
      2.  
        在 Windows 服务器上验证是否所有进程正在运行
    3.  
      对安装问题进行故障排除
    4.  
      对配置问题进行故障排除
    5.  
      设备配置问题解决方法
    6.  
      测试主服务器和客户端
    7.  
      测试介质服务器和客户端
    8.  
      解决与 UNIX 客户端相关的网络通信问题
    9.  
      解决与 Windows 客户端相关的网络通信问题
    10. vnetd 代理连接故障排除
      1.  
        vnetd 代理连接要求
      2.  
        从何着手对 vnetd 代理连接进行故障排除
      3.  
        验证 vnetd 进程及其代理是否处于活动状态
      4.  
        验证主机连接是否已设置代理
      5.  
        测试 vnetd 代理连接
      6.  
        检查连接和接受进程的日志文件
      7.  
        查看 vnetd 代理日志文件
    11. 安全证书吊销故障排除
      1.  
        对云提供商的已吊销 SSL 证书问题进行故障排除
      2.  
        对云提供商的 CRL 下载问题进行故障排除
      3.  
        主机的 CRL 如何影响证书吊销故障排除
      4.  
        NetBackup 作业因证书已被吊销或 CRL 不可用而失败
      5.  
        NetBackup 作业由于明显的网络错误而失败
      6.  
        NetBackup 作业由于资源不可用而失败
      7.  
        主服务器安全证书已吊销
      8.  
        确定 NetBackup 主机的证书状态
      9.  
        外部 CA 签名证书吊销问题故障排除
    12.  
      关于网络和主机名故障排除
    13. 验证 NetBackup 中的主机名和服务条目
      1.  
        UNIX 主服务器和客户端上主机名和服务条目的示例
      2.  
        UNIX 主服务器和介质服务器上主机名和服务条目的示例
      3.  
        UNIX PC 客户端上主机名和服务条目的示例
      4.  
        连接到多个网络的 UNIX 服务器上主机名和服务条目的示例
    14.  
      关于 bpclntcmd 实用程序
    15.  
      使用主机属性访问配置设置
    16.  
      解决磁盘已满的问题
    17. 冻结的介质故障排除注意事项
      1.  
        对冻结的介质进行故障排除时可参考的日志
      2.  
        关于导致介质冻结的情况
    18. 对 NetBackup Web 服务问题进行故障排除
      1.  
        查看 NetBackup Web 服务日志
      2.  
        配置外部 CA 后的 Web 服务问题故障排除
    19.  
      对 NetBackup Web 服务器证书问题进行故障排除
    20. 解决 PBX 问题
      1.  
        检查 PBX 安装
      2.  
        检查 PBX 是否正在运行
      3.  
        检查 PBX 是否已正确设置
      4.  
        访问 PBX 日志
      5.  
        对 PBX 安全性进行故障排除
      6.  
        确定 PBX 后台驻留程序或服务是否可用
    21. 远程主机验证问题故障排除
      1.  
        查看与主机验证相关的日志
      2.  
        启用与 NetBackup 8.0 和更低版本主机的不安全通信
      3.  
        批准待定的主机 ID-主机名映射
      4.  
        清除主机缓存
    22. 自动映像复制故障排除
      1.  
        与自动映像同步复制和 SLP 一起使用的主服务器的规则
      2. 使用外部证书配置时,目标 A.I.R. 可信主服务器操作失败
        1.  
          添加或更新信任关系
        2.  
          删除信任关系
      3.  
        关于对 SLP 组件管理的自动导入作业进行故障排除
    23.  
      对网络接口卡性能进行故障排除
    24.  
      关于 bp.conf 文件中的 SERVER 条目
    25.  
      关于存储单元不可用的问题
    26.  
      解决 Windows 上的 NetBackup 管理操作失败
    27.  
      在 UNIX 计算机上解析 NetBackup 管理控制台中显示的乱码文本
    28.  
      对 NetBackup 管理控制台中的错误消息进行故障排除
    29.  
      “NetBackup 管理控制台”需要有额外的磁盘空间来存储日志和临时文件
    30.  
      在配置外部 CA 后,无法登录 NetBackup 管理控制台
    31.  
      基于文件的外部证书问题故障排除
    32.  
      Windows 证书存储库问题故障排除
    33.  
      备份失败故障排除
    34.  
      对 NAT 客户端或 NAT 服务器的备份失败问题进行故障排除
    35.  
      对 NetBackup Messaging Broker(或 nbmqbroker)服务问题进行故障排除
    36.  
      Windows 系统的电子邮件通知出现问题
    37.  
      KMS 配置问题
    38.  
      由于密钥较大而导致启动 NetBackup CA 迁移时出现的问题
    39.  
      非特权用户(服务用户)帐户的相关问题
    40.  
      auth.conf 文件中的组名称格式问题
    41.  
      VxUpdate 软件包添加过程故障排除
    42.  
      FIPS 模式的问题
    43.  
      恶意软件扫描问题
    44.  
      启用传输中数据加密的 NetBackup 作业问题
    45.  
      非结构化数据即时访问问题
    46.  
      对多重身份验证问题进行故障排除
    47.  
      对多人授权问题进行故障排除
  3. 使用 NetBackup 实用程序
    1.  
      关于 NetBackup 故障排除实用程序
    2.  
      关于 NetBackup 调试日志分析实用程序
    3.  
      关于日志记录助理
    4.  
      关于网络故障排除实用程序
    5. 关于 NetBackup 支持实用程序 (nbsu)
      1.  
        NetBackup 支持实用程序 (nbsu) 的输出
      2.  
        NetBackup 支持实用程序 (nbsu) 的进度显示示例
    6. 关于 NetBackup 一致性检查实用程序 (NBCC)
      1.  
        NetBackup 一致性检查实用程序 (NBCC) 的输出
      2.  
        NBCC 进度显示的示例
    7.  
      关于 NetBackup 一致性检查修复 (NBCC) 实用程序
    8.  
      关于 nbcplogs 实用程序
    9. 关于机械手测试实用程序
      1.  
        在 UNIX 环境下进行机械手测试
      2.  
        在 Windows 环境下进行机械手测试
    10. 关于 NetBackup 智能诊断 (nbsmartdiag) 实用程序
      1.  
        使用 nbsmartdiag 实用程序进行 NetBackup 主机通信的工作流程
    11.  
      关于按作业 ID 收集日志
  4. 灾难恢复
    1.  
      关于灾难恢复
    2.  
      关于灾难恢复要求
    3.  
      灾难恢复软件包
    4.  
      关于灾难恢复设置
    5.  
      推荐的备份方法
    6. 关于适用于 UNIX 和 Linux 的磁盘恢复过程
      1. 关于恢复 UNIX 和 Linux 的主服务器磁盘
        1.  
          在根文件系统完好无损的情况下恢复主服务器
        2.  
          在根分区丢失的情况下恢复主服务器
      2.  
        关于恢复 UNIX 的 NetBackup 介质服务器磁盘
      3.  
        在 UNIX 客户端工作站上恢复系统磁盘
    7. 关于 UNIX 和 Linux 上的群集 NetBackup 服务器恢复
      1.  
        替换 UNIX 或 Linux 群集上的故障节点
      2.  
        恢复整个 UNIX 或 Linux 群集
    8. 关于适用于 Windows 的磁盘恢复过程
      1. 关于恢复 Windows 的主服务器磁盘
        1.  
          在 Windows 完好无损的情况下恢复主服务器
        2.  
          恢复主服务器和 Windows
      2.  
        关于恢复 Windows 的 NetBackup 介质服务器磁盘
      3.  
        恢复 Windows 客户端磁盘
    9. 关于 Windows 上的群集 NetBackup 服务器恢复
      1.  
        替换 Windows VCS 群集上的故障节点
      2.  
        恢复 Windows VCS 群集上的共享磁盘
      3.  
        恢复整个 Windows VCS 群集
    10.  
      灾难恢复安装后在群集主服务器上生成证书
    11.  
      关于还原灾难恢复软件包
    12.  
      关于 DR_PKG_MARKER_FILE 环境变量
    13.  
      在 Windows 上还原灾难恢复软件包
    14.  
      在 UNIX 上还原灾难恢复软件包
    15. 关于恢复 NetBackup 目录库
      1.  
        关于目录库备份过程
      2.  
        恢复 NetBackup 目录库或 NetBackup 目录库映像文件的前提条件
      3.  
        关于在 Windows 计算机上执行 NetBackup 目录库恢复
      4.  
        关于从磁盘设备执行 NetBackup 目录库恢复
      5.  
        关于 NetBackup 目录库恢复和符号链接
      6. 关于 NetBackup 目录库恢复
        1.  
          在目录库恢复之后指定 NetBackup 作业 ID 编号
      7.  
        NetBackup 灾难恢复电子邮件示例
      8. 关于恢复整个 NetBackup 目录库
        1.  
          使用 NetBackup 目录库恢复向导恢复整个 NetBackup 目录库
        2.  
          使用 bprecover -wizard 恢复整个 NetBackup 目录库
      9.  
        在目录库恢复之前建立与 NAT 介质服务器的连接
      10. 关于恢复 NetBackup 目录库映像文件
        1.  
          使用 NetBackup 目录库恢复向导恢复 NetBackup 目录库映像文件
        2.  
          使用 bprecover -wizard 恢复 NetBackup 目录库映像文件
      11. 关于恢复 NetBackup 数据库
        1.  
          从备份恢复 NetBackup 数据库
        2.  
          从暂存目录恢复 NetBackup 数据库
        3.  
          关于在暂存目录中处理 NetBackup 数据库
        4.  
          终止数据库连接
      12.  
        在配置 NetBackup Access Control 时恢复 NetBackup 目录库
      13.  
        从目录库备份的非主副本恢复 NetBackup 目录库
      14.  
        不使用灾难恢复文件恢复 NetBackup 目录库
      15.  
        从命令行恢复 NetBackup 用户控制的联机目录库备份
      16.  
        从 NetBackup 联机目录库备份还原文件
      17.  
        取消冻结 NetBackup 联机目录库恢复介质
      18.  
        在目录库恢复期间出现退出状态 5988 时要执行的步骤

关于网络和主机名故障排除

在具有多个网络且客户端包含多个主机名的配置中,NetBackup 管理员在配置策略项时必须谨慎。管理员必须考虑网络配置(物理地址、主机名和别名、名称服务(如 NIS 或 DNS)、路由表等)。如果管理员希望在特定的网络路径之间传递备份和还原数据,则尤其需要考虑这些内容。

进行备份时,NetBackup 连接到策略中配置的主机。操作系统的网络代码会解析此名称,并通过系统路由表定义的网络路径发送该连接。在做此决定的过程中,并不考虑 bp.conf 文件。

当从客户端执行还原时,客户端连接到主服务器上。例如,在 UNIX 计算机上,主服务器是 /usr/openv/netbackup/bp.conf 文件中指定的第一台服务器。在 Windows 计算机上,主服务器是在“指定 NetBackup 计算机和策略类型”对话框的“用于备份和还原的服务器”下拉菜单中指定的。若要打开此对话框,请启动“NetBackup 备份、存档和还原”界面,然后单击“文件”菜单上的“指定 NetBackup 计算机和策略类型”。用于将服务器名称映射为 IP 地址的客户端网络代码决定了服务器的网络路径。

接收到连接后,目标主机确定连接主机的对等主机名。如果目标主机是主服务器,还会根据对等主机名确定客户端的配置名称。

对等名称源自该连接的 IP 地址。这意味着该地址必须转换为主机名(使用 getnameinfo() 网络例程)。当按照下行所示建立连接时,在 bpcdbprd 调试日志中可看到该名称:

bpcd: Connection from host peername ipaddress ...
bprd: Connection from host peername ipaddress ...

在客户端上,连接服务器的对等主机名必须与本地 NetBackup 配置中的服务器或介质服务器条目匹配:字符串匹配或与每个服务器条目的 getaddrinfo() 信息进行比较。

在主服务器上,比较更加复杂。

然后,通过查询 UNIX/Linux 主机上的 bpdbm 进程或 Windows 主机上的 NetBackup 数据库管理器服务,根据对等名称得出客户端的配置名称。

bpdbm 进程会将对等名称与从以下客户端生成的客户端名称列表进行比较:

  • 为其运行备份的所有客户端

  • 所有策略中的所有客户端

首先进行的是字符串的比较。通过将对等名称与客户端名称的列表进行对比来验证比较。

如果这些比较都没有成功,则使用更具强制性的方法,即针对列表中的每个客户端名称,将所有名称与使用 getaddrinfo() 找到的别名进行比较。

配置名称是第一个成功的比较。

如果比较失败,在大多数情况下,bprd 会将请求方客户端(如下所示)替换为对等名称,因为请求中的主机名不在网络和 NetBackup 配置等的管理控制之下。

比较失败的示例:

客户端具有新的网络接口,并更改了第一个服务器条目以利用新网络。主服务器上的名称服务会将客户端的新源 IP 解析为对等名称,该名称不是任何策略中任何客户端的网络别名。

如果设置了 VERBOSE,则会将这些比较记录在 bpdbm 调试日志中。通过在客户端上使用 bpclntcmd 命令,可以确定客户端的配置名称。例如:

# /usr/openv/netbackup/bin/bpclntcmd -pn (UNIX)

# install_path\NetBackup\bin\bpclntcmd -pn (Windows)

expecting response from server wind.abc.me.com 
danr.abc.me.com danr 194.133.172.3 4823

其中,第一个输出行标识请求所指向的服务器。第二个输出行表示服务器按以下顺序作出的响应:

  • 到服务器的连接的对等名称

  • 客户端的配置名称

  • 到服务器的连接的 IP 地址

  • 与服务器连接的源 IP 地址

当客户端连接到服务器时,它向服务器发送以下三个名称:

  • 浏览客户端

  • 请求方客户端

  • 目标客户端

浏览客户端名称用于标识要列出或从其还原的客户端文件。客户端上的用户可以修改此名称以便从另一台客户端上还原文件。例如,在 Windows 客户端上,用户可以通过“备份、存档和还原”界面来更改客户端名称。(有关说明,请参见 NetBackup 联机帮助)。但是,要使更改生效,管理员也必须在服务器上做出相应的更改。

请参见 NetBackup 管理指南,第 I 卷

请求方客户端是客户端上 CLIENT_NAME 或 gethostname() 函数的值。

仅当管理员将还原从服务器推送到客户端时,才会考虑目标客户端名称。对于用户还原,目标客户端和请求方客户端是一样的。对于管理员还原,管理员可以为目标客户端指定另一个名称。

等到这些名称出现在 bprd 调试日志中时,请求方客户端的名称已转换为客户端的配置名称。

用于重新连接到客户端以完成还原的名称可以是客户端的对等名称,也可以是其配置名称。还原请求的类型(例如,从服务器上的根目录还原、从客户端还原、还原到另一台客户端等)会对此操作产生影响。

当在 NetBackup 策略中修改客户端名称以适应特定的网络路径时,管理员需要考虑以下方面:

  • 在客户端上配置的客户端名称。例如,在 UNIX 上,客户端名称为该客户端的 bp.conf 文件中的 CLIENT_NAME。在 Windows 客户端上,该名称位于“NetBackup 客户端属性”对话框的“常规”选项卡上。若要打开此对话框,请在“备份、存档和还原”界面中的“文件”菜单上选择“NetBackup 客户端属性”

  • 当前在策略配置中指定的客户端。

  • 记录在主服务器的 images 目录中的现有客户端备份和存档映像。在 UNIX 服务器上,images 目录为 /usr/openv/netbackup/db/images。在 Windows NetBackup 服务器上,images 目录为 install_path\NetBackup\db\images

如果发生以下情况,可能需要管理员手动修改其中的某个客户端名称:客户端与服务器之间有多个网络连接,并且由于与连接相关的问题,来自客户端的列出或还原请求失败。

traceroute (UNIX) 和 tracert (Windows) 程序通常可以提供有关网络配置的重要信息。

如果使用了域名服务 (DNS) 并且符合下列条件,则主服务器可能无法响应客户端请求:客户端通过其 gethostname() 库获得的名称无法被主服务器的 DNS 所识别。客户端和服务器配置可以确定是否存在这种情况。客户端上的 gethostname() 函数返回的未限定主机名可能无法由主服务器上的 DNS 解析。

尽管可以重新配置名称服务(包括 hosts 文件),但该解决方案并非始终可行。为此,NetBackup 在主服务器上提供了一个特殊的文件。文件如下所示:

/usr/openv/netbackup/db/altnames/host.xlate (UNIX)

install_path\NetBackup\db\altnames\host.xlate (Windows)

您可以创建并编辑此文件以强制进行所需的 NetBackup 客户端主机名转换。

host.xlate 文件中的每一行都包含三个元素:一个数字键和两个主机名。每一行都左对齐且行中的每个元素都由一个空格字符隔开。

    key peername client_as_known_by_server
  

下面对上文的变量进行了描述:

  • key 是一个数值,NetBackup 用它来指定在哪些情况下需要进行转换。目前该值必须始终为 0,这表示配置名转换。

  • peername 是要转换的值。主服务器上的 getnameinfo() 将发起客户端连接的源 IP 地址解析为该值。

  • client_as_known_by_server 是在客户端响应请求时用于替换 peername 的名称。该名称必须是在主服务器上的 NetBackup 配置中配置的名称,通常是策略中的客户端。它还应被主服务器使用的名称服务所识别,并且必须被执行备份的介质服务器的网络服务所识别。

下面是一个示例:

0 danr danr.eng.aaa.com

当主服务器收到对所配置的客户端名称的请求时(数字键 0),该名称将始终替换对等名称。