Veritas Access 故障排除指南

Last Published:
Product(s): Access (7.4)
Platform: Linux
  1. 简介
    1.  
      关于故障排除
    2.  
      故障排除过程的通用技巧
    3.  
      故障排除过程的一般方法
    4.  
      关于 support 用户帐户
    5.  
      配置 support 用户帐户
    6.  
      使用 support 帐户登录
  2. 常规故障排除过程
    1.  
      关于常规故障排除过程
    2.  
      查看 Veritas Access 日志文件
    3.  
      关于事件日志
    4.  
      关于 shell 活动日志
    5.  
      设置 CIFS 日志级别
    6.  
      设置 NetBackup 客户端日志级别和调试选项
    7.  
      检索并发送调试信息
    8.  
      两个连续 OpenStack 命令之间的延迟不足可能会导致失败
  3. 监视 Veritas Access
    1.  
      关于监视 Veritas Access 操作
    2.  
      监视处理器活动
    3.  
      生成 CPU 和设备利用率报告
    4.  
      监视网络通信
    5.  
      导出和显示网络通信详细信息
  4. 常见恢复过程
    1.  
      关于常见的恢复过程
    2.  
      重新启动服务器
    3. 使服务联机
      1.  
        使用 services 命令
    4.  
      从非正常关闭中恢复
    5.  
      测试网络连接
    6.  
      使用 traceroute 进行故障排除
    7.  
      使用 traceroute 命令
    8.  
      收集文件系统的元数据保存映像
    9.  
      更换以太网接口卡(联机模式)
    10.  
      更换以太网接口卡(脱机模式)
    11.  
      更换 Veritas Access 节点
    12.  
      更换磁盘
    13. 加速复制
      1.  
        关于同步复制作业
      2.  
        同步间歇性复制作业
    14.  
      卸载修补程序版本或软件升级
  5. 对“将 Veritas Access 云作为层”功能进行故障排除
    1.  
      云分层的故障排除技巧
    2.  
      在云层读取或写入数据时出现问题
    3.  
      用于检查云分层错误的日志位置
  6. 对 Veritas Access 安装和配置问题进行故障排除
    1.  
      如何查找管理控制台 IP
    2.  
      查看安装日志
    3.  
      安装失败且未完成
    4.  
      从群集中排除 PCI ID
    5.  
      无法从 root 文件系统损坏中恢复
    6.  
      storage disk list 命令不返回任何结果
  7. 对 LTR 升级进行故障排除
    1.  
      查找日志文件以对 LTR 升级进行故障排除
    2.  
      对 LTR 的升级前问题进行故障排除
    3.  
      对 LTR 的升级后问题进行故障排除
  8. 对 Veritas Access CIFS 问题进行故障排除
    1.  
      拒绝用户访问 CTDB 目录共享
  9. 对 Veritas Access GUI 启动问题进行故障排除
    1.  
      解决 GUI 启动问题

故障排除过程的一般方法

在通过某些常规故障排除技巧缩小问题范围后,可借助以下方法进一步确定问题所在:

  • 交换相同部件。

    在具有相同或并行部件和子系统的系统中,一个很好的方法是在这些子系统之间交换组件,看问题是否与交换的组件一起发生转移。例如,如果群集中的某个节点上出现 Veritas Access 网络连接问题,可交换以太网接口卡以确定问题是否会转移到新的节点。

  • 移除并行组件。

    如果系统包含多个在移除后不会影响整个系统的并行或冗余组件,请先移除这些组件(每次一个),看系统是否开始正常运行。例如,在群集中逐个关闭节点,以查看问题是否仍然存在。

  • 将系统分为几个部分。

    在具有多个部分或阶段的系统中,仔细测量每个阶段输入和输出的变量,直到找到出现问题的阶段。例如,如果运行复制作业时出现问题,请检查作业以前是否已成功运行,并尝试确定作业开始失败时的具体时间点。

  • 监视一段时间内(或位置范围内)的系统行为。

    使用 Support> services show all 命令显示服务及其当前状态的列表。

    设置进程(如 Support> traceroute 命令或一系列 Support> iostat 命令),以监视一段时间内的系统活动,或监视整个网络上的系统活动。这种监视方法尤其有助于跟踪间歇性问题、处理器活动问题、节点连接问题等。