Veritas Access 故障排除指南

Last Published:
Product(s): Access (7.4)
Platform: Linux
  1. 简介
    1.  
      关于故障排除
    2.  
      故障排除过程的通用技巧
    3.  
      故障排除过程的一般方法
    4.  
      关于 support 用户帐户
    5.  
      配置 support 用户帐户
    6.  
      使用 support 帐户登录
  2. 常规故障排除过程
    1.  
      关于常规故障排除过程
    2.  
      查看 Veritas Access 日志文件
    3.  
      关于事件日志
    4.  
      关于 shell 活动日志
    5.  
      设置 CIFS 日志级别
    6.  
      设置 NetBackup 客户端日志级别和调试选项
    7.  
      检索并发送调试信息
    8.  
      两个连续 OpenStack 命令之间的延迟不足可能会导致失败
  3. 监视 Veritas Access
    1.  
      关于监视 Veritas Access 操作
    2.  
      监视处理器活动
    3.  
      生成 CPU 和设备利用率报告
    4.  
      监视网络通信
    5.  
      导出和显示网络通信详细信息
  4. 常见恢复过程
    1.  
      关于常见的恢复过程
    2.  
      重新启动服务器
    3. 使服务联机
      1.  
        使用 services 命令
    4.  
      从非正常关闭中恢复
    5.  
      测试网络连接
    6.  
      使用 traceroute 进行故障排除
    7.  
      使用 traceroute 命令
    8.  
      收集文件系统的元数据保存映像
    9.  
      更换以太网接口卡(联机模式)
    10.  
      更换以太网接口卡(脱机模式)
    11.  
      更换 Veritas Access 节点
    12.  
      更换磁盘
    13. 加速复制
      1.  
        关于同步复制作业
      2.  
        同步间歇性复制作业
    14.  
      卸载修补程序版本或软件升级
  5. 对“将 Veritas Access 云作为层”功能进行故障排除
    1.  
      云分层的故障排除技巧
    2.  
      在云层读取或写入数据时出现问题
    3.  
      用于检查云分层错误的日志位置
  6. 对 Veritas Access 安装和配置问题进行故障排除
    1.  
      如何查找管理控制台 IP
    2.  
      查看安装日志
    3.  
      安装失败且未完成
    4.  
      从群集中排除 PCI ID
    5.  
      无法从 root 文件系统损坏中恢复
    6.  
      storage disk list 命令不返回任何结果
  7. 对 LTR 升级进行故障排除
    1.  
      查找日志文件以对 LTR 升级进行故障排除
    2.  
      对 LTR 的升级前问题进行故障排除
    3.  
      对 LTR 的升级后问题进行故障排除
  8. 对 Veritas Access CIFS 问题进行故障排除
    1.  
      拒绝用户访问 CTDB 目录共享
  9. 对 Veritas Access GUI 启动问题进行故障排除
    1.  
      解决 GUI 启动问题

从非正常关闭中恢复

在某些情况下,当节点非正常关闭时(例如,在意外出现系统停止或电源故障期间),可能会在本地节点上收到一条错误消息,要求您使用 Linux fsck(文件系统检查)命令修复节点上的文件。

不建议(且可能无法)使用 fsck 命令尝试修复节点,而是应该使用群集中正常运行的节点在损坏的节点上重新安装 Veritas Access 软件。

恢复节点

  1. 使用 master 帐户登录 Veritas Access。
  2. 从群集中删除故障节点。要删除节点,请输入以下内容:
                Cluster> del nodename
              

    其中 nodename 是故障节点的名称。

    例如:

                Cluster > del access_01
              

    注意:

    系统将从群集中删除故障节点的信息。当故障节点重新引导时,它将检测到自身已被删除,并将进行自我清理。

  3. 从群集中删除节点后,重新引导已删除的节点,随后即可使用在将该节点添加到群集之前的原始物理 IP 地址访问该节点。
  4. 通过输入以下内容重新添加节点:
                Cluster> add nodeip
              

    其中 nodeip 是已删除节点的可访问 IP 地址。

    例如:

                Cluster > add 172.16.113.118