Veritas NetBackup™ Appliance 容量规划和性能调整指南

Last Published:
Product(s): Appliances (3.3.0.1)
Platform: NetBackup Appliance OS
  1. 关于本指南
    1.  
      关于本指南
    2.  
      关于目标读者
    3.  
      关于 NetBackup Appliance 文档
  2. 第 I 部分. 容量规划
    1. 分析备份要求
      1. 分析备份要求
        1.  
          您希望备份哪些内容?
        2.  
          您希望备份多少数据?
        3.  
          何时应执行备份?
        4.  
          保留期限是什么?
        5. 记录您的备份需求
          1.  
            用于记录计算机系统信息的模板
          2.  
            记录数据库信息的模板
          3.  
            记录应用程序服务器信息的模板
    2. 设计备份系统
      1.  
        处理企业备份系统的用例
      2.  
        远程办公室或分支机构的备份系统寻址用例
      3. 关于 NetBackup 设备
        1.  
          关于主服务器角色
        2.  
          关于介质服务器角色
      4.  
        关于 NetBackup 53xx 高可用性解决方案
      5. 选择新设备
        1.  
          选择介质服务器
        2.  
          选择主服务器
  3. 第 II 部分. 最佳做法
    1. 关于最佳做法部分
      1.  
        关于最佳做法
      2.  
        维护站点参考
    2. 关于实现重复数据删除解决方案
      1.  
        关于实现重复数据删除解决方案
      2.  
        一般建议
      3.  
        Oracle
      4.  
        Microsoft SQL
      5.  
        DB2
      6.  
        Sybase
      7.  
        Lotus Notes
    3. 网络注意事项
      1.  
        关于网络因素
      2.  
        关于光纤通道连接
      3. 关于 SAN 区域配置
        1.  
          关于为 NetBackup Appliance 对 SAN 进行区域划分
      4.  
        验证网络带宽
    4. 存储配置
      1.  
        关于存储配置
      2. 关于配置共享存储池
        1.  
          计算备份的基本流计数
      3. 关于移动存储分区以获得更好的性能
        1. 移动分区
          1.  
            “移动”对话框
        2.  
          使用 NetBackup Appliance 命令行操作界面移动分区
        3.  
          将 MSDP 分区从基本磁盘移动到扩展磁盘以获得最佳性能
    5. 常规最佳做法
      1.  
        常规最佳做法
      2.  
        关于“通知”设置
      3.  
        关于 IPMI 配置
      4.  
        灾难恢复最佳做法
      5.  
        作业性能
      6.  
        体系结构
      7.  
        NetBackup 目录库备份
      8.  
        通过 SLP(存储生命周期策略)进行修补
      9.  
        VMware 使用设备进行备份
      10.  
        提高 NetBackup Appliance 还原性能
  4. 第 III 部分. 性能优化
    1. 基于角色的性能监视
      1.  
        基于角色的配置作为影响性能的因素
      2.  
        哪些因素影响主服务器的性能?
      3.  
        哪些因素影响介质服务器 (MSDP) 的性能?
    2. 优化网络设置并提高性能
      1.  
        优化网络设置并提高性能
      2.  
        SAN 光纤通道设置
      3.  
        网络结合
      4.  
        VMware VADP
      5.  
        增加的 MTU 的极大帧实施
    3. 存储配置
      1.  
        存储配置
      2.  
        重复数据删除磁盘 I/O 和 RAID 级别设置
      3. RAID 控制器操作
        1.  
          RAID 控制器命令
      4.  
        重复数据删除负载平衡
      5.  
        存储生命周期策略
      6.  
        自动映像复制 (AIR)
      7.  
        AdvancedDisk 设置
      8.  
        磁带输出操作
    4. NetBackup Appliance 调整过程和性能监视
      1. 关于诊断性能问题
        1.  
          关于 CPU 监视和调整
        2.  
          关于内存监视和调整
        3.  
          关于网络监视和调整
        4.  
          关于 I/O 监视和调整
        5.  
          发现资源瓶颈的通用准则
      2. 关于性能调整实践
        1.  
          关于 I/O 性能调整
        2.  
          关于 Oracle 备份和还原性能调整
        3.  
          将 NetBackup 客户端上的 NET_BUFFER_SZ 设置为 0 以提升 WAN 优化性能
      3. 关于优化过程和性能监视
        1. NetBackup 客户端性能
          1.  
            使用 nbperfchk 验证 NetBackup Appliance 上的磁盘性能
        2.  
          其他性能监视命令
  5. 第 IV 部分. 容量规划和性能调整的快速参考
    1. 容量规划检查清单
      1.  
        容量规划检查清单
      2.  
        容量测量工作表
    2. 最佳做法检查清单
      1.  
        最佳做法检查清单
    3. 如何监视设备的性能
      1.  
        关于监视设备性能
      2.  
        性能监视矩阵
  6.  
    索引

关于 CPU 监视和调整

表:vmstat 输出示例(使用 vmstat 5 收集) 显示了 98% 重复数据删除备份作业的 120 个流在 53xx 设备上运行时 vmstat 命令的输出示例。

表:vmstat 输出示例(使用 vmstat 5 收集)

r

b

swpd

Free

Buff

缓存

si

so

us

sy

id

wa

89

0

1006344

348907856

37632

11694512

0

0

62

30

8

0

84

0

1006316

348450264

37640

12016276

11

0

62

30

8

0

63

0

1006316

348104004

37664

12260816

0

0

63

30

7

0

76

0

1006288

347857280

37664

12491148

5

0

61

29

9

0

46

0

1006288

347538340

37684

12756108

0

0

61

30

8

0

72

0

1006260

347111556

37692

13083760

3

0

62

30

8

0

72

0

1006252

346786820

37692

13332416

6

0

62

30

8

0

61

0

1006164

346485836

37712

13612680

28

0

59

29

13

0

92

0

1006156

346136540

37720

13902248

0

0

60

30

10

0

106

0

1006132

345721588

37724

14190992

6

0

61

31

9

0

82

0

1006128

345355448

37732

14465996

0

0

61

30

9

0

113

0

1005972

345072276

37740

14760008

30

0

61

30

10

0

66

0

1005964

344747824

37740

15004520

1

0

61

30

9

0

98

0

1005924

344446500

37748

15282376

8

0

60

30

10

0

118

0

1005920

344035148

37760

15582400

0

0

61

30

9

0

96

0

1005900

343802084

37764

15882380

4

0

62

30

9

0

60

0

1005900

343406276

37784

16175128

0

0

58

29

13

0

61

0

1005872

343038168

37792

16470724

3

0

62

30

7

0

60

0

1005868

342653976

37792

16747684

1

0

61

30

9

0

116

0

1005836

342343076

37800

17001952

5

0

62

30

8

0

注意:

为简化显示内容已从输出中删除某些列。

根据上表我们可以得出结论,系统受 CPU 约束,因为 id 列(显示 CPU 空闲百分比)几乎为个位数。这表示 53xx CPU 利用率持续超过 90%。系统受 CPU 约束的另一个指示未第一列 rr 列的值在 46 和 118 之间波动。r 代表“CPU 准备运行队列”。这是当前正在运行或准备运行但在等待空闲 CPU 的进程的计数。53xx 具有 40 个逻辑 CPU 线程,最多可同时处理 40 个并行进程。将列 r 中的值减去 40 即可得到准备运行但仍在等待 CPU 周期的进程的数目。

根据上述 CPU 统计数据,以及这是在系统运行 120 个并行 98% 备份流时发生的事实,您可以采取两种可能的操作来降低 CPU 消耗:

  • 降低作业的批处理大小。如果 CPU 过于繁忙,作业可能花费过多时间来等待可用 CPU 周期。减少每一批的并行作业数能够提高整体系能。

  • 添加另一台 53xx 作为指纹服务器可将 CPU 容量提升两倍,也是一个很自然的解决方案。

一个快速内部实验表明,增加一台指纹服务器后,设备性能提升近 40% 达 10GB/秒,并且 CPU 利用率减少近 50%。此时,网络成为瓶颈,因为 53xx 能够支持高达 10 x 10 Gbps 的 NIC,最高提供大约 10 GB/秒的网络吞吐量。可以看出,如果系统上安装更多 10 x 10 Gbps 的 NIC,系统性能将得到更大提升。