Veritas NetBackup™ Appliance 容量规划和性能调整指南
关于 CPU 监视和调整
表:vmstat 输出示例(使用 vmstat 5 收集) 显示了 98% 重复数据删除备份作业的 120 个流在 53xx 设备上运行时 vmstat 命令的输出示例。
表:vmstat 输出示例(使用 vmstat 5 收集)
r |
b |
swpd |
Free |
Buff |
缓存 |
si |
so |
us |
sy |
id |
wa |
---|---|---|---|---|---|---|---|---|---|---|---|
89 |
0 |
1006344 |
348907856 |
37632 |
11694512 |
0 |
0 |
62 |
30 |
8 |
0 |
84 |
0 |
1006316 |
348450264 |
37640 |
12016276 |
11 |
0 |
62 |
30 |
8 |
0 |
63 |
0 |
1006316 |
348104004 |
37664 |
12260816 |
0 |
0 |
63 |
30 |
7 |
0 |
76 |
0 |
1006288 |
347857280 |
37664 |
12491148 |
5 |
0 |
61 |
29 |
9 |
0 |
46 |
0 |
1006288 |
347538340 |
37684 |
12756108 |
0 |
0 |
61 |
30 |
8 |
0 |
72 |
0 |
1006260 |
347111556 |
37692 |
13083760 |
3 |
0 |
62 |
30 |
8 |
0 |
72 |
0 |
1006252 |
346786820 |
37692 |
13332416 |
6 |
0 |
62 |
30 |
8 |
0 |
61 |
0 |
1006164 |
346485836 |
37712 |
13612680 |
28 |
0 |
59 |
29 |
13 |
0 |
92 |
0 |
1006156 |
346136540 |
37720 |
13902248 |
0 |
0 |
60 |
30 |
10 |
0 |
106 |
0 |
1006132 |
345721588 |
37724 |
14190992 |
6 |
0 |
61 |
31 |
9 |
0 |
82 |
0 |
1006128 |
345355448 |
37732 |
14465996 |
0 |
0 |
61 |
30 |
9 |
0 |
113 |
0 |
1005972 |
345072276 |
37740 |
14760008 |
30 |
0 |
61 |
30 |
10 |
0 |
66 |
0 |
1005964 |
344747824 |
37740 |
15004520 |
1 |
0 |
61 |
30 |
9 |
0 |
98 |
0 |
1005924 |
344446500 |
37748 |
15282376 |
8 |
0 |
60 |
30 |
10 |
0 |
118 |
0 |
1005920 |
344035148 |
37760 |
15582400 |
0 |
0 |
61 |
30 |
9 |
0 |
96 |
0 |
1005900 |
343802084 |
37764 |
15882380 |
4 |
0 |
62 |
30 |
9 |
0 |
60 |
0 |
1005900 |
343406276 |
37784 |
16175128 |
0 |
0 |
58 |
29 |
13 |
0 |
61 |
0 |
1005872 |
343038168 |
37792 |
16470724 |
3 |
0 |
62 |
30 |
7 |
0 |
60 |
0 |
1005868 |
342653976 |
37792 |
16747684 |
1 |
0 |
61 |
30 |
9 |
0 |
116 |
0 |
1005836 |
342343076 |
37800 |
17001952 |
5 |
0 |
62 |
30 |
8 |
0 |
注意:
为简化显示内容已从输出中删除某些列。
根据上表我们可以得出结论,系统受 CPU 约束,因为 r。r 列的值在 46 和 118 之间波动。r 代表“CPU 准备运行队列”。这是当前正在运行或准备运行但在等待空闲 CPU 的进程的计数。53xx 具有 40 个逻辑 CPU 线程,最多可同时处理 40 个并行进程。将列 r 中的值减去 40 即可得到准备运行但仍在等待 CPU 周期的进程的数目。
列(显示 CPU 空闲百分比)几乎为个位数。这表示 53xx CPU 利用率持续超过 90%。系统受 CPU 约束的另一个指示未第一列根据上述 CPU 统计数据,以及这是在系统运行 120 个并行 98% 备份流时发生的事实,您可以采取两种可能的操作来降低 CPU 消耗:
降低作业的批处理大小。如果 CPU 过于繁忙,作业可能花费过多时间来等待可用 CPU 周期。减少每一批的并行作业数能够提高整体系能。
添加另一台 53xx 作为指纹服务器可将 CPU 容量提升两倍,也是一个很自然的解决方案。
一个快速内部实验表明,增加一台指纹服务器后,设备性能提升近 40% 达 10GB/秒,并且 CPU 利用率减少近 50%。此时,网络成为瓶颈,因为 53xx 能够支持高达 10 x 10 Gbps 的 NIC,最高提供大约 10 GB/秒的网络吞吐量。可以看出,如果系统上安装更多 10 x 10 Gbps 的 NIC,系统性能将得到更大提升。