NetBackup™ 重复数据删除指南
- NetBackup 介质服务器重复数据删除选件简介
- 快速入门
- 规划部署
- 规划 MSDP 部署
- NetBackup 命名约定
- 关于 MSDP 重复数据删除节点
- 关于 NetBackup 重复数据删除目标
- 关于 MSDP 存储容量
- 关于 MSDP 存储和连接要求
- 关于 NetBackup 介质服务器重复数据删除
- 关于 NetBackup Client Direct 重复数据删除
- 关于 MSDP 远程办公客户端重复数据删除
- 关于 NetBackup 重复数据删除引擎凭据
- 关于 MSDP 的网络接口
- 关于 MSDP 端口用法
- 关于 MSDP 优化合成备份
- 关于 MSDP 和 SAN 客户端
- 关于 MSDP 优化复制和主从复制
- 关于 MSDP 性能
- 关于 MSDP 流处理程序
- MSDP 部署最佳做法
- 置备存储
- 重复数据删除的授权
- 配置重复数据删除
- 配置 MSDP 服务器端重复数据删除
- 配置 MSDP 客户端重复数据删除
- 关于 MSDP 重复数据删除多线程代理
- 配置重复数据删除多线程代理行为
- 配置重复数据删除插件与多线程代理的交互
- 关于 MSDP 指纹识别
- 关于 MSDP 指纹缓存
- 配置 MSDP 指纹缓存行为
- 关于将远程客户端重复数据删除的 MSDP 指纹缓存设定为种子
- 在客户端上配置 MSDP 指纹缓存种子设定
- 在存储服务器上配置 MSDP 指纹缓存种子设定
- 关于采样和预测缓存
- 重建采样缓存
- 启用对 400 TB MSDP 的支持
- 关于使用 NetBackup 密钥管理服务器服务进行 MSDP 加密
- 关于使用外部 KMS 服务器的 MSDP 加密
- 为介质服务器重复数据删除池配置存储服务器
- 关于 NetBackup 重复数据删除的磁盘池
- 配置用于重复数据删除的磁盘池
- 创建数据目录以实现 400 TB MSDP 支持
- 向 400 TB 的介质服务器重复数据删除池添加卷
- 配置介质服务器重复数据删除池存储单元
- 为 MSDP 客户端重复数据删除配置客户端属性
- 禁用客户端的 MSDP 客户端重复数据删除
- 为策略中的所有客户端禁用客户端重复数据删除
- 关于 MSDP 压缩
- 关于 MSDP 加密
- 为 MSDP 本地存储卷配置加密
- 为 MSDP 云存储卷配置加密
- 在不同的平台上配置 MSDP 加密
- 关于 MSDP 的滚动数据转换机制
- 滚动数据转换模式
- MSDP 加密行为和兼容性
- 为 MSDP 配置优化合成备份
- 关于用于 MSDP 复制和同步复制的单独网络路径
- 为 MSDP 复制配置单独的网络路径
- 关于同一域内的 MSDP 优化复制
- 在同一 NetBackup 域内配置 MSDP 优化复制
- 关于到其他域的 MSDP 复制
- 配置以不同 NetBackup 域为目标的 MSDP 复制
- 关于配置 MSDP 优化复制和复制带宽
- 关于 MSDP 云优化复制和主从复制的性能优化
- 关于存储生命周期策略
- 关于自动映像同步复制所需的存储生命周期策略
- 创建存储生命周期策略
- 关于 MSDP 备份策略配置
- 创建备份策略
- “弹性网络”属性
- 添加 MSDP 负载平衡服务器
- 关于 NetBackup 客户端上的可变长度重复数据删除
- 使用 cacontrol 命令行实用程序管理可变长度重复数据删除
- 关于 MSDP pd.conf 配置文件
- 编辑 MSDP pd.conf 文件
- 关于 MSDP contentrouter.cfg 文件
- 关于保存 MSDP 存储服务器配置
- 保存 MSDP 存储服务器配置
- 编辑 MSDP 存储服务器配置文件
- 设置 MSDP 存储服务器配置
- 关于 MSDP 主机配置文件
- 删除 MSDP 主机配置文件
- 重置 MSDP 注册表
- 关于保护 MSDP 目录库
- 更改 MSDP 卷影目录库路径
- 更改 MSDP 卷影目录库日程表
- 更改 MSDP 目录卷影副本数
- 配置 MSDP 目录库备份
- 更新 MSDP 目录库备份策略
- 关于 MSDP FIPS 遵从性
- 配置 NetBackup 客户端重复数据删除以支持 MSDP 的多个接口
- 关于 MSDP 多域支持
- 关于 MSDP 应用程序用户支持
- 关于 MSDP 多域 VLAN 支持
- 关于 NetBackup WORM 存储对不可变和不可删除数据的支持
- 使用非 root 用户运行 MSDP 服务
- 使用非 root 用户运行 MSDP 命令
- MSDP 云支持
- 关于 MSDP 云支持
- 在 NetBackup Web UI 中创建介质服务器重复数据删除池(MSDP、MSDP 云)存储服务器
- 管理 MSDP-C 的凭据
- 创建云存储单元
- 更新云 LSU 的云凭据
- 更新云 LSU 的加密配置
- 删除云 LSU
- 使用云 LSU 将数据备份到云
- 使用云 LSU 将数据复制到云
- 将 AIR 配置为使用云 LSU
- 关于向后兼容性支持
- 关于 cloud.json、contentrouter.cfg 和 spa.cfg 中的配置项
- 云空间回收
- 关于为实现云支持而进行的工具更新
- 关于云 LSU 的灾难恢复
- 关于使用 MSDP 云的映像共享
- 关于从 Microsoft Azure 存档中的备份还原
- 关于 Veritas Alta Recovery Vault Azure 和 Amazon
- 配置 Veritas Alta Recovery Vault Azure 和 Azure Government
- 使用 CLI 配置 Veritas Alta Recovery Vault Azure 和 Azure Government
- 配置 Veritas Alta Recovery Vault Amazon 和 Amazon Government
- 使用 CLI 配置 Veritas Alta Recovery Vault Amazon 和 Amazon Government
- Recovery Vault 从标准身份验证迁移到基于令牌的身份验证
- 关于 MSDP 云不可篡改的 (WORM) 存储支持
- 关于 AWS IAM Role Anywhere 支持
- 关于 Azure 服务主体支持
- 关于云中对象存储的即时访问
- 关于 NetBackup 对 AWS Snowball Edge 的支持
- 升级到 NetBackup 10.3 和群集环境
- MSDP S3 接口
- 监视重复数据删除活动
- 管理重复数据删除
- 恢复 MSDP
- 替换 MSDP 主机
- 卸载 MSDP
- 重复数据删除体系结构
- 配置和使用通用共享
- 关于通用共享
- 通用共享的优点
- 为通用共享配置和使用 MSDP 自建 (BYO) 服务器
- 配置通用共享的 MSDP 自建 (BYO) 服务器前提条件和硬件要求
- 关于 MSDP BYO 服务器的重复数据删除 Web 服务用户和用户组
- 配置通用共享用户身份验证
- 装入通过 NetBackup Web UI 创建的通用共享
- 关于通用共享自助式恢复
- 执行通用共享自助式恢复
- 使用采集模式
- 关于具有对象存储的通用共享
- 为通用共享启用对象存储
- 具有已禁用 MSDP 数据卷的通用共享
- 关于 vpfs_stats 实用程序
- 通用共享的灾难恢复
- 更改 vpfsd 实例数
- 为通用共享启用可变长度重复数据删除 (VLD) 算法
- 升级到 NetBackup 10.4
- 关于通用共享加速器
- 为通用共享加速器准备 NetBackup
- 安装通用共享加速器
- 配置通用共享加速器
- 为通用共享加速器创建保护策略
- 关于通用共享加速器配额
- 恢复通用共享加速器的时间点
- 删除恢复的通用共享加速器
- 通用共享加速器的日志记录
- 通用共享 VPFS 实例的日志记录和报告
- 通用共享中文件系统操作的 vpfsd 日志
- 使用标记文件接口执行通用共享操作
- 配置隔离恢复环境 (IRE)
- 使用 NetBackup 重复数据删除 Shell
- 关于 NetBackup 重复数据删除 Shell
- 从重复数据删除 shell 管理用户
- 从重复数据删除 shell 管理 VLAN 接口
- 管理 WORM 存储服务器上的保留策略
- 管理 WORM 存储服务器上具有保留锁定的映像
- 审核 WORM 保留更改
- 从重复数据删除 shell 保护 NetBackup 目录库
- 关于外部 MSDP 目录库备份
- 从重复数据删除 shell 管理证书
- 从重复数据删除 shell 管理 FIPS 模式
- 从重复数据删除 shell 加密备份
- 从重复数据删除 shell 调整 MSDP 配置
- 从重复数据删除 shell 设置 MSDP 日志级别
- 从重复数据删除 shell 管理 NetBackup 服务
- 从重复数据删除 shell 监控 NetBackup 服务并对其进行故障排除
- 从重复数据删除 shell 管理 S3 服务
- 重复数据删除 shell 命令的多人授权
- 在 Flex Scale 和 Cloud Scale 中管理云 LSU
- 故障排除
- 附录 A. 迁移到 MSDP 存储
- 附录 B. 从 Cloud Catalyst 迁移到 MSDP 直接云分层
- 附录 C. Encryption Crawler
- 索引
关于 NetBackup 客户端上的可变长度重复数据删除
目前,NetBackup Deduplication 遵循固定长度重复数据删除方法,即:将数据流分成若干固定长度的段 (128 KB),然后进行处理用于重复数据删除。固定长度重复数据删除的优点在于这种方法十分快速,它占用的计算资源更少。固定长度重复数据删除可有效处理大多数类型的数据流。但在某些情况下,固定长度重复数据删除可能会导致重复数据删除率较低。
如果在转变模式中修改了数据,也就是说,如果将一些数据插入文件的中间,在备份数据时,通过可变长度重复数据删除可提高重复数据删除率。可变长度重复数据删除可以减少备份存储,提高备份性能,并降低用于数据保护的总体成本。
注意:
对于当前 MSDP 智能重复数据删除算法和附属流转化器的重复数据删除率不佳的数据类型,请使用可变长度重复数据删除。启用可变长度重复数据删除可以提高重复数据删除率,但要注意 CPU 性能可能会受到影响。
在可变长度重复数据删除中,每个段的大小可变,且大小边界可配置。NetBackup 客户端会检查数据并对可变长度数据段应用安全哈希算法 (SHA-2)。将为每个数据段分配一个唯一的 ID,并且 NetBackup 会评估备份中是否存在具有相同 ID 的数据段。如果已存在该数据段,不会再次存储段数据。
警告:
如果对备份策略启用压缩,则可变长度重复数据删除不起作用,即使在对其进行配置后也如此。
下表介绍了可变长度重复数据删除对数据备份的影响:
表:可变长度重复数据删除的影响
|
对重复数据删除率的影响 |
如果在转变模式中修改数据文件(即,在二进制级别插入、删除或修改数据),则可变长度重复数据删除非常有益。再次备份此类已修改的数据时,可变长度重复数据删除的重复数据删除率将提高。因此,第二个或后续备份的重复数据删除率更高。 |
|
对 CPU 的影响 |
与固定长度重复数据删除相比,可变长度重复数据删除消耗的资源可能更多,但是可以提高重复数据删除率。可变长度重复数据删除需要更多 CPU 周期来计算段边界,并且备份时间可能超过固定长度重复数据删除方法。 |
|
对数据还原的影响 |
可变长度重复数据删除不影响数据还原进程。 |
默认情况下,NetBackup 客户端上禁用可变长度重复数据删除。从 NetBackup 10.2 开始,可以使用 cacontrol 命令行实用程序启用可变长度重复数据删除。在早期版本的 NetBackup 中,可以通过在 pd.conf 文件中添加参数来启用它。要对所有 NetBackup 客户端或策略启用相同的设置,必须在 pd.conf 文件中指定所有客户端或策略。
从 NetBackup 10.2 开始,可变长度重复数据删除的默认版本是 VLD v2。如果已在 pd.conf 文件中启用可变长度重复数据删除,且存储中不存在映像备份,则默认情况下使用 VLD v2。如果存储中已存在映像备份,NetBackup 会继续使用 VLD v1。
在重复数据删除负载平衡方案中,必须将介质服务器升级到 NetBackup 8.1.1 或更高版本并修改所有介质服务器上的 pd.conf 文件。如果备份作业为负载平衡池选择旧介质服务器(版本低于 NetBackup 8.1.1),则使用固定长度重复数据删除替代可变长度重复数据删除。在负载平衡方案中,避免配置使用不同 NetBackup 版本的介质服务器。通过可变长度重复数据删除生成的数据段与通过固定长度重复数据删除生成的数据段不同。因此,对使用不同 NetBackup 版本的介质服务器进行负载平衡会降低重复数据删除率。
请参见使用 cacontrol 命令行实用程序管理可变长度重复数据删除。