NetBackup™ for Apache Cassandra 管理指南

Last Published:
Product(s): NetBackup (11.1)

Cassandra 备份和恢复的组件和术语

下表介绍了 Cassandra 备份和恢复解决方案的不同组件和术语的用途。

表:

组件和术语

用途和定义

应用程序群集

  • 应用程序群集是 Cassandra 生产群集名称。

  • 群集名称必须是单个字词,字词间没有空格,并且必须是在生产节点上的 Cassandra.yaml 文件中使用的实际群集名称。

保护计划

保护计划定义了执行备份的时间、备份的保留期限和要使用的存储类型。

设置保护计划后,可以将资产订购到保护计划。

备份主机

备份主机充当代理客户端。所有备份和还原操作均通过备份主机执行。

Cassandra 备份恢复 (CBR) 解决方案配合使用 BigData 策略与应用程序类型 cassandra

保护计划使用此备份主机。

用于为 CBR 解决方案配置存储服务器的介质服务器必须用作备份主机。

注意:

还可以将 NetBackup 客户端用作备份主机。

Cassandra 群集

表示要保护的 Cassandra 生产群集

Cassandra 备份恢复组件

部署在数据暂存服务器和 Cassandra 群集上的 NetBackup 精简客户端,用于帮助执行备份和还原操作。

数据暂存服务器

除了 NetBackup 主服务器和备份主机外,NetBackup 还需要一组服务器来备份 Cassandra 群集。这些服务器通常为 Cassandra 群集中服务器总数的 20%。这些服务器用于在备份期间从 Cassandra 群集中删除重复数据并优化备份过程。

在备份或还原期间,Cassandra 密钥空间在 Cassandra 群集和数据暂存服务器之间并行进行流式传输。

数据暂存服务器,表示暂存群集。您需要部署节点,节点的使用视需要备份或还原的数据大小而定。

数据缩减

数据缩减过程中执行以下任务:

  • 有效协调

    来自不同节点但密钥相同的有效协调数据将传输到备份节点中的同一节点。

    协调操作在每个数据暂存服务器内并行进行,无需任何节点间通信。

  • 记录合成

    循环访问记录时,不同 SStable 中密钥相同的列会合并。

  • 语义重复数据删除

    过时和重复记录(副本)会被标识出来并删除。

NetBackup 主服务器

所有作业均从 NetBackup 主服务器执行。

并行流

使用 NetBackup 并行流框架,可以同时通过多台备份主机备份多个节点的数据块。