Important Update: Cohesity Products Documentation
All Cohesity product documentation are now managed via the Cohesity Docs Portal: https://docs.cohesity.com/HomePage/Content/home.htm. Some documentation available here may not reflect the latest information or may no longer be accessible.
Enterprise Vault™ 使用 Microsoft 文件分类基础架构分类
- 关于本指南
- 快速入门
- 设置分类属性
- 配置分类规则
- 定义和应用分类策略
- 在测试模式中运行分类
- 在整个站点中发布分类属性和规则
- 将分类与智能分区配合使用
- 附录 A. 用于分类规则中的 Enterprise Vault 属性
- 附录 B. 用于分类的 PowerShell cmdlet
- 关于分类 cmdlet
- Disable-EVClassification
- Get-EVClassificationFCITags
- Get-EVClassificationPolicy
- Get-EVClassificationStatus
- Get-EVClassificationTestMode
- Import-EVClassificationFCIRules
- New-EVClassificationPolicy
- Publish-EVClassificationFCIRules
- Remove-EVClassificationPolicy
- Set-EVClassificationPolicy
- Set-EVClassificationTestMode
- 附录 C. 监视和故障排除
采用 Veritas 信息分类器方法的规则所支持的配置参数
创建将采用 Veritas 信息分类器方法的规则时,必须指定一个或多个附加配置参数。 这些参数定义您希望在项目中搜索的文本字符串或正则表达式。 每个参数由名称和相应的值组成。
可以为同一规则指定多个配置参数。 例如,您可能希望创建一个规则,用于在项目主题行中搜索一个词,在邮件正文中搜索另一个词。 在这种情况下,项目必须匹配规则的所有参数才是匹配项目;Veritas 信息分类器将参数与布尔值 AND 运算符(而非 OR 运算符)关联起来。
注意:
要模拟将多个参数与布尔值 OR 运算符相关联的效果,请创建用于将相同值分配给相同分类属性的多个规则。 例如,您可以创建两个用于将相同值分配给 evtag.category 属性的规则:一个规则搜索项目主题行中的一个词,第二个规则搜索邮件正文中的另一个词。
在“分类参数”对话框的“名称”列中键入的值可设置配置参数的范围:这些值将指定您要搜索的项目的属性。
可通过在“名称”列中键入各属性的名称来搜索属性。 例如,您可以键入 cont 以搜索项目的邮件正文,或键入 rbea 以搜索收件人的电子邮件地址。 已编制索引的项目可具有大量属性,但对分类用途而言,只有一部分属性适用。这些是由 Enterprise Vault 存储在分类缓存文件夹下的纯文本文件中的属性和关联值。
如果您想要仅对某一个归档中的项目进行分类,可使用 archiveid 属性指定此归档的唯一标识符。例如,通过在一个配置参数中指定 archiveid 属性值,在另一个配置参数中指定 cont 属性值,您可以将分类操作限制为邮件正文中具有特定字词的指定归档中的项目。
还存在一些复合属性,您可以使用这些属性一次搜索项目的多个属性。 表:复合属性 说明了这些值。
表:复合属性
名称 | 说明 |
|---|---|
附件 | 搜索所有与附件相关的属性:内容、文件名、大小、类型和日期。 |
作者 | 搜索作者属性。 |
内容 | 搜索项目的主题行和内容及其附件。 |
项目 | 搜索完整项目:项目的主题行、内容和所有可分类属性及其附件。 |
收件人 | 搜索收件人列表属性。 |
主题 | 搜索项目的主题行及其附件。 |
可以通过用竖线符号 (|) 分隔多个属性,在单个“名称”值中组合这些属性。例如,以下“名称”值等效于复合值 Subject,因为它允许您搜索某个项目的主题行 (subj) 及其附件 (a_subj)。
subj|a_subj
下一个示例将搜索某个项目的主题行及其附件 (Subject) 以及这些附件的内容 (a_cont)。
Subject|a_cont
在“分类参数”对话框的“值”列中,可以指定要搜索的内容:例如,词、短语或正则表达式。
默认情况下,输入的值不区分大小写。因此,值 Fraud 的匹配项不仅包括 Fraud,还包括 fraud 和 FRAUD。但是,可使值区分大小写,方法是在值前面附加 (?-i)。例如,(?-i)Fraud 的匹配项只包括 Fraud。
以 ISO 8601 格式将日期和时间值指定为协调世界时 (UTC) 值。根据 ISO 8601,组合的日期和时间值具有以下格式:
yyyy-mm-ddThh:mm:ssZ
例如,2016-07-12T13:00:00Z。
表:“值”列中的受支持的值 介绍了 Veritas 信息分类器支持的值的类型。
表:“值”列中的受支持的值
值 | 说明 |
|---|---|
字符串 | 搜索指定的词或短语,例如 fraud 或 cover up。 |
正则表达式 | 搜索指定的正则表达式。 正则表达式是一种包含普通字符(例如,字母 a - z)和特殊字符(称为元字符)的文本格式。 该模式描述在搜索文本时要匹配的一个或多个字符串。例如,以下正则表达式与所有 VISA 卡编号中的数字序列匹配: \b4[0-9]{12}(?:[0-9]{3})?\b 正则表达式 docx? 可以匹配 doc 和 docx,因此在搜索 Microsoft Word 文档时非常有用。 您的正则表达式必须符合 .NET Framework 正则表达式语法。 有关此语法的详细信息,请参见 Microsoft 网站上的以下文章: https://msdn.microsoft.com/library/az24scfc.aspx http://go.microsoft.com/fwlink/?LinkId=180327 若要查看正则表达式语法的相关示例,请参见示例分类规则。 |
临近搜索 | 搜索彼此间相隔指定数量的字符的词或正则表达式。 标点和空格字符将按普通字符计数。 语法如下所示: NEAR[proximity,regular_expression,regular_expression] 例如,键入以下内容可查找彼此相隔 100 个字符以内的 fraud 和 cover up: NEAR[100,fraud,cover up] 键入以下内容可查找彼此相隔 150 个字符以内的 fraud 和 cover up 或 write off: NEAR[150,fraud,(cover up|write off)] |
字符串或正则表达式列表 | LIST[string_or_regular_expression|string_or_regular_expression|...] 例如,要查找 cost of sales、earnings per share 或 financial expenses,请键入以下内容: LIST[cost of sales|earnings per share|financial expenses] 如果要输入的列表包含成百上千个词语或短语,您可以使用以下备用语法最大程度提高性能: LARGELIST[string1|string2|string3|...] LARGELIST 使用不同的方法根据项目属性来评估该列表。通过将最有可能找到匹配的单词或短语置于列表的开始部分,您可以进一步提高性能。 注意: 与 LIST 不同,LARGELIST 不支持正则表达式。 |
日期范围 | 仅用于日期类型属性,例如 adat、date 和 mdat。搜索日期属性值位于指定日期范围内的项目。范围可以是开放式的。语法如下所示:
日期为 Enterprise Vault 存储服务器上当前时区中的日期。 |