Enterprise Vault™ 使用 Veritas 信息分类器进行分类
- 关于本指南
- 准备 Enterprise Vault 进行分类
- 设置 Veritas 信息分类器策略
- 定义和应用 Enterprise Vault 分类策略
- 在测试模式中运行分类
- 将分类与智能分区配合使用
- 附录 A. 用于自定义字段搜索的 Enterprise Vault 属性
- 附录 B. 用于分类的 PowerShell cmdlet
- 附录 C. 分类缓存文件夹
- 附录 D. 从 FCI 分类迁移到 Veritas 信息分类器
- 附录 E. 监视和故障排除
创建或编辑模式
创建或编辑模式
- 在 Veritas Information Classifier 左侧,单击 Patterns。
- 下图显示了 New Pattern 对话框,模式类型为 Regular expression。
执行以下操作之一:
要创建模式,请单击 New。
要编辑现有模式,请选择该模式,然后单击 Edit。
- 对字段进行如下设置:
Name
指定模式名称。名称必须唯一,并且最多只能包含 100 个字母数字、空格和特殊字符。
描述
(可选)简要描述 Veritas Information Classifier 中显示的模式。
Type
指定模式类型。
对于 Text 或 Regular expression 模式,必须指定要查找的值。如果将这些值作为模式值输入,则在策略条件中输入这些值时所需遵循的相同准则同样适用。
请参见关于策略条件。
选择 Similar document 以查找与提供的模板类似的项目。例如,您可以通过将空白表单作为模板提交来查找完成的表单。与 Text 和 Regular expression 模式不同,在策略条件中纳入 Similar document 模式时,可以设置这些模式所需的可信度。
文档相似度功能可以查找用户通过添加、删除或重新排序段落、句子或词语创建模板文档变体的实例。它还可以查找用户更改单个词语的实例。但是,词语的更改幅度越大,Veritas Information Classifier 找到匹配项的可能性越小。
您必须选择所需的相似度模式:Full 或 Section。在 Full 模式下,Veritas Information Classifier 会完整地将模板文档与其他文档进行比较。查找用户更改了模板文档的某些方面但未对总体大小造成很大影响的实例时,该模式非常有用。在 Section 模式下,Veritas Information Classifier 会查找模板文档的内容显示为较大文档中的一部分的实例。
要提交模板文档,请单击 Browse,然后选择所需的文档。
- 通过单击 Browse,然后选择一个应当与模式匹配的文档来测试模式。
选中“在图片中包括文本”复选框,可以使用光学字符识别 (OCR) 从图片中提取信息并执行分类。
注意:
只有在运行 Veritas Information Classifier 的系统上安装了 Tesseract 软件时,才会显示“在图片中包含文本”复选框。
稍等片刻,Veritas 信息分类器会指示是否已找到匹配项。当属于这种情况时,可以单击 Show details 查看匹配文本和可信度。
- 单击 Save。