Enterprise Vault™ 使用 Veritas Information Classifier 进行分类

Last Published:
Product(s): Enterprise Vault (14.4)
  1. 关于本指南
    1. 指南简介
      1.  
        Veritas 信息分类器与其他分类方法之间的关系
    2.  
      本指南的内容
    3. 从何处获取有关 Enterprise Vault 的详细信息
      1.  
        Enterprise Vault 培训模块
  2. 准备 Enterprise Vault 进行分类
    1.  
      关于准备步骤
    2.  
      用户需求
    3.  
      检查 Enterprise Vault 存储服务器上的高速缓存位置
    4.  
      设置数据访问帐户
    5.  
      在所有 Enterprise Vault 服务器上启用 Veritas 信息分类器
    6.  
      配置 Veritas 信息分类器以实现安全客户端连接
  3. 设置 Veritas Information Classifier 策略
    1.  
      Veritas 简介
    2.  
      打开 Veritas 信息分类器
    3.  
      寻找解决办法
    4.  
      分析内容取样,查找策略匹配项
    5. 关于策略
      1.  
        创建策略
      2.  
        关于策略条件
      3.  
        启用或禁用策略
      4.  
        导出或导入策略
      5.  
        重置策略
      6.  
        删除策略
    6. 关于模式
      1.  
        创建或编辑模式
      2.  
        导出或导入模式
      3.  
        删除模式
    7. 关于标记
      1.  
        创建或编辑标记
      2.  
        导出或导入标签
      3.  
        关于 Enterprise Vault 索引属性
      4.  
        分类属性值与保留类别的交互方式
      5.  
        设置保留类别注意事项
      6.  
        删除标记
    8. 关于情绪分析
      1.  
        关于情绪条件
      2.  
        在站点级别强制执行情绪分析
  4. 定义和应用 Enterprise Vault 分类策略
    1.  
      关于 Enterprise Vault 分类策略
    2. 定义分类策略
      1.  
        配置分类策略以分配持续时间最短的保留类别
    3.  
      关于与分类策略一起使用的 PowerShell cmdlet
    4.  
      将分类策略与保留计划关联
    5.  
      关于与保留计划一起使用的 PowerShell cmdlet
    6.  
      将保留计划应用于 Enterprise Vault 归档
  5. 在测试模式中运行分类
    1.  
      关于分类测试模式
    2.  
      实施分类测试模式
    3.  
      关于测试模式中运行分类所使用的 PowerShell cmdlet
    4.  
      了解分类测试模式报告
  6. 将分类与智能分区配合使用
    1.  
      关于智能分区
    2.  
      Enterprise Vault 如何确定是否将项目归档到智能分区
    3.  
      设置智能分区
    4.  
      验证 Enterprise Vault 是否已将项目归档到智能分区
  7. 附录 A. 用于自定义字段搜索的 Enterprise Vault 属性
    1.  
      关于 Enterprise Vault 属性
    2.  
      系统属性
    3.  
      附件属性
    4.  
      自定义的 Enterprise Vault 属性
    5.  
      文件系统归档项目的自定义 Enterprise Vault 属性
    6.  
      SharePoint 项目的自定义 Enterprise Vault 属性
    7.  
      Compliance Accelerator 处理的项目的自定义 Enterprise Vault 属性
    8.  
      用于策略管理软件的自定义属性
    9.  
      Enterprise Vault SMTP 归档的自定义属性
  8. 附录 B. 用于分类的 PowerShell cmdlet
    1.  
      关于分类 cmdlet
    2.  
      Disable-EVClassification
    3.  
      Get-EVClassificationPolicy
    4.  
      Get-EVClassificationStatus
    5.  
      Get-EVClassificationTestMode
    6.  
      Get-EVClassificationVICTags
    7.  
      Initialize-EVClassificationVIC
    8.  
      Set-EVClassificationVICFIPSMode
    9.  
      New-EVClassificationPolicy
    10.  
      Remove-EVClassificationPolicy
    11.  
      Set-EVClassificationPolicy
    12.  
      Set-EVClassificationTestMode
  9. 附录 C. 分类缓存文件夹
    1.  
      Enterprise Vault 对其提交以进行分类的项目的缓存方式
    2.  
      针对分类文件大小的限制
    3.  
      配置 Enterprise Vault 以便将分类文件保留在高速缓存文件夹中
  10. 附录 D. 从 FCI 分类迁移到 Veritas Information Classifier
    1.  
      转换 FCI 分类规则以用于 Veritas 信息分类器
  11. 附录 E. 监视和故障排除
    1.  
      审核
    2.  
      检查分类性能计数器
    3.  
      分类故障排除
    4.  
      在归档中搜索 Veritas 信息分类器已分类的项目
    5.  
      语言检测故障排除

创建或编辑模式

您无法编辑内置模式,但可以编辑您创建的任何自定义模式。

创建或编辑模式

  1. 在 Veritas 左侧,单击 Patterns
  2. 执行以下操作之一:

    • 要创建模式,请单击 New

    • 要编辑现有模式,请选择该模式,然后单击 Edit

    下图显示了 New Pattern 对话框,模式类型为 Regular expression
  3. 对字段进行如下设置:

    Name

    指定模式名称。名称必须唯一,并且最多只能包含 100 个字母数字、空格和特殊字符。

    Description

    (可选)简要描述在 Veritas 中显示的模式。

    Type

    指定模式类型。

    对于 TextRegular expression 模式,必须指定要查找的值。如果将这些值作为模式值输入,则在策略条件中输入这些值时所需遵循的相同准则同样适用。

    请参见关于策略条件

    选择 Similar document 以查找与提供的模板类似的项目。例如,您可以通过将空白表单作为模板提交来查找完成的表单。与 TextRegular expression 模式不同,在策略条件中纳入 Similar document 模式时,可以设置这些模式所需的可信度。

    文档相似度功能可以查找用户通过添加、删除或重新排序段落、句子或词语创建模板文档变体的实例。它还可以查找用户更改单个词语的实例。但是,词语的更改幅度越大,Veritas 找到匹配项的可能性越小。

    您必须选择所需的相似度模式:FullSection。在 Full 模式下,Veritas 会完整地将模板文档与其他文档进行比较。查找用户更改了模板文档的某些方面但未对总体大小造成很大影响的实例时,该模式非常有用。在 Section 模式下,Veritas 会查找模板文档的内容显示为较大文档中的一部分的实例。

    要提交模板文档,请单击 Browse,然后选择所需的文档。

    选择 Exact Data Match 以查找项目中一个或多个特定值的匹配项。通过精确数据匹配 (EDM) 设置更细化级别的数据匹配条件,从而精确控制数据分类过程并减少误报。

    通过 EDM,可以使用数据库记录创建模式。

    请参见“创建基于精确数据匹配的模式”

  4. 通过单击 Browse,然后选择一个应当与模式匹配的文档来测试模式。

    选中 Include text in images 复选框,可以使用光学字符识别 (OCR) 从图片中提取信息并执行分类。

    注意:

    只有在运行 Veritas 的系统上安装了 Tesseract 软件时,才会显示 Include text in images 复选框。

    稍等片刻,Veritas 会指示是否已找到匹配项。当属于这种情况时,可以单击 Show details 查看匹配文本和可信度。

  5. 单击 Save

创建基于精确数据匹配的模式

  1. 按照前面所述的初始步骤来创建模式。
  2. 在 Type 框中,单击以选择 Exact Data Match
  3. 指定以下配置选项:

    First row contains column headers

    如果源文档中的第一行包含每个字段的名称,请选择 Yes。如果选中,则不会考虑使用源文档中第一行的内容生成规则。

    如果源文档中的第一行不包含每个字段的名称,请选择 No

    Column delimiter

    此字段是可选字段。它指定分隔符字符,用于分隔数据文件中的每个列/字段。

    注意:

    • 分隔符可以是任何单个特殊字符。例如,逗号 (,)、竖线 (|)、空格等。

    • 如果源文档仅包含单个列/字段,则可以设置文件中不存在的任何分隔符字符。

    • 分隔符必须是单个字符值。

    Perform hashing to secure data fields

    如果需要对生成的用于创建 EDM 模式的规则进行哈希处理以保护数据,请选择 Yes。在生成的分类规则中存储数据字段时,使用哈希算法 SHA256 对其进行哈希处理。

    注意:

    如果在创建精确数据匹配模式时使用哈希,分类性能会降低。

    Use case-sensitive matching

    如果匹配需要区分大小写,请选择 Yes

    Proximity for matches

    以字符数指定两列或两个字段之间的距离,以便将匹配项视为有效。有效值大于 0。

    注意:

    • 如果源文档仅包含单个列/字段,则邻近值应设置为 1。

    • 生成分类规则的 generateRulePack API 使用“From the first condition option”邻近选项。精确数据匹配不支持“Sliding Window”邻近选项。

    示例:

    在邻近值 = 20 的情况下,如果 CSV 源文档内容如下所示:

    Goodbye, Hello

    测试文档内容为:

    … You say Goodbye and I say Hello …

    此处,在“Goodbye”和“Hello”这两个词之间,邻近值是 19 个字符。匹配的词在设定的邻近值范围(即 20 个字符)内。因此,Veritas 将显示匹配项。

    Minimum columns to match

    指定应匹配以触发结果的最小列数。请注意,无论创建 EDM 模式时在 Minimum columns 中指定的值如何,都强制匹配第一列。

    注意:

    如果选中 All columns 复选框,将忽略 Minimum columns 字段。

    All columns

    如果源文档中的所有列/字段都需要匹配才能触发结果,请选中此复选框。

  4. Source Document 部分下,浏览以选择要基于其创建分类规则的 EDM 源文件。

    注意

    • EDM 源文档的类型必须为 CSV 或 TXT(仅纯文本)

    • 可配置最大文档大小。建议大小为 5 MB。

    • 不支持引用字段的 CSV 文档

  5. 单击 Save

    创建的 EDM 模式显示用户配置的精确数据匹配选项。为模式保留源文档名称,但不提供其位置或直接链接。请参见下图。

    可以使用创建的 EDM 模式执行以下操作:

    • 增强现有策略

    • 创建新策略

有关更多信息,请参见关于策略条件

编辑 EDM 模式时的已知问题

编辑 EDM 模式时,更新模式名称或说明可能会因内部系统错误而失败。如果遇到此问题,请与系统管理员或 Veritas 支持联系。