Enterprise Vault™ Veritas Information Classifier を使用した分類
- このマニュアルについて
- 分類のための Enterprise Vault の準備
- Veritas Information Classifier ポリシーの設定
- Enterprise Vault 分類ポリシーの定義と適用
- テストモードでの分類の実行
- スマートパーティションを使用した分類
- 付録 A. カスタムフィールドの検索に使う Enterprise Vault のプロパティ
- 付録 B. 分類に使う PowerShell cmdlet
- 付録 C. 分類キャッシュフォルダ
- 付録 D. FCI 分類から Veritas Information Classifier への移行
- 付録 E. 監視とトラブルシューティング
パターンの作成または編集
組み込みパターンは編集できませんが、自分で作成したカスタムパターンは編集できます。
パターンを作成または編集する方法
- Veritas Information Classifier の左側の[Patterns]をクリックします。
- 次の図に、パターンの種類が[Regular expression]に設定されている[New Patterns]ダイアログボックスを示します。
次のいずれかを実行します。
パターンを作成するには、[New]をクリックします。
既存のパターンを編集するには、パターンを選択して[Edit]をクリックします。
- フィールドを次のように設定します。
Name
パターン名を指定します。名前は一意である必要があり、最大 100 個の英数字、スペース、および特殊文字を含めることができます。
Description
(オプション) Veritas Information Classifier に表示するパターンの簡単な説明を入力します。
Type
パターンの種類を指定します。
[Text]または[Regular expression]のパターンでは、検索対象の値を指定する必要があります。これらの値をポリシー条件に入力する場合と同じガイドラインが、パターン値としての入力時にも適用されます。
ポリシー条件についてを参照してください。
指定されたテンプレートに類似するアイテムを検索するには、[Similar document]を選択します。たとえば、空白のフォームをテンプレートとして送信して、記入済みのフォームを検索できます。[Text]と[Regular expression]のパターンとは異なり、類似文書パターンをポリシー条件に組み込む際に[Similar document]パターンで必要な信頼度を設定できます。
類似文書機能を使用すると、テンプレート文書の段落、文、単語の追加、削除、並べ替えを行って作成された文書を検索できます。個々の単語が変更された例を検索することもできます。ただし、変更された単語が多くなると、Veritas Information Classifier で一致を検出できる可能性が低くなります。
[Full]または[Section]のいずれか必要な類似モードを選択する必要があります。[Full]モードでは、Veritas Information Classifier はテンプレート文書全体を他の文書全体と比較します。テンプレート文書がところどころ変更されているが全体的なサイズに大きな影響はない例を検索する場合に便利です。[Section]モードでは、Veritas Information Classifier はテンプレート文書の内容がより大きな文書の一部になっているインスタンスを検索します。
テンプレート文書を送信するには、[Browse]をクリックし、目的の文書を選択します。
- [Browse]をクリックし、ポリシーと一致すると考えられる文書を選択して、パターンをテストします。
イメージから情報を抽出し、光学式文字認識 (OCR) を使用して分類を実行する場合は、[Include text in images]チェックボックスにチェックマークを付けます。
メモ:
[Include text in images]チェックボックスは、Veritas Information Classifier を実行しているシステムに Tesseract ソフトウェアがインストールされている場合にのみ表示されます。
しばらくすると、Veritas Information Classifier に、一致が存在するかどうかが示されます。一致が見つかったら、[Show details]をクリックして一致するテキストと信頼度を確認します。
- [Save]をクリックします。