Enterprise Vault™ Veritas Information Classifier を使用した分類

Last Published:
Product(s): Enterprise Vault (14.2)
  1. このマニュアルについて
    1. 本書について
      1.  
        Veritas 情報分類子と他の分類方法との関係
    2.  
      このマニュアルの内容
    3. Enterprise Vault についての詳しい情報の入手先
      1.  
        Enterprise Vault トレーニングモジュール
  2. 分類のための Enterprise Vault の準備
    1.  
      準備手順について
    2.  
      前提条件
    3.  
      Enterprise Vault ストレージサーバーのキャッシュ場所の確認
    4.  
      データアクセスアカウントの設定
    5.  
      すべての Enterprise Vault サーバー上での Veritas Information Classifier の有効化
    6.  
      クライアントと安全に接続するための Veritas Information Classifier の設定
  3. Veritas Information Classifier ポリシーの設定
    1.  
      Veritas Information Classifier の概要
    2.  
      Veritas 情報分類子の表示
    3.  
      使用方法
    4.  
      ポリシーと一致するサンプルコンテンツの分析
    5. ポリシーについて
      1.  
        ポリシーの作成または編集
      2.  
        ポリシー条件について
      3.  
        ポリシーの有効化または無効化
      4.  
        ポリシーのエクスポートまたはインポート
      5.  
        ポリシーのリセット
      6.  
        ポリシーの削除
    6. パターンについて
      1.  
        パターンの作成または編集
      2.  
        パターンのエクスポートまたはインポート
      3.  
        パターンの削除
    7. タグについて
      1.  
        タグの作成または編集
      2.  
        タグのエクスポートまたはインポート
      3.  
        Enterprise Vault のインデックスプロパティについて
      4.  
        分類プロパティ値と保持カテゴリの相互作用
      5.  
        保持カテゴリの設定に関する注意事項
      6.  
        タグの削除
  4. Enterprise Vault 分類ポリシーの定義と適用
    1.  
      Enterprise Vault 分類ポリシーについて
    2. 分類ポリシーの定義
      1.  
        最短の保持期間を持つ保持カテゴリを割り当てる分類ポリシーの設定
    3.  
      分類ポリシーと連携して機能する PowerShell cmdlet について
    4.  
      分類プロパティと保持計画の関連付け
    5.  
      保持計画と連携して機能する PowerShell cmdlet について
    6.  
      Enterprise Vault アーカイブへの保持計画の適用
  5. テストモードでの分類の実行
    1.  
      分類テストモードについて
    2.  
      分類テストモードの実装
    3.  
      テストモードで分類を実行するための PowerShell cmdlet について
    4.  
      分類テストモードレポートについて
  6. スマートパーティションを使用した分類
    1.  
      スマートパーティションについて
    2.  
      Enterprise Vault がアイテムをスマートパーティションにアーカイブするかどうかを決める方法
    3.  
      スマートパーティションの設定
    4.  
      Enterprise Vault でアイテムがスマートパーティションにアーカイブされたことの確認
  7. 付録 A. カスタムフィールドの検索に使う Enterprise Vault のプロパティ
    1.  
      Enterprise Vault のプロパティについて
    2.  
      システムプロパティ
    3.  
      添付ファイルのプロパティ
    4.  
      Enterprise Vault のカスタムプロパティ
    5.  
      ファイルシステムアーカイブのアイテムの Enterprise Vault のカスタムプロパティ
    6.  
      SharePoint アイテムの Enterprise Vault のカスタムプロパティ
    7.  
      Compliance Accelerator 処理されたアイテムの Enterprise Vault のカスタムプロパティ
    8.  
      ポリシー管理ソフトウェアで使うためのカスタムプロパティ
    9.  
      Enterprise Vault SMTP アーカイブのカスタムプロパティ
  8. 付録 B. 分類に使う PowerShell cmdlet
    1.  
      cmdlet の分類について
    2.  
      Disable-EVClassification
    3.  
      Get-EVClassificationPolicy
    4.  
      Get-EVClassificationStatus
    5.  
      Get-EVClassificationTestMode
    6.  
      Get-EVClassificationVICTags
    7.  
      Initialize-EVClassificationVIC
    8.  
      Set-EVClassificationVICFIPSMode
    9.  
      New-EVClassificationPolicy
    10.  
      Remove-EVClassificationPolicy
    11.  
      Set-EVClassificationPolicy
    12.  
      Set-EVClassificationTestMode
  9. 付録 C. 分類キャッシュフォルダ
    1.  
      Enterprise Vault が分類のために送信するアイテムをキャッシュする方法
    2.  
      分類ファイルサイズの制限
    3.  
      キャッシュフォルダで分類ファイルを保持するための Enterprise Vault の構成
  10. 付録 D. FCI 分類から Veritas Information Classifier への移行
    1.  
      FCI 分類ルールを変換して Veritas 情報分類子で使用する
  11. 付録 E. 監視とトラブルシューティング
    1.  
      監査
    2.  
      分類パフォーマンスカウンタの確認
    3.  
      分類のトラブルシューティング
    4.  
      アーカイブ内での Veritas Information Classifier が分類したアイテムの検索
    5.  
      言語検出のトラブルシューティング

ポリシー条件について

条件は、Veritas Information Classifier で一致と判断されるために、アイテムが満たす必要がある基準を指定します。ポリシーには任意の数の条件を含めることができます。

条件の基本的なコンポーネント

すべての条件を次の基本的な形式で示す必要があります。

<プロパティ><演算子><値>

たとえば、次の条件の場合は、「Content」がプロパティ、「contains text」が演算子、「Stocks」が値になります。

Example of a Veritas Information Classifier condition

プロパティは、評価するアイテムの部分または特性 (コンテンツ、タイトル、更新日、ファイルサイズなど) を指定します。リストからプロパティを選択すると、選択したプロパティに合わせて、他の 2 つのフィールドのオプションが変わります。たとえば、更新日プロパティを選択した場合、他のフィールドには、1 つ以上の日付を設定するためのオプションが表示されます。コンテンツ、タイトル、作成者などのプロパティを選択した場合は、次の演算子を使用できます。

  • contains text

  • matches regex

  • matches pattern

  • language is

  • contains entity

  • sentiment score

各条件の右側で、Veritas Information Classifier で一致と判断されるためにアイテムが基準を満たす必要がある最小回数を指定できます。

カスタムフィールド

組織で使用しているさまざまなアプリケーションにより、アイテムに対するカスタムプロパティ情報が追加されることがあり、これらの分類が必要になります。たとえば、Enterprise Vault がアイテムを処理する場合、アイテムのメタデータのプロパティに情報をポピュレートし、この情報をアーカイブ済みアイテムとともに格納します。情報とは、具体的には Enterprise Vault がアイテムをアーカイブした日付、付帯する添付ファイルの個数などです。

特に関心のあるプロパティの名前を知っている場合、ポリシー条件のカスタムフィールドとしてその名前を入力できます。

カスタムフィールドを使用して、AIP ラベルに基づいて文書を分類できます。たとえば、AIP ラベル名が「MSIP_Label_0a8e637f-7bb7-4040-a22f-4e3924ef3558_Name」の場合、カスタム文字列フィールド名が「custom:MSIP_Label_0a8e637f-7bb7-4040-a22f-4e3924ef3558_Name」 (Microsoft Office ドキュメントの場合) または「pdf:docinfo:custom:MSIP_Label_0a8e637f-7bb7-4040-a22f-4e3924ef3558_Name」 (PDF ファイルの場合) のポリシーを作成して分類を実行できます。または、Veritas Information Classifier の YAML 設定でカスタムプロパティを作成し、そのプロパティのすべての AIP ラベル名をマッピングして、ユーザーインターフェースでこのカスタムプロパティを再利用できます。

Custom fields in policy conditions

Enterprise Vault のプロパティについてを参照してください。

テキストの一致

分類用に提出するアイテム内で特定の単語またはフレーズを検索する条件を設定する際には、次のガイドラインを確認してください。

  • 複数の単語またはフレーズを検索するには、それぞれを個別の行に指定します。アイテムが条件を満たすには、リスト内に 1 つの単語またはフレーズのみを含める必要があります。

  • 指定した単語またはフレーズに大文字と小文字の違いも含めて完全に一致するもののみを検索するには、[Match Case]を選択します。

  • 指定した単語またはフレーズが他の単語やフレーズの一部である場合を検索するには、[String Match]を選択します。たとえば、このオプションを選択した場合、「enter」は、「enters」、「entertainment」、「carpenter」と一致します。このオプションを選択しない場合、「enter」は「enter」とのみ一致します。

    同様に、[String Match]を選択した場合、「call me」というフレーズは、「call media」「recall meeting」と一致しますが、「surgically mend」とは一致しません。

  • 2 つの単語間の近接演算子 NEAR と BEFORE は、同じ行で指定できます。たとえば、「tax NEAR/10 reform」は、「tax」「reform」の間に 10 文字以下の単語が含まれる場合に一致します。「sales BEFORE/5 report」 は、「sales」「report」の前にあり、これらの単語の間に 5 文字以下の単語がある場合に一致します。どちらの場合も、数値が必須になります。

    メモ:

    テーブルや表計算ワークシートなどのフォーマット済みデータを評価するときに、これらの近接演算子が予想どおりに機能しない可能性があります。このデータを分類する前に実行する変換処理は、表のセルの順序を入れ替える可能性があります。たとえば、表計算ワークシートのセルに sales という単語が含まれ、そのセルの右隣のセルに report という単語があるとします。これは、sales BEFORE/5 report 演算子と一致しますが、変換処理によりこれら 2 つの単語が入れ替えられて、表計算ワークシートが変換された後は一致しないことがあります。

  • 単語とフレーズにはアスタリスク (*) と疑問符 (?) のワイルドカード文字を含めることができます。単語の一部としてアスタリスクを含めると、ゼロ個以上の文字と一致します。アスタリスクを単独で指定すると、1 つの単語に一致します。疑問符 (?) は 1 文字に一致します。次に例を示します。

    • 「stock*」は、「stock」、「stocks」、「stockings」と一致します。

    • 「*ock」は、「stock」、「clock」と一致します。

    • 「*ock*」は、「stock」、「clocks」と一致します。

    • 「??ock」は、「stock」、「clock」と一致しますが、「dock」とは一致しません。

    • 「sell * stock」は、「sell the stock」、「sell some stock」と一致しますが、「sell stock」とは一致しません。

    ワイルドカードを NEAR 演算子や BEFORE 演算子と組み合せて使用できます。次に例を示します。

    • 「s?l? BEFORE/1 stock*」は、「sold the stock」「sell stocks」「sale of stockings」と一致します。

正規表現の一致

正規表現 (regex) は、通常の文字 (a から z までの文字など) とメタ文字と呼ばれる特殊文字から成るテキストのパターンです。パターンとは、テキストを検索するときに照合する 1 つ以上の文字列です。たとえば、次の正規表現はすべての Visa カード番号で一連の数を照合します。

\b4[0-9]{12}(?:[0-9]{3})?\b

正規表現は Perl の正規表現の構文に従う必要があります。

この構文について詳しくは、Veritas Information Classifier のヘルプを参照してください。

https://regex101.com で入手できる無料のオンラインツールを使用して、正規表現を作成およびテストすると便利です。このツールでは、正規表現を入力するとその正規表現の説明が表示され、正規表現と入力したテスト文字列で一致するものがすべて一覧に表示されます。デフォルトの正規表現の種類である pcre (php) は、Veritas Information Classifier と互換性があります。

メモ:

正規表現との一致の検索は、特定の単語やフレーズを検索するよりもかなり時間がかかります。両方の種類の一致が互いに近接しているインスタンスを検索すると、パフォーマンスを大幅に向上させることができます。それには、正規表現の条件と特定の語句を検索する[次のテキストが含まれる]条件の両方を含む[すべて]という条件グループを設定して、必要な一致の近接度を指定します。Veritas Information Classifier は、最初に[次のテキストが含まれる]条件を評価して、次に正規表現の一致を検索します。

パターンの一致

パターンの一致では、選択されたアイテムプロパティを、既存の Veritas Information Classifier パターンと比較して評価します。選択したパターンによっては、受け入れる信頼度を設定できます。信頼度を高くすると、数は少ないが関連性のより高い一致が得られる可能性があります。

組み込みパターンを使用するポリシーをテストしたときに期待した結果を得られなかった場合は、次の点を確認してください。

  • テストアイテムがパターンの信頼度を満たしていることを確認することが重要です。たとえば Credit Card Policy は、デフォルトでは中程度の信頼度または高い信頼度が設定されている「Credit/Debit Card Number」パターンと一致するコンテンツを検索します。中程度の信頼度の要件を満たすには、コンテンツに次のいずれかが含まれている必要があります。

    • 区切り文字で分けられたクレジットカード番号 (数値の間にスペースまたはダッシュが含まれている)

    • 区切り文字で分けられていないクレジットカード番号と 1 つ以上のクレジットカードキーワード (AMEX、Visa など) の両方

    区切り文字で分けられていないクレジットカード番号は含まれているが、クレジットカードキーワードが含まれていないアイテムは、要件を満たしていないことになります。

  • [Show details]をクリックしてテスト結果を表示した後、[Test classification results]ウィンドウで一致の一部またはすべてがハイライトされないことがあります。これは、特定のパターンでのみ発生する既知の問題です。この問題は Veritas Information Classifier の今後のバージョンで修正される予定です。

言語の一致

ポリシーの照合を特定の言語のアイテムに制限する条件を設定できます。たとえば、主要な言語がフランス語であるアイテムを検索するには次のような条件を設定します。

Language search in Veritas Information Classifier

言語のリストに[Multiple languages detected]というオプションがあります。このオプションは、2 つ以上の言語を含むアイテムと一致します。

Veritas Information Classifier が主要な言語を特定できないためにアイテムを無視することを防ぐには、[Or Primary Language Unknown]を選択します。Veritas Information Classifier でアイテムの主要な言語を特定できない最も一般的な理由は、アイテムのコンテンツが非常に少ないことです。

エンティティの一致

ポリシーの照合をユーザー名または場所を含むコンテンツに制限する条件を設定できます。

メモ:

「contains entity」条件は、Veritas Information Classifier アプリケーションの実行時に nlp-service-0.1.4.jar を使用する場合にのみ利用可能です。また、固有表現認識 (NER) は英語でのみ利用可能です。

たとえば、ユーザー名を含むコンテンツを検索するには、次のような条件を設定します。

Entity search in Veritas Information

メモ:

固有表現認識 (NER) は、通常の分類に比べ、より多くの時間とリソースを消費します。NER は大規模な文書 (特に 10 MB を超える文書) には適していません。

条件グループ

条件のセットをグループ化し、その条件グループを他の条件グループ内に入れ子にすることができます。選択したグループ演算子によって、アイテムが一致と判断されるためにそのグループ内の条件のすべてを満たす必要があるか、一部を満たす必要があるか、どの条件も満たさない必要があるかが決まります。次のグループ演算子を使用できます。

  • All of。アイテムは指定した条件すべてを満たす必要があります。

  • Any of。アイテムは指定した条件の少なくとも 1 つを満たす必要があります。

  • None of。アイテムは指定した条件のいずれも満たさない必要があります。

    メモ:

    [All of]グループ内に[None of]グループを入れ子にして、特定の条件に一致し、特定の条件に一致しないものを除外する検索を行うことができます。たとえば、「(条件 X AND 条件 Y) BUT NOT 条件 Z」で適切な結果を得るには、[All of]グループに X 条件と Y 条件、入れ子にした[None of]グループに Z 条件を指定します。

  • n or more of。アイテムは指定した数の条件を満たす必要があります。

[All of]グループの場合にのみ、各条件が指定した文字数内に出現する場合を検索することができます。たとえば、次の条件グループでは、「Goodbye」という単語が「Hello」という単語の 20 文字以内に出現する場合を検索します。

Proximity search in Veritas Information Classifier

テキスト文字列「You say Goodbye and I say Hello」は、「Hello」の最初の文字と「Goodbye」の最初の文字の間が 20 文字より少ないため、これらの条件と一致します。同様に、テキスト文字列「You say Hello and I say Goodbye」も、2 つの単語の終わりの間の文字数が 20 文字を下回るため、一致します。どちらの場合も、スペースが文字としてカウントされます。

メモ:

[within nn characters]近接検索を実行する場合は、同じ検索語を複数の条件で重複して使用しないように注意してください。たとえば、1 つ目の条件で「Fred」、「Sue」、「Bob」という名前を検索するように定義し、2 つ目の条件で「Joe」、「Bob」、「Sarah」を検索するように定義したとします。この場合、「Bob」の単一のインスタンスを含むアイテムが、これらの条件を満たすことになります。

[from the first condition]Do Not Translate UI[in a sliding window]を選択できます。このオプションでは、指定した数の連続する文字列内で条件が一致する場合を探します。たとえば、「Goodbye」という単語が「Hello」という単語から連続した 20 文字内に出現する場合を検索する条件グループの場合、「You say Goodbye and I say Hello」は一致しません。「Goodbye」という単語の開始時点から「Hello」という単語の終了時点までが 23 文字あるためです。

Sliding window example