Enterprise Vault™ Veritas Information Classifier を使用した分類
- このマニュアルについて
- 分類のための Enterprise Vault の準備
- Veritas Information Classifier ポリシーの設定
- Enterprise Vault 分類ポリシーの定義と適用
- テストモードでの分類の実行
- スマートパーティションを使用した分類
- 付録 A. カスタムフィールドの検索に使う Enterprise Vault のプロパティ
- 付録 B. 分類に使う PowerShell cmdlet
- 付録 C. 分類キャッシュフォルダ
- 付録 D. FCI 分類から Veritas Information Classifier への移行
- 付録 E. 監視とトラブルシューティング
言語検出のトラブルシューティング
デフォルトでは、Veritas Information Classifier は 80 文字以上ある場合にメッセージ内の言語を判別します。Veritas Information Classifier 2.4.0 を使用することで、管理者は言語検出の最小文字数と、信頼度の高低を設定できます。複数の言語が小さいファイル内に存在する場合、管理者は言語検出が実行される各チャンクのより小さいサイズを指定できます。
次の手順を実行します。
C:\Program Files (x86)\Enterprise Vault\Services\vic\Engine
ディレクトリに移動し、テキストエディタで.vic-overrides-config.yml
ファイルを開きます。このファイルは、カスタマイズする際に Veritas Information Classifier の構成設定を上書きするために使用されます。
- 分類子セクションのプロパティ languageDetectionEnabled が true に設定されている必要があります。
- 言語検出の値を上書きするには、分類子セクションで次のプロパティの値を設定します。
プロパティ
説明
minimumTextRequiredForLanguageDetection
言語検出のためのテキストの最小の長さを指定します。
設定値より小さいテキストは言語「不明」として指定されます。デフォルト値は 80 の Unicode 文字です。
chunkSizeForLanguageDetection
言語検出が実行される各チャンクのサイズを指定します。デフォルト値は 300 です。
たとえば、ドキュメントが 500 文字の Unicode 文字の場合、Veritas Information Classifier は最初の 300 文字で言語を検出し、次に最後の 200 文字で、最も出現する言語をプライマリとして指定します。
ドキュメントにおいて複数の言語が存在する Unicode 文字が 300 文字未満の場合は、このプロパティを使用して言語検出のチャンクサイズを減らします。
minimumConfidenceForLanguageDetection
言語を検出する信頼度を指定します。信頼度が高いほど精度は高くなりますが、言語が「不明」と判断される可能性が高くなります。
値は 1 から 100 の間である必要があります。デフォルト値は 90 です。
上書きエントリの例:
classifier: minimumTextRequiredForLanguageDetection: 200 chunkSizeForLanguageDetection: 400 minimumConfidenceForLanguageDetection: 90
.vic-overrides-config.yml
ファイルを保存します。- EnterpriseVaultVIC アプリケーションプールを再利用します。
変更は
C:\Program Files (x86)\Enterprise Vault\Services\vic\Engine
ディレクトリの.vic-merged-config.yml
ファイルに反映されます。