分類タブ - プロジェクト設定ウィンドウ
[分類] タブを使用して、プロジェクトの分類を構成できます。
- [分類設定]
-
このグループには次の設定があります。
- [デフォルト分類結果]
-
他の分類結果を判断できない場合に使用する、目的のデフォルト分類結果を選択します。(デフォルト: 未分類)
- [分類評価]
-
使用する分類評価のタイプを選択します。次の選択肢があります。
-
[自動評価]。(デフォルト:選択済み)
信頼度と距離に指定した値が、結果を評価するために使用されます。複数ページのドキュメントの場合、ページごとに分類を実行し、ページの分類に成功すると停止します。分類されたページの後にあるページはすべて処理されません。
-
[スクリプトに実装された評価]。
同じページごとの分類ループが実行されますが、作成したカスタム スクリプトによって、分類結果の評価、分類ループの解除、およびドキュメントの最終的な分類結果の判断を行います。スクリプトに対して実行された評価とともにクラス レベルの分類を使用することはできません。[スクリプトに実装された評価] 値を選択した場合、以前に行った設定は無視されます。
-
- [レイアウト分類]
-
このグループには次の設定があります。
- [分類動作]
-
レイアウト分類を使用してドキュメントを分類する方法を次のいずれかの選択肢から選択します。
-
[最初のページのみを分類]。(デフォルト:選択済み)
指定した分類子タイプのドキュメントの最初のページのみを分類ループで処理する場合は、この値を選択します。ページを分類できない場合、ドキュメントは未分類のままになります。
-
[各ページを分類]。
この値は、ページが分類されるか、ドキュメント全体が処理されて分類されてないままの状態になるまで、指定した分類子タイプの複数ページのドキュメントの各ページを分類ループで処理する場合に選択します。
-
[レイアウト分類を使用しない]。
レイアウト分類子を使用しない場合は、この値を選択します。
トレーニング可能なドキュメント分割を使用している場合、この値を選択してもページ分類子での各ページの分割による分類には影響しません。ここで選択したオプションにより、ドキュメントの分割後のレイアウト分類を使用したドキュメントの分類方法を指定します。
-
レイアウト分類子メソッドを選択した後に、次の設定を使用して信頼度を指定できます。
- [最小信頼度]
-
この設定を使用して、最小信頼度を設定します。これは、分類結果を割り当てるための自動評価に必要な最小値です。(デフォルト:70)
- [最短距離]
-
この設定を使用して、最良の分類結果と次善の分類結果の間の最短距離を設定します。(デフォルト:10)
- [レイアウト分類子]
-
プロジェクトの 1 つ以上のクラスでレイアウト分類が有効になっている場合、この分類子が本番時に実行されます。次のボタンを使用して、レイアウト分類子を管理します。
- [プロパティ]
-
このボタンをクリックして、[レイアウト分類子のプロパティ] ウィンドウを表示します。
- [リセット]
-
このボタンをクリックして、プロジェクトからレイアウト分類子を削除します。いずれかのクラスでレイアウト分類が有効になっている場合、削除はスキップされ、代わりにコンテンツ分類が実行されます。
- [コンテンツ分類]
-
このグループには次の設定があります。
- [トレーニング動作]
-
ドキュメントの特定のページまたは複数のページを無視して、トレーニングから除外することができます。この設定は、ドキュメント ビューアの [サムネイル] ビューで行います。
次のいずれかの値から、ドキュメントのトレーニング方法を選択します。
-
[最初のページのみをトレーニング]。(デフォルト:選択済み)
無視しない最初のページに基づき、コンテンツ分類用にドキュメントをトレーニングする場合は、この値を選択します。
この値を有効にすると、コンテンツ分類の認識はドキュメントの最初のページに対してのみ実行されます。後で 「すべてのページをトレーニング」 に切り替える場合は、プロジェクトを再度トレーニングする必要があります。これにより、すべてのページが認識され、コンテンツ分類用に情報を利用してテキストを編集できるようになります。
-
[すべてのページをトレーニング]。
無視したページを除き、コンテンツ分類に完全なドキュメントを含める場合は、この値を選択します。
選択したトレーニング動作は、分類オンライン ラーニングにも使用されます。
-
- [分類動作]
-
コンテンツ分類を使用してドキュメントを分類する方法を次のいずれかの値から指定します。
-
[最初のページのみを分類]。(デフォルト:選択済み)
指定した分類子タイプのドキュメントの最初のページのみを分類ループで処理する場合は、この値を選択します。ページを分類できない場合、ドキュメントは未分類になります。
-
[各ページを分類]。
この値は、ページが分類されるか、ドキュメント全体が処理されて分類されてないままの状態になるまで、指定された分類子タイプの複数ページのドキュメントの各ページを分類ループで処理する場合に選択します。
-
[すべてのページを一括分類]。
この値を選択すると、すべてのページのテキストがマージされ、コンテンツ分類子で一度に処理できるようになります。
-
[コンテンツ分類を使用しない]。
コンテンツ分類子を使用しない場合は、この値を選択します。この値を使用すると、レイアウト分類子のみが使用されている場合、分類時に必要に応じて OCR を回避できます。
指示分類子はコンテンツの分類時に処理されるため、この設定を選択すると、[プロジェクト ツリー] で構成したすべての指示に影響を及ぼす可能性があります。[最初のページのみを分類] 値を選択した場合、指示は最初のページのみで実行されます。ただし、[コンテンツ分類を使用しない] 値を選択した場合、指示は処理されません。プロジェクトで分類結果を改善するために指示を使用している場合は、この値に適切な値を選択してください。
トレーニング可能なドキュメント分割を使用している場合、この値を選択してもページ分類子での各ページの分割による分類には影響しません。ここで選択したオプションにより、ドキュメントの分割後のコンテンツ分類を使用したドキュメントの分類方法を指定します。
コンテンツ分類子メソッドを選択した後に、次のコンテンツ分類子設定で信頼度を指定できます。
- [最小信頼度]
-
この設定を使用して、最小信頼度を設定します。これは、分類結果を割り当てるための自動評価に必要な最小値です。(デフォルト:50)
- [最短距離]
-
この設定を使用して、最良の分類結果と次善の分類結果の間の最短距離を設定します。(デフォルト:10)
- [コンテンツ分類子]
-
プロジェクトの 1 つ以上のクラスでコンテンツ分類が有効になっている場合、この分類子が本番時に実行されます。次のコンテンツ分類子タイプから選択できます。
-
[アダプティブ機能分類子]。(デフォルト:選択済み)
これは、トレーニングを行って経時的に分類結果を改善する、「サンプルから学習」型の分類子です。この分類子には、次のボタンを使用できます
- [プロパティ]
-
このボタンをクリックすると、メインのコンテンツ分類子の [アダプティブ機能分類子のプロパティ] ウィンドウが表示されます。
- [リセット]
-
このボタンをクリックすると、プロジェクトからメインのコンテンツ分類子が削除されます。いずれかのクラスでコンテンツ分類が有効になっている場合、分類結果は他の分類メソッドに依存します。
-
[テキスト分類子]。
この分類子は現在サポートされておらず、このタイプの分類子が使用されている古いプロジェクトにのみ使用する必要があります。
-
-
ウィンドウの下部にあるボタンの説明は、「共通 Transformation Designer ボタン」を参照してください。