クラス詳細

クラス [プロジェクト ツリー] - [クラス] アイコン を選択すると、クラス詳細が [プロジェクト ツリー] に表示されます。

[詳細] ウィンドウの右上には、[スクリプト コード] ウィンドウを開くためのボタンがあります。この [スクリプトを表示] アイコンをクリックするとさまざまな行数が表示され、スクリプト コードがすでに存在するかどうかを確認できます。 検証フォームをカスタマイズしている場合は、[検証フォーム レイアウト] ウィンドウを表示するためのボタンも使用できます。

クラス詳細には、クラスの構成に使用する複数のオプションが表示されます。

[分類]

このグループには次のオプションがあります。

[レイアウト分類用にこのクラスをトレーニング]

選択した場合、[分類トレーニング セット] のこのクラスに属するドキュメントは、レイアウト分類用にプロジェクトをトレーニングするために使用されます。これは、構成中に手動で実行するか、本番中に自動的に実行することができます。これにより、このクラスのドキュメントがレイアウトに基づいて簡単に認識されるようになります。このオプションはデフォルトで選択されています。

これは、分類グループ テンプレートを使用して作成されたプロジェクトでのみ使用できます。

[コンテンツ分類用にこのクラスをトレーニング]

選択した場合、[分類トレーニング セット] のこのクラスに属するドキュメントは、コンテンツ分類用にプロジェクトをトレーニングするために使用されます。これは、構成中に手動で実行するか、本番中に自動的に実行することができます。これにより、このクラスのドキュメントがコンテンツに基づいて簡単に認識されるようになります。このオプションはデフォルトで選択されています。

[分類オンライン ラーニングに対してこのクラスを監視]
このオプションは分類グループにのみ関連します。このオプションが抽出グループに対して有効になっている場合でも、その値がプロジェクトに影響を与えることはありません。

このオプションは、[レイアウト分類用にこのクラスをトレーニング] オプションまたは [コンテンツ分類用にこのクラスをトレーニング] オプションのいずれかをここで選択し、[アドバンスト] ウィンドウで [分類オンライン ラーニングを使用] オプションを選択した場合のみ有効化されます。

このオプションを選択すると、トレーニング ドキュメントを使用して、分類結果が経時的に改善されます。トレーニング ドキュメントは、プロジェクトの構成中に手動で追加でき、本番中に自動的に収集されます。このオプションはデフォルトではクリアになっています。

[有効な分類結果]

このオプションを選択した場合、クラスを分類ステップの結果として使用できます。このオプションが選択されていない場合、分類プロセスでドキュメントをこのクラスに割り当てることはできません。このオプションはデフォルトで選択されています。

クラスが分類結果にならないようにすることで、単純に共通のフィールドと共通の抽出方法を定義するという目的で基本クラスとして挿入するクラスに対して役立つ場合があります。

クラスが分類条件を満たしていても分類結果にならないように設定している場合、クラスが見つかると、その親が分類結果として使用されます。親がない場合、ドキュメントは分類されません。

[手動分類に利用可能]

[手動分類に利用可能] を選択した場合、クラス名はクラス リストに含まれます。このオプションを選択しない場合、クラス名はリストから除外され、ユーザーはクラス名を分類結果として割り当てることはできません。

このオプションはデフォルトで選択されています。

ドキュメントが非表示クラスとして分類されている場合、このクラスはこのドキュメントのクラスのリストに含まれます。
[クラスにリダイレクト]

このオプションを使用すると、分類結果を置き換えることができます。設定した場合、再分類はドキュメントごとに 1 回だけ行われ、複数のリダイレクトが定義されていてもチェーン リダイレクトは発生しません。このオプションの値は、 <リダイレクトなし> デフォルトで設定されています。

ドキュメントがこのクラスに最終結果として配置されていてリダイレクト オプションを指定している場合、指定されたクラスは元のクラスの元の結果と同じ信頼度の最終結果になります。

このオプションは、すべてが 1 つの論理クラスに属するさまざまなフォームが多数ある場合に役立ちます。たとえば、住所フォームの変更などが挙げられます。この例については、多言語ドキュメントなど、ドキュメント タイプごとに個別のサブクラスが存在する可能性があります。これらのフォームで特別なアクションを実行する必要がない場合は、論理クラスにリダイレクトして住所を変更できます。

[アドバンスト] タブで構成したクラス レベルの分類閾値とともにリダイレクトを使用し、ドキュメントを別のクラスにリダイレクトする場合、リダイレクトされたクラスの構成設定を使用して、分類結果の信頼度が高いか低いかが判断されます。

[サブツリー分類]

このグループには次のオプションがあります。

[サブツリー分類を有効化]

このオプションをオンにすると、このクラスが有効な分類結果である場合、サブツリー分類に定義された信頼度の値と距離の値を使用して、完全な子クラス ツリーの 2 番目の分類ステップが開始されます。さらに、親よりも単一の子が優先されるなどの階層ルールが適用されます。この追加のステップは、サブツリー分類と呼ばれます。このオプションはデフォルトではクリアになっています。

サブツリー分類に対して、さまざまな信頼度と距離の値を設定できます。これらの異なる値によって、単一の分類ステップで取得できる分類結果よりも、より高度に区別化された分類結果を得ることができます。

通常、最初の分類ステップでは、アダプティブ機能分類またはレイアウト分類のいずれかを使用します。一般的には、指示分類はサブツリー分類に最も適しています。

サブツリー分類を使用することで、レイアウト分類とコンテンツ分類を組み合わせることができます。そのためには、[レイアウト分類子] でドキュメントを分類し、クラスのサブツリー分類をアクティブ化する必要があります。サブツリー内の評価には、コンテンツ分類の結果のみが使用されます。これは、レイアウトが非常に似ており、テキスト コンテンツに基づいてフォームを区別する必要がある場合に役立ちます。

[最小信頼度]

このオプションは、[サブツリー分類を有効化] オプションが選択されている場合にのみ使用できます。サブツリー分類の実行に必要な最小信頼度を指定します。このオプションの値は、 40% デフォルトで設定されています。

サブツリー分類に使用する指示には、最初の分類ステップに影響を与えないように、グローバルな分類閾値よりも低い信頼度を設定する必要があります。

[最短距離]

このオプションは、[サブツリー分類を有効化] オプションが選択されている場合にのみ使用できます。定義された指示に基づいてサブツリー内の結果を検索できるようにするための最短距離を指定します。このオプションの値は、 10% デフォルトで設定されています。

この距離設定は、グローバルな距離よりも低い値を設定する必要があります。

[親クラス経由のサブツリー分類が必要です]

親クラスがサブツリー分類を使用して分類されている場合にのみ子クラスに有効な分類が必要である場合は、このリストからクラスを選択します。このオプションの値は、 <無制限> デフォルトで設定されています。

クラス レベルの分類閾値とともにサブツリー分類を使用し、ドキュメントが子クラスに割り当てられている場合、構成された設定を使用して、分類結果の信頼度が高いか低いかが判断されます。

[サブツリー分類子]

サブツリー分類が有効になっている場合、プロジェクトのトレーニング時にサブツリー分類子が自動的に作成されます。次のボタンがどちらも無効になっている場合、このクラスにはサブツリー分類子がありません。

  • [プロパティ]このボタンをクリックして、サブツリー分類子の AFC プロパティを編集します。

  • [リセット]このボタンをクリックして、サブツリー分類子プロパティをデフォルト値にリセットします。

[トレーニング可能なドキュメント分割]

このグループには次のオプションがあります。

[最小ページ数]

ドキュメントに必要な最小ページ数を示す値を入力します。このオプションの値は、 1 デフォルトで設定されています。

[最大ページ数]

ドキュメントに予期される最大ページ数を示す値を入力します。このオプションの値は、 0 デフォルトで設定されています。 (これは、ドキュメントの長さが無制限であることを意味します)。

[標準ドキュメント分割]

コンテンツには、単一または複数ページのドキュメント、あるいはその両方の組み合わせ、または厳密でないページが含まれる場合があります。ドキュメントの分割時には複数ページのドキュメントが処理され、必要に応じて、それらのページが設定に従って個別のドキュメントに分割されます。

ドキュメントの分割がアクティブ化されている場合、厳密でないページが 1 つの複数ページ ドキュメントにすべて追加され、ドキュメント分割によって処理されます。最初のステップでは、ドキュメントの分割が実行されます。すべての複数ページ ドキュメントが処理され、それぞれの複数ページ ドキュメント自体がページごとに順次処理されます。

ドキュメントの分割が完了すると、新しく作成されたドキュメントが分類されます。

複数ページのドキュメントの分割時には、それぞれの単一ページが分類され、分類結果の分割設定に応じてページごとに新しいドキュメントが作成されるか、現在のドキュメントにページが追加されます。その後、次のページが分類され、現在のドキュメントに追加されるか、完全な複数ページ ドキュメントが処理されてから新しいドキュメントに追加されます。

ドキュメント分割がアクティブ化されていない場合、厳密でないページごとに 1 ページのドキュメントが作成されます。

通常、ドキュメント分割はプロジェクト レベルでアクティブ化します。

これらのオプションは、プロジェクトでドキュメント分割が有効化されていない場合は無効になります。

このグループには次のオプションがあります。

[分割を無視]

プロジェクトでドキュメントの分割が有効化されている場合、[分割を無視] を選択して、単一クラスのドキュメントの分割を無効にできます。つまり、このクラスのドキュメントのページは、未分類のページとして処理されるようになります。

このオプションが選択されていない場合、このクラスのドキュメントは分割され、複数の追加オプションが利用可能になります。このオプションはデフォルトではクリアになっています。

[クラス表現]

「最初のページ」 オプションを選択すると、固定ページ長を設定できます。デフォルトでは、固定ページ長の値は 0 (ゼロ) です。これは、ページ数に制限がないことを意味します。

たとえば、固定ページ長が 3 に設定されており、複数ページのドキュメントに対してドキュメント分割の処理を行う場合、処理中に次のことが発生します。

ドキュメントの分割では、複数ページのドキュメントがページごとに処理されます。各ページの分類が実行され、ページがこのクラスに分類された場合は新しいドキュメントが作成され、ページがこの新しいドキュメントに追加されます。固定ドキュメント長が 3 に設定されているため、次の 2 ページは、別のクラスに属しているかどうかに関わらず、分類を行わずにドキュメントに追加されます。3 番目のページが追加された後に現在のドキュメントが閉じ、3 ページ分が含まれます。複数ページ ドキュメントの次のページは、複数ページ ドキュメントのすべてのページの処理が完了してから処理されます。

値がゼロに設定されており、処理された複数ページのドキュメントのページがこのクラスに分類される場合は、新しいドキュメントが作成され、ページが追加されます。以下のような場合、複数ページ ドキュメントの次のページが現在のドキュメントに追加されます。

  • ページが未分類

  • ページは、[対応する最初のページ] と同じクラスの [中のページ] または [最後のページ] として分類されます。

複数ページ ドキュメントの処理済みのページが、現在のドキュメントの中のページまたは最後のページ以外の別のクラスに分類された場合、現在のドキュメントが閉じ、現在のページは新しいドキュメントに追加されます。

複数ページ ドキュメントのすべてのページが処理された後に、次の複数ページ ドキュメントが処理されます。

「中のページ」 または 「最後のページ」 を選択すると、[対応する最初のページ] のリストが有効になり、中のページまたは最後のページのクラスを指定できるようになります。これを行うと、現在のドキュメントの [対応する最初のページ] オプションで選択されたクラスに分類された場合に、現在処理されているドキュメントに中のページ (または最後のページ) が追加されます。それ以外の場合はドキュメントが閉じ、中 (または最後) のページが別の新しいドキュメントに追加されます。

重要 最初のページに対して中のページまたは最後のページを定義する場合、このオプションは他の設定よりも優先されるため、最初のページのオプションの [固定ページ長] を 0 (無制限) に設定する必要があります。[固定ページ長] が 1 以上に設定されている場合、中のページまたは最後のページの設定に対する固定ページ長は考慮されず、ページは分類されずに追加されます。

<なし> を選択した場合、中のページが常に現在のドキュメントに追加されます。最後のページについては、ページが追加された後にドキュメントが閉じ、複数ページ ドキュメントの次の処理済みページに対して新しいドキュメントが開始される以外は中のページと同様に機能します。

固定ページ長が定義されたドキュメントの中のページまたは最後のページを定義する場合、[固定ページ長] オプションが他の設定よりも優先されるため、これらの設定は考慮されません。
[固定ページ長]

このオプションは、「クラス表現」「最初のページ」オプションを選択した場合にのみ使用できます。このタイプのすべてのドキュメントが固定ページ長に設定されている場合、ここでそのページ長を指定できます。これにより、ドキュメントが正しく分割され、ページに抽出用のコンテンツが含まれているかどうかが簡単に判別されます。このオプションの値は、 0 デフォルトで設定されています。 (これは、固定ページ長はなく、ドキュメントにはさまざまなページ長を設定できることを意味します)。

[対応する最初のページ]

このオプションは、「クラス表現」[中のページ] または [最後のページ] に設定されている場合にのみ有効になります。リストからクラスを選択した場合、選択したクラスとして分類済みのドキュメントに新しいドキュメントを作成するのではなく、中のページまたは最後のページが追加されます。

[認識]

このグループには次のオプションがあります。

[認識プロファイル]

リストから認識プロファイルを選択します。このオプションの値は、 では、デフォルトの認識プロファイル デフォルトで設定されています。 が使用されます。

選択したプロファイルを変更するには、[認識プロファイルを構成] をクリックします。または、[認識プロファイル] をクリックして、既存の認識プロファイルを追加または編集します。

[分類閾値]

このグループには次のオプションがあります。

[プロジェクト レベルの分類閾値のみを使用]

クラス レベルで信頼度の高い分類結果に分類閾値を使用するには、このオプションをオフにします。デフォルトではこのオプションが選択されており、プロジェクト レベルの [プロジェクト設定] の [分類] タブで定義した分類閾値が使用されます。このオプションをオフにすると、対応する分類子がプロジェクト設定で定義されている場合に、次のオプションが使用できるようになります。

[レイアウト分類]

レイアウト分類の最善の候補の信頼度がこの値よりも高い場合、分類結果は信頼度が高いと判断されます。信頼度がこの値以下の場合、分類結果は信頼度が低いと判断されます。このオプションは、[プロジェクト設定] の [分類] タブでレイアウト分類が選択されている場合にのみ使用できます。

[コンテンツ分類]

コンテンツ分類の最善の候補の信頼度がこの値よりも高い場合、分類結果は信頼度が高いと判断されます。信頼度がこの値以下の場合、分類結果は信頼度が低いと判断されます。このオプションは、[プロジェクト設定] の [分類] タブでコンテンツ分類が選択されている場合にのみ使用できます。

[トレーニング可能なドキュメント分割 (TDS)]

最善の候補がこの値よりも高い場合、分類結果は信頼度が高いと判断されます。信頼度がこの値以下の場合、分類結果は信頼度が低いと判断されます。このオプションは、[プロジェクト設定] の [ドキュメントの分割] タブで [トレーニング可能なドキュメント分割 (TDS)] が選択されており、TDS モデル ファイルが使用可能な場合にのみ使用できます。

[レポート]

このグループには次のオプションがあります。

[自然言語処理]

このグループには次のオプションがあります。

[言語]

Natural Language Processing engine が抽出に使用する言語を認識できるように、リストから言語を選択します。この設定はクラス レベルで適用されているため、クラスをさまざまな言語で使用するように構成できます。

このリストが空の場合は、最初に Natural Language Processing engine をインストールする必要があります。NLP engine と言語のインストールに関する情報は、Kofax TotalAgility インストール ガイド に記載されています。

カスタム エンティティを使用している場合、選択した言語が、カスタム エンティティ ファイルを保管する場所を示します。

デフォルトでは、このオプションは、プロジェクト設計言語に設定されています。

[名前付きエンティティの抽出]

選択すると、抽出中にプロジェクトにより名前付きエンティティの抽出が実行されます。これらのエンティティは、ロケータを使用せずにスクリプトで参照できます。

ただし、名前付きエンティティ ロケーターを使用する場合にこのオプションをオフにすると、名前付きエンティティの抽出はオンデマンドで実行されます。

このオプションはデフォルトではクリアになっています。

[エンジンの停止]

Natural Language Processing engine を停止します。その後、エンジンは必要に応じてオンデマンドで再起動されます。

[その他]

このグループには次のオプションがあります。

[説明]
クラスの説明を入力します。この説明は、プロジェクト クラスを選択するとクラスのリストに表示されます。