プロセス タブ

リボンの [プロセス] タブは、ドキュメントの処理のテスト、認識の実行、およびプロジェクトのトレーニングに使用します。

さらに、分割、分類、および抽出のベンチマークを構成できます。

[トレーニング] グループで使用可能な設定

設定

名前および説明

[トレーニング] - [分類] アイコン

このアイコンのテキストは、プロジェクトの構成方法に応じて異なります。

[分類]/[分割および分類]

このラベルが [分類] の場合は、この設定によって分類子がトレーニングされます。ただし、トレーニングされるのは、レイアウトまたはコンテンツ分類子がプロジェクトに構成され、トレーニング セットにクラスのドキュメントが含まれる場合に限られます。

このラベルが [分割および分類] の場合は、この設定によって分類および分割がトレーニングされます。これは、[プロジェクト設定]標準ドキュメント分割またはトレーニング可能なドキュメント分割が有効になっている場合にのみ使用できます。

[トレーニング] - [抽出] アイコン

[抽出およびテーブル抽出]

トレーニング ドキュメントが [抽出セット] に追加されている場合、トレーニング可能なロケータをトレーニングします。プロジェクト内のいずれかのクラスでテーブル検出が有効になっている場合は、[テーブル抽出セット] のトレーニング ドキュメントに基づいてテーブル抽出トレーニングも実行されます。

テーブル抽出用のトレーニング ドキュメントを含むクラスがない場合、またはプロジェクトが最後にトレーニングされた後に新しいトレーニング ドキュメントが追加されていない場合、テーブル抽出トレーニングは実行されません。

次のサブメニュー項目のいずれかを選択して、抽出およびテーブル抽出を絞り込みます。

[トレーニング] - [抽出] アイコン [抽出]

トレーニング ドキュメントが [抽出セット] に追加されている場合、トレーニング可能なロケータをトレーニングします。

Table Extraction Training icon [テーブル抽出]

テーブル検出が有効になっている場合、この設定によって [テーブル抽出セット] 内のドキュメントに基づいてテーブル抽出がトレーニングされます。

[トレーニング] - [自動最適化分類] アイコン

[コンテンツ分類子を最適化]

選択したドキュメント セットのコンテンツを取得し、アダプティブ機能分類子 (AFC) を使用してコンテンツ分類のパラメータを最適化します。

[テスト] グループで使用可能な設定

設定

名前および説明

[テスト] - [選択項目を認識] アイコン

[認識]

認識設定のデフォルト プロファイルを使用してテキスト認識を実行します。

[テーブルの検出] アイコン

[テーブルの検出]

ドキュメントのすべてのテーブルを検出し、その情報を XDoc に保存します。

次のサブメニュー設定のいずれかを選択して、テーブル検出を絞り込みます。

[テーブルの検出] アイコン [選択したドキュメントのテーブルの検出]

選択したドキュメントのテーブルの検出を実行します。

[テスト] - [ドキュメントを再帰的に分類] アイコン [再帰的なテーブルの検出]

選択したフォルダ内のすべてのドキュメントに対してテーブル検出を実行します。

[テスト] - [選択項目を分割] アイコン

[分割]

ドキュメント分割を実行し、その結果を [ドキュメント分割結果] ウィンドウに表示します。

[テスト] - [選択項目を分類] アイコン

[分類]

分類を実行します。

[テスト] - [選択項目を抽出] アイコン

[抽出]

選択したクラスのフィールドとロケータ定義を使用してデータを抽出します。次のサブメニュー設定のいずれかを選択して、抽出を絞り込みます。

[テスト] - [選択項目を抽出] アイコン [選択したドキュメントを抽出]

選択したクラスのフィールドとロケータ定義を使用して、選択したドキュメントからデータを抽出します。

[テスト] - [選択項目を抽出] アイコン [検証せずに選択したドキュメントを抽出]

選択したクラスのフィールドとロケータ定義を使用して、検証を使用せずに選択したドキュメントからデータを抽出します。

[テスト] - [選択項目を処理] アイコン

[処理]

分類と抽出を実行します。次のサブメニュー設定のいずれかを選択して、処理を絞り込みます。

[テスト] - [選択項目を処理] アイコン [選択したドキュメントを処理]

選択したドキュメントの分類と抽出を実行します。

[テスト] - [選択項目を処理] アイコン [検証せずに選択したドキュメントを処理]

検証を使用せずに選択したドキュメントの分類と抽出を実行します。

[データをクリア] アイコン

[データをクリア]

選択したドキュメントのデータをクリアします。次のサブメニュー設定のいずれかを選択すると、データを再帰的にクリアできます。

[データをクリア] アイコン [選択したドキュメントをクリア]

選択したドキュメントの抽出データと分類結果をクリアします。

[データをクリア] アイコン [ドキュメントを再帰的にクリア]

すべてのドキュメントの抽出データと分類結果をクリアします。

[すべてクリア] アイコン [すべてクリア]

選択したドキュメントの抽出データと分類結果をクリアします。

[データをロード] アイコン

[データをロード]

選択したドキュメントの保存済みの抽出データまたは分類結果をロードします。

[ベンチマーク] グループで使用可能な設定

設定

名前および説明

[ベンチマーク] - [分割] アイコン

[分割]

選択したドキュメント サブセット内のすべてのドキュメントをメモリに読み込んですべてのページを 1 つのドキュメントに結合し、既存の分割設定を使用してこのドキュメントを分割します。進行状況バーは、ドキュメントが何パーセント処理されたかを示します。進行状況バーが 100% に達すると、[分割ベンチマーク] ウィンドウが表示され、分析用に分割ベンチマークの結果が表示されます。

[ベンチマーク] - [分類] アイコン

[分類]

[分類ベンチマーク] ウィンドウを表示し、分類トレーニングのトレーニング ドキュメント セットの分類品質に関する詳細な分析の計算を実行します。

[分類ベンチマーク (すべての分類設定)] アイコン [分類ベンチマーク (すべての分類設定)]

[分類ベンチマーク] ウィンドウを表示し、すべてのプロジェクト分類設定を使用して、ベンチマーク セットの分類品質に関する詳細な分析の計算を実行します。

[分類ベンチマーク (分類子別)] アイコン [分類ベンチマーク (特定の分類子)]

[分類ベンチマーク] ウィンドウを表示し、特定の分類子のみを使用して、ベンチマーク セットの分類品質に関する詳細な分析の計算を実行します。

[ベンチマーク] - [抽出] アイコン

[抽出]

[抽出ベンチマーク] ウィンドウを表示し、抽出品質の分析を実行します。抽出ベンチマークの結果を絞り込むには、次のサブメニュー設定のいずれかを選択します。

[ベンチマーク] - [抽出選択されたクラス] アイコン [抽出ベンチマーク (選択したクラス)]

[抽出ベンチマーク] ウィンドウを表示し、現在選択されているクラスの抽出品質の分析を実行します。選択したドキュメント サブセット内のすべてのドキュメントは、選択したクラスの抽出設定を使用して抽出されます。ドキュメントは抽出の実行前には分類されません。ベンチマークの結果をファイルに保存することができます。

[ベンチマーク] - [抽出選択されたクラスおよび子] アイコン [抽出ベンチマーク (選択されたクラスおよび子)]

[抽出ベンチマーク] ウィンドウを表示します。選択したドキュメント サブセットのすべてのドキュメントは、選択したクラスとその子クラスの抽出設定を使用して分類および抽出されます。ただし、抽出ベンチマークの結果では、選択したクラスまたはその子クラスの 1 つとして分類されたドキュメントのみが考慮されます。

同様のフィールドを含む複数の子クラスに共通の基本クラスがある場合は、この設定を使用します。たとえば、請求書、注文、およびその他のドキュメントを処理するプロジェクトがあるとします。請求書クラスには、複数のサプライヤ サブクラスがあります。子クラスにも同様のフィールドがあるため、抽出ベンチマークを実行して、これらのクラスの抽出結果をテストできます。

[ベンチマーク] - [抽出すべてのクラス] アイコン [抽出ベンチマーク (すべてのクラス)]

[抽出ベンチマーク] ウィンドウを表示します。プロジェクト内のすべてのクラスの抽出ベンチマークを実行します。選択したドキュメント サブセット内のすべてのドキュメントが分類され、現在の設定を使用して抽出されます。

同様のフィールドを持つ複数のクラスを含んだプロジェクトがある場合は、この設定を使用します。たとえば、請求書を処理するプロジェクトに、サプライヤごとに異なるクラスがある場合などが挙げられます。