[テーブル抽出セット]
このドキュメント セットを使用して、テーブル検出をトレーニングします。ドキュメントを追加してトレーニングすると、プロジェクトが本番環境にある場合のアドバンスト テーブルの認識が向上します。
プロジェクトが時間の経過とともに変化する場合、または新しいテーブルが認識されない場合、唯一の解決策は手作業によるトレーニングとなります。これは、テーブル検出に対するオンライン ラーニング機能がないためです。オンライン ラーニングを行う代わりに、新しいテーブル トレーニング ドキュメントを追加して編集し、プロジェクトを再トレーニングしてから、プロジェクトをリリースします。その後処理されるドキュメントには、新しいトレーニング基準を満たす欠落していたテーブルを取り入れる必要があります。認識結果が低下する場合や新しいテーブルが導入された場合は、この手順を繰り返します。
このドキュメント セットには、<すべてのドキュメント> ドキュメント サブセットのみが含まれます。ドキュメントは [フィルタ] の選択に基づいて表示または非表示になり、[テーブル トレーニング] ウィンドウは <選択されたクラス> フィルタで動作します。[プロジェクト ツリー] でクラスを選択すると、そのクラスのテーブル トレーニング ドキュメントのみが表示されます。
分類されていないドキュメントを [テーブル抽出セット] に追加した場合は、<フィルタなし> フィルタを選択したときにのみ表示され、[トレーニングから除外] アイコン が付加されます。このため、Kofax では、[テーブル抽出セット] にドキュメントを追加する前にドキュメントを分類し、認識結果を作成しておくことを推奨しています。
選択したクラスの [テーブル抽出セット] に分類済みのドキュメントが初めて追加された場合、これらのドキュメントは最初はトレーニングから除外され、[トレーニングから除外] アイコンが表示されます。テーブル ラベルをドキュメントに追加すると、ドキュメントは自動的にトレーニングに追加され、[トレーニングに含める] アイコンが表示されます。これは、少なくとも 1 つのテーブル ラベルがトレーニング ドキュメントに追加されるまで、ドキュメントがトレーニングから除外されることを意味します。テーブル ラベルのないドキュメントを手動で含めることはできますが、トレーニングで問題が発生する可能性があります。
ドキュメント サブセットからドキュメントを削除せずに、ドキュメントをテーブル トレーニングから手動で除外することができます。これは、[使用] 列のアイコンをクリックして行います。[トレーニングに含める] アイコン は、ドキュメントがトレーニングに使用されていることを示す場合に使用されます。[トレーニングから除外] アイコン は、トレーニング ドキュメントがトレーニングに含まれていないことを示します。割り当てられていないドキュメントを表示するには、[フィルタ] を <フィルタなし> に設定する必要が生じる場合があります。
ドキュメントがトレーニング から除外されている場合でも、ドキュメントは [テーブル トレーニング] ウィンドウに表示されます。ただし、このドキュメントが除外されていることを示すインジケータがあり、除外されている場合でも予測されたラベルが表示されます。つまり、ドキュメントがトレーニングから除外されている場合でも、テーブル検出情報は [トレーニング] ウィンドウに表示されます。ただし、この情報はトレーニング データから除外されます。
テーブル トレーニングでは、割り当てられたクラスを使用して、クラス レベルのトレーニング用にドキュメントを収集します。トレーニングが実行されると、選択したクラスのドキュメントのうち、確認および保護されているものがすべてトレーニングに使用されます。除外されたドキュメントは分類されますが、トレーニング データには含まれません。
このドキュメント セットに、2000 を超えるトレーニング ドキュメントを含めることはできません。この上限を超えると、プロジェクトのパフォーマンスに悪影響を及ぼす可能性があります。
[テーブル抽出セット] は次の方法で管理できます。
-
[テーブル抽出セット] 内のドキュメント サブセットにドキュメントを追加する
-
[テーブル抽出セット] を整理するのに役立つドキュメント サブセットを追加する
-
選択したクラスの [テーブル抽出セット] にドキュメントを追加する
-
テーブル トレーニング ドキュメントを編集する
-
[テーブル抽出セット] からドキュメント サブセットまたはドキュメントを削除する
-
列データに基づいてドキュメントを並べ替える
関連トピック: