テーブル トレーニング ドキュメント
[テーブル抽出セット] にドキュメントが初めて追加された場合、これらのドキュメントは最初はトレーニングから除外され、[トレーニングから除外] アイコンが表示されます。テーブル ラベルがドキュメントに追加されると、ドキュメントがトレーニングに追加されて、[トレーニングに含める] アイコンが表示されます。これは、少なくとも 1 つのテーブル ラベルがトレーニング ドキュメントに追加されるまで、ドキュメントがトレーニングから除外されることを意味します。テーブル ラベルのないドキュメントを手動で含めることはできますが、トレーニングで問題が発生する可能性があります。
ドキュメントのトレーニングとテーブル検出に関しては、次の事項に注意してください。
-
含まれているドキュメント内のすべてのテーブルは、ラベルのないテーブルであっても、トレーニングに使用されます
-
ラベルのないテーブルには、「不明」のラベルが自動的に付けられます
-
除外されたドキュメントのテーブルは、ラベルが付いている場合でも、トレーニングには使用されません
-
除外されたドキュメントのすべてのテーブルには、「不明」のラベルが自動的に付けられます
-
このようなラベルのないテーブルであっても、含まれているドキュメント内のラベルの付いたテーブルと照合されます
-
-
2 つの異なるテーブルに同じテーブル ラベルが割り当てられている場合、または同じ種類の 2 つのテーブルに異なるラベルが割り当てられている場合、テーブルの分類はうまく機能しません
-
含まれているドキュメント内にある、関連するすべてのテーブルにラベルを付けるか、そのドキュメントをトレーニングから完全に除外することをお勧めします。
含まれているドキュメントにラベルがない場合、このドキュメントに他の場所にあるラベル付きのテーブルと同様のテーブルが含まれていると、トレーニングに悪影響を及ぼします。
テーブル トレーニング ドキュメントを編集する場合は、1 つ以上のテーブル モデルが必要です。テーブルのラベリングを開始するときにテーブル モデルが存在しない場合は、テーブル トレーニング ドキュメントを編集するときにオンデマンドで作成できます。テーブル モデルは [プロジェクト設定] - [テーブル] タブで管理されます。
各テーブル ラベルは、特定のテーブル モデルを指しています。ただし、ドキュメント内のテーブルには、テーブル モデルを指すテーブル ラベル以外の追加設定を含めることができます。1 つのドキュメントに同じテーブル モデルを使用するテーブル ラベルを複数設定したり、これらのテーブル ラベルごとに設定を変更することもできます。
次の作業
-
トレーニング ドキュメントを [テーブル抽出セット] に追加します。
-
テーブル トレーニング ドキュメントを編集します。
-
必要に応じて、[アドバンスト テーブル ロケータ] を追加するか、テーブル検出データを使用するスクリプトを追加します。
-
適切なサンプル ドキュメントを使用して変更をテストします。
関連トピック: