[テーブル抽出セット] へのドキュメントの追加

テーブルの対応関係をプロジェクトに指示するには、トレーニング ドキュメントを [テーブル抽出セット] に追加する必要があります。すべてのトレーニング ドキュメントと同様に、これらのドキュメントは理想的であることのほかに、処理することが予想される典型的なドキュメント サンプルであることも必要です。ドキュメントの画像にノイズや歪みが多く含まれている場合、抽出結果が不適切になる可能性があります。

最良の結果を得るには、テーブル抽出に使用されるドキュメントを [テーブル抽出セット] に追加する前に、これらのすべてのドキュメントが既に分類および認識されていることを確認してください。

選択したクラスの [テーブル抽出セット] にドキュメントを追加するには、以下の手順に従って、設定します。

  1. トレーニングに使用するドキュメントを含む [テスト セット] がまだ開かれていない場合は、開きます。

    最良の結果を得るには、これらのドキュメントが分類済みであり、認識結果が作成されていることを確認してください。

  2. [プロジェクト ツリー] でクラスを選択します。

    [テーブル検出の有効化] 設定が有効になっていることを確認します。有効になっていない場合は、このクラスに対して有効にするように求めるメッセージが表示されます。

  3. [テスト セット] 内の 1 つ以上のドキュメントを右クリックし、[選択したクラスのトレーニング セットに追加 (テーブル抽出)] を選択します。

    ドキュメントが [テーブル抽出セット] に追加されます。

    このドキュメント セットにドキュメントが初めて追加された場合、これらのドキュメントはトレーニングから除外されます。これは、[使用] 列の [トレーニングから除外] アイコンで示されます。ドキュメントをテーブル トレーニングに含めるには、ドキュメントごとに少なくとも 1 つのテーブル ラベルが必要です。これらのドキュメントにテーブル ラベルが追加されると、アイコンが [トレーニングに含める] に変わります。

  4. 他のドキュメントとクラスにこれらの手順を繰り返します。

次の作業

テーブル検出ではドキュメント内の複数のテーブルを検出できるため、テーブル トレーニング ドキュメントを編集して、ドキュメント内のどのテーブルを対象とするのかをプロジェクトに指示する必要があります。

関連トピック: