テーブル トレーニング ドキュメントの編集

次の手順では、クラスの [テーブル抽出セット] に 1 つ以上のトレーニング ドキュメントがすでに追加されていることが前提となります。[テーブル抽出セット] にドキュメントが初めて追加された場合、これらのドキュメントは最初はトレーニングから除外され、[トレーニングから除外] アイコンが表示されます。テーブル ラベルがドキュメントに追加されると、ドキュメントがトレーニングに追加されて、[トレーニングに含める] アイコンが表示されます。これにより、少なくとも 1 つのテーブル ラベルがトレーニング ドキュメントに追加されるまで、ドキュメントがトレーニングから除外されます。

[テーブル抽出セット] のテーブル トレーニング ドキュメントを編集するには、以下の手順に従って、設定します。

  1. クラスを選択し、[テーブル抽出セット] を選択します。

    クラスに割り当てられているトレーニング ドキュメントのリストが表示されます。

  2. [ドキュメント] ツールバーで [テーブル トレーニング] [テーブル トレーニング] アイコン をクリックします。

    [テーブル トレーニング] ウィンドウが表示され、ドキュメント セット内のドキュメントごとに検出されたテーブル データが表示されます。

  3. [テーブル トレーニング] ウィンドウのリストを使用してドキュメントの展開または折りたたみを行い、検出されたテーブルを含むページを表示します。選択したページとテーブルを使用してイメージ ビューアが更新されます。現在選択されているテーブルは緑色で強調表示されます。他のすべてのテーブルは青色になります。

    テーブルを構成するには、イメージ ビューア内の強調表示された緑のテーブルをクリックするか、[テーブル ラベルの割り当て] [テーブル ラベルの割り当て] アイコン をクリックします。

    [テーブル ラベルの割り当て] ウィンドウが表示されます。

  4. リストからテーブル モデルを選択して、[OK] をクリックします。

    必要なテーブル モデルが利用できない場合は、[テーブル モデル] をクリックして、新しいテーブル モデルを作成します。

    新しいテーブル モデルが作成されると、[テーブル ラベルの割り当て] ウィンドウに戻ります。新しいテーブル モデルを選択し、[OK] をクリックします。

    イメージ ビューアのテーブルにラベルが適用されます。

  5. テーブル モデルがテーブルに適用されたら、必要に応じてテーブルの列を個別に構成します。新しいラベルの付いたテーブルの列をクリックするか、[列ラベルの割り当て] [列ラベルの割り当て] アイコン をクリックします。

    [列ラベルの割り当て] ウィンドウが表示されます。使用可能な列のリストは、適用されたテーブル モデルの列に限定されています。

  6. リストから適切なバッチを選択して、[OK] をクリックします。

    テーブル モデルに該当する列がない場合は、[テーブル モデル] をクリックしてテーブル モデルを編集し、列を追加します。

  7. このクラスに割り当てられ、[トレーニングに含める] に設定されている [テーブル抽出セット] 内のすべてのドキュメントに対して、手順 3 から 6 を繰り返します。
  8. [テーブル ラベルの設定] [テーブル ラベルの設定] アイコン をクリックして、トレーニング ドキュメントのテーブル ラベル設定を編集します。

    [テーブル ラベルの設定] ウィンドウが表示されます。

  9. リストされたテーブル ラベルごとに、テーブルに [行ヘッダー] を含めるかどうかを選択します。テーブル ラベルごとに 閾値 の値を設定する場合は、[自動最適化の閾値] 設定をオフにしし、必要に応じてスライダーを使用して [閾値] の値を調整します。
  10. [OK] をクリックして、変更を保存します。

    [テーブル ラベルの設定] ウィンドウが閉じます。

  11. [テーブルのトレーニングと分類][トレーニングと分類] アイコン 設定をクリックして、テーブル トレーニング ドキュメントをトレーニングします。

    このトレーニングは、選択したクラスとそのトレーニング ドキュメントに対してのみ実行されます。

    [テーブル トレーニング] ウィンドウのトレーニング結果は、トレーニング ドキュメントを追加する必要がある場合を確認するのに役立ちます。たとえば、特定のテーブル ラベルの信頼度が常に低い場合は、トレーニング ドキュメントを追加します。同様に、特定の列ラベルの信頼度が低い場合は、適切に表現された特定の列が含まれるトレーニング ドキュメントを追加します。

    プロジェクト全体のトレーニングを実行するには、リボンの [プロセス] タブの [抽出およびテーブル抽出] または [テーブル トレーニング] 設定を使用します。プロジェクト全体に対してトレーニングを実行すると、最近変更されたクラスのみがトレーニングされることに注意してください。[テーブル トレーニング] ウィンドウで最近クラスにトレーニングを行った場合、トレーニング ドキュメントに変更がない限り、トレーニングは行われません。

  12. 必要に応じて、トレーニング ドキュメントを追加します。
  13. 必要に応じて、[使用] 列のアイコンをクリックして、ドキュメントをトレーニングから除外します。[トレーニングに含める] アイコンは、ドキュメントが使用されていることを示し、[トレーニングから除外] アイコンは、ドキュメントが除外されていることを示します。
  14. トレーニング結果が適切である場合は、[テーブル トレーニング] ウィンドウを閉じます。
  15. 必要に応じて、リボンの [プロセス] タブで [抽出およびテーブル抽出] [トレーニング] - [抽出] アイコン を選択して、テーブル抽出用にプロジェクト全体をトレーニングします。

    これにより、トレーニング可能なロケータとテーブル抽出用のトレーニングされていないクラスがトレーニングされます。[テーブル トレーニング] ウィンドウで最近クラスにトレーニングを行った場合、そのクラスは再度トレーニングされません。

    プロジェクトはテーブル検出用にトレーニングされています。