グループ ロケータのトレーニング タイプ

トレーニング タイプにより、ロケータのトレーニング中に使用するアルゴリズムを定義して、ドキュメントの抽出をどのように行うかを指定します。ロケータのトレーニング タイプに対して行った変更は、プロジェクトの再トレーニング後に有効になります。ロケータのトレーニング タイプが、使用するナレッジベースに影響を及ぼしたり制限を与えたりすることはありません。ナレッジベースを作成する際に、ナレッジベースを作成するためのアルゴリズムを選択できます。最良の結果を得るには、汎用ナレッジベースを使用し、新たにトレーニングしたドキュメントのトレーニング タイプを [特定] に制限します。この組み合わせによって、認定済みの汎用ナレッジベースを使用できるようになるため、オンライン ラーニング中に特定のドキュメント トレーニングを改善できます。

トレーニング タイプには次のようなものがあります。

汎用

このタイプは主に、候補またはフィールドに関連するキーワードおよびキーワードの場所に基づきます。そのため、この設定を選択した場合は、ドキュメントからデータを抽出するための良好な OCR 品質が必要になります。汎用トレーニングでは、トレーニング済みのサンプル ドキュメントの一部に含まれるキーワードと同様のキーワードを含む未知のドキュメントから値を抽出することもできます。

特定

このタイプは、サンプル ドキュメントのレイアウトを学習し、同じレイアウトを持つ別のドキュメントにのみ抽出を適用します。これは通常、同一のベンダーの請求書などに使用します。トレーニング済みのレイアウトであるため、特定のトレーニングでは、制限されたキーワード、固定位置、および既知のフィールド形式を組み合わせて使用することができます。これらを組み合わせることで、一般的な抽出よりもはるかに高い認識精度が得られます。ただし、このタイプのトレーニングは、トレーニング済みのレイアウトでのみ機能します。

両方

両方のトレーニング タイプを使用する場合、フィールドに対して、一般的な検索方法と特定の検索方法によるトレーニングが行われます。抽出中に特定の検索が最初に実行され、結果が見つかるとロケータは特定の検索メソッドの結果のみを返します。結果が見つからない場合は汎用検索メソッドが実行され、結果が見つかるとロケータはそれらの結果を返します。