抽出オンラインラーニングの有効化

プロジェクトが本番中であっても抽出結果を改善する場合は、抽出オンラインラーニングを使用します。

本番中にドキュメントが収集されるため、プロジェクト自体に変更を加えることなく、後続のバッチで効果を確認できます。

本番中にドキュメントが収集されることで、蓄積された多数のドキュメントがプロジェクトのパフォーマンスに悪影響を与えることがあります。最良の結果を得るには、プロジェクトライフサイクルの推奨事項に従い、最も効率的な方法でトレーニングドキュメントを保存します。

抽出オンラインラーニングを有効にするには、以下の手順に従って、設定します。

オンラインラーニングを有効にします。
[プロジェクト] タブの [構成] グループで、[プロジェクト設定] を選択します。
[一般] タブの [オンラインラーニング] で、[アドバンスト] をクリックします。

[アドバンスト] ウィンドウが表示されます。
[一般設定] グループで、[抽出オンラインラーニングを使用] を選択します。

[抽出オンラインラーニング設定] グループが有効になります。
動的な特定ナレッジベースを使用しない場合は、必要に応じて [抽出時に動的ナレッジベースを使用] をオフにします。

この設定をオフにした場合、抽出を改善するには、プロジェクト管理者が抽出オンラインラーニング用にマークされたドキュメントを手動でインポートおよびレビューし、プロジェクトをトレーニングする必要があります。最良の結果を得るには、この設定をオフにしないでください。
Validation ユーザーがドキュメントをマークする作業を省き、かつ、オンラインラーニング用にマークするドキュメントを決定する複雑なスクリプトを記述しない場合は、[Validation 後に自動トレーニング] を選択します。
この設定を選択すると、オンラインラーニングに適したドキュメントが自動的にマークされます。

オンラインラーニング用にドキュメントを自動的に収集するには、[フィールドの詳細] ウィンドウでドキュメントが監視されるようにフィールドを構成する必要があります。監視できるのは、トレーニング可能なロケータフィールドに割り当てられたフィールドのみです。

これらの設定が両方とも選択されている場合、[インポート用に保管される最大ドキュメント数] の値にまだ達しておらず、ドキュメントのレイアウト ID にまだトレーニングドキュメントが必要なときに、次のいずれかが発生すると、ドキュメントが [抽出オンラインラーニング] 用にマークされます。
- 抽出されたフィールドの信頼度が、特定の信頼度レベルを下回っている。
- Validation 中にフィールド座標が手動で変更された。
必要に応じて、[インポート用に保管される最大ドキュメント数] の値を調整して、収集されるトレーニングドキュメントの数を制限します。

100～20,000 の値のドキュメント数を入力します。
完了したら、[OK] をクリックします。

[アドバンスト] ウィンドウが閉じ、変更が保存されます。
必要に応じて、[OK] をクリックして [プロジェクト設定] ウィンドウを閉じます。
プロジェクトの変更を保存します。

抽出オンライン ラーニングの有効化

抽出オンラインラーニングの有効化