抽出オンライン ラーニングの有効化
プロジェクトが本番中であっても抽出結果を改善する場合は、抽出オンライン ラーニングを使用します。
本番中にドキュメントが収集されるため、プロジェクト自体に変更を加えることなく、後続のバッチで効果を確認できます。
本番中にドキュメントが収集されることで、蓄積された多数のドキュメントがプロジェクトのパフォーマンスに悪影響を与えることがあります。最良の結果を得るには、プロジェクト ライフ サイクルの推奨事項に従い、最も効率的な方法でトレーニング ドキュメントを保存します。
抽出オンライン ラーニングを有効にするには、以下の手順に従って、設定します。
- オンライン ラーニングを有効にします。
- [プロジェクト] タブの [構成] グループで、[プロジェクト設定] を選択します。
-
[一般] タブの [オンライン ラーニング] で、[アドバンスト] をクリックします。
[アドバンスト] ウィンドウが表示されます。
-
[一般設定] グループで、[抽出オンライン ラーニングを使用] を選択します。
[抽出オンライン ラーニング設定] グループが有効になります。
-
動的な特定ナレッジベースを使用しない場合は、必要に応じて [抽出時に動的ナレッジベースを使用] をオフにします。
この設定をオフにした場合、抽出を改善するには、プロジェクト管理者が抽出オンライン ラーニング用にマークされたドキュメントを手動でインポートおよびレビューし、プロジェクトをトレーニングする必要があります。最良の結果を得るには、この設定をオフにしないでください。
-
Validation ユーザーがドキュメントをマークする作業を省き、かつ、オンライン ラーニング用にマークするドキュメントを決定する複雑なスクリプトを記述しない場合は、[Validation 後に自動トレーニング] を選択します。
この設定を選択すると、オンライン ラーニングに適したドキュメントが自動的にマークされます。
オンライン ラーニング用にドキュメントを自動的に収集するには、[フィールドの詳細] ウィンドウでドキュメントが監視されるようにフィールドを構成する必要があります。監視できるのは、トレーニング可能なロケータ フィールドに割り当てられたフィールドのみです。
これらの設定が両方とも選択されている場合、[インポート用に保管される最大ドキュメント数] の値にまだ達しておらず、ドキュメントのレイアウト ID にまだトレーニング ドキュメントが必要なときに、次のいずれかが発生すると、ドキュメントが [抽出オンライン ラーニング] 用にマークされます。
-
抽出されたフィールドの信頼度が、特定の信頼度レベルを下回っている。
-
Validation 中にフィールド座標が手動で変更された。
-
-
必要に応じて、[インポート用に保管される最大ドキュメント数] の値を調整して、収集されるトレーニング ドキュメントの数を制限します。
100~20,000 の値のドキュメント数を入力します。
-
完了したら、[OK] をクリックします。
[アドバンスト] ウィンドウが閉じ、変更が保存されます。
- 必要に応じて、[OK] をクリックして [プロジェクト設定] ウィンドウを閉じます。
- プロジェクトの変更を保存します。