抽出オンラインラーニング

認識結果に不満が残るドキュメントの結果を改善するには、抽出オンラインラーニングを使用します。

抽出オンラインラーニングは、トレーニング可能なロケータでのみ使用できます。

抽出オンラインラーニングのためにドキュメントをマークすると、本番中に同じレイアウトのドキュメントの認識を改善することができます。

この機能を使用するには、ドキュメントフィールドの幾何学的情報が必要です。このタイプの抽出オンラインラーニングではプロジェクトを手動でトレーニングする必要がなく、請求書を処理するプロジェクトに最適です。

このタイプのラーニングは、本番中にフィールド認識率を最適化するように設計されています。これにより、プロジェクトの初期設定を迅速に行い、本番中に継続的に最適化することができます。

このラーニングは主に、すべてのトレーニング可能なロケータの特定のトレーニングアルゴリズムに基づいています。

ドキュメントに対して抽出オンラインラーニングを実行すると、本番中に次のプロセスが行われます。

ドキュメントがシステムにスキャンされ、ドキュメントデータベースに保存されます。
Transformation Server によってデータベースからドキュメントが取得され、抽出が実行されます。抽出が終了すると、ドキュメントとその抽出結果はデータベースに返されます。
Validation オペレータは、ドキュメントデータベース内の更新済みドキュメントを開く検証アクティビティを行います (Thin Client - ドキュメントサービス)。失敗した抽出結果がある場合は、ユーザーが正しい情報を提供します。

ユーザーがアクティビティを完了すると、検証済みドキュメントが正しいトレーニング情報とともにドキュメントデータベースにもう一度返されます。Thin Client によって、変更されたドキュメントが、オンラインラーニングフォルダと呼ばれるドキュメントデータベースの特別な保持領域にもコピーされます。
Transformation Server によって、オンラインラーニングフォルダに保存されているすべてのドキュメントがスケジュールされた間隔で取得され、プロジェクトが動的にトレーニングされます。検証オペレータが提供したすべての情報が処理され、ダイナミックナレッジベースに保存されます。

これらのドキュメントは、[新しいサンプル] ドキュメントセットにもコピーされます。プロジェクト管理者はこのドキュメントセットから Transformation Designer にドキュメントをインポートして、プロジェクトのパフォーマンス向上に役立てることができます。
次回 Transformation Server が抽出を実行するときは、抽出を支援するためにダイナミックナレッジベースの情報が使用されます。

抽出オンライン ラーニング

抽出オンラインラーニング