抽出オンライン ラーニング

認識結果に不満が残るドキュメントの結果を改善するには、抽出オンライン ラーニングを使用します。

抽出オンライン ラーニングは、トレーニング可能なロケータでのみ使用できます。

抽出オンライン ラーニングのためにドキュメントをマークすると、本番中に同じレイアウトのドキュメントの認識を改善することができます。

この機能を使用するには、ドキュメント フィールドの幾何学的情報が必要です。このタイプの抽出オンライン ラーニングではプロジェクトを手動でトレーニングする必要がなく、請求書を処理するプロジェクトに最適です。

このタイプのラーニングは、本番中にフィールド認識率を最適化するように設計されています。これにより、プロジェクトの初期設定を迅速に行い、本番中に継続的に最適化することができます。

このラーニングは主に、すべてのトレーニング可能なロケータの特定のトレーニング アルゴリズムに基づいています。

ドキュメントに対して抽出オンライン ラーニングを実行すると、本番中に次のプロセスが行われます。

  1. ドキュメントがシステムにスキャンされ、ドキュメント データベースに保存されます。

  2. Transformation Server によってデータベースからドキュメントが取得され、抽出が実行されます。抽出が終了すると、ドキュメントとその抽出結果はデータベースに返されます。

  3. Validation オペレータは、ドキュメント データベース内の更新済みドキュメントを開く検証アクティビティを行います (Thin Client - ドキュメント サービス)。失敗した抽出結果がある場合は、ユーザーが正しい情報を提供します。

    ユーザーがアクティビティを完了すると、検証済みドキュメントが正しいトレーニング情報とともにドキュメント データベースにもう一度返されます。Thin Client によって、変更されたドキュメントが、オンライン ラーニング フォルダと呼ばれるドキュメント データベースの特別な保持領域にもコピーされます。

  4. Transformation Server によって、オンライン ラーニング フォルダに保存されているすべてのドキュメントがスケジュールされた間隔で取得され、プロジェクトが動的にトレーニングされます。検証オペレータが提供したすべての情報が処理され、ダイナミック ナレッジベースに保存されます。

    これらのドキュメントは、[新しいサンプル] ドキュメント セットにもコピーされます。プロジェクト管理者はこのドキュメント セットから Transformation Designer にドキュメントをインポートして、プロジェクトのパフォーマンス向上に役立てることができます。

  5. 次回 Transformation Server が抽出を実行するときは、抽出を支援するためにダイナミック ナレッジベースの情報が使用されます。