オンライン学習
オンライン学習によって、抽出結果が向上します。ドキュメントの抽出結果が不十分な場合は、正しいデータを提供してから、そのドキュメントをオンライン学習用にマーキングできます。TotalAgility で以降のドキュメントを処理する際に、学習した新しいドキュメントによって、同様の抽出エラーを最小限に抑えることができます。
TotalAgility は、ドキュメントのコンテンツを抽出し、そのコンテンツを有意味な構造で格納します。オンライン学習によって、学習可能なロケーターが運用中に動的なナレッジ ベースを使用して、効率的にコンテンツを検索および抽出できるようになります。動的に学習したコンテンツは、そのナレッジ ベースに追加されます。ソリューション インテグレータが学習データを確認した後で、そのデータが静的なナレッジ ベースに発行されます。この静的ナレッジ ベースはバイナリ ファイルで、他のプロジェクト ファイルと一緒に格納されます。オンライン学習用の動的ナレッジ ベースは、データ リポジトリに格納されます。
オンライン学習用にドキュメントが選択されると、学習アルゴリズムがそのドキュメントのメタデータを検索し、学習可能なロケーターにとって意味のある情報を抽出します。
次の場合に、ドキュメントをオンライン学習用にマーキングできます。
-
ドキュメントが正しく分類されていない。
-
特定のオンライン学習用にドキュメントを既にマーキングしておらず、抽出が不十分で、そのドキュメントがそのクラスの典型的な例である。
- 自動マーキング
-
1 つのドキュメント グループに対してオンライン学習と自動オンライン学習の両方が有効になっている場合は、特定のフィールドによって、ドキュメントをオンライン学習用に自動的にマーキングできます。これらのフィールドでは、
Monitor for Automatic Online Learning
プロパティが有効になります。オペレータが、抽出プロセスによって選択されたものとは異なる、監視対象フィールド用の認識結果を選択すると、オンライン学習が自動的に有効になります。オペレータが新しいテキストを入力した場合は、その認識が完全に失敗したことを意味し、オンライン学習をそのフィールドに対して使用することはできません。その結果、プロパティの設定には関係なく、自動的に有効化されることはありません。
[オンライン学習] ボタンが表示されている場合、オペレータは、監視対象フィールドによってそのドキュメントが有効化された後に、キャンセルまたはマーキング解除することができます。