ナレッジベース
Kofax TotalAgility のナレッジベースは、抽出パターンの保存に使用される、バイナリ ファイルのリポジトリです。
ユーザーがナレッジベースを新しいプロジェクトにインポートすると、継承されたナレッジにより、プロジェクトは特定の割合の請求書からすぐにデータを抽出できます。1 つのプロジェクトに複数のナレッジベースが対応している場合があります。
適切に抽出されなかったドキュメントは、プロジェクトの抽出結果を改善するために使用できます。このトレーニングは通常、トレーニング セットに置かれたサンプル ドキュメントを処理するシステム管理者の責任で行います。トレーニング セッション中に、プロジェクトとともに保存される新しい抽出パターンが作成されます。
この新しい抽出パターンをナレッジベースに追加して、移植可能にすることもできます。この操作を行うと、そのナレッジベースを使用するすべてのプロジェクトがトレーニングの恩恵を受けることになります。
Kofax TotalAgility は、関連する抽出パターンの情報のみを ナレッジベースに保存します。ナレッジベースからトレーニング ドキュメントのコンテンツにアクセスしたり、表示したりすることはできません。
5 つのタイプの利用可能なナレッジベースに、次の情報が保存されます。
- 金額グループ (*.kba) - 小計や合計などの、金額フィールドの抽出パターンを保存します。
- 請求書グループ (*.kbi) - 請求書番号や請求書日付などの、請求書フィールドのパターンを保存します。
- 注文グループ (*.kbo) - 注文番号や注文日付などの、注文フィールドの抽出パターンを保存します。
- トレーニング可能なグループ (*.kbtgl) - その他のグループ ロケータではカバーされないフィールドの任意の値のパターンを保存します。
- トレーニング可能なテーブル (*.kbtbl) - テーブル内のさまざまなタイプのフィールドの抽出パターンを保存します。
さまざまなタイプのナレッジベースに加えて、汎用アルゴリズムと特定のアルゴリズムという、2 つのアルゴリズムのいずれかを使用して抽出パターンを作成できます。
両方の抽出パターンを提供するには、アルゴリズム タイプごとに異なるナレッジベースを作成します。ただし、トレーニング可能なテーブルのナレッジベースで使用できるアルゴリズムは限定されるため、最大で 9 種類の異なるナレッジベースを作成できます。
抽出オンライン ラーニングを行うと、本番システム内ですぐにフィードバック ループが発生します。トレーニング ドキュメントのナレッジを利用して抽出率を改善するために、手動で操作する必要はありません。