ナレッジベース

Kofax TotalAgility のナレッジベースは、抽出パターンの保存に使用される、バイナリファイルのリポジトリです。

ユーザーがナレッジベースを新しいプロジェクトにインポートすると、継承されたナレッジにより、プロジェクトは特定の割合の請求書からすぐにデータを抽出できます。1 つのプロジェクトに複数のナレッジベースが対応している場合があります。

適切に抽出されなかったドキュメントは、プロジェクトの抽出結果を改善するために使用できます。このトレーニングは通常、トレーニングセットに置かれたサンプルドキュメントを処理するシステム管理者の責任で行います。トレーニングセッション中に、プロジェクトとともに保存される新しい抽出パターンが作成されます。

この新しい抽出パターンをナレッジベースに追加して、移植可能にすることもできます。この操作を行うと、そのナレッジベースを使用するすべてのプロジェクトがトレーニングの恩恵を受けることになります。

Kofax TotalAgility は、関連する抽出パターンの情報のみをナレッジベースに保存します。ナレッジベースからトレーニングドキュメントのコンテンツにアクセスしたり、表示したりすることはできません。

5 つのタイプの利用可能なナレッジベースに、次の情報が保存されます。

さまざまなタイプのナレッジベースに加えて、汎用アルゴリズムと特定のアルゴリズムという、2 つのアルゴリズムのいずれかを使用して抽出パターンを作成できます。

両方の抽出パターンを提供するには、アルゴリズムタイプごとに異なるナレッジベースを作成します。ただし、トレーニング可能なテーブルのナレッジベースで使用できるアルゴリズムは限定されるため、最大で 9 種類の異なるナレッジベースを作成できます。

抽出オンラインラーニングを行うと、本番システム内ですぐにフィードバックループが発生します。トレーニングドキュメントのナレッジを利用して抽出率を改善するために、手動で操作する必要はありません。