推奨フィールドの抽出

データのペア、つまりキーと対応する値のペアを見つけるために、別の AI エンジンが事前にトレーニングされています。提案フィールドはドキュメント上でハイライトされ、キーは黄色、キーの値は青色で表示されます。

提案フィールドを選択して、抽出を構成します。抽出するすべての提案フィールドに対して、この手順を繰り返します。フィールドの提案を非表示にするには、 [推奨フィールドを非表示] をクリックして、推奨フィールドをオフに切り替えます。

AI エンジンでは類似したキーワードが統合されるため、キーワードのすべてのバリエーションを追加する必要はありません。ただし、キーワードを追加するときは次の点に注意してください。

  • キーワードの照合では大文字と小文字は区別されません。

  • セミコロンは単語の区切り文字です。

  • 空の値は削除されます。

    たとえば、Acct_Number; ;Acct_Name は自動的に Acct_Number;Acct_Name に変換されます。

  • 次の文字が検出された場合は、抽出結果から削除されます。

    ./\"!?':-_

    たとえば、これらの文字を削除すると、InvoiceNrInvoice-Nr、または 01764578970176/457897 の間の一致信頼度が高まります。

Quick Capture ソリューションを 8.0.0 より前のバージョンの Tungsten TotalAgility で開くと、既存のドキュメントの推奨フィールドに基づいて追加の抽出方法やフィールド データは追加されません。ドキュメントを再度アップロードします。それにより、AI エンジンが実行され、推奨フィールドの情報が生成されます。

このトピックでは、フィールド抽出の有効化 の手順をすでに実行していることを前提としています。

次の手順に従って、抽出用の推奨フィールドを追加できます。

  1. まだ有効になっていない場合は、 [推奨フィールドを表示] をクリックして、推奨フィールドをオンに切り替えます。

    すでにトレーニング済みのフィールドは緑色で強調表示されます。使用可能なペアは黄色と青で強調表示され、黄色はキー、青はそれに対応する値を示します。キーの上にマウス カーソルを置くと、その値が表示されます。値の上にマウス カーソルを置くと、そのキーが表示されます。値が大きく離れている場合は、マウス カーソルを置くとリンクが線で示されます。

  2. 抽出する推奨フィールド ペアをクリックします。

    フィールド値は青で、対応するキーは黄色です。

    選択したフィールドに対して、[推奨フィールドを追加] ウィンドウが表示されます。

    [選択された項目] フィールドに値が入力され、[名前] フィールドに選択したフィールドのキーが入力されます。

  3. 新しいフィールドの場合は、[新規または既存?] 設定を [新しいフィールド] に設定します。

    同じ内容のフィールドをすでに追加している場合は、既存のフィールドに基づいてフィールドを追加することを検討してください。

  4. 必要に応じて、次の [詳細設定] を設定します。
    1. リストから [タイプ] を選択します。

      ここで選択した値に応じて、下に異なる設定が表示されます。

    2. オプション。[フォーマッタ] を選択します。

      システム内の [デフォルトの日付フォーマッタ][デフォルトの金額フォーマッタ] を編集し、お住まいの国で使用されている最も一般的な入力形式を使用するように調整します。

    3. オプション。[キーワード] を追加します。

      これは、セミコロンで区切られた可能なフィールド ラベルのリストです。このタイプのドキュメント間でラベルが異なる場合にのみ必要です。

    4. フィールドがドキュメントに常に存在する必要がある場合は、[必須です] を選択します。それ以外の場合は、未選択のままにしておきます。
    5. 以下の設定は、[タイプ] で選択した値によって異なります。以下の表の関連する値に対する手順に従います。

      タイプ

      手順

      テキスト

      1. オプション。[最小文字長] の値を選択して指定します。

      2. オプション。[最大文字長] の値を選択して指定します。

      3. オプション。[許可される文字の定義] を選択し、文字のリストを入力します。このリストはリテラルなので、区切り文字は必要ありません。

      4. オプション。[制限された文字の定義] を選択し、許可されない文字のリストを入力します。このリストはリテラルなので、区切り文字は必要ありません。

      [日付]

      1. [参照日] を選択します。

        [固定の日付] を選択した場合は、カレンダーから日付を選択します。

      2. オプション。[参照日の前の期間] を選択し、ドキュメントが特定の期間内に収まるように日数を指定します。

      3. オプション。[参照日の後の期間] を選択し、ドキュメントが特定の期間内に収まるように日数を指定します。

      [数字]

      このタイプのフィールドには追加の手順は必要ありません。

  5. [保存] をクリックします。

    [推奨フィールドを追加] ウィンドウが閉じ、選択したドキュメント タイプにフィールドが追加されます。

    選択したドキュメント タイプに対してトレーニングが自動的に実行されます。トレーニングの円形アイコンがオレンジ色の場合は、このフィールドを追加ドキュメントに追加します。

  6. オプション。抽出用の追加フィールドを追加します。

    トレーニングの円が緑色になったら、フィールドを追加する必要はなくなります。