形式ロケータ

[形式ロケータ] アイコン形式ロケータは、パターン マッチング (正規表現単純表現) や高度なアルゴリズム (レーベンシュタイントライグラム) などの形式定義で機能します。辞書キーワードと連携した形式定義は、ゾーンを定義する必要がなく、ドキュメントからデータを抽出するために使用されます。ロケータは、ドキュメントのページ全体または一部の読み取りで実行され、ドキュメントのレイアウトではなく、データに固有の検索を使用してデータを抽出します。ロケータは、見つかった候補とデータ出力を評価します。

1 つの形式ロケータに複数の形式定義を追加して、柔軟性を高めることができます。この方法では、形式ロケータがドキュメントを検索し、いずれかの形式定義と一致するすべてのアイテムを収集するため、便利です。形式が単語全体と一致するのか、または一部と一致するのかに応じて、信頼度が割り当てられます。この抽出方法で最終的な信頼度を計算する場合は、キーワードも考慮されます。

形式ロケータを構成するには、選択したクラスに追加します。ロケータ プロパティを変更する前に、クラスのドキュメントを含むドキュメント セットを開きます。次に、ロケータのプロパティを開いて、[形式ロケータ] を構成できます。

一般タブから次のように [形式ロケータ] を管理します。

  • 別のロケータの結果を使用する

  • 正規表現に OCR 置換を使用する

  • 非正規表現の設定を構成する

形式定義タブから次のように [形式ロケータ] を管理します。

[評価設定] タブから次のように [形式ロケータ] を管理します。

形式ロケータのプロパティ ウィンドウ には次のタブがあります。