ローカル Fuzzy データベースの追加

ロケータまたはスクリプトで [ローカル Fuzzy データベース] を使用するには、まずプロジェクトに追加する必要があります。プロジェクトにローカル Fuzzy データベースを追加する前に、.CSV または .TXT ファイルが正しく書式設定されていることを確認してください。

ローカル Fuzzy データベースでサポートされているレコード数以下にすることをお勧めします。サポートされるレコードのデフォルト数は 500 万に設定されています。データベースがこの制限を超えることは可能ですが、必要になるメモリは増大します。ただし、割り当てられるメモリを増やしても、処理速度は低下する場合があります。また、KofaxSearch and Matching Server を通して管理されるリモート Fuzzy データベースを使用することもできます。

[ローカル Fuzzy データベース] を追加することができます。以下の手順に従って、設定します。

  1. [プロジェクト] タブの [構成] グループで、[プロジェクト設定] [プロジェクト設定] アイコン を選択します。
  2. [データベース] タブをクリックしてデータベースの設定を表示します。
  3. [データベース] グループで、[追加] をクリックします。[新しいデータベースの追加] ウィンドウが表示されます。
  4. [データベース名] フィールドに、新しい Fuzzy データベースのわかりやすい名前を入力します。
  5. [データベース タイプ] リストで、[ローカル Fuzzy データベース] のタイプを選択します。
  6. [OK] をクリックします。[ローカル Fuzzy データベースのプロパティ] ウィンドウが表示されます。
  7. [ローカル Fuzzy データベースのプロパティ] ウィンドウで、次の設定を行います。
    1. [参照したインポート ファイル (テキストまたは csv ファイル)] の場所を [ファイル システム] または [Web] のいずれかから選択します。

      選択内容に応じて、次のいずれかを実行します。

      選択項目

      アクション

      [Web]

      [URL を参照] をクリックして、目的の Web アドレスを入力します。

      選択したファイルが保護されている場合は、[はい] を選択し、[ユーザー名][パスワード] を入力します。

      [テスト] をクリックして、URL が使用可能であることを確認します。

      ソース データベース ファイルのコピーがプロジェクトのファイル システム階層にインポートされ、列のリストが [列の構成] グループに表示されます。

      [ファイル システム]

      [参照] をクリックして、必要な .txt ファイルまたは .csv ファイルに移動します。

      ソース データベース ファイルのコピーがプロジェクトのファイル システム階層にインポートされ、列のリストが [列の構成] グループに表示されます。

    2. [列の構成] グループで、各列に対して [検索] または [フィルタ] を選択して、あいまい検索時の列の動作を指定します。
    3. 必要に応じて、[列の構成] グループで、最初に行を選択してから列の名前をクリックして、名前を変更します。Enter キーを押して変更を保存します。

      列の名前を変更すると、下のプレビューが自動的に更新されます。

    4. [インポート オプション] グループで、必要に応じて次の設定を構成します。

      設定

      動作

      [大文字と小文字を区別しない]

      データベースで大文字と小文字を区別しない場合は、この設定を選択してください。この場合、検索時に、すべての文字列が自動的に小文字に変換されます。この設定はフィルタには適用されません。

      [フィルタでは大文字と小文字が区別されます]

      この設定は、[列の構成] テーブルの 1 つ以上のフィールドで [フィルタ] 設定が選択されている場合に使用できます。

      スクリプトに入力したフィルタ値をデータベースのエントリと正確に一致させる場合は、この設定を選択します。

      [最初の行にキャプションが含まれています]

      ローカル Fuzzy データベースに列ヘッダー名が含まれる場合は、この設定を選択します。

      [フィールド区切り文字]

      データベース ソース ファイルの入力フィールドを区切るフィールド区切り文字を入力します。(デフォルト:;)

      必要に応じて、[タブ] を選択して、タブ文字を追加のフィールド区切り文字として使用します。

      [単語区切り文字]

      データベースに複合語が含まれている場合は、複合語を分割する文字を入力します。(デフォルト:-,)

      必要に応じて、[タブ][スペース] を選択して、これらの文字を単語区切り文字に使用します。

      [無視する文字]

      無視する文字を入力します。これらの文字は、インポート時にデータベース フィールドから除外され、処理前に検索テキストから除外されます。(デフォルト:."'!)

      必要に応じて、追加の無視する文字として [スペース] を選択します。

    1. 必要に応じて、[文字列置換] グループで文字列置換を追加、削除、変更、またはインポートします。
    2. [最適化] グループで、必要に応じて次の設定を構成します。

      設定

      動作

      [インポート ファイルからの自動更新]

      ソース ファイルが変更されたときにデータベースを自動的に更新する場合に選択します。プロジェクトがロードされると、自動更新が行われます。(デフォルト:オフ)

      [メモリにデータベース インデックスをロード]

      選択すると、Fuzzy データベースがメモリに保持され、あいまい検索がより効率的に処理されます。このフィールドをクリアすると、メモリの使用量が減りますが、あいまい検索は大幅に遅くなります。(デフォルト:選択済み)

      この設定をクリアすると、[列の構成] グループの [フィルタ] 設定は使用できなくなります。

      [データベース処理]

      データベース処理の品質を選択して、データベース検索を最適化します。

      [基本] に設定すると、[列の構成] グループの [フィルタ] 設定は使用できなくなります。[基本] 設定は、結果の精度が低下する古いアルゴリズムも使用します。精度の低下は、特に大規模なデータベースの場合に顕著になります。小さいデータベースの場合は、この設定を使用すると処理速度が速くなる場合があります。

  8. [OK] をクリックして、ローカル Fuzzy データベースを保存します。

    プロパティ ウィンドウが閉じて、[データベース] グループのデータベースのリストに新しいローカル Fuzzy データベースが表示されます。

  9. 必要に応じて、[OK] をクリックして [プロジェクト設定] ウィンドウを閉じます。
  10. プロジェクトの変更を保存します。