ローカル Fuzzy データベースの追加
ロケータまたはスクリプトで [ローカル Fuzzy データベース] を使用するには、まずプロジェクトに追加する必要があります。プロジェクトにローカル Fuzzy データベースを追加する前に、.CSV または .TXT ファイルが正しく書式設定されていることを確認してください。
ローカル Fuzzy データベースでサポートされているレコード数以下にすることをお勧めします。サポートされるレコードのデフォルト数は 500 万に設定されています。データベースがこの制限を超えることは可能ですが、必要になるメモリは増大します。ただし、割り当てられるメモリを増やしても、処理速度は低下する場合があります。また、KofaxSearch and Matching Server を通して管理されるリモート Fuzzy データベースを使用することもできます。
[ローカル Fuzzy データベース] を追加することができます。以下の手順に従って、設定します。
- [プロジェクト] タブの [構成] グループで、[プロジェクト設定] を選択します。
- [データベース] タブをクリックしてデータベースの設定を表示します。
- [データベース] グループで、[追加] をクリックします。[新しいデータベースの追加] ウィンドウが表示されます。
- [データベース名] フィールドに、新しい Fuzzy データベースのわかりやすい名前を入力します。
- [データベース タイプ] リストで、[ローカル Fuzzy データベース] のタイプを選択します。
- [OK] をクリックします。[ローカル Fuzzy データベースのプロパティ] ウィンドウが表示されます。
-
[ローカル Fuzzy データベースのプロパティ] ウィンドウで、次の設定を行います。
-
[参照したインポート ファイル (テキストまたは csv ファイル)] の場所を [ファイル システム] または [Web] のいずれかから選択します。
選択内容に応じて、次のいずれかを実行します。
選択項目
アクション
[Web]
[URL を参照] をクリックして、目的の Web アドレスを入力します。
選択したファイルが保護されている場合は、[はい] を選択し、[ユーザー名] と [パスワード] を入力します。
[テスト] をクリックして、URL が使用可能であることを確認します。
ソース データベース ファイルのコピーがプロジェクトのファイル システム階層にインポートされ、列のリストが [列の構成] グループに表示されます。
[ファイル システム]
[参照] をクリックして、必要な .txt ファイルまたは .csv ファイルに移動します。
ソース データベース ファイルのコピーがプロジェクトのファイル システム階層にインポートされ、列のリストが [列の構成] グループに表示されます。
- [列の構成] グループで、各列に対して [検索] または [フィルタ] を選択して、あいまい検索時の列の動作を指定します。
-
必要に応じて、[列の構成] グループで、最初に行を選択してから列の名前をクリックして、名前を変更します。Enter キーを押して変更を保存します。
列の名前を変更すると、下のプレビューが自動的に更新されます。
-
[インポート オプション] グループで、必要に応じて次の設定を構成します。
設定
動作
[大文字と小文字を区別しない]
データベースで大文字と小文字を区別しない場合は、この設定を選択してください。この場合、検索時に、すべての文字列が自動的に小文字に変換されます。この設定はフィルタには適用されません。
[フィルタでは大文字と小文字が区別されます]
この設定は、[列の構成] テーブルの 1 つ以上のフィールドで [フィルタ] 設定が選択されている場合に使用できます。
スクリプトに入力したフィルタ値をデータベースのエントリと正確に一致させる場合は、この設定を選択します。
[最初の行にキャプションが含まれています]
ローカル Fuzzy データベースに列ヘッダー名が含まれる場合は、この設定を選択します。
[フィールド区切り文字]
データベース ソース ファイルの入力フィールドを区切るフィールド区切り文字を入力します。(デフォルト:;)
必要に応じて、[タブ] を選択して、タブ文字を追加のフィールド区切り文字として使用します。
[単語区切り文字]
データベースに複合語が含まれている場合は、複合語を分割する文字を入力します。(デフォルト:-,)
必要に応じて、[タブ] と [スペース] を選択して、これらの文字を単語区切り文字に使用します。
[無視する文字]
無視する文字を入力します。これらの文字は、インポート時にデータベース フィールドから除外され、処理前に検索テキストから除外されます。(デフォルト:."'!)
必要に応じて、追加の無視する文字として [スペース] を選択します。
- 必要に応じて、[文字列置換] グループで文字列置換を追加、削除、変更、またはインポートします。
-
[最適化] グループで、必要に応じて次の設定を構成します。
設定
動作
[インポート ファイルからの自動更新]
ソース ファイルが変更されたときにデータベースを自動的に更新する場合に選択します。プロジェクトがロードされると、自動更新が行われます。(デフォルト:オフ)
[メモリにデータベース インデックスをロード]
選択すると、Fuzzy データベースがメモリに保持され、あいまい検索がより効率的に処理されます。このフィールドをクリアすると、メモリの使用量が減りますが、あいまい検索は大幅に遅くなります。(デフォルト:選択済み)
この設定をクリアすると、[列の構成] グループの [フィルタ] 設定は使用できなくなります。
[データベース処理]
データベース処理の品質を選択して、データベース検索を最適化します。
[基本] に設定すると、[列の構成] グループの [フィルタ] 設定は使用できなくなります。[基本] 設定は、結果の精度が低下する古いアルゴリズムも使用します。精度の低下は、特に大規模なデータベースの場合に顕著になります。小さいデータベースの場合は、この設定を使用すると処理速度が速くなる場合があります。
-
[参照したインポート ファイル (テキストまたは csv ファイル)] の場所を [ファイル システム] または [Web] のいずれかから選択します。
-
[OK] をクリックして、ローカル Fuzzy データベースを保存します。
プロパティ ウィンドウが閉じて、[データベース] グループのデータベースのリストに新しいローカル Fuzzy データベースが表示されます。
- 必要に応じて、[OK] をクリックして [プロジェクト設定] ウィンドウを閉じます。
- プロジェクトの変更を保存します。