ローカル Fuzzy データベースの追加
このトピックの手順を使用して、ローカル Fuzzy データベースを追加します
ローカル Fuzzy データベースは、ロケータやスクリプトで使用されます。データベースの .CSV または .TXT ファイルが正しくフォーマットされていることを確認してください。
ローカル Fuzzy データベースでサポートされているレコード数以下にすることをお勧めします。サポートされるレコードのデフォルト数は 500 万に設定されています。データベースがこの制限を超えることは可能ですが、必要になるメモリは増大します。ただし、割り当てられるメモリを増やしても、処理速度は低下する場合があります。また、Tungsten Search and Matching Server を通して管理されるリモート Fuzzy データベースを使用することもできます。
手順
-
[プロジェクト] タブの [構成] グループで、[プロジェクト設定]
を選択します。
- データベースの設定を表示するには、[データベース] タブを選択します。
- [データベース] グループで、[追加] を選択します。[新しいデータベースの追加] ウィンドウが表示されます。
- [データベース名] フィールドに、新しい Fuzzy データベースに対するわかりやすい名前を入力します。
- [データベース タイプ] リストで、[ローカル Fuzzy データベース] のタイプを選択します。
- [OK] を選択します。[ローカル Fuzzy データベースのプロパティ] ウィンドウが表示されます。
-
[ローカル Fuzzy データベースのプロパティ] ウィンドウで、次の設定を行います。
-
[参照したインポート ファイル (テキストまたは csv ファイル)] の場所を [ファイル システム] または [Web] のいずれかから選択します。
選択内容に応じて、次のいずれかを実行します。
選択項目
アクション
[Web]
[URL を参照] を選択して、目的の Web アドレスを入力します。
選択したファイルが保護されている場合は、[はい] を選択し、[ユーザー名] と [パスワード] を入力します。
[テスト] を選択して、URL が使用可能であることを確認します。
ソース データベース ファイルのコピーがプロジェクトのファイル システム階層にインポートされ、列のリストが [使用する列] グループに表示されます。
[ファイル システム]
[参照] を選択して、必要な .txt ファイルまたは .csv ファイルに移動します。
ソース データベース ファイルのコピーがプロジェクトのファイル システム階層にインポートされ、列のリストが [使用する列] グループに表示されます。
- [使用する列] グループで、各列に対して [検索] または [フィルタ] を選択して、あいまい検索時の列の動作を指定します。
-
オプション。[使用する列] グループで、最初に行を選択してから列の名前を選択して、名前を変更します。Enter キーを押して変更を保存します。
列の名前を変更すると、下のプレビューが自動的に更新されます。
-
[インポート オプション] グループで、必要に応じて次の設定を構成します。
設定
動作
[大文字と小文字を区別しない]
データベースで大文字と小文字を区別しないようにする場合に選択します。この場合、検索時に、すべての文字列が自動的に小文字に変換されます。この設定はフィルタには適用されません。
[フィルタでは大文字と小文字が区別されます]
[使用する列] テーブルの 1 つ以上のフィールドで [フィルタ] 設定が選択されている場合に使用できます。
スクリプトに入力するフィルタ値がデータベースのエントリと正確に一致している必要がある場合に選択します。
[最初の行にキャプションが含まれています]
ローカル Fuzzy データベースに列ヘッダー名が含まれている場合に選択します。
[フィールド区切り文字]
データベース ソース ファイルの入力フィールドを区切るフィールド区切り文字を入力します。(デフォルト:;)
オプション。タブ文字を追加のフィールド区切り文字として使用するには、[タブ] を選択します。
[単語区切り文字]
データベースに複合語が含まれている場合は、複合語を分割する文字を入力します。(デフォルト:-,)
オプション。[タブ] と [スペース] を単語区切り文字に使用するには、これらの文字を選択します。
[無視する文字]
無視する文字を入力します。これらの文字は、インポート時にデータベース フィールドから除外され、処理前に検索テキストから除外されます。(デフォルト:."'!)
オプション。追加の無視する文字として [スペース] を選択します。
- オプション。[文字列置換] グループで文字列置換を追加、削除、変更、またはインポートします。
-
[最適化] グループで、必要に応じて次の設定を構成します。
設定
動作
[インポート ファイルからの自動更新]
ソース ファイルが変更されたときにデータベースを自動的に更新します。プロジェクトがロードされると、自動更新が行われます。(デフォルト: オフ)
[メモリにデータベース インデックスをロード]
Fuzzy データベースがメモリに保持され、あいまい検索がより効率的に処理されるようになります。このフィールドをクリアすると、メモリの使用量が減りますが、あいまい検索は大幅に遅くなります。(デフォルト: 選択済み)
この設定をクリアすると、[使用する列] グループの [フィルタ] 設定は使用できなくなります。
[データベース処理]
データベース処理の品質を指定して、データベース検索を最適化します。
[ベーシック] に設定すると、[使用する列] グループの [フィルタ] 設定は使用できなくなります。[ベーシック] 設定は、結果の精度が低下する古いアルゴリズムも使用します。精度の低下は、特に大規模なデータベースの場合に顕著になります。小さいデータベースの場合は、この設定を使用すると処理速度が速くなる場合があります。
-
[参照したインポート ファイル (テキストまたは csv ファイル)] の場所を [ファイル システム] または [Web] のいずれかから選択します。
-
[OK] を選択して、ローカル Fuzzy データベースを保存します。
プロパティ ウィンドウが閉じて、[データベース] グループのデータベースのリストに新しいローカル Fuzzy データベースが表示されます。
- オプション。[OK] を選択して [プロジェクト設定] ウィンドウを閉じます。
- プロジェクトの変更を保存します。