ローカル Fuzzy データベースの追加

このトピックの手順を使用して、ローカル Fuzzy データベースを追加します

ローカル Fuzzy データベースは、ロケータやスクリプトで使用されます。データベースの .CSV または .TXT ファイルが正しくフォーマットされていることを確認してください。

ローカル Fuzzy データベースでサポートされているレコード数以下にすることをお勧めします。サポートされるレコードのデフォルト数は 500 万に設定されています。データベースがこの制限を超えることは可能ですが、必要になるメモリは増大します。ただし、割り当てられるメモリを増やしても、処理速度は低下する場合があります。また、Tungsten Search and Matching Server を通して管理されるリモート Fuzzy データベースを使用することもできます。

手順

[プロジェクト] タブの [構成] グループで、[プロジェクト設定] を選択します。
データベースの設定を表示するには、[データベース] タブを選択します。
[データベース] グループで、[追加] を選択します。[新しいデータベースの追加] ウィンドウが表示されます。
[データベース名] フィールドに、新しい Fuzzy データベースに対するわかりやすい名前を入力します。
[データベースタイプ] リストで、[ローカル Fuzzy データベース] のタイプを選択します。
[OK] を選択します。[ローカル Fuzzy データベースのプロパティ] ウィンドウが表示されます。

[ローカル Fuzzy データベースのプロパティ] ウィンドウで、次の設定を行います。

[参照したインポートファイル (テキストまたは csv ファイル)] の場所を [ファイルシステム] または [Web] のいずれかから選択します。

選択内容に応じて、次のいずれかを実行します。

選択項目	アクション
[Web]	[URL を参照] を選択して、目的の Web アドレスを入力します。選択したファイルが保護されている場合は、[はい] を選択し、[ユーザー名] と [パスワード] を入力します。 [テスト] を選択して、URL が使用可能であることを確認します。ソースデータベースファイルのコピーがプロジェクトのファイルシステム階層にインポートされ、列のリストが [使用する列] グループに表示されます。
[ファイルシステム]	[参照] を選択して、必要な .txt ファイルまたは .csv ファイルに移動します。ソースデータベースファイルのコピーがプロジェクトのファイルシステム階層にインポートされ、列のリストが [使用する列] グループに表示されます。

選択項目

アクション

[Web]

[URL を参照] を選択して、目的の Web アドレスを入力します。

選択したファイルが保護されている場合は、[はい] を選択し、[ユーザー名] と [パスワード] を入力します。

[テスト] を選択して、URL が使用可能であることを確認します。

ソースデータベースファイルのコピーがプロジェクトのファイルシステム階層にインポートされ、列のリストが [使用する列] グループに表示されます。

[ファイルシステム]

[参照] を選択して、必要な .txt ファイルまたは .csv ファイルに移動します。

[使用する列] グループで、各列に対して [検索] または [フィルタ] を選択して、あいまい検索時の列の動作を指定します。
オプション。[使用する列] グループで、最初に行を選択してから列の名前を選択して、名前を変更します。Enter キーを押して変更を保存します。

列の名前を変更すると、下のプレビューが自動的に更新されます。

[インポートオプション] グループで、必要に応じて次の設定を構成します。

設定	動作
[大文字と小文字を区別しない]	データベースで大文字と小文字を区別しないようにする場合に選択します。この場合、検索時に、すべての文字列が自動的に小文字に変換されます。この設定はフィルタには適用されません。
[フィルタでは大文字と小文字が区別されます]	[使用する列] テーブルの 1 つ以上のフィールドで [フィルタ] 設定が選択されている場合に使用できます。スクリプトに入力するフィルタ値がデータベースのエントリと正確に一致している必要がある場合に選択します。
[最初の行にキャプションが含まれています]	ローカル Fuzzy データベースに列ヘッダー名が含まれている場合に選択します。
[フィールド区切り文字]	データベースソースファイルの入力フィールドを区切るフィールド区切り文字を入力します。(デフォルト:;) オプション。タブ文字を追加のフィールド区切り文字として使用するには、[タブ] を選択します。
[単語区切り文字]	データベースに複合語が含まれている場合は、複合語を分割する文字を入力します。(デフォルト:-,) オプション。[タブ] と [スペース] を単語区切り文字に使用するには、これらの文字を選択します。
[無視する文字]	無視する文字を入力します。これらの文字は、インポート時にデータベースフィールドから除外され、処理前に検索テキストから除外されます。(デフォルト:."'!) オプション。追加の無視する文字として [スペース] を選択します。

オプション。[文字列置換] グループで文字列置換を追加、削除、変更、またはインポートします。

[最適化] グループで、必要に応じて次の設定を構成します。

設定	動作
[インポートファイルからの自動更新]	ソースファイルが変更されたときにデータベースを自動的に更新します。プロジェクトがロードされると、自動更新が行われます。(デフォルト: オフ)
[メモリにデータベースインデックスをロード]	Fuzzy データベースがメモリに保持され、あいまい検索がより効率的に処理されるようになります。このフィールドをクリアすると、メモリの使用量が減りますが、あいまい検索は大幅に遅くなります。(デフォルト: 選択済み) この設定をクリアすると、[使用する列] グループの [フィルタ] 設定は使用できなくなります。
[データベース処理]	データベース処理の品質を指定して、データベース検索を最適化します。 [ベーシック] に設定すると、[使用する列] グループの [フィルタ] 設定は使用できなくなります。[ベーシック] 設定は、結果の精度が低下する古いアルゴリズムも使用します。精度の低下は、特に大規模なデータベースの場合に顕著になります。小さいデータベースの場合は、この設定を使用すると処理速度が速くなる場合があります。

設定

動作

[インポートファイルからの自動更新]

ソースファイルが変更されたときにデータベースを自動的に更新します。プロジェクトがロードされると、自動更新が行われます。(デフォルト: オフ)

[メモリにデータベースインデックスをロード]

Fuzzy データベースがメモリに保持され、あいまい検索がより効率的に処理されるようになります。このフィールドをクリアすると、メモリの使用量が減りますが、あいまい検索は大幅に遅くなります。(デフォルト: 選択済み)

この設定をクリアすると、[使用する列] グループの [フィルタ] 設定は使用できなくなります。

[データベース処理]

データベース処理の品質を指定して、データベース検索を最適化します。

[ベーシック] に設定すると、[使用する列] グループの [フィルタ] 設定は使用できなくなります。[ベーシック] 設定は、結果の精度が低下する古いアルゴリズムも使用します。精度の低下は、特に大規模なデータベースの場合に顕著になります。小さいデータベースの場合は、この設定を使用すると処理速度が速くなる場合があります。

[OK] を選択して、ローカル Fuzzy データベースを保存します。

プロパティウィンドウが閉じて、[データベース] グループのデータベースのリストに新しいローカル Fuzzy データベースが表示されます。
オプション。[OK] を選択して [プロジェクト設定] ウィンドウを閉じます。
プロジェクトの変更を保存します。

詳細情報