ローカル Fuzzy データベースの追加

ロケータまたはスクリプトで [ローカル Fuzzy データベース] を使用するには、まずプロジェクトに追加する必要があります。プロジェクトにローカル Fuzzy データベースを追加する前に、.CSV または .TXT ファイルが正しく書式設定されていることを確認してください。

ローカル Fuzzy データベースでサポートされているレコード数以下にすることをお勧めします。サポートされるレコードのデフォルト数は 500 万に設定されています。データベースがこの制限を超えることは可能ですが、必要になるメモリは増大します。ただし、割り当てられるメモリを増やしても、処理速度は低下する場合があります。また、KofaxSearch and Matching Server を通して管理されるリモート Fuzzy データベースを使用することもできます。

[ローカル Fuzzy データベース] を追加することができます。以下の手順に従って、設定します。

[プロジェクト] タブの [構成] グループで、[プロジェクト設定] を選択します。
[データベース] タブをクリックしてデータベースの設定を表示します。
[データベース] グループで、[追加] をクリックします。[新しいデータベースの追加] ウィンドウが表示されます。
[データベース名] フィールドに、新しい Fuzzy データベースのわかりやすい名前を入力します。
[データベースタイプ] リストで、[ローカル Fuzzy データベース] のタイプを選択します。
[OK] をクリックします。[ローカル Fuzzy データベースのプロパティ] ウィンドウが表示されます。

[ローカル Fuzzy データベースのプロパティ] ウィンドウで、次の設定を行います。

[参照したインポートファイル (テキストまたは csv ファイル)] の場所を [ファイルシステム] または [Web] のいずれかから選択します。

選択内容に応じて、次のいずれかを実行します。

選択項目	アクション
[Web]	[URL を参照] をクリックして、目的の Web アドレスを入力します。選択したファイルが保護されている場合は、[はい] を選択し、[ユーザー名] と [パスワード] を入力します。 [テスト] をクリックして、URL が使用可能であることを確認します。ソースデータベースファイルのコピーがプロジェクトのファイルシステム階層にインポートされ、列のリストが [列の構成] グループに表示されます。
[ファイルシステム]	[参照] をクリックして、必要な .txt ファイルまたは .csv ファイルに移動します。ソースデータベースファイルのコピーがプロジェクトのファイルシステム階層にインポートされ、列のリストが [列の構成] グループに表示されます。

選択項目

アクション

[Web]

[URL を参照] をクリックして、目的の Web アドレスを入力します。

選択したファイルが保護されている場合は、[はい] を選択し、[ユーザー名] と [パスワード] を入力します。

[テスト] をクリックして、URL が使用可能であることを確認します。

ソースデータベースファイルのコピーがプロジェクトのファイルシステム階層にインポートされ、列のリストが [列の構成] グループに表示されます。

[ファイルシステム]

[参照] をクリックして、必要な .txt ファイルまたは .csv ファイルに移動します。

[列の構成] グループで、各列に対して [検索] または [フィルタ] を選択して、あいまい検索時の列の動作を指定します。
必要に応じて、[列の構成] グループで、最初に行を選択してから列の名前をクリックして、名前を変更します。Enter キーを押して変更を保存します。

列の名前を変更すると、下のプレビューが自動的に更新されます。

[インポートオプション] グループで、必要に応じて次の設定を構成します。

設定	動作
[大文字と小文字を区別しない]	データベースで大文字と小文字を区別しない場合は、この設定を選択してください。この場合、検索時に、すべての文字列が自動的に小文字に変換されます。この設定はフィルタには適用されません。
[フィルタでは大文字と小文字が区別されます]	この設定は、[列の構成] テーブルの 1 つ以上のフィールドで [フィルタ] 設定が選択されている場合に使用できます。スクリプトに入力したフィルタ値をデータベースのエントリと正確に一致させる場合は、この設定を選択します。
[最初の行にキャプションが含まれています]	ローカル Fuzzy データベースに列ヘッダー名が含まれる場合は、この設定を選択します。
[フィールド区切り文字]	データベースソースファイルの入力フィールドを区切るフィールド区切り文字を入力します。(デフォルト:;) 必要に応じて、[タブ] を選択して、タブ文字を追加のフィールド区切り文字として使用します。
[単語区切り文字]	データベースに複合語が含まれている場合は、複合語を分割する文字を入力します。(デフォルト:-,) 必要に応じて、[タブ] と [スペース] を選択して、これらの文字を単語区切り文字に使用します。
[無視する文字]	無視する文字を入力します。これらの文字は、インポート時にデータベースフィールドから除外され、処理前に検索テキストから除外されます。(デフォルト:."'!) 必要に応じて、追加の無視する文字として [スペース] を選択します。

必要に応じて、[文字列置換] グループで文字列置換を追加、削除、変更、またはインポートします。

[最適化] グループで、必要に応じて次の設定を構成します。

設定	動作
[インポートファイルからの自動更新]	ソースファイルが変更されたときにデータベースを自動的に更新する場合に選択します。プロジェクトがロードされると、自動更新が行われます。(デフォルト:オフ)
[メモリにデータベースインデックスをロード]	選択すると、Fuzzy データベースがメモリに保持され、あいまい検索がより効率的に処理されます。このフィールドをクリアすると、メモリの使用量が減りますが、あいまい検索は大幅に遅くなります。(デフォルト:選択済み) この設定をクリアすると、[列の構成] グループの [フィルタ] 設定は使用できなくなります。
[データベース処理]	データベース処理の品質を選択して、データベース検索を最適化します。 [基本] に設定すると、[列の構成] グループの [フィルタ] 設定は使用できなくなります。[基本] 設定は、結果の精度が低下する古いアルゴリズムも使用します。精度の低下は、特に大規模なデータベースの場合に顕著になります。小さいデータベースの場合は、この設定を使用すると処理速度が速くなる場合があります。

設定

動作

[インポートファイルからの自動更新]

ソースファイルが変更されたときにデータベースを自動的に更新する場合に選択します。プロジェクトがロードされると、自動更新が行われます。(デフォルト:オフ)

[メモリにデータベースインデックスをロード]

選択すると、Fuzzy データベースがメモリに保持され、あいまい検索がより効率的に処理されます。このフィールドをクリアすると、メモリの使用量が減りますが、あいまい検索は大幅に遅くなります。(デフォルト:選択済み)

この設定をクリアすると、[列の構成] グループの [フィルタ] 設定は使用できなくなります。

[データベース処理]

データベース処理の品質を選択して、データベース検索を最適化します。

[基本] に設定すると、[列の構成] グループの [フィルタ] 設定は使用できなくなります。[基本] 設定は、結果の精度が低下する古いアルゴリズムも使用します。精度の低下は、特に大規模なデータベースの場合に顕著になります。小さいデータベースの場合は、この設定を使用すると処理速度が速くなる場合があります。

[OK] をクリックして、ローカル Fuzzy データベースを保存します。

プロパティウィンドウが閉じて、[データベース] グループのデータベースのリストに新しいローカル Fuzzy データベースが表示されます。
必要に応じて、[OK] をクリックして [プロジェクト設定] ウィンドウを閉じます。
プロジェクトの変更を保存します。

検索ヒント

検索では、ユーザーが入力した単語が含まれるトピックが返されます。複数の単語を入力すると、OR 検索と想定して、いずれかの単語が含まれるトピックが返されます。完全に一致する語句を検索するには、検索単語を引用符で囲んでください。

また、検索では、あいまい一致も使用しており、部分的に一致する単語 (「コンピュータ」と「コンピューター」など) を考慮します。結果は、トピックごとの検索単語数に基づき、関連度順に表示されます。完全一致は強調表示されます。

絞り込み検索を行うには、以下の演算子を使用できます:

検索に含める単語は、単語の前に「+」と入力し、検索に含めない単語は、単語の前に「-」と入力します。(例: 「ユーザ +ショートカット –グループ」と入力すると、「ショートカット」や「ユーザショートカット」が返され、「グループ」や「ユーザグループ」は返されません。)

不明な文字には、ワイルドカードとして「*」を使用します。ワイルドカードは、検索単語内の任意の場所で使用できます。(例: 「インスト*」と入力すると、「インストール」および「インストラクション」が返されます。)

トピックのタイトルのみを検索するには、検索フレーズの入力を「title:」で開始します。(例: 「title:設定」と入力すると、「ソフトウェアの設定の変更.」というタイトルのトピックが返されます。)

複数の単語を含む検索では、検索内で単語の優先度を指定できます。単語の後に「^」と単語の重みを指定する正の数を入力します。値が高いほど、重みが高いことを意味します。(例: 「ショートカット^10 グループ」では、「グループ」よりも「ショートカット」の重みが 10 倍となります。)

あいまい検索を使用して、タイプミスを考慮するには、単語の後に「~」と修正する文字数を指定する正の数を入力します。(例: 「ポート~1」では、「ポスト」、「オート」、または「ポーク」など、1 文字修正すると一致するその他のインスタンスが返されます。)

演算子は、検索語として使用できないことに注意してください: + - * : ~ ^ ' "

ローカル Fuzzy データベースの追加

検索結果

検索ヒント