辞書オプション ウィンドウ
このウィンドウは、次の設定を使用して辞書ファイルを変更するために使用します。
- [参照したインポート ファイル (テキストまたは csv ファイル)]
-
次のいずれかの参照ファイルの場所を選択します。
-
[ファイル システム]。
目的の辞書の場所を参照します。ウィンドウを閉じるとインポート プロセスが自動的に開始され、インポートされたデータベースの行数をカウントするメッセージ ボックスが表示されます。
2 列の 100 万行をインポートするには、約 1 分かかります。
-
[Web]。
ローカルの Fuzzy データベース ファイルの URL を入力します。
[テスト] をクリックして、指定した URL への接続が利用可能であることを確認します。
認証が必要な場合は、ユーザー名とパスワードを入力します。
-
- [インポート ファイルからの自動更新]
-
Kofax TotalAgility - Transformation Server によるコンテンツの処理時に、ソース データベースのチェックを行って変更の有無を確認し、変更がある場合はプロジェクトにコピーするように指定することができます。(デフォルト:選択済み)
ソース ファイルに変更があった場合、次回の Transformation Server の実行時に、インポートされた辞書が自動的に更新されるようにするには、この設定を選択します。
これは、定期的に更新されるネットワーク上の辞書を使用する場合に特に役立ちます。このオプションを選択すると、Transformation Server が最後に実行された時点における辞書の変更内容を常に利用できるようになります。
別のコンピュータでプロジェクト ファイルを使用するには、同じパスを使用して辞書にアクセスできるようにする必要があります。たとえば、辞書ファイルを他のコンピュータ上の同じパスにコピーします。または、辞書ファイルを別のコンピュータにコピーして、そのパスを再選択します。
この設定を選択して、実行時にコンテンツが更新されると、インポートされた辞書ファイルがソース辞書と同期されるようにします。
これにより、こうした自動更新を他のモジュールの処理に使用できるようになります。
ソース辞書が定期的に更新される場合にのみ、この設定を有効にすることをお勧めします。それ以外の場合、不要な更新チェックが発生してパフォーマンスが低下する可能性があります。(デフォルト:オフ)
この自動更新機能の動作は、Thin Clients では少し異なります。コンボ ボックスを一定の間隔で確実に同期させるために、追加の Thin Clients web.config 設定が上記動作の反復のために必要になります。この設定をしない場合、コンボ ボックスは 1 度入力され、プロジェクトがキャッシュされている間使用されます。つまり、複数のコンボ ボックスは、複数のバッチに同じプロジェクトを使用して 1 度更新されることになります。この新しい ForceDictionaryUpdate web.config 設定については、『Thin Client Server Installation Guide』(Thin Client Server インストール ガイド) を参照してください。
検証ルールにより参照される辞書は、web.config 設定にかかわらず正常に更新されます。
- [単語]
-
単語リストには、インポートされた csv ファイルまたはテキスト ファイルのエントリが含まれます。フィールド区切り文字が使用可能で、[インポート ファイルには自動置換値が含まれています] を選択している場合は、追加の [テキスト置換] 列が表示されます。ファイルの内容は、辞書の単語およびテキスト置換アイテムのリストとして表示されます。
- [インポート オプション]
-
このグループには次の設定があります。
- [大文字と小文字を区別しない]
-
すべての検索文字列とルックアップ文字列を小文字に変換するには、この設定を選択します。大文字と小文字は区別されません。(デフォルト:選択済み)
- [その他の区切り文字]
-
データベースのフィールドに「Diagon-Alley」などの複合語が含まれていても検索時に 2 つの単一の単語と見なす必要がある場合は、この設定を使用して、追加の区切り文字を指定します。検索文字列は、この区切り文字に基づいて単一の用語に分割されます。この例では、ハイフンが区切り文字として使用され、「Diagon」 と 「Alley」 が個別に検索および評価されます。
区切り文字は、認識用に定義された区切り文字に対応している必要があります。対応していない場合、認識時に単語が正しく分割されない可能性があり、個別に検索しても単語が検出されないか、または見つかった場合でも信頼度が低くなります。(デフォルト: -, (スペース、ハイフン、コンマ))
スペース区切り文字は通常の単語の区切り方法を示すため、必須です。スペース区切り文字を削除すると、形式ロケータで使用した際に辞書が機能しなくなる可能性があります。
- [削除する文字]
-
入力レコードから不要な文字をフィルタリングする場合は、この設定を使用します。(デフォルト: 空)
- [自動テキスト置換]
-
このグループには次の設定があります。
- [インポート ファイルには自動置換値が含まれています]
-
インポートされたファイルに、抽出済みのテキスト アイテムの置換に使用可能なテキストが含まれる場合は、この設定を選択します。たとえば、ドキュメント内で「January」が見つかった場合、辞書を使用して数値「1」に置換されるようにします。これにより、「January」に対するあらゆる表記を受け入れ、「1」という同一の置換値に変換することができます。(デフォルト:オフ)
- [フィールド区切り文字]
-
辞書の値と自動置換値を区切る文字を入力します。(;)
ウィンドウの下部にあるボタンの説明は、「共通 Transformation Designer ボタン」を参照してください。