OmniPage ゾーン プロファイルの設定 ウィンドウ
このウィンドウを使用して、OmniPage ゾーン認識のプロパティを設定できます。次の設定グループを構成に使用できます。
このウィンドウの最下部では、次のボタンが使用できます。
|
ボタン |
説明 |
|---|---|
| [OK] |
変更を保存してウィンドウを閉じます。 |
| [キャンセル] |
変更を保存せずにウィンドウを閉じます。 |
|
開いているウィンドウのヘルプを表示します。 |
[言語]
この設定では、1 つまたは複数の言語を選択できます。任意の言語を組み合わせることができます。デフォルトでは英語のみが選択されています。
追加の言語を選択すると、ヘッダ内の言語数が増加します。すべての言語が表示されるわけではないため、リストの下の方で一部の言語が選択されていることを確認できます。
Asian Plus OCR アドオンを購入してある場合は、追加の言語がサポートされます。
[一般設定]
このグループには次の設定があります。
- [文字タイプ]
-
次のいずれかを選択して、ゾーンに使用される抽出のタイプをフィルタリングできます。
-
[すべて] (デフォルト: 選択済み)
-
[数値]
-
[アルファベット]
-
- [認識モード]
-
[認識モード] を次の値から選択します。
-
[高速]
認識の正確度よりも認識速度を優先するには、この値を選択します。この値を選択すると、認識プロセスにかかる時間が短くなりますが、全体的な認識の正確度が低下する可能性があります。
-
[調和]。(デフォルト: 選択済み)
この値を選択して、認識の正確度の優先順位と認識の速度のバランスをとります。
-
[正確]
認識速度よりも認識の正確度を優先する場合は、この値を選択します。この値を選択すると、認識プロセスに時間がかかります。
-
- [MRZ モード]
-
選択すると、専用の認識エンジンが MRZ テキストのゾーンを処理し、[印刷タイプ] が自動的に [OCR-B] に設定されます。これは、OCR-B が MRZ で使用されるフォントであるためです。
このゾーン内に非 MRZ テキストがある場合、その認識の正確度は低くなる可能性があります。このため、ドキュメント上の非 MRZ テキストを認識する場合は、新しいゾーンを作成したうえで別のゾーン プロファイルを使用して、できるだけ認識が適切なものになるようにします。
- [ケース変換]
-
この設定は、[文字タイプ] 設定の値が [すべて] または [英数字] である場合に使用できます。値が [数値] に設定されている場合、この設定は無効になります。
認識されたテキストの大文字と小文字を変換するこの設定は、アジア言語ではサポートされていません。
次のいずれかの値を選択します。
-
[大文字小文字自動判別]。(デフォルト: 選択済み)
ゾーン内のテキストに大文字と小文字が混在している場合は、この値を選択します。ケース変換は適用されません。
-
[小文字]
ゾーン内で認識されたテキストを小文字に変換するには、この値を選択します。
-
[大文字]
ゾーン内で認識されたテキストを大文字に変換するには、この値を選択します。
-
- [禁止文字]
-
ゾーン内で検出されてはならない文字の区切りなしのリストです。ケース変換が適用されて、大文字と小文字が区別されるようになった後に、禁止文字が適用されます。いずれかの禁止文字が検出された場合は、認識結果に誤りがあると見なされ、文字は ^ 文字に置き換えられます。誤りのある文字に [OCR 置換] が定義されている場合は、代わりに代替文字が使用されます。入力したすべての文字は文字どおりの意味になるため、範囲はサポートされません。
たとえば、[禁止文字] 設定に「Apf」を入力すると、文字「A」、「p」、および「f」が禁止されます。
「A-F」を入力すると、文字「A」と「F」、およびハイフン文字「-」が禁止されます。範囲全体を禁止するには、この範囲内の文字をそれぞれ入力します。
- [追加文字]
-
選択した言語のほかに使用できる文字のリストを追加します。これはコンマ区切りのリストです。
たとえば、MICR E-13B フォントで印刷されたコンテンツがあり、OmniPage 認識エンジンを使用している場合は、「⑆」、「⑈」、「⑇」、および「⑉」を追加文字として追加します。これらの記号が追加文字として追加されていない場合、認識結果には含まれません。
同様に、言語が英語に設定されていて、アクセント記号または発音区別符号を含む一部の文字が予期したとおりに認識されない場合は、それらを追加文字のリストに追加します。
[プリンタ タイプ]
このグループでは、予期される印刷またはフォントのタイプを選択できます。次の 1 つまたは複数の値を選択します。
-
[自動] (デフォルト: 選択済み)
-
[印字]
-
[手書き]
-
[OCR-A]
-
[OCR-B]
-
[Dot 9 Matrix]
-
[Dot 24 Matrix]
-
[MICR CMC-7]
-
[MICR E-13B]
[辞書]
このグループには次の設定があります。
- [言語辞書]
-
以下の 1 つ以上の言語の認識中にスペル チェックを実行する場合に選択します。
- ブラジル語
- カタロニア語
- チェコ語
- デンマーク語
- オランダ語
- 英語
- エスペラント語
- フィンランド語
- フランス語
- ドイツ語
- ギリシャ語
- ハンガリー語
- イタリア語
- ノルウェー語
- ポーランド語
- ポルトガル語
- ロシア語
- スロベニア語
- スペイン語
- スウェーデン語
- トルコ語
- [ユーザー辞書]
-
この設定を選択して、認識中のスペル チェックを支援するために使用する独自の辞書を指定します。認識結果に含まれるスペルが間違っている単語は、ユーザー辞書の対応するエントリで常に置き換えられるとは限らないことを知っておくことが重要です。
選択した場合、辞書を参照して選択します。
ユーザー辞書は、Asian Plus OCR アドオン言語に対してはサポートされていません。
(デフォルト:なし)
- [ビジネス用語辞書]
-
[辞書を使用] を選択してから、リストからビジネス用語辞書を選択します。この辞書により、認識中のスペル チェックの品質を、選択した辞書の内容を使用して改善できます。ビジネス用語を含む次の辞書が利用できます。ここに適切な設定がない場合は、上記の [ユーザー辞書] 設定を使用して独自の用語リストを指定してください。(デフォルト:なし)
-
英語金融辞書
-
オランダ語医学辞典
-
英語医学辞典
-
フランス語医学辞典
-
ドイツ語医学辞典
-
オランダ語法務辞書
-
英語法務辞書
-
フランス語法務辞書
-
ドイツ語法務辞書
-
関連トピック: