RecoStar 認識用の国と言語

言語は、ドキュメントごとに、またはドキュメント内の段落ごとに異なる場合があります。また、1 つの単語が本文とは異なる言語で記述されることがあるため、1 行内でも言語が異なる場合があります。

重要 RecoStar 認識エンジンは、Kofax TotalAgility の次のリリースで削除される予定です。そのため、Kofax では、すべての新規プロジェクトのページ認識とゾーン認識で OmniPage 認識プロファイルを使用することを推奨しています。1 つ以上の RecoStar プロファイルを使用する既存のプロジェクトがある場合は、それらのプロジェクトを変更して、同等の OmniPage プロファイルを使用することもお勧めします。

手書きに関する国固有のスタイルと表記、住所の一般的な形式、国関連のスペルに関する最も一般的な語彙は、認識エンジンを構成するときに非常に重要になります。

また、国ごとに複数の言語が必要になる場合があります。たとえば、ドイツではドイツ語のみが必要ですが、スイスではドイツ語、フランス語、イタリア語、およびレトロマンス語が必要です。

複数言語のドキュメントで十分な認識結果が得られるようにするには、国の選択のみを使用するか、国と言語の選択を組み合わせます。

ヒント 最良の結果を得るには、国グループや複数の言語を指定するのではなく、1 つの国を指定して、選択範囲をできるだけ絞り込みます。これは、国または言語の組み合わせを追加するたびに、「[機械印刷]」 の認識速度が低下するためです。

地域に即した手書きスタイル、標準のレタリング フォント、または英数字以外のコンテンツ タイプが使用されている場合は、常に 1 つの国のみを選択し、言語は選択しないでください。

言語グループを使用する場合は、常に選択範囲を次のいずれかに限定してください。

  1. キリル文字 (Windows コード ページ 1251 に準拠)

  2. ギリシャ語 (Windows コード ページ 1253 に準拠)

  3. ラテン語 (中央ヨーロッパの場合は Windows コード ページ 1250、西ヨーロッパの場合は 1252、トルコの場合は 1254、バルト諸国の場合は 1257 に準拠)

  4. アゼルバイジャン語