OmniPage ページ認識のプロファイル設定 ウィンドウ

このウィンドウを使用して、OmniPage 全ページ認識のプロパティを設定できます。次の設定を構成に使用できます。

[言語]

このグループを使用すると、使用可能な言語の包括的なリストから 1 つ以上の言語を選択できます。任意の言語を組み合わせることができます。デフォルトでは、英語のみが選択されています。

追加の言語を選択すると、ヘッダ内の言語数が増加します。すべての言語が表示されるわけではないため、リストの下の方で一部の言語が選択されていることを確認できます。

英語と 1 つの追加言語を選択した場合、認識中は他の言語が優先されます。たとえば、英語とギリシャ語を選択した場合は、ドキュメントの大部分がギリシャ語になっていて、英語の単語はわずかであると想定されます。

多くのドキュメントがあり、ほとんどが英語で記述されているものと、ほとんどがギリシャ語で記述されているものがある場合は、ドキュメントを事前に分類して、本番でさまざまなプロジェクトを使用することをお勧めします。または、単一のプロジェクトを使用して、認識が実行される前にドキュメントを正しい言語に分類してから、主要言語の再読み込みプロファイルを使用します。

[一般設定]

このグループには次の設定があります。

[単語区切り文字]

このフィールドを使用して、単語を区切る文字を定義します。(デフォルト:/:()-#)

中国語と日本語の文字の場合、単語として認識されるためには、上記で定義された区切り文字またはスペースが単語の最後に存在している必要があります。スペースや区切り文字のない連続した文字は、個々の単語として認識されません。

[認識モード]

[認識モード] を次の値から選択します。

  • [高速]

    認識の正確度よりも認識速度を優先するには、この値を選択します。この値を選択すると、認識プロセスにかかる時間が短くなりますが、全体的な認識の正確度が低下する可能性があります。

  • [調和]。(デフォルト:選択済み)

    この値を選択して、認識の正確度の優先順位と認識の速度のバランスをとります。

  • [正確]

    認識速度よりも認識の正確度を優先する場合は、この値を選択します。この値を選択すると、認識プロセスに時間がかかります。

[画像転送モード]

この認識メソッドで画像を転送する方法を選択します。以下の値のいずれかを選択できます。

  • [メモリ]。(デフォルト:選択済み)

    すでにメモリに格納されているバイナリ イメージを使用するには、この値を選択します。

  • [ファイル]

    この値を選択して、認識エンジンから直接アクセスできるようにファイル パスを指定します。選択した場合、画像に対して実行された画像の前処理は、認識中に無視されます。

    [画像転送モード][ファイル] を選択した場合、混合印刷のページ プロファイルに OmniPage ページ プロファイルを使用することはできません。OmniPage ページ プロファイルが混合印刷ページのプロファイルですでに使用されている場合、[ファイル] 転送モードを選択すると、対応する混合印刷プロファイルからその OmniPage ページ プロファイルが削除され、エラー メッセージが表示されます。

    画像転送モードがファイル ベースの場合、混合印刷ページのプロファイルでは画像を処理できません。これは、混合認識では、混合印刷ページのプロファイルで構成された認識印刷タイプごとに 1 つずつ、2つの画像がメモリに作成されるためです。

[辞書]

このグループには次の設定があります。

[言語辞書]

以下のすべての言語の認識中にスペル チェックを実行する場合に選択します。

  • ブラジル語
  • カタロニア語
  • チェコ語
  • デンマーク語
  • オランダ語
  • 英語
  • エスペラント語
  • フィンランド語
  • フランス語
  • ドイツ語
  • ギリシャ語
  • ハンガリー語
  • イタリア語
  • ノルウェー語
  • ポーランド語
  • ポルトガル語
  • ロシア語
  • スロベニア語
  • スペイン語
  • スウェーデン語
  • トルコ語
[ユーザー辞書]

この設定を選択して、認識中のスペル チェックを支援するために使用する独自の辞書を指定します。認識結果に含まれるスペルが間違っている単語は、ユーザー辞書の対応するエントリで常に置き換えられるとは限らないことを知っておくことが重要です。

選択した場合、辞書を参照して選択します。

次の言語リストでは、ユーザー辞書はサポートされていません。

  • アラビア語

  • 中国語 (簡体字および繁体字)

  • ヘブライ語

  • 日本語

  • 韓国語

  • タイ語

  • ベトナム語

(デフォルト:なし)

[ビジネス用語辞書]

[辞書を使用] を選択してから、リストからビジネス用語辞書を選択します。この辞書により、認識中のスペル チェックの品質を、選択した辞書の内容を使用して改善できます。ビジネス用語を含む次の辞書が利用できます。ここに適切な設定がない場合は、上記の [ユーザー辞書] 設定を使用して独自の用語リストを指定してください。

  • 英語金融辞書

  • オランダ語医学辞典

  • 英語医学辞典

  • フランス語医学辞典

  • ドイツ語医学辞典

  • オランダ語法務辞書

  • 英語法務辞書

  • フランス語法務辞書

  • ドイツ語法務辞書

(デフォルト:なし)

[OmniPage の生の結果]

このグループを使用して、OmniPage 認識エンジンから取得した生の結果の保存方法を構成します。

[ページ要素の入力]

形式とスコープを指定して生のページ結果を提供するには、この設定を選択します。(デフォルト:オフ)

[スコープ]

生の結果に含まれるスコープの値を選択します。

  • [すべての要素]選択すると、ドキュメントのすべてのページのすべての情報が提供されます。
  • [テーブルのみ]この値を選択すると、テーブル情報のみが提供されます。

この設定は、[ページ要素の入力] 設定が選択されている場合にのみ使用できます。

[データ形式]

生データの記録方法の形式を選択します。以下から選択します。

  • [XML]

  • [JSON]

この設定は、[ページ要素の入力] 設定が選択されている場合にのみ使用できます。

ウィンドウの下部にあるボタンの説明は、「共通 Transformation Designer ボタン」を参照してください。