言語の選択

このプログラムを使用して変換を実行すると、ラテン文字、ギリシャ文字、ロシア文字など 100 以上の言語を処理できます。テキスト レイヤーを使用したページの変換時には、通常、言語の選択が重要になることはありません。言語の選択は、OCR の実行時に、イメージのみのページや、標準ではないエンコーディングのテキストを扱う際に重要になります。

ここでは、サポートされるすべての言語の一覧を示します。これらのうち、辞書がサポートされているものを太字で示します。

アフリカーンス語、アルバニア語、アイマラ語、バスク語、ベンバ語、ブラックフット語、ブルトン語、ブゴツ語、ブルガリア語、白ロシア語、カタロニア語、チャモロ語、チェチェン語、コルシカ語、クロアチア語、クロー語、チェコ語デンマーク語オランダ語英語エスペラント語、エストニア語、フェロー語、フィジー語、フィンランド語フランス語、フリジア語、フリウリ語、ゲール語 (アイルランド)、ゲール語 (スコットランド)、ガリシア語、ガンダ語、ドイツ語、ギリシャ語、グアラニー語、ハニ語、ハワイ語、ハンガリー語、アイスランド語、イド語、インドネシア語、インテルリングア、イヌイット語、イタリア語、カバルダ語、カシューブ語、カワ語、キクーユ語、コンゴー語、クペル語、クルド語、ラテン語、ラトビア語、リトアニア語、ルバ語、ルクセンブルグ語、マラガシ語、マレー語、マリンケ語、マルタ語、マオリ語、マヤ語、ミャオ語、ミナンカバウ語、モホーク語、モルダビア語、ナワトル語、ノルウェー語、ニャンジャ語、オクツィデンタル、オジブウェー語、パピアメント語、ピジン英語、ポーランド語ポルトガル語 (標準)、ポルトガル語 (ブラジル)、プロヴァンス語、ケチュア語、ラエティア語、ルーマニア語、ロマニー語、ルアンダ語、ルンディ語、ロシア語、サーミ語 (ルレ)、サーミ語 (北部)、サーミ語 (南部)、サモア語、サルディーニャ語、セルビア語 (キリル)、セルビア語 (ラテン)、ショナ語、スー語、スロヴァキア語、スロベニア語、ソマリ語、ソルビア語 (ウェンド)、ソト語、スペイン語、スンダ語、スワヒリ語、スワジ語、スウェーデン語、タガログ語、タヒティ語、トンガ語、ツワナ語、トゥン語、トルコ語、ウクライナ語、ビサヤ語、ウェールズ語、ウォロフ語、コーサ語、サポテク語、ズールー語、日本語中国語 (簡体字)中国語 (繁体字)、および韓国語

最良の OCR 精度を得るためには、[OCR の設定] ダイアログ ボックスで、ドキュメントに含まれている言語のみを選択してください。言語は複数選択が可能ですが、以下の制限があります。

  • 一つのアジア言語、または一つ以上のラテン文字もしくはキリル文字を使用する言語、いずれかのみを選択してください。

  • アジア言語は他の言語と併用することはできません。

  • 使用するドキュメントがこれらの制限を超過している場合は、[言語の自動検出] チェック ボックスを選択してください。

  • リストをリセットしてもう一度選択を行うには、[すべてを選択解除] をクリックします。

[言語の自動検出] オプションは、自動処理のためのオプションです。このオプションにより、各ソース ドキュメントの内容を分析し、上記の一覧の太字で示された言語から 1 つの言語を選択して各ページ全体に割り当てます。自動検出が設定されている場合、他の言語は選択できません。

[言語の自動検出] オプションには、単一のページに含まれる異なる言語を識別して分離する機能はありません。このプログラムでこれを実行するには、ドキュメント内に含まれていることがわかっているすべての言語を手動で選択します。これにより、内部の検出機能に基づいて、すべてのテキストが選択した言語のいずれかに割り当てられます。