OCR(光学式文字認識)は、テキストのビットマップイメージ(スキャンされたドキュメントなど)を、Kofax Power PDF for Macやその他のテキスト編集ソフトウェアで選択、コピー、検索できるテキストに変換するプロセスです。 テキストがOCRによって認識されると、テキストの画像の上の非表示のレイヤーに配置されます。 テキストをコピーすると、テキストはこの非表示のOCRレイヤーからコピーされます。 OCRテクノロジーでは、ビットマップテキストの完全なレンダリングを生成できません。 そのため、OCRで出力したテキストを校正して編集する必要があります。
[環境設定]>[OCR]で認識する言語を選択します(ユーザー設定)。
一方、Kofax Power PDF for MacがOCRを実行している場合、進捗バーが表示されます。 スキャンしたドキュメントのサイズと内容によっては、操作に数秒またはそれ以上かかる場合があります。
OCRを手動で実行するには、[編集]> [OCRページ]を選択します。 Kofax Power PDF for Mac これにより、OCR操作の実行が開始され、進捗バーが表示されます。
Kofax Power PDF for Mac ドキュメントが1ページの1つの画像であると認識された場合、そのドキュメントがスキャンであると想定され、自動的にOCRの実行を提案します。 たまに、Kofax Power PDF for Macはスキャンした文書を認識できない場合があります。 その場合、[編集]メニューではOCRページがグレー表示され、選択できなくなります。
(Kofax Power PDF for Macの高度な機能)。 OCRの一括処理 を参照してください。
医療および法律の辞書はKofax Power PDF for MacのOCRエンジンに含まれています。そのため、医療および法律の固有の単語を認識することにより、スキャンされたドキュメントのOCR出力の品質を向上させることができます。 この機能は内蔵されているため、オンにしたり、設定を調整したりする必要はありません。 OCRテキストを編集する場合、選択したテキストでスペルが間違っている単語が赤い波線の下線で表示される場合があります。