校正と検索可能な PDF について

スキャンによって生成された PDF には、ページ画像のみが含まれています。Power PDF では、このような画像のみの PDF ドキュメントを検索可能な PDF にすることができます。これを行うには、光学式文字認識 (OCR) を利用します。この処理は、校正によって精度を上げることができます。校正を開始するには、[ホーム] > [検索可能な PDF の作成] > [校正] を選択します。

検索可能な PDF を作成する方法に関する詳細については、「PDF ファイルを検索可能にする」を参照してください。「検索可能 PDF の変換設定」の説明に従ってオプションを指定します。

[ファイル] > [オプション] > [ドキュメント] > [検索可能な PDF ドキュメント] で PDF を検索可能にした場合は、常に校正を実行するようにしてください。

校正により、OCR によって生成されたテキストの精度を上げることができます。認識により、認識された各文字および各単語の信頼水準が決定されます。疑わしい単語については、確認できます。校正ツールのパネルの上部 (A) に、単語または文字列の画像が表示されます。次のパネル (B) に、現在選択されている候補が表示されます。下部のパネル (C) に、辞書を利用して派生された代替候補が一覧表示されます。右側のボタンを使用して、現在選択されている候補を保持するか、修正候補のいずれかを選択します。適切な候補がない場合は、正しい単語または文字列を [問題のある単語] テキストボックスに入力し、[OK] を押します。[ドキュメント準備完了] (D) をクリックすると、ドキュメントの末尾に到達する前に校正を終了します。[ページ準備完了] (E) をクリックすると、現在のページの残りのテキストをスキップして、次のページに移動します。[ドキュメントに認識済みテキストを表示] チェックボックス (F) を選択すると、テキストレイヤーが表示され、元の画像レイヤーがフェード表示されます。この方が読みやすくなる場合もあります。

[校正] ウィンドウ右側にあるボタンを使用することで、提案された候補を処理できます。

無視: 現在の修正候補が正しい場合に選択します。校正ツールは、次の疑わしい単語に進みます。
すべて無視: 以降に検出された同一の疑わしい単語をすべて正しいと見なす場合に選択します。
テキスト以外: OCR 処理では、線画や図に対してテキストの候補が作成される場合があります。修正候補テキストをドロップする場合は、このボタンを使用します。
追加: 現在選択されている候補を受け入れて、現在の辞書に追加します。

この場所で辞書を選択できます。組み込みの辞書を補足したり、組み込みの辞書なしで言語を認識できるようにしたりするために、ユーザー辞書を指定することが可能です。
変更: 現在選択されている候補を受け入れます。
すべて変更: 現在選択されている候補を受け入れて、以降に検出された同一の出現箇所すべてに対してその候補を適用します。

すべての候補が正しくない場合は、編集ボックスに正しい候補を入力して、[変更] または [すべて変更] をクリックします。