將 PDF 檔案變更為可搜尋
如果純影像 PDF 檔案中有文字或者是從包含文字的影像檔建立 PDF 檔案,將無法搜尋這些文件中的內容。若要將這些檔案變更為可搜尋,應使用 OCR 提取其文字。可搜尋的 PDF 文件會呈現頁面影像,但是也會將可辨識的文字放置在個別圖層上,每個文字字元參照其對應的影像。如此即可搜尋 PDF。若要存取必須以準確原始外觀加以封存的文件內容,可搜尋的 PDF 特別適用。
如果選取了 [可搜尋的 PDF],那麼只有在輸入檔案中沒有偵測到可存取的文字圖層時,才會執行 OCR 程序。找到文字圖層時,就會使用該圖層建立可搜尋的一般 PDF,而不需要執行 OCR。即使停用了 [可搜尋的 PDF] 也是一樣的情形。
使用 Create Assistant 將純影像 PDF 檔案或各種類型的影像檔案轉換為可搜尋的 PDF 文件。
您可以在 [可搜尋的 PDF 轉換設定] 對話方塊中設定 OCR 語言。
Create Assistant 提供名為「可搜尋的 PDF」的個別設定檔,但是,您也可以透過開啟 [可搜尋的 PDF] 核取方塊來使用其他設定檔建立可搜尋的 PDF。
使用 Create Assistant 中可搜尋的 PDF 設定檔
- 在 [Create Assistant 設定檔] 清單中選取 [可搜尋的 PDF]。
- 開啟一或多個欲轉換為可搜尋的 PDF 的檔案。
- 按一下 [設定檔],檢查 [PDF Create 設定檔] 對話方塊中的設定。[可搜尋的 PDF] 核取方塊預設為已選取。保留此設定,並視需要變更其他設定 (例如,保全或浮水印)。
-
按一下 [設定] 按鈕,以顯示 [可搜尋的 PDF 轉換設定] 對話方塊。
- 在 [OCR 語言] 清單中選取來源文件的語言。
- 視需要變更其他設定,然後按一下 [確定] 以關閉對話方塊。
- 按一下 [確定] 以關閉 [PDF Create 設定檔] 對話方塊。
-
按一下 [開始建立 PDF] 工具。
依據目前的目標設定來執行儲存。產生的 PDF 檔案將會儲存在來源資料夾或預先定義的資料夾,或是顯示 [另存新檔] 對話方塊。
資訊對話方塊會顯示建立程序的狀態資訊以及產生的 PDF 檔案的清單,其中包括檔案名稱、路徑、檔案類型以及建立日期。
- PDF Create [列印資訊] 對話方塊會顯示建立程序的狀態資訊以及產生的 PDF 檔案的清單,其中包括檔案名稱、路徑、檔案類型以及建立日期。按一下 [關閉] 返回 [建立 PDF] 視窗,然後關閉該視窗。 按一下 [關閉] 返回 [建立 PDF] 視窗,然後關閉該視窗。
使用 Create Assistant 中其他設定檔建立可搜尋的 PDF
- 在 [Create Assistant 設定檔] 清單中,選取設定檔並載入檔案。
- 按一下 [設定檔]。
-
在 [PDF Create 設定檔] 對話方塊中,選取 [可搜尋] 核取方塊。
若要使用 MRC 壓縮產生可搜尋的 PDF,請啟用這兩個核取方塊。在這種情況下,如果按一下 [設定] 按鈕,將會顯示 [可搜尋的 MRC PDF 轉換設定] 對話方塊。
- 按一下 [設定] 按鈕,以顯示 [可搜尋的 PDF 轉換設定] 對話方塊。選取來源文件的語言,然後按一下 [確定]。
- 在 [PDF Create 設定檔] 對話方塊中,檢查並視需要變更其他設定 (例如,保全或浮水印)。
- 按一下 [確定] 以關閉 [PDF Create 設定檔] 對話方塊。
-
按一下 [開始建立 PDF] 工具。
依據目前的目標設定來執行儲存。產生的 PDF 檔案將會儲存在來源資料夾或預先定義的資料夾,或是顯示 [另存新檔] 對話方塊。
- 資訊對話方塊會顯示建立程序的狀態資訊以及產生的 PDF 檔案的清單,其中包括檔案名稱、路徑、檔案類型以及建立日期。 按一下 [關閉] 返回 [建立 PDF] 視窗,然後關閉該視窗。
在 Power PDF 中將包含純影像部分的 PDF 轉換為可搜尋
若要在 Power PDF 中將純影像 PDF 或包含純影像部分的 PDF 轉換為可搜尋的 PDF,請繼續執行下列步驟。
-
在功能區的 [首頁] 索引標籤上,按一下 [將 PDF 變更為可搜尋]。
- 在 [轉換頁面] 對話方塊中,選取是針對包含純影像部分的頁面還是針對所有頁面執行 OCR (光學字元辨識) – 在此情況下,PDF 中先前存在的任何文字圖層內容會取代為 OCR 結果。
-
按一下 [設定] 以顯示 [可搜尋的 PDF 轉換設定] 對話方塊。視需要更新最重要的設定,然後按一下 [確定] 以儲存變更並返回。
如需有關設定的更多詳細資訊,請參閱關於編輯 PDF 文件。
- 在 [OCR 語言] 清單中選取來源文件的語言。
- 如果文字圖層已存在,但因非標準編碼而無法使用,則選取 [使用 OCR 處理文件] 以執行 OCR。
- 選取 [OCR 後自動校訂結果] 以對產生的文字進行校訂,從而提高 OCR 程序的準確性。
- 按一下 [確定] 執行轉換。