將 PDF 檔案變更為可搜尋

如果純影像 PDF 檔案中有文字或者是從包含文字的影像檔建立 PDF 檔案,將無法搜尋這些文件中的內容。若要將這些檔案變更為可搜尋,應使用 OCR 提取其文字。可搜尋的 PDF 文件會呈現頁面影像,但是也會將可辨識的文字放置在個別圖層上,每個文字字元參照其對應的影像。如此即可搜尋 PDF。若要存取必須以準確原始外觀加以封存的文件內容,可搜尋的 PDF 特別適用。

如果選取了 [可搜尋的 PDF],那麼只有在輸入檔案中沒有偵測到可存取的文字圖層時,才會執行 OCR 程序。找到文字圖層時,就會使用該圖層建立可搜尋的一般 PDF,而不需要執行 OCR。即使停用了 [可搜尋的 PDF] 也是一樣的情形。

使用 Create Assistant 將純影像 PDF 檔案或各種類型的影像檔案轉換為可搜尋的 PDF 文件。

如需支援的檔案類型清單,請參閱 Create Assistant

您可以在 [可搜尋的 PDF 轉換設定] 對話方塊中設定 OCR 語言。

Create Assistant 提供名為「可搜尋的 PDF」的個別設定檔,但是,您也可以透過開啟 [可搜尋的 PDF] 核取方塊來使用其他設定檔建立可搜尋的 PDF。

使用 Create Assistant 中可搜尋的 PDF 設定檔

  1. 在 [Create Assistant 設定檔] 清單中選取 [可搜尋的 PDF]
  2. 開啟一或多個欲轉換為可搜尋的 PDF 的檔案。
  3. 按一下 [設定檔],檢查 [PDF Create 設定檔] 對話方塊中的設定。[可搜尋的 PDF] 核取方塊預設為已選取。保留此設定,並視需要變更其他設定 (例如,保全或浮水印)。
  4. 按一下 [設定] 按鈕,以顯示 [可搜尋的 PDF 轉換設定] 對話方塊。
    1. [OCR 語言] 清單中選取來源文件的語言。
    2. 視需要變更其他設定,然後按一下 [確定] 以關閉對話方塊。
  5. 按一下 [確定] 以關閉 [PDF Create 設定檔] 對話方塊。
  6. 開始建立 PDF 圖示 按一下 [開始建立 PDF] 工具。

    依據目前的目標設定來執行儲存。產生的 PDF 檔案將會儲存在來源資料夾或預先定義的資料夾,或是顯示 [另存新檔] 對話方塊。

    資訊對話方塊會顯示建立程序的狀態資訊以及產生的 PDF 檔案的清單,其中包括檔案名稱、路徑、檔案類型以及建立日期。

  7. PDF Create [列印資訊] 對話方塊會顯示建立程序的狀態資訊以及產生的 PDF 檔案的清單,其中包括檔案名稱、路徑、檔案類型以及建立日期。按一下 [關閉] 返回 [建立 PDF] 視窗,然後關閉該視窗。 按一下 [關閉] 返回 [建立 PDF] 視窗,然後關閉該視窗。

使用 Create Assistant 中其他設定檔建立可搜尋的 PDF

  1. 在 [Create Assistant 設定檔] 清單中,選取設定檔並載入檔案。
  2. 按一下 [設定檔]
  3. [PDF Create 設定檔] 對話方塊中,選取 [可搜尋] 核取方塊。

    若要使用 MRC 壓縮產生可搜尋的 PDF,請啟用這兩個核取方塊。在這種情況下,如果按一下 [設定] 按鈕,將會顯示 [可搜尋的 MRC PDF 轉換設定] 對話方塊。

  4. 按一下 [設定] 按鈕,以顯示 [可搜尋的 PDF 轉換設定] 對話方塊。選取來源文件的語言,然後按一下 [確定]
  5. [PDF Create 設定檔] 對話方塊中,檢查並視需要變更其他設定 (例如,保全或浮水印)。
  6. 按一下 [確定] 以關閉 [PDF Create 設定檔] 對話方塊。
  7. 開始建立 PDF 圖示 按一下 [開始建立 PDF] 工具。

    依據目前的目標設定來執行儲存。產生的 PDF 檔案將會儲存在來源資料夾或預先定義的資料夾,或是顯示 [另存新檔] 對話方塊。

  8. 資訊對話方塊會顯示建立程序的狀態資訊以及產生的 PDF 檔案的清單,其中包括檔案名稱、路徑、檔案類型以及建立日期。 按一下 [關閉] 返回 [建立 PDF] 視窗,然後關閉該視窗。

在 Power PDF 中將包含純影像部分的 PDF 轉換為可搜尋

若要在 Power PDF 中將純影像 PDF 或包含純影像部分的 PDF 轉換為可搜尋的 PDF,請繼續執行下列步驟。

您可以在 [檔案] > [選項] > [文件] > [可搜尋的 PDF 文件] 下對此轉換進行調整。

  1. 將 PDF 變更為可搜尋圖示 在功能區的 [首頁] 索引標籤上,按一下 [將 PDF 變更為可搜尋]
  2. [轉換頁面] 對話方塊中,選取是針對包含純影像部分的頁面還是針對所有頁面執行 OCR (光學字元辨識) – 在此情況下,PDF 中先前存在的任何文字圖層內容會取代為 OCR 結果。
  3. 按一下 [設定] 以顯示 [可搜尋的 PDF 轉換設定] 對話方塊。視需要更新最重要的設定,然後按一下 [確定] 以儲存變更並返回。

    如需有關設定的更多詳細資訊,請參閱關於編輯 PDF 文件

    1. [OCR 語言] 清單中選取來源文件的語言。
    2. 如果文字圖層已存在,但因非標準編碼而無法使用,則選取 [使用 OCR 處理文件] 以執行 OCR。
    3. 選取 [OCR 後自動校訂結果] 以對產生的文字進行校訂,從而提高 OCR 程序的準確性。
  4. 按一下 [確定] 執行轉換。