可搜尋的 PDF 轉換設定
只要您執行下列任一動作,就會顯示此對話方塊:
- 選取 [可搜尋] 核取方塊,並按一下 PDF Create [設定檔] 對話方塊中的 [設定] 按鈕。
- 按一下 [轉換] > [其他] > [可搜尋的 PDF],然後按一下 [轉換頁面] 對話方塊中的 [設定]。
- 造訪 [檔案] > [選項] > [文件] > [可搜尋的 PDF 文件] 中 OCR 處理程序的偏好設定。
如果要從影像檔案或不可搜尋的純影像 PDF 檔案建立可搜尋的 PDF,請使用這些設定。如需支援檔案類型清單,請參閱 Create Assistant。
OCR 語言
OCR 可用來從影像擷取文字,讓影像檔成為可搜尋的檔案。選取來源文件中顯示的語言。
拒絕字元
依照預設,無法辨識的字元會以拒絕字元 (即波狀符號:~) 表示。例如,如果 OCR 無法辨識 REJECT 中的 J,且 ~ 是拒絕字元,就會在文件中顯示 RE~ECT 字串。
在 [拒絕字元] 編輯方塊中輸入想要使用的字元。請嘗試選擇文件中不會出現的字元。
保留原始影像
如果想要在轉換後保留原始影像,請選取此核取方塊。
自動調整紙張方向
選取此核取方塊,可自動設定頁面方向 (橫向或直向)。
處理頁面
選取在將 PDF 文件轉換為可搜尋文件時要處理的頁面。
- 純影像頁面:預設中 Power PDF 僅處理沒有文字圖層,只有純影像 (點陣圖格式) 內容的頁面。
- 所有頁面:選取此選項可處理所有頁面,而不論頁面包含有哪些元件。
- 使用 OCR 處理文件:如只要以 OCR 處理文件,選取此選項。所有頁面會在內部轉換成點陣圖格式,然後經由 OCR 處理。此方法可去除所有非視覺和非標準化的元素 (例如:隱藏或覆蓋的物件,和使用非標準字元碼字型的文字),而且在可搜尋 PDF 的標準轉換程序失敗時會有所幫助。
- 辨識非標準編碼頁面:選取此選項,可處理包含本身字型和/或特別字元編碼的頁面。
OCR 後自動校訂結果
(僅限從 Power PDF 存取。)
選取此選項,可在處理的文件上執行互動拼寫檢查。按一下使用者詞典,可新增或建立您自己的詞彙。
自動尋找純影像頁(需要重新啟動)
(僅限從 Power PDF 存取。)
如此選項已選取,則 Power PDF 會在開啟後檢查每一個 PDF,如果此文件有純影像頁面,則可轉換成可搜尋的 PDF。由於檢查程序耗時,因此該選項預設為清除。
在導覽列中通知
(僅限從 Power PDF 存取,只有選取上方核取方塊時才能啟用。)
選取在導覽列中通知 可讓 Power PDF 通知您位於功能區下方通知列內的純影像。按一下 [可搜尋] 可顯示 [自動偵測] 對話方塊,並在 OCR 選項中選擇以套用在純影像頁面上。
清除在導覽列中通知,可在一發現純影像頁面時,就讓 Power PDF 顯示 [自動偵測] 對話方塊,沒有通知。
附註
當輸入檔案是文字檔或包含可存取的文字圖層時,會建立一般的可搜尋 PDF 而不會執行 OCR,因此在這些情形下,就不會使用 OCR 語言和拒絕字元設定。