Prohledávatelné PDF

Pokud máte obrazové soubory PDF obsahující text nebo soubory PDF ze souborů obrázků obsahujících text, nebude možné tyto dokumenty prohledávat na základě jejich obsahu. Chcete-li tyto soubory prohledávat, je třeba použít funkci OCR a extrahovat z nich text. Prohledávatelný dokument PDF se skládá nejen z obrázků stránek, ale také ze samostatné vrstvy rozpoznaného textu, přičemž každý znak textu je propojený se svým obrazovým protějškem. Tato funkce umožňuje prohledávání souboru PDF. Prohledávatelný formát PDF je obzvláště užitečný v případech, kdy je třeba mít přístup k obsahu dokumentů, jež musí být archivovány přesně v původní podobě.

 

Poznámka

Když vyberete položku Prohledávatelný soubor PDF, dojde ke spuštění zpracování OCR pouze v případě, že ve vstupním souboru není zjištěna žádná dostupná vrstva textu. V případě nalezení vrstvy textu bude tato vrstva použita k vytvoření normálního souboru PDF, který lze prohledávat bez nutnosti spuštění OCR. K tomu dojde i v případě, že je položka Prohledávatelný soubor PDF zakázána.

 

Ke změně souborů PDF pouze s obrázky nebo různých typů souborů obrázků na prohledávatelné dokumenty PDF můžete použít aplikaci Create Assistant.

V dialogovém okně Nastavení převodu prohledávatelného PDF můžete nastavit jazyk OCR.

Tip

Viz seznam podporovaných typů souborů v aplikaci Create Assistant.

 

Aplikace Create Assistant poskytuje samostatný profil nazvaný Prohledávatelný soubor PDF, ale prohledávatelný soubor PDF lze také vytvořit pomocí jiných profilů se zaškrtnutým políčkem Prohledávatelný soubor PDF.

 

Použití profilu „Prohledávatelný soubor PDF“ v aplikaci Create Assistant

Ikona Možnosti

  1. Ve výběrovém poli Profil aplikace Create Assistant vyberte položku Prohledávatelný soubor PDF.

  2. Otevřete jeden nebo několik soubor, které chcete změnit na prohledávatelné soubory PDF.

  3. Klikněte na tlačítko Profily a zkontrolujte nastavení v dialogovém okně Profily aplikace PDF Create. Dojde k automatickému zaškrtnutí políčka Prohledávatelné PDF. Zachovejte toto nastavení a podle potřeby změňte ostatní nastavení (například zabezpečení, vodoznak, atd.).

  4. Kliknutím na tlačítko Nastavení zobrazte dialogové okno Nastavení převodu prohledávatelného PDF. Vyberte jazyk zdrojového dokumentu a poté dialogové okno zavřete. Kliknutím na tlačítko OK zavřete dialogové okno Profily aplikace PDF Create.

  5. Start PDF creation icon
    Klikněte na nástroj Spustit vytváření souboru PDF. Pokud vyberete několik souborů s možností Vytvořit soubor PDF pro každý vstupní dokument a nastavíte položku Dotázat název souboru jako možnost pro ukládání, zobrazí se dialogové okno Uložit jako pro každý generovaný soubor PDF zvlášť.

Vytváření prohledávatelného PDF pomocí ostatních profilů

Ikona Možnosti

  1. Ve výběrovém poli Profil aplikace Create Assistant vyberte profil a načtěte soubory.

  2. Klikněte na tlačítko Profily.

  3. V dialogovém okně Profily aplikace PDF Create zaškrtněte políčko Prohledávatelný.

  4. Kliknutím na tlačítko Nastavení zobrazte dialogové okno Nastavení převodu prohledávatelného PDF. Vyberte jazyk zdrojového dokumentu a poté klikněte na tlačítko OK.

  5. V dialogovém okně Profily aplikace PDF Create zkontrolujte a podle potřeby změňte další nastavení (například zabezpečení, vodoznak, atd.). Klikněte na tlačítko OK a spusťte vytváření podle výše uvedených pokynů.

Tip

Chcete-li získat Prohledávatelné PDF s kompresí MRC, zaškrtněte obě políčka. V takovém případě se po kliknutí na tlačítko Nastavení zobrazí dialogové okno Nastavení převodu prohledávatelných souborů PDF s MRC.

 

 

Pokud v aplikaci Power PDF otevřete soubor PDF pouze s obrázky nebo soubor, který obsahuje stránky pouze s obrázky, je možné nastavit automatické zjišťování této skutečnosti programem (Soubor > Možnosti > Dokument > Prohledávatelné dokumenty PDF). Chcete-li tuto akci provést, zrušte zaškrtnutí příslušného políčka (ve výchozím nastavení je políčko zaškrtnuto). Jsou-li povoleny výzvy, program nabídne vytvoření následujících dokumentů:

  • Prohledávatelný soubor PDF: Vyberete-li tuto volbu, původní obrázky stránek budou zachovány, takže bude zachován vzhled, ale přidá se prohledávatelná textová vrstva.

  • Normální PDF: Dojde k vytvoření textu a zachování obrázků, ale obrázky původní stránky budou odstraněny.

  • Formulář PDF: Pomocí nástroje Form Typer se v souboru vytvoří aktivní ovládací prvky formuláře.

  • Zachování původního souboru PDF: Soubor zůstane v původním stavu.

Více podrobností naleznete v části O úpravách dokumentů PDF.

 

Poznámka

Ikona Prohledávatelné PDF

V aplikaci Power PDF je možné změnit soubor PDF pouze s obrázky nebo soubor s částmi tvořenými pouze obrázky na prohledávatelný soubor PDF pomocí příkazu Vytvořit prohledávatelný soubor PDF v nabídce Domů > Převést. Tento převod můžete ovlivnit v části Soubor > Možnosti > Dokument > Prohledávatelné dokumenty PDF. Určete, zda se má funkce OCR spouštět jen na stránkách s částmi tvořenými pouze obrázky nebo na všech stránkách – v tomto případě se veškerý obsah textové vrstvy v souboru PDF nahradí výsledky funkce OCR. Jiná možnost povoluje spuštění funkce OCR, pokud je textová vrstva přítomna, avšak nepoužitelná v důsledku nestandardního kódování. Na vygenerovaném textu lze provést korekturu, aby se zvýšila jeho přesnost po procesu OCR.