Jak extrahovat a ukládat obrázky ze souboru PDF v systému Linux

Video: Jak extrahovat a ukládat obrázky ze souboru PDF v systému Linux

Video: Jak extrahovat a ukládat obrázky ze souboru PDF v systému Linux
Video: 25 Things You Can Do With QuickTime Player 2024, Březen
Jak extrahovat a ukládat obrázky ze souboru PDF v systému Linux
Jak extrahovat a ukládat obrázky ze souboru PDF v systému Linux
Anonim
Můžete snadno převést soubory PDF do upravitelného textu v systému Linux pomocí nástroje příkazového řádku "pdftotext". Pokud však v původním souboru PDF existují nějaké obrázky, nejsou vyčerpány. Chcete-li extrahovat obrázky ze souboru PDF, můžete použít jiný nástroj příkazového řádku s názvem "pdfimages".
Můžete snadno převést soubory PDF do upravitelného textu v systému Linux pomocí nástroje příkazového řádku "pdftotext". Pokud však v původním souboru PDF existují nějaké obrázky, nejsou vyčerpány. Chcete-li extrahovat obrázky ze souboru PDF, můžete použít jiný nástroj příkazového řádku s názvem "pdfimages".

POZNÁMKA: Když řekneme něco napsat v tomto článku a v textu jsou citace, NEVIDÍTE citace, pokud nestanovíme jinak.

Nástroj "pdfimages" je součástí balíčku poppler-utils. Můžete zkontrolovat, zda je nainstalován v systému a případně jej nainstalovat podle kroků popsaných v tomto článku.

Chcete-li extrahovat obrázky ze souboru PDF pomocí pdfimages, stisknutím klávesy Ctrl + Alt + T otevřete okno Terminál. Na výzvu zadejte následující příkaz.

pdfimages /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

Poznámka: Pro všechny příkazy uvedené v tomto článku nahradit první cestu v příkazu a název souboru PDF cestu a název souboru pro původní soubor PDF. Druhá cesta by měla být cesta k kořenové složce, do které chcete ukládat extrahované obrázky. Slovo "obrázek" na konci druhé cesty představuje to, co chcete předat s vaším názvem souboru. Názvy souborů snímků jsou automaticky číslovány (000, 001, 002, 003 atd.). Chcete-li přidat text na začátek každého obrázku, zadejte tento text na konci druhé cesty. V našem příkladu bude každý název souboru obrázku začínat "obrazem", jako je image-001.ppm, image-002.ppm atd. Mezi text, který zadáte, a číslo přidáte pomlčku.

Výchozí formát obrázku je PPM (přenosný pixmap) pro non-monochromatické obrázky nebo PBM (přenosné bitmapy) pro monochromatické obrázky. Tyto formáty jsou navrženy pro snadnou výměnu mezi platformami.
Výchozí formát obrázku je PPM (přenosný pixmap) pro non-monochromatické obrázky nebo PBM (přenosné bitmapy) pro monochromatické obrázky. Tyto formáty jsou navrženy pro snadnou výměnu mezi platformami.

POZNÁMKA: V souboru PDF můžete získat dva obrazové soubory pro každý obrázek. Druhý snímek pro každý snímek je prázdný, takže budete moci zjistit, které obrázky obsahují obrázky ze souboru podle miniatury v souboru ve Správci souborů.

Chcete-li vytvořit soubory obrázků.jpg, přidejte k příkazu příkaz "-j", jak je uvedeno níže.
Chcete-li vytvořit soubory obrázků.jpg, přidejte k příkazu příkaz "-j", jak je uvedeno níže.

pdfimages -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

POZNÁMKA: Výchozí výstup můžete také změnit na PNG pomocí volby "-png" nebo TIFF pomocí volby "-tiff".

Hlavní obrazový soubor pro každý snímek je uložen jako soubor.jpg. Druhý prázdný snímek je stále soubor.ppm nebo.pbm.
Hlavní obrazový soubor pro každý snímek je uložen jako soubor.jpg. Druhý prázdný snímek je stále soubor.ppm nebo.pbm.
Pokud chcete převést obrázky pouze na určitou stránku a po ní, použijte volbu "-f" číslem, abyste označili první stránku, kterou chcete převést, jak je ukázáno v příkladovém příkazu níže.
Pokud chcete převést obrázky pouze na určitou stránku a po ní, použijte volbu "-f" číslem, abyste označili první stránku, kterou chcete převést, jak je ukázáno v příkladovém příkazu níže.

pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

POZNÁMKA: Kombinovali jsme volbu "-j" s volbou "-f", abychom získali obrázky.jpg a udělali totéž s volbou "-l" uvedenou níže.

Chcete-li převést všechny obrázky před a na určité stránce, použijte volbu "-l" (malá písmena "L", nikoliv číslo "1") s číslem, která označuje poslední stránku, kterou chcete převést, jak je uvedeno níže.
Chcete-li převést všechny obrázky před a na určité stránce, použijte volbu "-l" (malá písmena "L", nikoliv číslo "1") s číslem, která označuje poslední stránku, kterou chcete převést, jak je uvedeno níže.

pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

Poznámka: Můžete použít možnosti "-f" a "-l" společně převést obrazy v určitém rozsahu stránek uprostřed dokumentu.

Pokud v souboru PDF existuje heslo majitele, použijte volbu "-opw" a heslo v jednoduchých uvozovkách, jak je uvedeno níže. Pokud je heslo v souboru PDF uživatelským heslem, použijte volbu "-upw" místo hesla.
Pokud v souboru PDF existuje heslo majitele, použijte volbu "-opw" a heslo v jednoduchých uvozovkách, jak je uvedeno níže. Pokud je heslo v souboru PDF uživatelským heslem, použijte volbu "-upw" místo hesla.

POZNÁMKA: Ujistěte se, že máte v příkazu pouze jedno uvozovky.

pdfimages -opw ‘password’ -j /home/lori/Documents/SampleWithImages.pdf /home/lori/Documents/ExtractedImages/image

Doporučuje: