Miten poimia ja tallentaa kuvia PDF-tiedostosta Linuxissa
Voit helposti muuntaa PDF-tiedostoja muokattavaksi tekstiksi Linuxissa komentorivin pdftotext-työkalulla. Jos alkuperäisessä PDF-tiedostossa on kuitenkin kuvia, niitä ei poisteta. Jos haluat poimia kuvia PDF-tiedostosta, voit käyttää toista komentorivityökalua, jonka nimi on ”pdfimages”.
HUOMAUTUS: Kun sanomme kirjoittaa tämän artikkelin ja tekstin ympärillä on lainauksia, ÄLÄ anna lainauksia, ellei toisin mainita.
”Pdfimages” -työkalu on osa poppler-utils-pakettia. Voit tarkistaa, onko se asennettu järjestelmään ja asenna se tarvittaessa tässä artikkelissa kuvatulla tavalla.
Jos haluat poimia kuvia PDF-tiedostosta pdfimagesin avulla, avaa pääteikkuna painamalla “Ctrl + Alt + T”. Kirjoita seuraava komento kehotteeseen.
pdfimages /home/lori/Documents/SampleWithImages.pdf / home / lori / Asiakirjat / ExtractedImages / image
HUOMAUTUS: Korvaa kaikki tässä artikkelissa esitetyt komennot komennon ensimmäinen polku ja PDF-tiedostonimi alkuperäisen PDF-tiedoston polulle ja tiedostonimelle. Toisen polun pitäisi olla polku juurikansioon, johon haluat tallentaa uutetut kuvat. Sana "kuva" toisen reitin lopussa edustaa mitä haluat etukäteen tiedostonimen kanssa. Kuvien tiedostonimet numeroidaan automaattisesti (000, 001, 002, 003 jne.). Jos haluat lisätä tekstiä kunkin kuvan alkuun, kirjoita se toisen polun loppuun. Esimerkissämme jokainen kuva-tiedostonimi alkaa ”kuvalla”, kuten kuva-001.ppm, kuva-002.ppm jne. Määritetyn tekstin ja numeron väliin lisätään viiva..
Kuvamuoto on oletusarvoisesti PPM (siirrettävä kuvakaappaus) ei-yksivärisille kuville tai PBM (kannettava bittikartta) yksivärisille kuville. Nämä muodot on suunniteltu vaihtamaan helposti alustojen välillä.
HUOMAUTUS: Saatat saada kaksi kuvatiedostoa jokaiselle PDF-tiedoston kuvalle. Toinen kuva jokaiselle kuvalle on tyhjä, joten voit kertoa, mitkä kuvat sisältävät tiedostosta tiedostot tiedostonhallinnan pienoiskuvan avulla..
Jos haluat luoda .jpg-kuvatiedostoja, lisää komentoon "-j" vaihtoehto, kuten alla on esitetty.
pdfimages -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Asiakirjat / ExtractedImages / image
HUOMAUTUS: Voit myös muuttaa oletuslähdön PNG: ksi käyttämällä “-png” -vaihtoehtoa tai TIFF-toimintoa “-tiff” -vaihtoehdolla.
Jokaisen kuvan pääkuva-tiedosto tallennetaan .jpg-tiedostona. Toinen tyhjä kuva on edelleen .ppm- tai .pbm-tiedosto.
Jos haluat vain muuntaa kuvia tietylle sivulle ja sen jälkeen, käytä “-f” -vaihtoehtoa, jossa on numero, josta näet ensimmäisen muunnettavan sivun, kuten alla olevassa esimerkkikomennossa näkyy.
pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Asiakirjat / ExtractedImages / image
HUOMAUTUS: Yhdistimme "-j" -vaihtoehdon "-f" -vaihtoehdon kanssa, jotta saisimme .jpg-kuvat ja teimme saman myös "-l" -vaihtoehdon, joka on mainittu alla..
Jos haluat muuntaa kaikki kuvat ennen tiettyä sivua ja tiettyä sivua, käytä "-l" (pienen "L", ei numeron "1") vaihtoehtoa, jossa on numero, josta näkyy viimeinen muunnettava sivu, kuten alla on esitetty.
pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Asiakirjat / ExtractedImages / image
HUOMAUTUS: Voit muuntaa kuvat tietyllä sivualueella asiakirjan keskellä käyttämällä -f- ja -l-vaihtoehtoja..
Jos PDF-tiedostossa on omistajan salasana, käytä “-opw” -vaihtoehtoa ja salasanaa yksittäisissä lainauksissa, kuten alla on esitetty. Jos PDF-tiedoston salasana on käyttäjän salasana, käytä salasanalla sen sijaan -upw-vaihtoehtoa.
HUOMAUTUS: Varmista, että komentossasi on yksittäisiä lainausmerkkejä.
pdfimages -opw 'password' -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Asiakirjat / ExtractedImages / image
Saat lisätietoja pdfimages-komennon käytöstä kirjoittamalla Terminal-ikkunan kehotteeseen ”pdfimages” ja painamalla “Enter”. Komennon käyttötarkoitus näyttää luettelon komennossa käytettävistä vaihtoehdoista.