PDF-tiedoston muuntaminen muokattavaksi tekstiksi käyttämällä komentoriviä Linuxissa
On monia syitä, miksi haluat ehkä muuntaa PDF-tiedoston muokattavaksi tekstiksi. Ehkä sinun täytyy tarkistaa vanha asiakirja ja kaikki, mitä sinulla on, on sen PDF-versio. PDF-tiedostojen muuntaminen Windowsissa on helppoa, mutta mitä jos käytät Linuxia?
Ei huolia. Näytämme, miten PDF-tiedostot voidaan helposti muuntaa muokattavaksi tekstiksi käyttämällä pdftotext-nimistä komentorivityökalua, joka on osa "poppler-utils" -pakettia. Tämä työkalu on jo asennettu. Jos haluat tarkistaa, onko pdftotext asennettu järjestelmään, avaa pääteikkuna painamalla Ctrl + Alt + T. Kirjoita seuraava komento kehotteeseen ja paina "Enter".
dpkg -s poppler-utils
HUOMAUTUS: Kun sanomme kirjoittaa tämän artikkelin ja tekstin ympärillä on lainauksia, ÄLÄ anna lainauksia, ellei toisin mainita.
Jos pdftotextia ei ole asennettu, kirjoita seuraava komento kehotteeseen ja paina "Enter".
sudo apt-get asenna poppler-utils
Kirjoita salasana, kun sitä pyydetään, ja paina "Enter".
Poppler-utils-paketissa on useita työkaluja, joiden avulla PDF voidaan muuntaa eri formaatteihin, käsitellä PDF-tiedostoja ja saada tietoja tiedostoista.
Seuraavassa on peruskomento muunnettaessa PDF-tiedosto muokattavaksi tekstitiedostoksi. Paina “Ctrl + Alt + T” avataksesi pääteikkunan, kirjoita komento kehotteeseen ja paina “Enter”.
pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Muuta jokaisen tiedoston polku vastaamaan alkuperäisen PDF-tiedoston sijaintia ja nimeä ja mihin haluat tallentaa tuloksena olevan tekstitiedoston. Vaihda myös tiedostonimet vastaamaan tiedostojen nimiä.
Tekstitiedosto luodaan ja voidaan avata aivan kuten avaat minkä tahansa muun tekstitiedoston Linuxissa.
Muunnetulla tekstillä voi olla rivinvaihto paikoissa, joita et halua. Rivikatkot lisätään PDF-tiedoston jokaisen rivin jälkeen.
Voit säilyttää asiakirjan ulkoasun (otsikot, alatunnisteet, sivut jne.) Muunnetussa tekstitiedostossa olevasta alkuperäisestä PDF-tiedostosta käyttämällä "-layout" -lippua.
pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Jos haluat muuntaa vain PDF-tiedostosivun, käytä "-f" ja "-l" (pienet "L") liput, jos haluat määrittää ensimmäisen ja viimeisen sivun muunneltavalle alueelle.
pdftotext -f 5 -l 9 / home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Jos haluat muuntaa suojatun ja salatun PDF-tiedoston omistajan salasanalla, käytä “-opw” -lippua (lipun ensimmäinen merkki on pienen kirjaimen O, ei nolla).
pdftotext -opw 'password' /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Muuta ”salasana” siihen, jota käytetään muunnettavan alkuperäisen PDF-tiedoston suojaamiseen. Varmista, että yhden salasanan ympärillä on yksittäisiä lainausmerkkejä.
Jos PDF-tiedosto on suojattu ja salattu käyttäjän salasanalla, käytä ”-ww” -lippua ”-opw” -lippun sijasta. Loput komennosta ovat samat.
Voit myös määrittää muunnellulle tekstille sovellettavan rivin merkin tyypin. Tämä on erityisen hyödyllistä, jos aiot käyttää tiedostoa eri käyttöjärjestelmässä, kuten Windowsissa tai Macissa. Voit tehdä tämän käyttämällä "-eol" -lippua (lipun keskimerkki on pienen kirjaimen "O", ei nolla), jota seuraa välilyönti ja rivimerkin tyyppi, jota haluat käyttää (" unix ”,“ dos ”tai“ mac ”).
HUOMAUTUS: Jos et määritä tekstitiedostolle tiedostonimeä, pdftotext käyttää automaattisesti PDF-tiedostonimen perustaa ja lisää ".txt" -laajennuksen. Esimerkiksi "file.pdf" muunnetaan tiedostoksi "file.txt". Jos tekstitiedosto on määritetty nimellä "-", muunnettu teksti lähetetään stdoutiin, mikä tarkoittaa, että teksti näkyy Terminal-ikkunassa eikä tallenneta tiedostoon.
Sulje Terminal -ikkuna napsauttamalla vasemmassa yläkulmassa olevaa X-painiketta.
Jos haluat lisätietoja pdftotext-komennosta, kirjoita "man page pdftotext" -kenttään pääteikkunan kehotteessa.