Kotisivu » Ilmaiset ohjelmistolataukset » Pura teksti PDF- ja kuvatiedostoista

    Pura teksti PDF- ja kuvatiedostoista

    Onko PDF-dokumentti, jonka haluat poistaa kaikista teksteistä? Entä skannatun asiakirjan kuvatiedostot, jotka haluat muuntaa muokattavaksi tekstiksi? Nämä ovat joitakin yleisimpiä ongelmia, joita olen nähnyt työpaikalla tiedostojen käsittelyssä.

    Tässä artikkelissa puhun useista eri tavoista, joilla voit yrittää poimia tekstiä PDF-tiedostosta tai kuvasta. Uuttamistulokset vaihtelevat PDF- tai kuvan tekstin tyypin ja laadun mukaan. Tulokset vaihtelevat myös käytetyn työkalun mukaan, joten on parasta kokeilla mahdollisimman monta alla olevaa vaihtoehtoa saadaksesi parhaat tulokset.

    Pura teksti kuvasta tai PDF-tiedostosta

    Yksinkertaisin ja nopein tapa aloittaa on kokeilla online-PDF-tekstinpoistopalvelua. Nämä ovat yleensä ilmaisia, ja ne voivat antaa sinulle juuri sen, mitä etsit ilman, että sinun tarvitsee asentaa mitään tietokoneellesi. Tässä on kaksi, joita olen käyttänyt erittäin hyvien tulosten saavuttamiseksi:

    ExtractPDF

    ExtractPDF on ilmainen työkalu kuvien, tekstien ja fonttien tarttumiseen PDF-tiedostosta. Ainoa rajoitus on, että PDF-tiedoston enimmäiskoko on 10 Mt. Se on vähän pieni; joten jos sinulla on suurempi tiedosto, kokeile muita alla olevia menetelmiä. Valitse tiedosto ja napsauta sitten Lähetä tiedosto painiketta. Tulokset ovat yleensä hyvin nopeita ja tekstin esikatselu tulee nähdä, kun napsautat Teksti-välilehteä.

    On myös mukavaa lisäetua, että se poimii myös kuvia PDF-tiedostosta, jos tarvitset niitä! Kaiken kaikkiaan online-työkalu toimii hyvin, mutta olen joutunut pari PDF-dokumenttia, jotka antavat minulle hauskoja tuloksia. Teksti uutetaan hienosti, mutta jostain syystä se on rivinvaihto jokaisen sanan jälkeen! Ei ole suuri ongelma lyhyelle PDF-tiedostolle, mutta varmasti ongelma tiedostoille, joissa on paljon tekstiä. Jos näin tapahtuu, kokeile seuraavaa työkalua.

    Online-tekstintunnistus

    Online-tekstintunnistus yleensä pyrki työskentelemään asiakirjoilla, jotka eivät muunneet oikein ExtractPDF: llä, joten kannattaa kokeilla molempia palveluja nähdäksesi, mitkä antavat sinulle paremman tuotoksen. Online-tekstintunnistusohjelmassa on myös joitakin mukavampia ominaisuuksia, jotka voivat osoittautua käteviksi kaikille, joilla on suuri PDF-tiedosto, joka tarvitsee vain muuntaa tekstin muutaman sivun sijaan koko asiakirjan.

    Ensimmäinen asia, jonka haluat tehdä, on mennä eteenpäin ja luoda ilmainen tili. Se on hieman ärsyttävää, mutta jos et luo ilmaista tiliä, se muuntaa PDF-tiedoston vain osittain koko asiakirjan sijaan. Lisäksi sen sijaan, että voisit vain ladata vain 5 MB: n asiakirjan, voit ladata enintään 100 Mt tiedostoa kohden tilillä.

    Valitse ensin kieli ja valitse sitten tulostettavien tiedostojen tyyppi. Sinulla on pari vaihtoehtoa ja voit valita useamman kuin yhden. Alla Monisivuinen asiakirja, voit valita Sivunumerot ja valitse vain ne sivut, jotka haluat muuntaa. Valitse sitten tiedosto ja napsauta Muuntaa!

    Muuntamisen jälkeen sinut tuodaan Asiakirjat-osioon (jos olet kirjautunut sisään), jossa voit nähdä, kuinka monta vapaata sivua olet poistunut ja linkit ladattujen tiedostojen lataamiseen. Tuntuu siltä, ​​että sinulla on vain 25 sivua ilmaiseksi päivässä, joten jos tarvitset enemmän kuin sinun, sinun täytyy joko odottaa vähän tai ostaa lisää sivuja.

    Online-tekstintunnistus teki erinomaisen työn muuntamalla PDF-tiedostoja, koska se pystyi säilyttämään tekstin todellisen asettelun. Kokeessani otin Word-asiakirjan, joka käytti luoteja, eri fonttikokoja jne. Ja muutti sen PDF-tiedostoksi. Sitten käytin Online OCR: ää muuntamaan sen takaisin Word-muotoon ja se oli noin 95% sama kuin alkuperäinen. Se on melko vaikuttava minulle.

    Lisäksi, jos haluat muuntaa kuvan tekstiksi, Online OCR voi tehdä sen yhtä helposti kuin tekstin poiminta PDF-tiedostoista.

    Ilmainen online-tekstintunnistus

    Koska puhuimme tekstistä tekstintunnistukseen, haluan mainita toisen hyvän verkkosivuston, joka toimii todella hyvin kuvissa. Ilmainen online-tekstintunnistus oli erittäin hyvä ja erittäin tarkka, kun otin tekstiä testikuvista. Otin pari kuvaa iPhonesta kirjoja, esitteitä jne. Sivuilta, ja olin yllättynyt siitä, kuinka hyvin se pystyi muuntamaan tekstin.

    Valitse tiedosto ja napsauta sitten Lataa-painiketta. Seuraavassa näytössä on pari vaihtoehtoa ja kuvan esikatselu. Voit rajata sen, jos et halua kirjoittaa OCR: ää. Napsauta sitten OCR-painiketta ja muunnettu teksti näkyy kuvan esikatselun alapuolella. Sillä ei myöskään ole rajoituksia, mikä on todella mukavaa.

    Verkkopalvelujen lisäksi on kaksi vapaata PDF-muunninta, joita haluan mainita, jos tarvitset ohjelmistoja, jotka toimivat paikallisesti tietokoneessa, jotta voit suorittaa tuloksen. Verkkopalveluissa tarvitset aina Internet-yhteyden ja se ei ehkä ole mahdollista kaikille. Huomasin kuitenkin, että freeware-ohjelmien konversioiden laatu oli huomattavasti huonompi kuin verkkosivustojen laatu.

    PDF-tekstin poisto

    PDF-tekstin poisto-ohjelma on freeware, joka tekee melko hyvän työn tekstin poimimisesta PDF-tiedostoista. Kun olet ladannut sen ja asentanut sen, valitse PDF-tiedosto napsauttamalla Avaa-painiketta. Käynnistä prosessi napsauttamalla sitten Extract text.

    Se pyytää sinua tallentamaan tekstin tulostustiedoston ja sen jälkeen se alkaa purkaa. Voit myös napsauttaa Vaihtoehto -painike, jonka avulla voit valita vain tietyt sivut, joita haluat purkaa, ja poimintatyypin. Toinen vaihtoehto on mielenkiintoinen, koska se poimii tekstin eri asetteluissa ja kannattaa kokeilla kaikkia kolmea nähdäksesi, mitkä antavat sinulle parhaan tuloksen.

    PDF2Text Pilot

    PDF2Text Pilot tekee hyvää työtä tekstin purkamisessa. Siinä ei ole vaihtoehtoja; lisäät vain tiedostoja tai kansioita, muuntaa ja toivoa parasta. Se toimi hyvin joissakin PDF-tiedostoissa, mutta useimmissa niistä oli lukuisia kysymyksiä.

    Napsauta Lisää tiedostoja ja valitse sitten Muuntaa. Kun muunnos on valmis, avaa tiedosto napsauttamalla Selaa. Etäisyys vaihtelee tämän ohjelman avulla, joten älä odota paljon.

    Lisäksi on syytä mainita, että jos olet yritysympäristössä tai voit saada käsiisi Adobe Acrobatin kopiosta työstä, voit todella saada paljon parempia tuloksia. Acrobat ei tietenkään ole ilmainen, mutta sillä on vaihtoehtoja muuntaa PDF-tiedosto Wordiin, Exceliin ja HTML-muotoon. Se tekee myös parhaan työn ylläpitää alkuperäisen asiakirjan rakennetta ja muuntaa monimutkaisen tekstin.