5 ilmaista online-tekstintunnistuspalvelua testattu ja tarkistettu
Onko PDF-dokumentti tai kuva, jonka haluat muuntaa tekstiksi? Viime aikoina joku lähetti minulle sähköpostiviestissä asiakirjan, jota tarvitsin muokata ja lähettää takaisin korjauksilla. Henkilö ei löytänyt digitaalista kopiota, joten minulla oli tehtäväksi saada tämä teksti digitaaliseksi.
Minulla ei ollut mitään tapaa viettää aikaa kirjoittamalla kaiken takaisin, joten pääsin ottamaan mukavan laadukkaan kuvan asiakirjasta ja poltin sitten tiensä läpi monia online-tekstintunnistuspalveluita, jotta voisin nähdä, mikä voisi antaa minulle parhaan tulokset.
Tässä artikkelissa käydään läpi pari suosikkisivustoa OCR: lle, jotka ovat ilmaisia. On syytä huomata, että useimmat näistä sivustoista tarjoavat peruspalvelun ja maksavat sitten vaihtoehtoja, jos haluat lisäominaisuuksia, kuten suurempia kuvia, monisivuisia PDF-dokumentteja, erilaisia syöttökieliä jne..
On myös hyvä tietää etukäteen, että useimmat näistä palveluista eivät vastaa alkuperäisen asiakirjan muotoilua. Nämä ovat lähinnä tekstin poimintaan. Jos tarvitset kaiken, jos haluat olla tietyssä asettelussa tai muodossa, sinun on tehtävä se manuaalisesti, kun saat tekstin tekstintunnistuksesta.
Lisäksi parhaat tulokset tekstin saamiseksi tulevat asiakirjoista, joiden resoluutio on 200-400 DPI. Jos sinulla on alhainen DPI-kuva, tulokset eivät ole yhtä hyviä.
Lopuksi testasin paljon sivustoja, jotka eivät juuri toimi. Jos Google on ilmainen online-tekstintunnistus, näet joukon sivustoja, mutta useimmat 10 parhaan tuloksen sivustot eivät edes suorittaneet muuntamista. Jotkut ajautuisivat pois, muut antaisivat virheitä ja jotkut vain jäivät "muuntamaan" sivulle, joten en edes vaivaudu mainitsemaan näitä sivustoja.
Kullakin sivustolla testasin kaksi asiakirjaa, jotta voisin nähdä, kuinka hyvin tulos olisi. Testejä varten käytin yksinkertaisesti iPhonen 5S: ää ottamaan kuvan molemmista asiakirjoista ja ladoin ne sitten suoraan verkkosivustoille muuntamista varten.
Jos haluat nähdä, mitä kuvat näyttivät testistäni, olen liittänyt ne tähän: Test1 ja Test2. Huomaa, että nämä eivät ole puhelimesta otettujen kuvien tarkkuutta. Käytin koko resoluutiokuvaa ladattaessa sivustoihin.
OnlineOCR
OnlineOCR.net on puhdas ja yksinkertainen sivusto, joka toimitti erittäin hyviä tuloksia testissäni. Tärkeintä on se, että sillä ei ole tonnia mainoksia kaikkialla, mikä on yleensä tällaisten kapealla palvelualueilla..
Käynnistä valitsemalla tiedosto ja odota, kunnes lataus päättyy. Tämän sivuston enimmäiskoko on 100 Mt. Jos rekisteröidyt ilmaiseen tiliin, saat muutamia lisäominaisuuksia, kuten suurempaa latauskokoa, monisivuisia PDF-tiedostoja, erilaisia syöttökieliä, enemmän tuloksia tunnissa jne..
Valitse seuraavaksi syöttökieli ja valitse sitten tulostusmuoto. Voit valita Word, Excel tai Plain Text. Klikkaa Muuntaa -painiketta ja näet tekstin, joka näkyy laatikon alareunassa yhdessä latauslinkin kanssa.
Jos kaikki haluamasi teksti on, kopioi ja liitä se laatikosta. Suosittelen kuitenkin ladata Word-asiakirjan, koska se on yllättävän hyvä tehtävä alkuperäisen asiakirjan asettelun pitämiseksi.
Esimerkiksi, kun avasin Word-asiakirjan toista testiä varten, olin yllättynyt siitä, että asiakirja sisälsi taulukon, jossa oli kolme saraketta, aivan kuten kuvassa.
Kaikista sivustoista tämä oli ylivoimaisesti paras. On syytä rekisteröidä, jos tarvitset paljon tuloksia.
Täydellisyyden vuoksi aion myös linkittää kunkin palvelun tuottamat tulostustiedostot, jotta voit nähdä tulokset itse. Tässä ovat tulokset OnlineOCR: Test1 Doc ja Test2 Doc.
Huomaa, että kun avaat nämä Word-asiakirjat tietokoneellasi, saat Wordissa viestin, jonka mukaan se on Internetistä ja muokkaus on poistettu käytöstä. Se on täysin kunnossa, koska Word ei luota Internetissä oleviin asiakirjoihin, eikä sinun tarvitse todellakin tehdä muokkausta, jos haluat vain tarkastella asiakirjaa.
i2OCR
Toinen sivusto, joka antoi melko hyviä tuloksia, oli i2OCR. Prosessi on hyvin samanlainen: valitse kieli, tiedosto ja paina sitten Pura teksti.
Sinun täytyy odottaa hetki tai kaksi täällä, koska tämä sivusto kestää hieman kauemmin. Varmista myös vaiheessa 2, että kuva näkyy oikealla puolella ylöspäin esikatselussa, muuten saat tulosta nippu gibberishiä. Jostain syystä iPhonen kuvat näkyivät muotokuvaustilassa tietokoneessani, mutta maisema, kun lähetin tähän sivustoon.
Minun täytyi avata kuva manuaalisesti kuvankäsittelyohjelmassa, kiertää sitä 90 astetta ja kääntää se sitten muotokuvaan ja tallentaa se sitten uudelleen. Kun olet valmis, selaa alaspäin ja näyttää esikatselun tekstistä sekä latauspainiketta.
Tämä sivusto menestyi melko hyvin ensimmäisen testin tulosten kanssa, mutta ei tehnyt niin hyvin toisen testin kanssa, jolla oli sarakkeen asettelu. Seuraavassa on tulokset i2OCR: Test1 Doc ja Test2 Doc.
FreeOCR
Free-OCR.com ottaa kuvat ja muuntaa ne tavalliseksi tekstiksi. Sillä ei ole mahdollisuutta viedä Word-muotoon. Valitse tiedosto, valitse kieli ja valitse sitten alkaa.
Sivusto on nopea ja saat tuotoksen melko nopeasti. Klikkaa linkkiä ladataksesi tekstitiedoston tietokoneellesi.
Kuten alla olevassa kohdassa mainittu NewOCR, tämä sivusto hyödyntää kaikki asiakirjan T: t. Minulla ei ole aavistustakaan, miksi se tekisi niin, mutta jotenkin outoa syytä tämä sivusto ja NewOCR tekivät niin. Se ei ole iso asia muuttaa sitä, mutta se on ikävä prosessi, jota sinun ei pitäisi tehdä.
Tässä ovat tulokset FreeOCR: Test1 Doc ja Test2 Doc.
ABBYY FineReader Online
FineReader Online -palvelun käyttämiseksi sinun on rekisteröidyttävä tilille, joka saa 15 päivän maksuttoman kokeilun OCR: ään jopa 10 sivulle ilmaiseksi. Jos tarvitset vain kerran OCR: n vain muutaman sivun, voit käyttää tätä palvelua. Varmista, että napsautat vahvistusviestin vahvistussähköpostissa rekisteröinnin jälkeen.
Klikkaa Tunnistaa yläosassa ja valitse sitten upload valita tiedosto. Valitse kieli, tulostusmuoto ja napsauta sitten Tunnistaa pohjalla. Tällä sivustolla on puhdas käyttöliittymä eikä myöskään mainoksia.
Testissäni tämä sivusto pystyi tarttumaan tekstiin ensimmäisestä testiasiakirjasta, mutta se oli täysin valtava, kun avasin Word-asiakirjan, joten päädyin tekemään sen uudelleen ja valitsemalla tulostusmuodoksi Plain Text..
Toisessa testissä sarakkeilla Word-dokumentti oli tyhjä, enkä edes löytänyt tekstiä. Etkö ole varma, mitä siellä tapahtui, mutta se ei näytä pystyvän käsittelemään mitään muuta kuin yksinkertaisia kappaleita. Tässä ovat tulokset FineReader: Test1 Doc ja Test2 Doc.
NewOCR
Seuraava sivusto, NewOCR.com, oli OK, mutta ei lähes yhtä hyvä kuin ensimmäinen sivusto. Ensinnäkin, siinä on mainoksia, mutta ei onneksi. Valitse ensin tiedosto ja napsauta sitten esikatselu nappi.
Voit sitten kiertää kuvaa ja säätää aluetta, johon haluat skannata tekstiä. Se on melko paljon sellaista, miten skannausprosessi toimii tietokoneessa, jossa on liitetty skanneri.
Jos asiakirjassa on useita sarakkeita, voit tarkistaa Sivun asetteluanalyysi -painike ja se yrittää jakaa tekstin sarakkeisiin. Napsauta OCR-painiketta, odota muutama sekunti, kunnes se on valmis, ja selaa sitten alaspäin, kun sivu päivittyy.
Ensimmäisessä testissä se sai kaiken tekstin oikein, mutta jostakin syystä aktivoi jokaisen asiakirjan T: n! Ei ole aavistustakaan, miksi se tekisi sen, mutta se teki. Toisessa testissä, jossa sivun analyysi oli käytössä, se sai suurimman osan tekstistä, mutta ulkoasu oli kokonaan pois.
Tässä ovat tulokset NewOCR: Test1 Doc ja Test2 Doc.
johtopäätös
Kuten näette, vapaa ei todellakaan anna sinulle hyviä tuloksia suurimman osan ajasta valitettavasti. Ensimmäinen mainittu sivusto on ylivoimaisesti paras, koska se ei vain tehnyt hyvää työtä koko tekstin tunnistamisessa, vaan se onnistui myös säilyttämään alkuperäisen asiakirjan muodon.
Jos tarvitset vain tekstiä, useimmilla yllä mainituilla verkkosivuilla pitäisi olla mahdollisuus tehdä se sinulle. Jos sinulla on kysyttävää, voit kommentoida. Nauttia!