Tesseract.js Tuo kuvan OCR-käännöksen selaimiin

OCR-käännös ei vieläkään ole täydellinen, mutta se on parantunut dramaattisesti viime vuosina. Tesseract on johtava tapa käännösmoottori tällä hetkellä avoinna C++.

Vaikka tämä on uskomaton kirjasto, se on kuitenkin vain ohjelmistoja. Onneksi joku teki Tesseractin sataman JavaScriptiin, jota kutsutaan nimellä Tesseract.js. Se tukee jopa 60 kieltä ja vaikka se ei todellakaan ole täydellinen, se tekee työn hyvin.

Asennus ja asennus on helppoa missä voit kohdistetaan mihin tahansa kuvaan sivulla ja suorita Tesseract.recognize () toimia. Tämä voi viedä minkä tahansa kuvan ja se tulee automaattisesti pakata ja kääntää suoraan selaimessa.

Saat paljon monimutkaisemman, mutta kauneus on miten voit suorittaa OCR: n yhdellä koodirivillä.

Tarkista Tesseract.js-aloitussivu, jos haluat nähdä live-esittelyn. Tämä toimii juuri selaimessa, jossa voit vedä ja pudota skannattu kuva tekstistä, jotta saat automaattisen tekstintunnistuksen.

Voit myös ladata tämän esimerkin paikallisesti GitHub-sivun kautta tai voit rakentaa oman sovelluksesi lisäämällä Tesseract.js-komentosarjan suoraan CDN-levyltä.

Yksinkertaisin koodiesimerkki näyttää seuraavalta myImage on suora viittaus HTML-kuvaelementtiin:

 Tesseract.recognize (myImage) .en (toiminto (tulos) console.log (tulos));

Joka tapauksessa tämä kirjasto on niin hyödyllinen, että voit siirtyä OCR: n kanssa verkossa. Se on kaukana täydellisestä, mutta se on myös paras resurssi web-kehittäjille, jotka haluavat dynaamisen sivun OCR-toiminnon.

Lisätietoja on Tesseract.js GitHub -sivulla, jossa voit tarkistaa live-esittelyn ja selata online-dokumentaatiota.