Un program pentru recunoașterea unui document scanat. Cele mai bune programe de recunoaștere a textului

Recunoașterea optică a textului este un proces în care textul fotografiat sau scanat este convertit în format de document folosind un program special.

Adică, în loc de o imagine, veți avea un text tip standard care poate fi editat.

În acest material vom discuta care program de recunoaștere a textului este mai bun (TOP 7 utilități sunt prezentate mai jos).

Alegere

Cum să alegi cel mai potrivit program și ce caracteristici principale are un astfel de software?

Poate diferi în diverși indicatori - acuratețea recunoașterii, capacitatea de a lucra cu o anumită limbă, capacitatea de a păstra structura originală a textului etc.

Un astfel de software poate fi distribuit contra cost sau gratuit și poate fi implementat atât online (sub formă de servicii speciale), cât și sub formă de programe preinstalate.

Algoritmul de lucru este că pentru fiecare literă a alfabetului este compilată o bază de date cu opțiuni despre cum poate arăta într-o fotografie, elementele sale principale sunt evidențiate și salvate. De îndată ce astfel de elemente sunt detectate în fotografie, programul recunoaște litera corespunzătoare. În funcție de cât de bine și în detaliu a fost compilată o astfel de bază de date, calitatea recunoașterii materialelor depinde în cele din urmă.

Prin urmare, este important ca software-ul să fie proiectat să funcționeze special cu limba rusă (unele programe pot funcționa cu text scris în două limbi simultan, altele nu).

În plus, unele utilități și servicii sunt capabile să păstreze chiar și structura originală a textului (, liste), tipul său de design (indenturi etc.) și chiar .

În ce cazuri este necesar un astfel de software?

  • La crearea documentelor când este disponibilă doar o versiune tipărită;
  • La compilarea rezumatelor, rapoartelor și nevoia de a cita un fragment mare de text dintr-o carte;
  • Pentru lucrări editoriale, când textul este disponibil doar în format foto etc.

De fapt, domeniul de aplicare al software-ului este foarte larg și, dacă este ales corect, poate face lucrul cu textul mai ușor și mai rapid.

Specificații

Software-ul diferă în multe privințe: metoda de implementare (online sau sub formă de utilitar), licența de utilizare (plătită sau gratuită), lista de limbi recunoscute, calitatea recunoașterii și multe altele.

Pentru ca utilizatorul să facă alegere corectă cât mai repede posibil, tabelul de mai jos prezintă principalele caracteristici ale unor astfel de programe.

Titluri Licenţă Scanare Verificarea ortografică Traducere Procesarea textului în editor Lucrul cu text scris de mână Lucrul cu imagini calitate slabă
Abbyy Fine Reader Plătit, cu gratuit perioada de probă timp de 10 zile Da Da Da parţial parţial Da
OCR Cunei Form Gratuit Da Da Nu Da Nu Da
Readiris Pro Nu Da Nu Da Da Da
OCR Freemore Gratuit Da Nu Nu Da Nu Da
Cititor de capturi de ecran Abbyy Plătit, cu probă gratuită de 14 zile Nu Da Da Nu Nu parţial
Adobe Acrobat Plătit, cu o perioadă de încercare gratuită de 7 zile Da Nu Nu parţial Nu parţial
OCR online gratuit Gratuit Nu Nu Nu Nu parţial Da

Toate utilitatile enumerate in tabelul de mai jos sunt descrise in detaliu si sunt plasate in ordinea TOP, de la cel mai bun la cel mai rau.

Abbyy Fine Reader

Acesta este software-ul de cea mai înaltă calitate și multifuncțional din acest TOP. Se distinge prin acuratețea înaltă a recunoașterii și are o serie de avantaje; este distribuit contra cost.

Programul funcționează cu succes în multe limbi în timpul recunoașterii, este capabil să păstreze structura textului și tipul de formatare.

Este destinat profesioniștilor, prin urmare, potrivit celor mai mulți utilizatori, merită banii.

  • Număr mare de limbi acceptate;
  • Capacitatea de a păstra stilul de formatare și caracteristicile structurale ale unui document destul de precis;
  • Disponibilitatea unei versiuni de încercare gratuită timp de 10 zile;
  • Nicio reducere a calității muncii chiar și cu volume mari text (ceea ce se observă adesea în alte programe care recunosc textul din ce în ce mai rău cu fiecare fotografie încărcată ulterioară, iar problema este corectată numai după o repornire).

Recenzii despre acest software diferit:" Program bun, ajută foarte mult în munca mea”, „Nu merită banii - există programe gratuite cu aceeași calitate a recunoașterii.”

OCR Cunei Form

OCR Cunei Form este poate una dintre cele mai funcționale și programe convenabile, dintre cele distribuite gratuit.

Oferă o calitate destul de ridicată a recunoașterii și funcționează chiar și cu fotografii de calitate slabă.

Programul vă permite să editați o fotografie direct în timp ce lucrați cu ea și recunoaște destul de bine fonturile și structurile (deși nu funcționează cu text scris de mână).

Capabil să le trimită direct editorului în forma text.

Are o viteză de funcționare destul de satisfăcătoare.

  • Lipsa traductorului încorporat;
  • Fără calitate a verificării ortografice;
  • Lipsa capacității de a lucra cu text scris de mână.

Recenziile utilizatorilor despre acest program sunt următoarele: „Software bun”, „Având în vedere că programul este gratuit, funcționează foarte bine.”

Readiris Pro

Readiris Pro - încă unul software plătit, care oferă o muncă destul de diversă și stabilă privind recunoașterea și editarea testelor.

Software-ul OCR vă permite să convertiți documentele fotografiate sau scanate direct în propoziții.

Faptul este că textul din imagine este prezentat sub forma unui raster, a unui set de puncte. Software-ul menționat convertește un set de puncte în text cu drepturi depline, disponibil pentru editare și salvare.

Recunoașterea literelor este concepută pentru a optimiza procesul de digitizare a cărților și documentelor tipărite sau scrise de mână.

Această metodă de digitizare este cu ordine de mărime mai rapidă decât viteza de tastare manuală dintr-o imagine. Utilizat pe scară largă în digitizarea bibliotecilor și arhivelor. În continuare, vom lua în considerare cei mai buni cinci reprezentanți ai familiei de programe similare.

ABBYY FineReader 10

FineReader este liderul incontestabil printre toate programele care recunosc textul din imagini. În special, nu există niciun software care să prelucreze mai clar alfabetul chirilic. În general, FineReader are 179 de limbi, textul în care este recunoscut cu extrem de succes.

Singurul lucru care poate dezamăgi utilizatorii este că programul este plătit. Doar o versiune de încercare de 15 zile este disponibilă gratuit. În această perioadă este permisă scanarea a 50 de pagini.

Apoi va trebui să plătiți pentru a utiliza programul. FineReader „mâncă” cu ușurință orice imagine de calitate mai mult sau mai puțin înaltă. Sursa este complet lipsită de importanță. Fie că este o fotografie, o scanare a unei pagini sau orice imagine cu litere.

Avantaje:

  • recunoaștere exactă;
  • un număr mare de limbi de citit;
  • toleranta la calitatea imaginii sursa.

Defect:

  • versiune de încercare pentru 15 zile.

OCR CuneiForm

Software de citire gratuit informații text din imagini. Precizia recunoașterii este cu un ordin de mărime mai mică decât cea a programului anterior luat în considerare. Dar cum pt utilitate gratuită, funcționalitatea este încă excelentă.

Interesant! CuneiForm recunoaște blocuri de text, imagini graficeși chiar diverse mese. Mai mult, se pot citi chiar și tabele fără căptușeală.

Pentru a asigura acuratețea, la procesul de recunoaștere sunt conectate dicționare speciale, care completează vocabularul din documentele scanate.

Avantaje:

  • distributie gratuita;
  • utilizarea dicționarelor pentru a verifica corectitudinea textului;
  • scanarea textului din fotocopii de calitate slabă.

Defecte:

  • precizie relativ scăzută;
  • număr mic de limbi acceptate.

WinScan2PDF

Nici măcar nu este program cu drepturi depline, ci o utilitate. Nu necesită instalare, dar dosar executiv cântărește doar câțiva kiloocteți. Procesul de recunoaștere este extrem de rapid, deși documentele rezultate sunt salvate exclusiv în format PDF.

De fapt, întregul proces se realizează prin apăsarea a trei butoane: selectarea sursei, a destinației și, de fapt, lansarea programului.

Utilitarul este conceput pentru procesarea rapidă în lot a multor fișiere. Pentru confortul utilizatorului, există un mare pachet lingvistic interfata.

Avantaje:

Defecte:

  • dimensiune minimă;
  • singurul format de fișier de ieșire.

SimpleOCR

Excelent program mic pentru recunoașterea textelor din imagini. Acceptă chiar și citirea manuscriselor. Problema este că limba rusă nu este inclusă nici în pachetul de limbi ale interfeței, nici în lista de limbi acceptate pentru recunoaștere.

Cu toate acestea, dacă trebuie să scanați engleză, daneză sau franceză, atunci nu veți găsi o opțiune gratuită mai bună.

În domeniul său de aplicare, programul oferă decodare precisă a fonturilor, eliminarea zgomotului și extragerea imaginilor grafice. În plus, interfața programului are încorporată editor de text, aproape identic cu WordPad, ceea ce crește semnificativ gradul de utilizare al programului.

Avantaje:

  • recunoașterea exactă a textului;
  • editor de text convenabil;
  • eliminarea zgomotului dintr-o imagine.

Defecte:

  • absența completă a limbii ruse.

Freemore OCR

Programul vă permite să extrageți rapid text și grafică din imagini. Software-ul acceptă lucrul cu mai multe scanere fără pierderi de performanță. Textul extras poate fi salvat în format document text sau document MS Office.

În plus, este prevăzută o funcție de recunoaștere a mai multor pagini.

Freemore OCR este distribuit gratuit, cu toate acestea, interfața este doar în limba engleză. Dar această împrejurare nu afectează în niciun fel ușurința în utilizare, deoarece comenzile sunt organizate într-un mod intuitiv.

Avantaje:

  • distributie gratuita;
  • capacitatea de a lucra cu mai multe scanere;
  • acuratețea recunoașterii este decentă.

Defecte

  • Lipsa limbii ruse în interfață;
  • Necesitatea de a descărca pachetul în limba rusă pentru recunoaștere.

Software-ul OCR vă permite să convertiți documentele fotografiate sau scanate direct în propoziții.

Faptul este că textul din imagine este prezentat sub forma unui raster, a unui set de puncte.

Software-ul menționat convertește un set de puncte în text cu drepturi depline, disponibil pentru editare și salvare.

Recunoașterea literelor este concepută pentru a optimiza procesul de digitizare a cărților și documentelor tipărite sau scrise de mână.

Această metodă de digitizare este cu ordine de mărime mai rapidă decât viteza de tastare manuală dintr-o imagine. Utilizat pe scară largă în digitizarea bibliotecilor și arhivelor.

ABBYY FineReader 10

FineReader este liderul incontestabil printre toate programele care recunosc textul din imagini. În special, nu există niciun software care să prelucreze mai clar alfabetul chirilic.

În general, FineReader are 179 de limbi, textul în care este recunoscut cu extrem de succes.

Singurul lucru care poate dezamăgi utilizatorii este că programul este plătit.

Doar o versiune de încercare de 15 zile este disponibilă gratuit. În această perioadă este permisă scanarea a 50 de pagini.

Sursa este complet lipsită de importanță. Fie că este o fotografie, o scanare a unei pagini sau orice imagine cu litere.

Avantaje:

  • recunoaștere exactă;
  • un număr mare de limbi de citit;
  • toleranta la calitatea imaginii sursa.

Defect:

  • versiune de încercare pentru 15 zile.

OCR CuneiForm

Program gratuit pentru citirea informațiilor text din imagini. Precizia recunoașterii este cu un ordin de mărime mai mică decât cea a programului anterior luat în considerare.

Dar pentru un utilitar gratuit, funcționalitatea este încă excelentă.

Programul poate citi și salva fontul și dimensiunea textului recunoscut. Baza de date conține majoritatea fonturilor tipărite utilizate.

Este acceptată chiar și recunoașterea textului care iese dintr-o mașină de scris.

Pentru a asigura acuratețea, la procesul de recunoaștere sunt conectate dicționare speciale, care completează vocabularul din documentele scanate.

Avantaje:

  • distributie gratuita;
  • utilizarea dicționarelor pentru a verifica corectitudinea textului;
  • scanarea textului din fotocopii de calitate slabă.

Defecte:

  • precizie relativ scăzută;
  • număr mic de limbi acceptate.

WinScan2PDF

Acesta nu este nici măcar un program cu drepturi depline, ci un utilitar. Nu este necesară nicio instalare, iar fișierul executabil cântărește doar câțiva kiloocteți.

Procesul de recunoaștere este extrem de rapid, deși documentele rezultate sunt salvate exclusiv în format PDF.

De fapt, întregul proces se realizează prin apăsarea a trei butoane: selectarea sursei, a destinației și, de fapt, lansarea programului.

Utilitarul este conceput pentru procesarea rapidă în lot a multor fișiere. Pentru confortul utilizatorilor, este furnizat un pachet mare de limbi de interfață.

Avantaje:

  • portabilitate;
  • lucru rapid;
  • ușurință de utilizare.

Defecte:

Problema este că limba rusă nu este inclusă nici în pachetul de limbi ale interfeței, nici în lista de limbi acceptate pentru recunoaștere.

Cu toate acestea, dacă trebuie să scanați engleză, daneză sau franceză, atunci nu veți găsi o opțiune gratuită mai bună.

În domeniul său de aplicare, programul oferă decodare precisă a fonturilor, eliminarea zgomotului și extragerea imaginilor grafice.

În plus, interfața programului are o interfață încorporată aproape identică cu WordPad, ceea ce crește semnificativ gradul de utilizare al programului.

Avantaje:

  • recunoașterea exactă a textului;
  • editor de text convenabil;
  • eliminarea zgomotului dintr-o imagine.

Defecte:

  • absența completă a limbii ruse.

Sunt programe speciale care poate „citi” imagini cu text. Conversia înseamnă că, pe baza unui algoritm, textul descris pe un document scanat este convertit în propoziții. Întreaga dificultate este că în imagine programul nu vede un set de litere, ci un raster, o structură de puncte. Toate aceste puncte având formă diferită, sunt decriptate utilitati speciale, transformându-l într-un text obișnuit cu care puteți lucra în continuare.
Programele de recunoaștere a textului sunt utilizate la traducerea diverselor literaturi și documente pe hârtie în vizualizare electronică. Bibliotecile și arhivele sunt transferate în mod similar către vizualizare digitală.

Digitalizarea automată folosind un program depășește performanța metoda manuala apelare rapidă, motiv pentru care această metodă este atât de comună. Vă vom spune despre cele mai bune cinci programe pentru recunoașterea textelor fotografiate.

ABBYY FineReader 10


FineReader- nava amiral printre software, care recunoaște textele din imagini. Acest program este utilizat pe scară largă printre utilizatorii obișnuițiși profesioniști în digitalizare. Popularitatea sa se datorează calității muncii sale. FineReader se ocupă perfect de chirilic și alte 178 de limbi.

Singurul dezavantaj al programului, ca să spunem așa, este că este plătit. Dar utilizatorii care l-au încercat timp de două săptămâni și au scanat un număr de pagini cumpără produsul pentru că cu siguranță merită banii.

FineReader poate „citi” text din orice imagine, și nu imaginea în sine calitate superioară. Folosind programul, puteți converti orice document în formă digitală: de la o imagine obișnuită la o pagină scanată.

Pro:

  • Recunoaște clar textul;
  • Citește multe limbi;
  • Nu solicită mari calitatea imaginii, documentului, fotografiei.
Contra:
  • Versiunea gratuită este limitată de timp (două săptămâni) și de numărul de pagini scanate (55).

OCR CuneiForm


Cuneiform recunoaște optic textele din fișierele grafice și le convertește într-o formă editabilă. Utilitarul este disponibil într-o singură versiune, gratuit și diferă de programul anterior prin calitatea recunoașterii. Dar acest lucru nu mă deranjează și mulți oameni îl folosesc software gratuit, crezând că funcţionalitate face o treabă grozavă.

Cu acest program nu numai că vei converti textul în formă digitală, dar vei salva și fontul și înălțimea literelor. Baza de date a fonturilor CuneiForm este extinsă, utilitarul poate recunoaște chiar și imaginile scanate și tastate.

Pentru a descifra mai clar textul, utilitarul folosește dicționare specializate. Aceste dicționare sunt actualizate constant, astfel încât CuneiForm are un vocabular bogat.

Pro:

  • Versiunea gratuită a programului;
  • Textul este corectat pentru acuratețe folosind dicționare;
  • Decriptează orice imagini, chiar și cele de calitate scăzută;
  • Păstrează structura documentului, chiar și formatarea acestuia.
Contra:
  • Erori în texte;
  • Un total de 24 de limbi sunt acceptate.

WinScan2PDF


WinScan2PDF- un utilitar compact care scanează orice documente. Este lansat sub forma unui fișier portabil, o versiune portabilă, care nu trebuie instalată pe un computer sau alte dispozitive. Utilitarul citește instantaneu orice text și îl salvează doar într-un document PDF.

Programul este foarte usor de folosit chiar si pentru cei mai neinstruiti utilizatori. Pentru a obține rezultatul dorit, trebuie să apăsați doar trei butoane:

  • Selectați un fișier grafic;
  • Specificați locația de descărcare;
  • Începeți procesul.
Programul este capabil să proceseze rapid multe simultan fisiere grafice, motiv pentru care este atât de popular în rândul utilizatorilor: începători și profesioniști.

Pro:

  • Lipsa distribuției;
  • Decodificarea instantanee a textului grafic;
  • Interfață minimalistă, ușor de utilizat.
Contra:
  • Greutatea de utilitate este de numai 55 Kb;
  • Textul poate fi salvat numai în format de document portabil.

SimpleOCR


SimpleOCR - aplicație gratuită, care recunoaște textul scanat optic, dar numai pornit limbi straine. Din păcate, limba rusă nu este inclusă în pachetul de interfață sau în lista de suport. În caz contrar, utilitarul face o treabă excelentă, recunoscând chiar și textele scrise de mână.

Textele de ieșire diferă nivel înalt precizie. De asemenea, puteți utiliza utilitarul pentru a extrage un fișier grafic și a elimina zgomotul. O altă caracteristică distinctivă este prezența unui editor de text încorporat, care este foarte convenabil de utilizat.

Pro:

  • Funcționează corect, cu precizie ridicată;
  • Poate elimina zgomotul din grafică;
  • Vă permite să editați imediat textele primite.
Contra:
  • Nu există suport în limba rusă.

Freemore OCR


Mai liber- gratuit, simplă utilitate, care citește ușor și rapid texte din diferite fișiere grafice, chiar și din mai multe scanere în același timp, și le traduce în format convenabil. În plus, utilitarul poate procesa multe pagini simultan.

Interfața nu acceptă limba rusă, dar chiar și în ciuda acestui lucru, utilitatea este larg răspândită și populară în rândul utilizatorilor casnici, deoarece este foarte ușor de utilizat.

Pro:

  • versiune gratuită;
  • criptează și decriptează fișierele;
  • vă permite să vizualizați proprietățile documentului;
  • interfață simplă, nu supraîncărcată cu butoane;
  • rezultat corect, de înaltă precizie;
  • citește mai multe scanere simultan.
Contra:
  • Interfața cu utilizatorul nu este tradusă în rusă;
  • Pentru a decripta textele rusești, trebuie să descărcați o limbă suplimentară.

Probabil că toată lumea este familiarizată cu situația în care o scanare a unui document, de exemplu, o pagină a unei cărți, trebuie convertită în text tipărit. Există programe speciale pentru asta, dar cele mai multe dintre ele sunt cunoscute de foarte puțini oameni. Probabil că toată lumea știe doar ABBYY FineReader. Într-adevăr, FineReader este dincolo de concurență. Acesta este cel mai bun program pentru scanarea și recunoașterea textului în limba rusă, dar este lansat exclusiv în versiuni plătite si este destul de scump. Câți oameni sunt dispuși să plătească aproape 7.000 de ruble pentru cea mai mare licență bugetară dacă intenționează să proceseze una sau două cărți pe an?

Dacă considerați nejustificată achiziția unui produs comercial scump, de ce să nu folosiți analogi, dintre care unele sunt gratuite? Da, nu sunt atât de bogate în funcții, dar fac față cu succes multor sarcini pe care mulți cred că doar FineReader le poate gestiona. Deci, să aruncăm o privire la câteva dintre alternativele disponibile. Și, în același timp, să vedem cum diferă de standardul general acceptat.

Pentru a compara alte programe cu ABBYY FineReader, haideți să aflăm de ce este atât de bun. Iată o listă cu principalele sale funcții:

  • Lucrul cu fotografii, scanări și documente pe hârtie.
  • Editarea conținutului fișierelor pdf - text, blocuri individuale, elemente interactive si alte lucruri.
  • Convertiți pdf în format Microsoft Wordși înapoi. Creați fișiere pdf din orice document text.
  • Comparați conținutul documentelor în 35 de limbi, de exemplu, hârtie scanată și electronică (nu în toate edițiile).
  • Recunoașterea și conversia textelor scanate, tabele, formule matematice.
  • Executarea automată a operațiunilor de rutină (nu în toate edițiile).
  • Suportă 192 de alfabete naționale.
  • Verificarea ortografică a textului recunoscut în rusă, ucraineană și în alte 46 de limbi.
  • Suportă 10 formate de fișiere de introducere grafică și 10 de text, fără a include pdf.
  • Salvarea fișierelor în format grafic și formate de text, și, de asemenea, în formă cărți electronice EPUB și FB2.
  • Citirea codurilor de bare.
  • Interfață în 20 de limbi, inclusiv rusă și ucraineană.
  • Acceptă majoritatea modelelor de scanere existente.

Capacitățile programului sunt excelente, dar pentru utilizatorii casnici care nu procesează documente la scară industrială, acestea sunt redundante. Cu toate acestea, pentru cei care au nevoie să recunoască doar câteva pagini, ABBYY oferă servicii gratuit - prin serviciul web FineReaderOnline. După înregistrare, puteți procesa 10 pagini de text scanat sau fotografiat și apoi 5 pagini pe lună. Mai mult - pentru o taxă suplimentară.

Costul celei mai ieftine licențe FineReader pentru instalare pe un computer este de 6.990 de ruble (versiunea standard).

Un utilitar gratuit mic și extrem de simplu, desigur, nu este capabil să concureze cu monstrul, dar rezolvă sarcina principală - recunoașterea textului scanat - așa cum era de așteptat. Mai mult, pentru asta nici nu necesita instalare pe un PC (portabil). Și este controlat de doar trei butoane.

Pentru a recunoaște text folosind WinScan2PDF, faceți clic pe „Selectare sursă” și specificați scanerul conectat (cu fișiere gata făcute Programul, din păcate, nu funcționează). Puneți documentul în scaner și faceți clic pe Scanare. Dacă doriți să anulați operația, faceți clic pe Anulare. Astea sunt toate instructiunile.

Utilitarul acceptă 23 de limbi, inclusiv rusă, și funcționează cu fișiere cu mai multe pagini. Rezultatul final este salvat în format pdf, scanare document - jpg.

Serviciul web Free-OCR.com

Free-OCR.com (OCR - Recunoaștere optică a caracterelor, recunoaștere optică caractere) este un serviciu de internet gratuit pentru recunoașterea textelor scanate sau fotografiate salvate în format de imagine grafică (jpg, gif, tiff, bmp) sau pdf. Acceptă 29 de limbi, inclusiv rusă și ucraineană, iar utilizatorul poate selecta nu una, ci mai multe, dacă textul sursă le conține.

Free-OCR nu necesită înregistrare și nu are nicio restricție privind numărul de documente încărcate. Doar dimensiunea fișierului este limitată - până la 6 Mb. Serviciul nu procesează mai precis documentele cu mai multe pagini, ignoră totul, cu excepția primei foi.

Viteza de recunoaștere a textului scanat este destul de mare. O coală A4 cu un fragment de carte în limba rusă a fost procesată în aproximativ 5 secunde, dar calitatea nu a fost satisfăcătoare. Recunoaște fonturile mari - ca în cărțile pentru copii - 100%, iar fonturile medii și mici - aproximativ 80%. Cu documentele în limba engleză, lucrurile sunt oarecum mai bune - fontul mic și cu contrast redus a fost recunoscut corect cu aproximativ 95%.

Serviciu web OCR online gratuit

- un alt serviciu web gratuit, foarte asemănător cu precedentul, dar cu funcționalitate extinsă. El:

  • Suporta 106 limbi.
  • Procesează documente cu mai multe pagini, inclusiv cele în mai multe limbi.
  • Recunoaște textele de pe documente scanate și foto de mai multe tipuri. Pe lângă cele 10 formate de imagine grafică, procesează documente pdf, djvu, doxc, odt, arhive zipŞi fișiere comprimate Unix.
  • Salvează fișierele de ieșire într-unul din cele 3 formate: txt, doc și pdf.
  • Sprijină recunoașterea ecuațiilor matematice.
  • Vă permite să rotiți imaginea 90-180° în ambele direcții.
  • Recunoaște corect textul din mai multe coloane pe o singură pagină.
  • Poate recunoaște un fragment selectat.
  • După procesare, vă oferă să copiați fișierul în clipboard, să îl descărcați pe computer, să îl încărcați în Google Docs sau să îl publicați pe Internet. De asemenea, este posibil să traduceți imediat textul într-o altă limbă folosind Google Translate sau Bing Translator.

Trebuie să acordăm credit OCR online gratuit pentru faptul că citește destul de bine imaginile cu rezoluție scăzută și contrast redus. Rezultatul recunoașterii tuturor textelor în limba rusă care i-au fost furnizate a fost 100% sau aproape de acesta.

OCR online gratuit, în opinia noastră, este unul dintre cele mai bune alternative FineReader, dar gratuit prelucrează doar 20 de pagini (deși nu este specificat pentru ce perioadă). Utilizarea ulterioară a serviciului costă de la 0,5 USD per pagină.

Microsoft OneNote

Programul de luare de note Microsoft OneNote, excluzând versiunea foarte veche și cea mai recentă 17, conține și funcționalitate OCR. Nu este la fel de avansat ca în aplicațiile specializate, dar totuși potrivit pentru utilizare dacă nu există alte opțiuni.

Pentru a recunoaște textul dintr-o imagine cu folosind OneNote, inserați imaginea în fișier („Imagine” - „Inserare”), faceți clic dreapta pe ea și selectați „Copiați textul din imagine”.

După aceea, lipiți textul copiat oriunde în notă.

În mod implicit, limba de recunoaștere este setată la engleză. Dacă aveți nevoie de rusă sau de orice alta, modificați manual setarea.

Calitatea recunoașterii textului rusesc în Microsoft OneNote lasă mult de dorit, așa că nu poate fi numit un înlocuitor complet pentru FineReader. Și procesarea documentelor mari cu mai multe pagini în el este foarte incomod.

SimpleOCR

Vechi program gratuit SimpleOCR este, de asemenea, un instrument de recunoaștere a textului foarte decent cu imagini electroniceși scanări, dar, din păcate, fără suport pentru limba rusă. Dar are o funcție unică pentru citirea cuvintelor scrise de mână, precum și un editor care vă permite să corectați erorile înainte de a salva rezultatul final.

Alte caracteristici SimpleOCR:

  • Verificarea ortografică cu posibilitatea de a actualiza manual dicționarul.
  • Citirea documentelor la rezoluție scăzută și cu semne (există o opțiune de a șterge „zgomotul”).
  • Cea mai apropiată selecție posibilă a fonturilor și transferul stilurilor de scriere (bold, italic). Dacă se dorește, funcția poate fi dezactivată.
  • Prelucrarea simultană a mai multor foi sau a unui fragment separat.
  • Selecţie posibile eroriîn textul terminat pentru editare manuală.
  • Suportă multe modificări ale scanerelor.
  • Formate de intrare ale documentelor electronice: tif, jpg, bmp, cerneală, precum și scanări.
  • Salvarea textului terminat în formatele txt și doc.

Calitatea recunoașterii atât a textelor tipărite, cât și a manuscriselor este destul de ridicată.

Programul ar putea fi numit universal dacă nu pentru suportul limitat de limbă. Ultima versiune Acceptă doar engleză, franceză și daneză, probabil că nu există planuri pentru a adăuga altele. Interfața este în întregime în engleză, dar este ușor de înțeles. În plus, în fereastra principală există un buton „Demo”, care lansează un videoclip de instruire despre lucrul cu SimpleOCR.

Programul companiei belgiene de dezvoltare I.R.I.S este cu adevărat un adevărat concurent pentru ABBYY FineReader rusesc. Puternic, rapid, multi-platformă, bazat pe motorul OCR proprietar utilizat de Adobe, HP și Canon, recunoaște perfect chiar și cele mai greu de citit texte. Acceptă 137 de limbi, inclusiv rusă și ucraineană.

Caracteristici și funcții Readiris:

  • Cea mai mare viteză de procesare a fișierelor dintre aplicațiile din această clasă, concepute pentru volume mari.
  • Păstrarea formatării text sursă(fonturi, dimensiune, stil de scriere).
  • Singură și procesare în lot fișiere, suport pentru documente cu mai multe pagini.
  • Recunoașterea ecuațiilor matematice, caractere specialeși coduri de bare.
  • Ștergerea textului din „zgomot” - linii, pete etc.
  • Integrare cu diverse servicii cloudGoogle Docs, Evernote, Dropbox, SharePoint și altele.
  • Sprijin pentru toată lumea modele moderne scanere.
  • Formate de date de intrare: pdf, djvu, jpg, png și altele, în care sunt salvate imaginile grafice, precum și cele primite direct de la scaner.
  • Formate de ieșire: doc, docx, xls, xlsx, txt, rtf, html, csv, pdf. Este acceptată conversia în djvu.

Interfața programului este în limba rusă, utilizarea este intuitivă. Nu oferă utilizatorilor posibilitatea de a edita conținutul fișierelor pdf, cum ar fi FineReader, dar, în opinia noastră, face față sarcinii principale - recunoașterea textului.

Readiris vine în două versiuni plătite. Preţ Licențe profesionale este 99,00 €, Corporate - 199 €. Aproape ca ABBYY.

Freemore OCR

Freemore OCR - (! site-ul web al programului http://freemoresoft.com/freeocr/index.php poate fi blocat de antivirusuri din cauza publicității „gunoi” încorporat în programul de instalare) - un alt utilitar simplu, compact și gratuit, care recunoaște bine textele, dar implicit doar în limba engleză. Pachetele în alte limbi trebuie descărcate și instalate separat.

Alte caracteristici și capabilități ale Freemore OCR:

  • Lucru simultan cu mai multe scanere.
  • Acceptă multe formate de date grafice, inclusiv cele proprietare, cum ar fi psd (fișier Adobe Photoshop). Sunt acceptate toate formatele grafice standard.
  • Suport PDF.
  • Salvați rezultatul final în format pdf, txt sau docx și pentru a exporta text în Word, faceți clic pe un buton din bara de instrumente.
  • Editor încorporat (din păcate, programul nu salvează formatarea documentului sursă).
  • Vizualizați proprietățile documentului.
  • Imprimați textul recunoscut direct din fereastra principală.
  • Protecția prin parolă a fișierelor pdf.

La prima vedere, interfața programului poate părea complicată, dar de fapt este foarte ușor de utilizat. Instrumentele sunt împărțite în grupuri, ca pe o bandă Microsoft Office. Dacă vă uitați la ele mai îndeaproape, scopul acestui sau al unui buton va deveni rapid clar.

Pentru a descărca document electronicîn fereastra Freemore OCR, selectați mai întâi tipul acesteia - imagine sau fisier pdf, apoi apăsați butonul „Încărcare” corespunzător. Pentru a începe procesul de recunoaștere, faceți clic pe butonul „OCR” din grupul de instrumente cu același nume de lângă imagine bagheta magică(prezentat în captură de ecran).

Rezultatul scanării textelor în limba engleză din imagini atât bine citite, cât și greu de citit s-a dovedit a fi destul de satisfăcător. Singurul lucru care nu mi-a plăcut a fost că, împreună cu programul, pe computer sunt instalate tot felul de gunoi - unele false scanere antivirus, optimizatori și alte lucruri inutile și fără posibilitatea de a le refuza în timpul instalării. Într-un cuvânt, dacă nu pentru acest dezavantaj, aplicația ar putea fi recomandată ca fiind una bună. alternativă gratuită FineReader.