Recunoașterea optică a textului este un proces în care textul fotografiat sau scanat este convertit în format de document folosind un program special.
Adică, în loc de o imagine, veți avea un text tip standard care poate fi editat.
În acest material vom discuta care program de recunoaștere a textului este mai bun (TOP 7 utilități sunt prezentate mai jos).
Cum să alegi cel mai potrivit program și ce caracteristici principale are un astfel de software?
Poate diferi în diverși indicatori - acuratețea recunoașterii, capacitatea de a lucra cu o anumită limbă, capacitatea de a păstra structura originală a textului etc.
Un astfel de software poate fi distribuit contra cost sau gratuit și poate fi implementat atât online (sub formă de servicii speciale), cât și sub formă de programe preinstalate.
Algoritmul de lucru este că pentru fiecare literă a alfabetului este compilată o bază de date cu opțiuni despre cum poate arăta într-o fotografie, elementele sale principale sunt evidențiate și salvate. De îndată ce astfel de elemente sunt detectate în fotografie, programul recunoaște litera corespunzătoare. În funcție de cât de bine și în detaliu a fost compilată o astfel de bază de date, calitatea recunoașterii materialelor depinde în cele din urmă.
Prin urmare, este important ca software-ul să fie proiectat să funcționeze special cu limba rusă (unele programe pot funcționa cu text scris în două limbi simultan, altele nu).
În plus, unele utilități și servicii sunt capabile să păstreze chiar și structura originală a textului (, liste), tipul său de design (indenturi etc.) și chiar .
În ce cazuri este necesar un astfel de software?
De fapt, domeniul de aplicare al software-ului este foarte larg și, dacă este ales corect, poate face lucrul cu textul mai ușor și mai rapid.
Software-ul diferă în multe privințe: metoda de implementare (online sau sub formă de utilitar), licența de utilizare (plătită sau gratuită), lista de limbi recunoscute, calitatea recunoașterii și multe altele.
Pentru ca utilizatorul să facă alegere corectă cât mai repede posibil, tabelul de mai jos prezintă principalele caracteristici ale unor astfel de programe.
Titluri | Licenţă | Scanare | Verificarea ortografică | Traducere | Procesarea textului în editor | Lucrul cu text scris de mână | Lucrul cu imagini calitate slabă |
---|---|---|---|---|---|---|---|
Abbyy Fine Reader | Plătit, cu gratuit perioada de probă timp de 10 zile | Da | Da | Da | parţial | parţial | Da |
OCR Cunei Form | Gratuit | Da | Da | Nu | Da | Nu | Da |
Readiris Pro | Nu | Da | Nu | Da | Da | Da | |
OCR Freemore | Gratuit | Da | Nu | Nu | Da | Nu | Da |
Cititor de capturi de ecran Abbyy | Plătit, cu probă gratuită de 14 zile | Nu | Da | Da | Nu | Nu | parţial |
Adobe Acrobat | Plătit, cu o perioadă de încercare gratuită de 7 zile | Da | Nu | Nu | parţial | Nu | parţial |
OCR online gratuit | Gratuit | Nu | Nu | Nu | Nu | parţial | Da |
Toate utilitatile enumerate in tabelul de mai jos sunt descrise in detaliu si sunt plasate in ordinea TOP, de la cel mai bun la cel mai rau.
Acesta este software-ul de cea mai înaltă calitate și multifuncțional din acest TOP. Se distinge prin acuratețea înaltă a recunoașterii și are o serie de avantaje; este distribuit contra cost.
Programul funcționează cu succes în multe limbi în timpul recunoașterii, este capabil să păstreze structura textului și tipul de formatare.
Este destinat profesioniștilor, prin urmare, potrivit celor mai mulți utilizatori, merită banii.
Recenzii despre acest software diferit:" Program bun, ajută foarte mult în munca mea”, „Nu merită banii - există programe gratuite cu aceeași calitate a recunoașterii.”
OCR Cunei Form este poate una dintre cele mai funcționale și programe convenabile, dintre cele distribuite gratuit.
Oferă o calitate destul de ridicată a recunoașterii și funcționează chiar și cu fotografii de calitate slabă.
Programul vă permite să editați o fotografie direct în timp ce lucrați cu ea și recunoaște destul de bine fonturile și structurile (deși nu funcționează cu text scris de mână).
Capabil să le trimită direct editorului în forma text.
Are o viteză de funcționare destul de satisfăcătoare.
Recenziile utilizatorilor despre acest program sunt următoarele: „Software bun”, „Având în vedere că programul este gratuit, funcționează foarte bine.”
Readiris Pro - încă unul software plătit, care oferă o muncă destul de diversă și stabilă privind recunoașterea și editarea testelor.
Software-ul OCR vă permite să convertiți documentele fotografiate sau scanate direct în propoziții.
Faptul este că textul din imagine este prezentat sub forma unui raster, a unui set de puncte. Software-ul menționat convertește un set de puncte în text cu drepturi depline, disponibil pentru editare și salvare.
Recunoașterea literelor este concepută pentru a optimiza procesul de digitizare a cărților și documentelor tipărite sau scrise de mână.
Această metodă de digitizare este cu ordine de mărime mai rapidă decât viteza de tastare manuală dintr-o imagine. Utilizat pe scară largă în digitizarea bibliotecilor și arhivelor. În continuare, vom lua în considerare cei mai buni cinci reprezentanți ai familiei de programe similare.
FineReader este liderul incontestabil printre toate programele care recunosc textul din imagini. În special, nu există niciun software care să prelucreze mai clar alfabetul chirilic. În general, FineReader are 179 de limbi, textul în care este recunoscut cu extrem de succes.
Singurul lucru care poate dezamăgi utilizatorii este că programul este plătit. Doar o versiune de încercare de 15 zile este disponibilă gratuit. În această perioadă este permisă scanarea a 50 de pagini.
Apoi va trebui să plătiți pentru a utiliza programul. FineReader „mâncă” cu ușurință orice imagine de calitate mai mult sau mai puțin înaltă. Sursa este complet lipsită de importanță. Fie că este o fotografie, o scanare a unei pagini sau orice imagine cu litere.
Avantaje:
Defect:
Software de citire gratuit informații text din imagini. Precizia recunoașterii este cu un ordin de mărime mai mică decât cea a programului anterior luat în considerare. Dar cum pt utilitate gratuită, funcționalitatea este încă excelentă.
Interesant! CuneiForm recunoaște blocuri de text, imagini graficeși chiar diverse mese. Mai mult, se pot citi chiar și tabele fără căptușeală.
Pentru a asigura acuratețea, la procesul de recunoaștere sunt conectate dicționare speciale, care completează vocabularul din documentele scanate.
Avantaje:
Defecte:
Nici măcar nu este program cu drepturi depline, ci o utilitate. Nu necesită instalare, dar dosar executiv cântărește doar câțiva kiloocteți. Procesul de recunoaștere este extrem de rapid, deși documentele rezultate sunt salvate exclusiv în format PDF.
De fapt, întregul proces se realizează prin apăsarea a trei butoane: selectarea sursei, a destinației și, de fapt, lansarea programului.
Utilitarul este conceput pentru procesarea rapidă în lot a multor fișiere. Pentru confortul utilizatorului, există un mare pachet lingvistic interfata.
Avantaje:
Defecte:
Excelent program mic pentru recunoașterea textelor din imagini. Acceptă chiar și citirea manuscriselor. Problema este că limba rusă nu este inclusă nici în pachetul de limbi ale interfeței, nici în lista de limbi acceptate pentru recunoaștere.
Cu toate acestea, dacă trebuie să scanați engleză, daneză sau franceză, atunci nu veți găsi o opțiune gratuită mai bună.
În domeniul său de aplicare, programul oferă decodare precisă a fonturilor, eliminarea zgomotului și extragerea imaginilor grafice. În plus, interfața programului are încorporată editor de text, aproape identic cu WordPad, ceea ce crește semnificativ gradul de utilizare al programului.
Avantaje:
Defecte:
Programul vă permite să extrageți rapid text și grafică din imagini. Software-ul acceptă lucrul cu mai multe scanere fără pierderi de performanță. Textul extras poate fi salvat în format document text sau document MS Office.
În plus, este prevăzută o funcție de recunoaștere a mai multor pagini.
Freemore OCR este distribuit gratuit, cu toate acestea, interfața este doar în limba engleză. Dar această împrejurare nu afectează în niciun fel ușurința în utilizare, deoarece comenzile sunt organizate într-un mod intuitiv.
Avantaje:
Defecte
Software-ul OCR vă permite să convertiți documentele fotografiate sau scanate direct în propoziții.
Faptul este că textul din imagine este prezentat sub forma unui raster, a unui set de puncte.
Software-ul menționat convertește un set de puncte în text cu drepturi depline, disponibil pentru editare și salvare.
Recunoașterea literelor este concepută pentru a optimiza procesul de digitizare a cărților și documentelor tipărite sau scrise de mână.
Această metodă de digitizare este cu ordine de mărime mai rapidă decât viteza de tastare manuală dintr-o imagine. Utilizat pe scară largă în digitizarea bibliotecilor și arhivelor.
FineReader este liderul incontestabil printre toate programele care recunosc textul din imagini. În special, nu există niciun software care să prelucreze mai clar alfabetul chirilic.
În general, FineReader are 179 de limbi, textul în care este recunoscut cu extrem de succes.
Singurul lucru care poate dezamăgi utilizatorii este că programul este plătit.
Doar o versiune de încercare de 15 zile este disponibilă gratuit. În această perioadă este permisă scanarea a 50 de pagini.
Sursa este complet lipsită de importanță. Fie că este o fotografie, o scanare a unei pagini sau orice imagine cu litere.
Avantaje:
Defect:
Program gratuit pentru citirea informațiilor text din imagini. Precizia recunoașterii este cu un ordin de mărime mai mică decât cea a programului anterior luat în considerare.
Dar pentru un utilitar gratuit, funcționalitatea este încă excelentă.
Programul poate citi și salva fontul și dimensiunea textului recunoscut. Baza de date conține majoritatea fonturilor tipărite utilizate.
Este acceptată chiar și recunoașterea textului care iese dintr-o mașină de scris.
Pentru a asigura acuratețea, la procesul de recunoaștere sunt conectate dicționare speciale, care completează vocabularul din documentele scanate.
Avantaje:
Defecte:
Acesta nu este nici măcar un program cu drepturi depline, ci un utilitar. Nu este necesară nicio instalare, iar fișierul executabil cântărește doar câțiva kiloocteți.
Procesul de recunoaștere este extrem de rapid, deși documentele rezultate sunt salvate exclusiv în format PDF.
De fapt, întregul proces se realizează prin apăsarea a trei butoane: selectarea sursei, a destinației și, de fapt, lansarea programului.
Utilitarul este conceput pentru procesarea rapidă în lot a multor fișiere. Pentru confortul utilizatorilor, este furnizat un pachet mare de limbi de interfață.
Avantaje:
Defecte:
Problema este că limba rusă nu este inclusă nici în pachetul de limbi ale interfeței, nici în lista de limbi acceptate pentru recunoaștere.
Cu toate acestea, dacă trebuie să scanați engleză, daneză sau franceză, atunci nu veți găsi o opțiune gratuită mai bună.
În domeniul său de aplicare, programul oferă decodare precisă a fonturilor, eliminarea zgomotului și extragerea imaginilor grafice.
În plus, interfața programului are o interfață încorporată aproape identică cu WordPad, ceea ce crește semnificativ gradul de utilizare al programului.
Avantaje:
Defecte:
Sunt programe speciale care poate „citi” imagini cu text. Conversia înseamnă că, pe baza unui algoritm, textul descris pe un document scanat este convertit în propoziții. Întreaga dificultate este că în imagine programul nu vede un set de litere, ci un raster, o structură de puncte. Toate aceste puncte având formă diferită, sunt decriptate utilitati speciale, transformându-l într-un text obișnuit cu care puteți lucra în continuare.
Programele de recunoaștere a textului sunt utilizate la traducerea diverselor literaturi și documente pe hârtie în vizualizare electronică. Bibliotecile și arhivele sunt transferate în mod similar către vizualizare digitală.
Digitalizarea automată folosind un program depășește performanța metoda manuala apelare rapidă, motiv pentru care această metodă este atât de comună. Vă vom spune despre cele mai bune cinci programe pentru recunoașterea textelor fotografiate.
Singurul dezavantaj al programului, ca să spunem așa, este că este plătit. Dar utilizatorii care l-au încercat timp de două săptămâni și au scanat un număr de pagini cumpără produsul pentru că cu siguranță merită banii.
FineReader poate „citi” text din orice imagine, și nu imaginea în sine calitate superioară. Folosind programul, puteți converti orice document în formă digitală: de la o imagine obișnuită la o pagină scanată.
Pro:
Cu acest program nu numai că vei converti textul în formă digitală, dar vei salva și fontul și înălțimea literelor. Baza de date a fonturilor CuneiForm este extinsă, utilitarul poate recunoaște chiar și imaginile scanate și tastate.
Pentru a descifra mai clar textul, utilitarul folosește dicționare specializate. Aceste dicționare sunt actualizate constant, astfel încât CuneiForm are un vocabular bogat.
Pro:
Programul este foarte usor de folosit chiar si pentru cei mai neinstruiti utilizatori. Pentru a obține rezultatul dorit, trebuie să apăsați doar trei butoane:
Pro:
Textele de ieșire diferă nivel înalt precizie. De asemenea, puteți utiliza utilitarul pentru a extrage un fișier grafic și a elimina zgomotul. O altă caracteristică distinctivă este prezența unui editor de text încorporat, care este foarte convenabil de utilizat.
Pro:
Interfața nu acceptă limba rusă, dar chiar și în ciuda acestui lucru, utilitatea este larg răspândită și populară în rândul utilizatorilor casnici, deoarece este foarte ușor de utilizat.
Pro:
Probabil că toată lumea este familiarizată cu situația în care o scanare a unui document, de exemplu, o pagină a unei cărți, trebuie convertită în text tipărit. Există programe speciale pentru asta, dar cele mai multe dintre ele sunt cunoscute de foarte puțini oameni. Probabil că toată lumea știe doar ABBYY FineReader. Într-adevăr, FineReader este dincolo de concurență. Acesta este cel mai bun program pentru scanarea și recunoașterea textului în limba rusă, dar este lansat exclusiv în versiuni plătite si este destul de scump. Câți oameni sunt dispuși să plătească aproape 7.000 de ruble pentru cea mai mare licență bugetară dacă intenționează să proceseze una sau două cărți pe an?
Dacă considerați nejustificată achiziția unui produs comercial scump, de ce să nu folosiți analogi, dintre care unele sunt gratuite? Da, nu sunt atât de bogate în funcții, dar fac față cu succes multor sarcini pe care mulți cred că doar FineReader le poate gestiona. Deci, să aruncăm o privire la câteva dintre alternativele disponibile. Și, în același timp, să vedem cum diferă de standardul general acceptat.
Pentru a compara alte programe cu ABBYY FineReader, haideți să aflăm de ce este atât de bun. Iată o listă cu principalele sale funcții:
Capacitățile programului sunt excelente, dar pentru utilizatorii casnici care nu procesează documente la scară industrială, acestea sunt redundante. Cu toate acestea, pentru cei care au nevoie să recunoască doar câteva pagini, ABBYY oferă servicii gratuit - prin serviciul web FineReaderOnline. După înregistrare, puteți procesa 10 pagini de text scanat sau fotografiat și apoi 5 pagini pe lună. Mai mult - pentru o taxă suplimentară.
Costul celei mai ieftine licențe FineReader pentru instalare pe un computer este de 6.990 de ruble (versiunea standard).
Un utilitar gratuit mic și extrem de simplu, desigur, nu este capabil să concureze cu monstrul, dar rezolvă sarcina principală - recunoașterea textului scanat - așa cum era de așteptat. Mai mult, pentru asta nici nu necesita instalare pe un PC (portabil). Și este controlat de doar trei butoane.
Pentru a recunoaște text folosind WinScan2PDF, faceți clic pe „Selectare sursă” și specificați scanerul conectat (cu fișiere gata făcute Programul, din păcate, nu funcționează). Puneți documentul în scaner și faceți clic pe Scanare. Dacă doriți să anulați operația, faceți clic pe Anulare. Astea sunt toate instructiunile.
Utilitarul acceptă 23 de limbi, inclusiv rusă, și funcționează cu fișiere cu mai multe pagini. Rezultatul final este salvat în format pdf, scanare document - jpg.
Free-OCR.com (OCR - Recunoaștere optică a caracterelor, recunoaștere optică caractere) este un serviciu de internet gratuit pentru recunoașterea textelor scanate sau fotografiate salvate în format de imagine grafică (jpg, gif, tiff, bmp) sau pdf. Acceptă 29 de limbi, inclusiv rusă și ucraineană, iar utilizatorul poate selecta nu una, ci mai multe, dacă textul sursă le conține.
Free-OCR nu necesită înregistrare și nu are nicio restricție privind numărul de documente încărcate. Doar dimensiunea fișierului este limitată - până la 6 Mb. Serviciul nu procesează mai precis documentele cu mai multe pagini, ignoră totul, cu excepția primei foi.
Viteza de recunoaștere a textului scanat este destul de mare. O coală A4 cu un fragment de carte în limba rusă a fost procesată în aproximativ 5 secunde, dar calitatea nu a fost satisfăcătoare. Recunoaște fonturile mari - ca în cărțile pentru copii - 100%, iar fonturile medii și mici - aproximativ 80%. Cu documentele în limba engleză, lucrurile sunt oarecum mai bune - fontul mic și cu contrast redus a fost recunoscut corect cu aproximativ 95%.
- un alt serviciu web gratuit, foarte asemănător cu precedentul, dar cu funcționalitate extinsă. El:
Trebuie să acordăm credit OCR online gratuit pentru faptul că citește destul de bine imaginile cu rezoluție scăzută și contrast redus. Rezultatul recunoașterii tuturor textelor în limba rusă care i-au fost furnizate a fost 100% sau aproape de acesta.
OCR online gratuit, în opinia noastră, este unul dintre cele mai bune alternative FineReader, dar gratuit prelucrează doar 20 de pagini (deși nu este specificat pentru ce perioadă). Utilizarea ulterioară a serviciului costă de la 0,5 USD per pagină.
Programul de luare de note Microsoft OneNote, excluzând versiunea foarte veche și cea mai recentă 17, conține și funcționalitate OCR. Nu este la fel de avansat ca în aplicațiile specializate, dar totuși potrivit pentru utilizare dacă nu există alte opțiuni.
Pentru a recunoaște textul dintr-o imagine cu folosind OneNote, inserați imaginea în fișier („Imagine” - „Inserare”), faceți clic dreapta pe ea și selectați „Copiați textul din imagine”.
După aceea, lipiți textul copiat oriunde în notă.
În mod implicit, limba de recunoaștere este setată la engleză. Dacă aveți nevoie de rusă sau de orice alta, modificați manual setarea.
Calitatea recunoașterii textului rusesc în Microsoft OneNote lasă mult de dorit, așa că nu poate fi numit un înlocuitor complet pentru FineReader. Și procesarea documentelor mari cu mai multe pagini în el este foarte incomod.
Vechi program gratuit SimpleOCR este, de asemenea, un instrument de recunoaștere a textului foarte decent cu imagini electroniceși scanări, dar, din păcate, fără suport pentru limba rusă. Dar are o funcție unică pentru citirea cuvintelor scrise de mână, precum și un editor care vă permite să corectați erorile înainte de a salva rezultatul final.
Alte caracteristici SimpleOCR:
Calitatea recunoașterii atât a textelor tipărite, cât și a manuscriselor este destul de ridicată.
Programul ar putea fi numit universal dacă nu pentru suportul limitat de limbă. Ultima versiune Acceptă doar engleză, franceză și daneză, probabil că nu există planuri pentru a adăuga altele. Interfața este în întregime în engleză, dar este ușor de înțeles. În plus, în fereastra principală există un buton „Demo”, care lansează un videoclip de instruire despre lucrul cu SimpleOCR.
Programul companiei belgiene de dezvoltare I.R.I.S este cu adevărat un adevărat concurent pentru ABBYY FineReader rusesc. Puternic, rapid, multi-platformă, bazat pe motorul OCR proprietar utilizat de Adobe, HP și Canon, recunoaște perfect chiar și cele mai greu de citit texte. Acceptă 137 de limbi, inclusiv rusă și ucraineană.
Caracteristici și funcții Readiris:
Interfața programului este în limba rusă, utilizarea este intuitivă. Nu oferă utilizatorilor posibilitatea de a edita conținutul fișierelor pdf, cum ar fi FineReader, dar, în opinia noastră, face față sarcinii principale - recunoașterea textului.
Readiris vine în două versiuni plătite. Preţ Licențe profesionale este 99,00 €, Corporate - 199 €. Aproape ca ABBYY.
Freemore OCR - (! site-ul web al programului http://freemoresoft.com/freeocr/index.php poate fi blocat de antivirusuri din cauza publicității „gunoi” încorporat în programul de instalare) - un alt utilitar simplu, compact și gratuit, care recunoaște bine textele, dar implicit doar în limba engleză. Pachetele în alte limbi trebuie descărcate și instalate separat.
Alte caracteristici și capabilități ale Freemore OCR:
La prima vedere, interfața programului poate părea complicată, dar de fapt este foarte ușor de utilizat. Instrumentele sunt împărțite în grupuri, ca pe o bandă Microsoft Office. Dacă vă uitați la ele mai îndeaproape, scopul acestui sau al unui buton va deveni rapid clar.
Pentru a descărca document electronicîn fereastra Freemore OCR, selectați mai întâi tipul acesteia - imagine sau fisier pdf, apoi apăsați butonul „Încărcare” corespunzător. Pentru a începe procesul de recunoaștere, faceți clic pe butonul „OCR” din grupul de instrumente cu același nume de lângă imagine bagheta magică(prezentat în captură de ecran).
Rezultatul scanării textelor în limba engleză din imagini atât bine citite, cât și greu de citit s-a dovedit a fi destul de satisfăcător. Singurul lucru care nu mi-a plăcut a fost că, împreună cu programul, pe computer sunt instalate tot felul de gunoi - unele false scanere antivirus, optimizatori și alte lucruri inutile și fără posibilitatea de a le refuza în timpul instalării. Într-un cuvânt, dacă nu pentru acest dezavantaj, aplicația ar putea fi recomandată ca fiind una bună. alternativă gratuită FineReader.