Aplikácie OCR: rozpoznávanie textu, zoznamy, vývojári, váha programu, spustiteľné funkcie, funkcie, funkcie a spätná väzba používateľov.

Papier ako hlavný nosič informácií postupne stráca svoj význam. Namiesto papierových dokumentov použite ich elektronickú verziu, ak je to možné. Ale ako preložiť elektronické archívy do existujúcich archívov? Na vyriešenie tohto problému boli vytvorené špeciálne programy na rozpoznanie textu.

Čo sú OCR programy a ako fungujú

Tieto softvérové ​​produkty používajú technológiu ORC (rozpoznávanie optických znakov) alebo technológia ICR (inteligentné rozpoznávanie znakov). V ruštine sa tieto skratky prekladajú ako "optické" alebo "inteligentné rozpoznávanie znakov". Programy, ktoré používajú OCR, fungujú takto. Fotografia s textom prijatým zo skenera je rozdelená na niekoľko úlomkov. Pre každý z nich program vytvára niekoľko predpokladov. Kontrolami a porovnaním s normami poskytne každý fragment odhad zodpovedajúci stupňu náhodnosti. Pri výbere najväčšieho z nich program "vidí" symbol a zobrazí ho v poli zabudovaného textového editora.


IRC pracuje rovnakým spôsobom, ale umelé neurónové siete sa používajú na zvládnutie znakov. Hlavnou výhodou tejto metódy je kompaktnosť programov a neustále vzdelávanie. To vám umožní efektívne rozpoznať slová napísané človekom veľkými písmenami. Ale táto technológia nie je schopná "čítať" pevný rukopisný text. Pre každý z existujúcich operačných systémov, ich vlastnéAplikácie OCR. Najobľúbenejšie pre systém Windows je:
  • ABBYY FineReader;
  • OmniPage;
  • Readiris;
  • program Samsung Scan OCR;
  • Okrem počítačového softvéru existuje mnoho služieb na rozpoznávanie textov online. Medzi nimi najznámejšie sú FineReader Online, OnlineOCR, FreeOCR.


    ABBYY FineReader 14

    Tento softvérový produkt bol vyvinutý domácou spoločnosťou ABBYY, je jednou z najlepších aplikácií, ktoré používajú OCR. Základom programu je pôvodný motor s názvom Finereader Engine. Poskytuje nasledujúce funkcie:
  • Rýchle rozpoznávanie vytlačeného textu s presnosťou väčšou ako 98%. Netrpezlivosť na kvalitu pôvodného obrazu. To vám umožní identicky rozpoznať text fotografií nasnímaných pomocou skenera alebo fotoaparátu.
  • Technológia ADRT umožňuje rozpoznať nielen text, ale aj jeho formátovanie: písmo, zarážky, odseky, stĺpce.
  • Možnosť viacvláknového spracovania obrazu. To vám umožní používať všetky procesorové jadrá (max 4) na urýchlenie procesu rozpoznávania.
  • Podporuje viac ako 190 jazykov, vrátane tých, ktoré používajú abecedu inú ako latinčinu alebo cyriliku (japončina, čínština, arabčina).
  • Vstavaný textový editor vám umožňuje skontrolovať výsledok rozpoznávania alebo upraviť.
  • Interakcia so sadu Office. Umožňuje vám exportovať rozpoznaný text v aplikácii Microsoft Word a Exel pre ďalšie spracovanie.
  • Schopnosť študovať program. Táto funkcia vám umožňuje učiť program na "čítanie" konkrétnych písmen. Napríklad neštandardné písmo alebo písmená písané rukou.
  • Práca s PDF. FineReader dokáže rozpoznať text, ktorý typ súboru a "šiť" niekoľko naskenovaných obrázkov do formátu PDF alebo PDF /A.
  • Hlavnou nevýhodou tohto programu je cena. Nekonečná licencia pre základnú verziu bude stáť 7 tisíc rubľov. Verzie "Podnikanie" a "Podnikanie" - v 12 a 39 tisíc rubľov, resp. Ak chcete použiť program nielen doma, môžete si stiahnuť z torrent tracker rozbité 11. a 12. verziu produktu.
    Požiadavky:
  • Procesor 32 - alebo 64-bit, s 1 GHz a podporuje inštrukčnú sadu SSE 2. (Intel Celeron M a lepšie, AMD Athlon 64 a vyššie).
  • RAM: 1 GB. Ak má procesor viac ako jedno jadro, potom je potrebných ďalších 512 MB.
  • Video: všetky, ktorá podporuje rozlíšenie 1024 x 800.
  • , na pevnom disku: 3 GB pre inštaláciu a prevádzku.
  • Skener: podporuje ovládače TWAIN a WIA.
  • OS: Windows 788110.
  • Stanovisko o FineReader 14

    Hovorí o FineReader pozitívne, zdôrazňujú výhody schopnosť výrobku rozpoznať text z zlých papierových predlôh, pohodlné a jednoduché rozhranie a vysoká rýchlosť spracovanie obrazu. Medzi problémy, ktoré vznikajú pri použití OCR-program, niektorí hovoria, že nesprávne nick manažér pracujúci obraz. Napríklad: Nedostatočná práca na úpravu jasu naskenovaného obrázka.

    OmniPage 18

    Hlavným konkurentom spoločnosti FineReader na ruskom trhu programov ORC. Podľa funkčnosti je veľmi podobný súperovi, ale má niekoľko rozdielov:
  • Schopnosť spustiťskenovanie a rozpoznávanie pomocou tlačidiel skenera.
  • Podpora pre 4-jadrové procesory. To vám umožní znížiť čas rozpoznávania a konvertovať viacero obrázkov súčasne.
  • Vytvorenie vlastnej e-knižnice pre e-kníhkupectvo
  • Automatická detekcia konkrétneho jazyka.
  • Medzi nedostatky programu možno spomenúť nízku rýchlosť, ktorá je porovnateľná s 10. verziou FineReadera a cena za licenčnú kópiu - 150 dolárov.
    Systémové požiadavky:
  • Procesor: x32 alebo x64-bit, 1 GHz, Intel Pentium a lepší, AMD Athlon a lepší.
  • RAM: 512 MB.
  • ​​
  • Grafická karta: akékoľvek, podporuje rozlíšenie 1024 x 800 a farebnú hĺbku 16 bitov.
  • ​​
  • Pevný disk: 11 GB pre inštaláciu všetkých komponentov a 100 MB pre prácu.
  • Skener: podporuje ovládače TWAIN, WIA a ISIS.
  • Operačný systém: Windows XP SP3 Vista SP2 x32 /x6478.
  • Názory používateľov v programe OmniPage

    Hovorí sa, že je náhle negatívne, pretože vo všetkých častiach programu sú prítomné problémy, od krásneho, ale nepochopiteľného rozhrania až po zlé otázky. Produkt nie je prispôsobený na prácu vo WinXP. Môže byť nútený pracovať, ale bude musieť stráviť nejaký čas. OmniPage má problémy s rozpoznávaním. Napríklad: ľahko rozpozná čistý čierny text na hárku papiera s výkresmi, tabuľkami získanými zo skenera. Pri používaní obrázkov z fotoaparátu alebo mobilného telefónu sa presnosť rozpoznávania zníži na 70%, čo je pri spracovávaní veľkých dokumentov veľmi nepríjemné.

    Tiež 18.verzia sa nemusí spustiť z dôvodu chýb v kóde. Ak chcete tento problém vyriešiť, musíte nainštalovať opravu 1801.

    Prečítajte si Iris Pro 17

    Prečítajte si Iris je program OCR, ktorý s menším počtom peňazí (8000 vs. 12000) dokáže porovnať funkčnosť a výkon s programom FineReader. Profesionálna verzia má nasledujúce funkcie:
  • Práca na plný úväzok s PDF: rozpoznávanie, tvorba súborov pre databázy, kompresiu a hlas nad textom.
  • Podpora pre 140 jazykov.
  • Rozpoznanie papierových tabuliek a textov s možnosťou exportu do Exel a Word.
  • Získanie obrázkov z ľubovoľného modelu skenera.
  • K dispozícii je aj firemná verzia, ktorá vám umožňuje chrániť súbory PDF pomocou vodoznakov a manipulovať s dokumentmi dlhšími ako 50 strán. Systémové požiadavky:
  • Procesor: x86 alebo x64 s frekvenciou 1 GHz alebo vyššou.
  • RAM: 1 GB.
  • Grafická karta: Kto podporuje rozlíšenie 1024 x 800.
  • Pevný disk: 400 MB pre inštaláciu.
  • Skener: podporuje ovládače TWAIN, WIA.
  • Operačný systém: Windows 7810 x32 /x64.
  • Stanovisko o Readiris

    Hovorí o tomto programe rozpoznávanie OCR-textového ako dobrý a rýchly PDF konvertor Word s radom problémov:
  • Pokročilé rozhranie, v ktorom nováčik nie je ľahké pochopiť.
  • Automatické naskenovanie dokumentu pri zmene oblasti skenovania.
  • Zlá technická podpora.
  • Niekedy program nie je aktivovaný v dôsledku chýb v programovom kóde.
  • Program Samsung Scan OCR - Čo je to program?

    Ide o slobodný softvér, ktorý je dodávaný s multifunkčným zariadenímZariadenia "3 v 1" (tlačiareň, skener, kopírka) od spoločnosti Samsung. Bol vyvinutý v spolupráci s Iris, vytvoril ReadIris Pro, optimalizovaný pre prácu s multifunkčným zariadením výrobcu. Z pôvodného zariadenia "Reader" má aplikácia Samsung Scan ORC rozhranie, funkčnosť a veľkosť orezania - na pevnom disku je potrebných 40 MB.

    Online služby

    Ide o alternatívu k aplikáciám stacionárneho rozpoznávania textovo náročných textov. Napríklad OCR je FineReader. Vlastnosti systémov podobných projektov umožňujú rozpoznať text z obrázkov oveľa rýchlejšie ako na samostatnom počítači. Medzi službami, ktoré sa podieľajú na prijímaní textu z fotografií, môžete rozlíšiť tri z najvhodnejšieho: FineReaderOnline, FreeOCR, OnlineOCR.
    Prvým je priamy vývoj stacionárnej verzie produktu. Po registrácii dostane nový používateľ 10 voľných stránok na spracovanie a 5 každý mesiac. Toto obmedzenie môžete zrušiť zakúpením ročného predplatného pre 3200550017800 rubľov za 20005000 a 10 000 strán. Ak má používateľ licenciu na FineReader 14, musí sa zaregistrovať a aktivovať na použitie v online verzii. V takomto prípade dostane počet strán zodpovedajúci typu zakúpenej licencie: Standard (2000), Business (5000) alebo Enterprise (10 000).
    Služba onlineOCR.com vám umožňuje previesť 15 obrázkov za hodinu (obmedzenia pre neregistrovaných používateľov) do textu a uložiť ich ako súbory .docx, .xlsx alebo .txt. Po registrácii bude k dispozícii:
  • Ukladanie .pdf .doc, .xlx, .rtf.
  • Preveďte viacstranové súbory PDF.
  • Počet stránzvýši na 50.
  • V prípade, že stránka nie je dosť, môžu kúpiť niekoľko kusov 50-50000.
    Návrh FreeOCR.com odlišné od ich predchádzajúcich plných voľne a bez obmedzenia počtu strán spracovaných. site OCR-engine, ktorý podporuje ruskej, ukrajinskej, turecké, vietnamské, a všetky európske jazyky - celkom 29. Jedinou nevýhodou tohto portálu je pracovať iba s grafikou, ktoré sú zavádzané postupne, pretože spracovanie fronty sa nepredpokladá tvorcom. Zobrazuje rozpoznané informácie bez akéhokoľvek formátovania vo formáte TXT.

    Stanovisko o online-OCR služby

    Tieto stránky sú potrebné v prípadoch, keď sťahovanie a inštaláciu úplné ORC-program uskutočniteľný. Napríklad, ak chcete do abstraktu vložiť niekoľko citátov z knihy alebo časopisu. Medzi nevýhody známych izolovaných lokalít zadarmo (FineReader) a slabé funkčnosť (FreeOCR, OnlineOCR). Ak to zhrnieme, môžeme povedať, že existuje veľa programov OCR na rozpoznávanie textu pomocou obrázkov alebo súborov PDF a článok zobrazuje iba tie najznámejšie. Preto programy OCR pre skenery si každý užívateľ bude môcť vybrať podľa požiadaviek a rozpočtu. Alebo použite jednu z mnohých bezplatných OCR služieb.

    Súvisiace publikácie