Papier ako hlavný nosič informácií postupne stráca svoj význam. Namiesto papierových dokumentov použite ich elektronickú verziu, ak je to možné. Ale ako preložiť elektronické archívy do existujúcich archívov? Na vyriešenie tohto problému boli vytvorené špeciálne programy na rozpoznanie textu.
Čo sú OCR programy a ako fungujú
Tieto softvérové produkty používajú technológiu ORC (rozpoznávanie optických znakov) alebo technológia ICR (inteligentné rozpoznávanie znakov). V ruštine sa tieto skratky prekladajú ako "optické" alebo "inteligentné rozpoznávanie znakov". Programy, ktoré používajú OCR, fungujú takto. Fotografia s textom prijatým zo skenera je rozdelená na niekoľko úlomkov. Pre každý z nich program vytvára niekoľko predpokladov. Kontrolami a porovnaním s normami poskytne každý fragment odhad zodpovedajúci stupňu náhodnosti. Pri výbere najväčšieho z nich program "vidí" symbol a zobrazí ho v poli zabudovaného textového editora.
IRC pracuje rovnakým spôsobom, ale umelé neurónové siete sa používajú na zvládnutie znakov. Hlavnou výhodou tejto metódy je kompaktnosť programov a neustále vzdelávanie. To vám umožní efektívne rozpoznať slová napísané človekom veľkými písmenami. Ale táto technológia nie je schopná "čítať" pevný rukopisný text. Pre každý z existujúcich operačných systémov, ich vlastnéAplikácie OCR. Najobľúbenejšie pre systém Windows je:
ABBYY FineReader; OmniPage; Readiris; program Samsung Scan OCR;Okrem počítačového softvéru existuje mnoho služieb na rozpoznávanie textov online. Medzi nimi najznámejšie sú FineReader Online, OnlineOCR, FreeOCR.
ABBYY FineReader 14
Tento softvérový produkt bol vyvinutý domácou spoločnosťou ABBYY, je jednou z najlepších aplikácií, ktoré používajú OCR. Základom programu je pôvodný motor s názvom Finereader Engine. Poskytuje nasledujúce funkcie:
Rýchle rozpoznávanie vytlačeného textu s presnosťou väčšou ako 98%. Netrpezlivosť na kvalitu pôvodného obrazu. To vám umožní identicky rozpoznať text fotografií nasnímaných pomocou skenera alebo fotoaparátu.Technológia ADRT umožňuje rozpoznať nielen text, ale aj jeho formátovanie: písmo, zarážky, odseky, stĺpce.
Možnosť viacvláknového spracovania obrazu. To vám umožní používať všetky procesorové jadrá (max 4) na urýchlenie procesu rozpoznávania. Podporuje viac ako 190 jazykov, vrátane tých, ktoré používajú abecedu inú ako latinčinu alebo cyriliku (japončina, čínština, arabčina). Vstavaný textový editor vám umožňuje skontrolovať výsledok rozpoznávania alebo upraviť. Interakcia so sadu Office. Umožňuje vám exportovať rozpoznaný text v aplikácii Microsoft Word a Exel pre ďalšie spracovanie. Schopnosť študovať program. Táto funkcia vám umožňuje učiť program na "čítanie" konkrétnych písmen. Napríklad neštandardné písmo alebo písmená písané rukou. Práca s PDF. FineReader dokáže rozpoznať text, ktorý typ súboru a "šiť" niekoľko naskenovaných obrázkov do formátu PDF alebo PDF /A.Hlavnou nevýhodou tohto programu je cena. Nekonečná licencia pre základnú verziu bude stáť 7 tisíc rubľov. Verzie "Podnikanie" a "Podnikanie" - v 12 a 39 tisíc rubľov, resp. Ak chcete použiť program nielen doma, môžete si stiahnuť z torrent tracker rozbité 11. a 12. verziu produktu.
Požiadavky:
Procesor 32 - alebo 64-bit, s 1 GHz a podporuje inštrukčnú sadu SSE 2. (Intel Celeron M a lepšie, AMD Athlon 64 a vyššie). RAM: 1 GB. Ak má procesor viac ako jedno jadro, potom je potrebných ďalších 512 MB. Video: všetky, ktorá podporuje rozlíšenie 1024 x 800., na pevnom disku: 3 GB pre inštaláciu a prevádzku. Skener: podporuje ovládače TWAIN a WIA. OS: Windows 788110. Stanovisko o FineReader 14
Hovorí o FineReader pozitívne, zdôrazňujú výhody schopnosť výrobku rozpoznať text z zlých papierových predlôh, pohodlné a jednoduché rozhranie a vysoká rýchlosť spracovanie obrazu. Medzi problémy, ktoré vznikajú pri použití OCR-program, niektorí hovoria, že nesprávne nick manažér pracujúci obraz. Napríklad: Nedostatočná práca na úpravu jasu naskenovaného obrázka.
OmniPage 18
Hlavným konkurentom spoločnosti FineReader na ruskom trhu programov ORC. Podľa funkčnosti je veľmi podobný súperovi, ale má niekoľko rozdielov:
Schopnosť spustiťskenovanie a rozpoznávanie pomocou tlačidiel skenera. Podpora pre 4-jadrové procesory. To vám umožní znížiť čas rozpoznávania a konvertovať viacero obrázkov súčasne. Vytvorenie vlastnej e-knižnice pre e-kníhkupectvo Automatická detekcia konkrétneho jazyka.
Medzi nedostatky programu možno spomenúť nízku rýchlosť, ktorá je porovnateľná s 10. verziou FineReadera a cena za licenčnú kópiu - 150 dolárov.