Snahy o optické rozpoznávání písma OCR (z anglického Optical
Character Recognition) se poprvé objevily zhruba v polovine
minulého století. Zlom však prinesl teprve rok 1966, kdy se v
USA standardizovalo tzv. písmo OCR-A, první písmo umožnující
strojové ctení. Tvary tohoto písma byly zjednodušeny aby
strojové ctení bylo co nejpresnejší, ale písmo nebylo dobre
citelné okem. Tento standard našel uplatnení predevším ve
velkých bankách. Krátce na to se v Evrope objevil standard OCR-B.
Bylo to v roce 1968 a jeho autorem byl Adrian Frutiger. Tento
standard není sice tak dobre opticky citelný, je však dobre
citelný okem.
***
Celý postup optického rozpoznávání písma lze rozdelit do 2 fází.
Nejprve se pomocí skaneru sejme predloha. Dále se pak obraz písma
digitalizuje, tj. prevádí se do matice cerných a bílých bodu
(informace o stupni šedi se ztrácí). Klasický formát A4, pri
rozlišení skaneru 300 bodu na palec (tj. 118 bodu na
centimetr), je tak preveden na 8 950 500bodu, což predstavuje
1,125 MB pameti. Tato matice je prenesena do pocítace jako
obrázkový soubor, tedy bodový rastr. Pocítac “ví” v
tomto okamžiku o cerných a bílých bodech ale
“nezná” obsah textu. ten teprve vytvorí software, tj.
program pro rozpoznávání písma. V této fázi je nejprve treba
provést analýzu oblastí, které patrí k sobe, nebot stránka
muže obsahovat bloky textu, obrázky, tabulky atd. Komfortní a
výkonné programy samy oddelují cásti textu od obrázku a zpracují i
text rozdelený do sloupcu. Jednoduché programy pocítají s pomocí
zvencí, tzn. že prvotní analýzu provádí obsluha. Tak se text
rozdelí do rádku a zjistí se umístení písmen v rádcích. Teprve ted
muže nastoupit rozpoznávací logika.
***
Prirazení bodových rastru písmenum a urcení kódu techto písmen,
tak, jak s nimi pracuje pocítac, muže provádet program ruznými
postupy. Základní zpusoby jsou dva: rozpoznávání podle predlohové
matice a podle charakteristických tahu písmen. V prvém prípade se
využívá vzoru písmen v digitalizované podobe pro ruzné typy
písmen. Písmo, které pocítac nemá v pameti, rozpoznat nemuže.
Také jakákoliv deformace písma (napr. zúžení) prináší
komplikace. V druhém prípade program analyzuje urcité cásti
poznávaného písmene (vodorovná, svislá ci šikmá cára, typ
oblouku atd.), tj. provádí tzv. topologickou analýzu. Rozpoznávání
je úcinnejší, ani velikost rastru zde nepusobí
potíže.
***
V obou prípadech se predpokládá spoluúcast obsluhy, která musí
dodat programu chybející inteligenci. Napr. pokud je urcité písmeno
špatne rozpoznáváno, obsluha “naucí” program toto
písmeno správne identifikovat.
***