Un OCR (Optical Character Recognition) és un sistema que reconeix caràcters que no están en format de text, sinó com a imatge. És sencill, reconeix una agrupació de píxels i, posem la lletra A per exemple, en la seva "base de dades" diguem que té entés que una agrupació com aquella o similar pertany al caràcter A.
O sigui que simplemnt els reconeix per semblança, llavors pot tenir problemes, amb lletra escrita a má, que sigui irregular o sobre superficies que constin de difrents elements o colors. O sigui que el millor per reconeixer els caràcters és que aquest siguin ben clars i regulars, i que es diferenciin el fons de imatge, i que aquest fons sigui un fons pla.
Alguns programes OCR:
-Iris
-Omnipage
Acrobat també inclou reconeixment OCR, de fet, es el que utilitzarem a clase.
Cap comentari:
Publica un comentari a l'entrada