OCR

Retour à la page precedente
Publicité


OCR est l’acronyme du terme anglais « Optical Character Recognition » que l’on peut traduire en français par « reconnaissance optique de caractères (ROC) ».


L’OCR désigne une série de programmes informatiques basés sur des algorithmes mathématiques permettant la traduction d’images de textes imprimés ou dactylographiés en texte informatique (par exemple un fichier Word).


Pour aboutir à un tel resultat, un ordinateur nécessite un logiciel de reconnaissance optique de caractères, qui permet de récupérer le texte dans l’image d’un texte imprimé et de le sauvegarder dans un fichier pouvant être exploité dans un traitement de texte pour enrichissement et exploitable par un système informatique.


Le principe est simple : on part de l’image numérique réalisée par un scannerUn scanner est un périphérique informatique dont le but est de numériser des documents papier pour les passer au format numérique.
L’objectif est de p...
optique (le contraste doit être important). Le programme vient lire le document et, grâce à des bibliothèques de formes, détecte les caractères afin d’en faire correspondre la forme au caractère attendu.

Catégories associées
Retour à l'accueil du lexique
Annonces Google