Présenté par : Jabli Mohamed Amine Brahim Raddaoui

Slides:

Advertisements

Présentations similaires

Été INF1025 Driouch Elmahdi

Advertisements

Réaliser par : AYOUB EL MOUDEN SAID BAYT AZIZ AMCHTAL TARIK DAROUACHI

Accueil du public Déficient visuel. Quel est sa déficience visuelle ? Quelles solutions techniques ? - Quel est son niveau en informatique ? - Quelles.

Les outils pour améliorer la dictée vocale

EBSCO Host Bases de données et revues en texte intégral en ligne

1 : Léditeur 2 : Le traitement dimages. 3 : La visionneuse dimage. FRONTPAGE PAINT SHOP PRO ACD SEE.

TIC et enseignement supérieur: les acquis du SMSI, les défis de la mise en oeuvre. Jean-Michel HUBERT.

TRAITEMENT AUTOMATIQUE DES LANGUES : LES PRINCIPAUX PROGRAMMES

Les outils du TAL Par RIGAUD Anaïs RALLIER Armelle SANTIAGO Gwendoline

La fonction Style Permet de créer des types de texte, par exemple

A la prise de vue et au labo numérique

Présentation de PowerPoint 2007

Professeure : Kaoutar Année Scolaire : 2012 / 2013

Vue générale de Sharpdesk

Se passer du papier Oui, non, peut-être Collège du Management de la Technologie L'informatique du CDM Auteur : P. Bangerter.

*ou ayant des besoins particuliers

Traitements d'images et Vision par ordinateur

Excel Introduction.

Evaluation de la qualité des documents anciens

Création d'un diaporama Création d'un diaporama

© Nuance Communications, Inc. Tous droits réservés. Page 1 OmniPage Ultimate mai 2013.

PEUT-ON RECUPERER LES FICHIERS EFFACES ?

Reconnaissance d’empreintes digitales

Convertir un fichier en format .pdf

Le multimédia à l ’école : une révolution ?

Les enseignements technologiques d'exploration en SECONDE : pour une culture technologique.

Aplications bureautiques dans les travaux scolaires.

InDesign 2 Com 3562 Aude Dufresne et Jorge Zeledon.

Lorsque vous créez un document, il faut faire attention au poids des images (le nombre d’octets), si vous devez le diffuser par mel. Chaque image est un.

Démarche Qualité Logicielle

La décomposition en valeurs singulières: un outil fort utile

UNIX™ est le nom d'un système d'exploitation multitâche et multi-utilisateur créé en 1969, à usage principalement professionnel. Il a donné naissance à.

Les aides technologiques René Bélanger et Sylvie Desrosiers Décembre 2011 Commission scolaire de la Rivière-du-Nord.

Méthodologie pour la structuration semi- automatique d’un corpus lexicographique bilingue : le cas du dictionnaire français-kabyle Mahfoud MAHTOUT Université.

Réaliser un herbier numérique de plantes médicinales

Les images numériques IEN Cluses – 19 mars Plan Les pistes pédagogiques Expériences de pratiques personnelles dans sa classe Aspects techniques.

Affiches du XIXème siècle Fonctions et esthétique

Traitement de la parole : Synthèse et reconnaissance

Dans cet article, une nouvelle approche relative à l’indexation de la bande sonore de documents audiovisuels est proposée, son but est de détecter les.

Reconnaissance des personnes par le visage dans des séquences vidéo

Introduction aux bibliothèques numériques Alain Jacquesson Bibliothèque publique et universitaire Ville de Genève Vers

23 mars 2008© présente Comprendre Les documents PDF Tous droits réservés.

Les réseaux de neurones à réservoir en traitement d’images

Institut de sciences et technologies Département d’informatique

L’ergonomie des IHM : pourquoi, comment ?

Principes, usages et conception

Les Logiciels d’image. Remarque en ce qui concerne cet exposé Il existe sur le Marché actuel des centaines de logiciels d’image, certains gratuits mais.

LE TABLEUR-GRAPHEUR Séquence 1 Compétences visées :

PDF Un format universel?.

B2i école : domaines, aptitudes et pistes d’activités

Création d’un imagier en cycle 3 à destination du cycle 1

2005 Adobe Systems Incorporated. All Rights Reserved. 1 Solutions Adobe Acrobat Génération de fichiers PDF accessibles Lionel Lemoine

Aide Retraités & Seniors Niveau 1 Théorie Générale Argentique et numérique...( RVB & CMJ ) Conseils sur les différents modes ( sensibilité,

Introduction au Word Spotting 3 décembre 2012 Partha Pratim RoyJean-Yves RamelFrédéric Rayar AG BVH.

ORGANISATION DE L’ENSEIGNEMENT Informatique et Sciences du Numérique.

Modules Chapitre 1 : Système d’exploitation

Présentation du cahier de

Le Traitement Automatique des Langues (TAL)

OBJECTIFS : STOP à la recopie fastidieuse SÆCI « Recherche Structurée » permet de récupérer des informations de documents quelconques d’après leur positionnement.

 Définition  Les habiletés acquises en production multimédia  Les habiletés acquises en production audio et video  Les habiletés acquises en en production.

Pierre Malenfant Technologie 9 École du Carrefour

Traitement d’images 420-D78-SW A15 Semaine 02.

L’Iriscan Book 3 et son utilisation

Présentation de Dreamveawer

Bloc 1 - UE 5 - Technologies de l’information et de la communication TIC Bachelier en immobilier T. SOUMAGNE.

Bloc 1 - UE 5 - Technologies de l’information et de la communication TIC Bachelier en immobilier T. SOUMAGNE.

© 2015 Nuance Communications, Inc. Tous droits réservés. Nouveautés d'AutoStore 7 Mars 2015.

MES STRATÉGIES DE LECTURE

1 4th International Conference on Arabic Language Processing, May 2–3, 2012, Rabat, Morocco Titre Mohamed El Amine ABDERRAHIM Mohamed Alaedine ABDERRAHIM.

GUIDE PRATIQUE PLATE FORME LOGICIELLE QUESTIONNAIRE A CHOIX MULTIPLE. QCM DIRECT 6 NEOPTEC.

Transcription de la présentation:

Présenté par : Jabli Mohamed Amine Brahim Raddaoui Ministère de l'Enseignement supérieur et de la recherche scientifique Faculté de science De Gafsa La Reconnaissance optique des caractères Présenté par : Jabli Mohamed Amine Brahim Raddaoui Année Universitaire:2014/2015

Ministère de l'Enseignement supérieur et de la recherche scientifique Plan 1:Notre Besoin D’OCR 2:Domaine de Traitement D’image: 3: Qu'est-ce que l'OCR au juste ? a-Prétraitement? b-Segmentation c-Reconnaissance des Caractères d-Post-Traitement 4:Logiciel Ocr : 5:Exemple de logiciel a-ABBYY Fine Reader b-Faire la reconnaissance d’une image avec ABBYY FineReader

Nos besoin D’OCR: si vous vouliez numériser un article de journal ou un contrat sur papier. Deux solutions se présentent à vous : soit vous passez un temps incalculable à la ressaisir et à corriger les erreurs de frappe  soit vous transformez ces mêmes documents en format numérique en une fraction de secondes en utilisant un scanner (ou un appareil photo numérique) :c’est la technologie OCR de reconnaissance optique de caractères.

Domaine de Traitement D’image: Les techniques informatiques de traitement de l'image peuvent aider les humains dans la lecture de textes extrêmement difficiles, comme les manuscrits de Qumrân. Des approches coopératives où les ordinateurs assistent les humains et vice-versa constituent un domaine de recherche intéressant. Mots manuscrits

La reconnaissance de caractère est un domaine actif de recherche pour la science informatique depuis la fin des années 1950. Au début, on pensait qu'il s'agissait d'un problème facile, mais il apparut qu'il s'agissait d'un sujet beaucoup plus intéressant. Il faudra encore de nombreuses décennies aux ordinateurs, s'ils y parviennent un jour, pour lire tous les documents avec la même précision que les êtres humains.

Qu'est-ce que l'OCR au juste ? Le mot OCR (en anglais : Optical Character Recognition) signifie reconnaissance optique de caractères ou reconnaissance de texte, une technologie qui vous permet de convertir différents types de documents tels que les documents papiers scannes, les fichiers PDF ou les photos numériques, vers des formats modifiables et exploitables.

Les phases de la reconnaissance: Prétraitement Segmentation Reconnaissance Post-traitement

Prétraitement ou Pré-analyse Pré analyse de l'image : le but est d'améliorer éventuellement la qualité de l'image. Ceci peut inclure le redressement d'images inclinées ou déformées, des corrections de contraste, binarisation de l’image ,le passage en mode bicolore (noir et blanc, ou plutôt papier et encre), la détection de contours.

Donc la segmentation permet Segmentation en lignes et en caractères (ou Analyse de page) : vise à isoler dans l'image les lignes de texte et les caractères à l'intérieur des lignes. Cette phase peut aussi détecter le texte souligné, les cadres, les images. Donc la segmentation permet d’isoler dans l’image les différentes composantes (illustrations, blocs de texte, marges, etc.).

Binarisation, Segmentation Binarisation de region de texte Reconnaissance définitive de la lettre et de la segmentation

Classification par Caractéristiques Méthodes métriques La Reconnaissance Reconnaissance proprement dite des caractères : après normalisation (échelle, inclinaison), une instance à reconnaitre est comparée à une bibliothèque de formes connues, et on retient pour l'étape suivante la forme la plus « proche » (ou les N formes les plus proches), selon une distance ou une vraisemblance (likelihood). Les techniques de reconnaissance se classent en quelques grands types: Classification par Caractéristiques Méthodes métriques Méthodes statistiques

Post-traitement utilisant des méthodes linguistiques et contextuelles pour réduire le nombre d'erreurs de reconnaissance : systèmes à base de règles, ou méthodes statistiques basées sur des dictionnaires de mots, de syllabes, de N-grammes (séquences de caractères ou de mots). Dans les systèmes industriels, des techniques spécialisées pour certaines zones de texte (noms, adresses postales) peuvent utiliser des bases de données pour éliminer les solutions incorrectes. Génération du format de sortie, avec la mise en page pour les meilleurs systèmes.

Principaux logiciels de reconnaissance optique de caractères Logiciels libres GOCR (Unix, Windows) OCRopus (Unix) Tesseract (Unix, Windows) Logiciels freeware Moredata. logiciel freeware qui emploie tessnet (Windows). MoredataFast (Windows).

Logiciel Payants : Adobe Acrobat Professional (Windows. Mac OS) ExactScan ExactScan Pro et OCRKit (Mac OS) ABBYY FineReader (Unix, Windows. Mac OS) Nuance Omnipage (Windows) I R I S. Readiris (Unix, Windows. Mac OS) Nicomsoft OCR (Windows. Unix)

ABBYY Fine Reader ABBYY est un logiciel de reconnaissance des caractères ,il permet de créer des fichier interrogeables, facilement et rapidement modifiable , à partir de document papier, fichier PDF et photos numériques grâce à ses fonctionnalité comme la précision de reconnaissance et la conservation de format exceptionnelles de plus sa reconstruction intelligente de la structure et du formatage complexe des documents (tableaux, colonnes etc. )

Merci de Vos Attentions