SlideShare a Scribd company logo
1 of 23
04/06/2009




Amélioration du système de
reconnaissance de l’écriture arabe
manuscrite, basé sur le réseau RNT-DF
  Présenté par: Messaoudi Hafedh   Encadré par: M. Maddouri Mondher
                Mohamed Hichem                  Mme. Maddouri Samia
1.       Introduction
2.       Systèmes de reconnaissance de l’écriture manuscrite
     •       Types de reconnaissance de l’écriture manuscrite
     •       Etapes de reconnaissance de l’écriture manuscrite
     •       Caractérisation de l’écriture arabe
     •       Système RNT-DF
3.       Aspect méthodologique
     •       Détection des points diacritiques
     •       Estimation du nombre des PAWs
     •       Détection des hampes
4.       Aspect technique
     •       Problèmes de mémoires
     •       Interface
5.       Conclusion et perspectives

05/06/2009 13:18                  Messaoudi Hafedh , Mohamed Hichem   2
Systèmes de
                             Systèmes de                     Aspect
   Introduction                           Aspect           Aspect Aspect technique
Introduction reconnaissance de de l’écriture
                 reconnaissance                méthodologique         Conclusion
                 l’écriture        méthodologique        technique




   • Contexte
         – Reconnaissance de l’écriture arabe manuscrite
               • Discipline récente, apparue au début des années 80
               • Domaine de recherche très disputé
   • But
         – Amélioration du système de reconnaissance de
           l’écriture arabe manuscrite basé sur le réseau de
           neurones transparents RNT-DF
               • Améliorations méthodologique
               • Amélioration technique


   05/06/2009 13:18             Messaoudi Hafedh , Mohamed Hichem            3
Systèmes de
                                                   Aspect                    Aspect
Introduction          reconnaissance de                                                Conclusion
                          l’écriture           méthodologique              technique

   Types de reconnaissance de l’écriture manuscrite

   • Deux types de reconnaissance
         – Reconnaissance en ligne:
                • Reconnaissance en temps réel du texte à partir de la
                  trajectoire du stylo
                • Données sous forme de signal
         – Reconnaissance hors ligne:
                • Reconnaissance statique d’images
                • Absence d’informations temporelles
             Reconnaissance hors ligne est plus difficile (moins
             d’informations)


   05/06/2009 13:18                    Messaoudi Hafedh , Mohamed Hichem                     4
Systèmes de
                                                    Aspect                   Aspect
Introduction          reconnaissance de                                                Conclusion
                          l’écriture            méthodologique             technique

        Etapes de reconnaissance


       Prétraitement
         • Dilatation                         Extraction des
                                                                              Reconnaissance
       • Normalisation                       caractéristiques
             •…




   05/06/2009 13:18                    Messaoudi Hafedh , Mohamed Hichem                       5
Systèmes de
                                                  Aspect               Aspect
Introduction          reconnaissance de                                          Conclusion
                          l’écriture          méthodologique         technique

                        Caractérisation de l’écriture arabe
  Primitives Description
         H             Hampe
         J             Jambage
         B             Boucle
         P             Point diacritique au-dessus
                       du corps du mot
         Q             point diacritiQue au-
                       dessous du corps du mot
                       Rien des primitives ci-
         R
                       dessus
    D, M, F, I         Position des primitives dans
                       le mot (D : Début, M :
                       Milieu, F : Fin, I : Isolé)
       PAW
   05/06/2009 13:18    Piece of Arabic WordHafedh , Mohamed Hichem
                                       Messaoudi                                       6
Systèmes de
                                                         Aspect                    Aspect
Introduction              reconnaissance de                                                     Conclusion
                               l’écriture            méthodologique              technique

                               Système RNT-DF: Architecture

       • Réseau de Neurones Transparent – Descripteurs de Fourier

                                                 : Propagation
                                                 : Retropropagation
 reconnaître




                      Couche                 Couche                 Couche            Couche




                                                                                                     reconnu
    Mot à




                                                                                                       Mot
                        des                 des lettres            des PAWs          des mots
                     primitives

                           H
                           J
                           B
                           P
                           …                    …                      …
       05/06/2009 13:18                      Messaoudi Hafedh , Mohamed Hichem                        7
Systèmes de
                                              Aspect                    Aspect
Introduction          reconnaissance                                              Conclusion
                                          méthodologique              technique
                        de l’écriture
                        Détection des points diacritiques




    • Méthode existante:
          – Toute boucle détectée au dessus de la ligne
            supérieure ou au dessous de la ligne inférieure est
            un point diacritique




   05/06/2009 13:18               Messaoudi Hafedh , Mohamed Hichem                     8
Systèmes de
                                                       Aspect                  Aspect
Introduction            reconnaissance                                                       Conclusion
                                                   méthodologique            technique
                          de l’écriture
                           Détection des points diacritiques
                                            Observation

                        Boucle au dessus de la ligne                 Boucle au dessus de la ligne
                                supérieure                                   supérieure




 Ligne supérieure


 Ligne de base
 Ligne inférieure




        Mauvaise détection
        Bonne détection                                    Point diacritique entre ligne
        Non détection                                        inférieure et supérieure
     05/06/2009 13:18                    Messaoudi Hafedh , Mohamed Hichem                          9
Systèmes de
                                                Aspect                  Aspect
Introduction          reconnaissance                                              Conclusion
                                            méthodologique            technique
                        de l’écriture
                        Détection des points diacritiques
                                        Observation

                                           Boucle au dessus de
                                            la ligne supérieure




     Mauvaise détection
     Bonne détection


   05/06/2009 13:18               Messaoudi Hafedh , Mohamed Hichem                    10
Systèmes de
                                                 Aspect                  Aspect
Introduction          reconnaissance                                               Conclusion
                                             méthodologique            technique
                        de l’écriture
                        Détection des points diacritiques
                                        Traitement
        Proportionnalité de                                            Nombre de points
             la forme                Remplissage interne                 de contour


                               Si (largeur > hauteur)
                                         rapport = largeur / hauteur
                               Sinon
                                         rapport = hauteur / largeur
                         Nombre Point de contours < Seuil


                                     La boucle est considérée
                                 proportionnelle si rapport < seuil


   05/06/2009 13:18                Messaoudi Hafedh , Mohamed Hichem                      11
Systèmes de
                                                Aspect                  Aspect
Introduction          reconnaissance                                              Conclusion
                                            méthodologique            technique
                        de l’écriture
                       Estimation du nombre des PAWs
                                        Observation

    Nombre PAWS
     correct = 5

   Nombre de PAWs
     détectés = 6




    Nombre PAWS
     correct = 8

   Nombre de PAWs
    détectés = 10




   05/06/2009 13:18               Messaoudi Hafedh , Mohamed Hichem                    12
Systèmes de
                                                Aspect                       Aspect
Introduction          reconnaissance                                                     Conclusion
                                            méthodologique                 technique
                        de l’écriture
                       Estimation du nombre des PAWs
                                        Traitement




  Un PAW est éliminé si:

       Sa largeur est              Son plus haut point est                 Son plus bas point est au
       supérieure à sa       ET    au dessous de la ligne             OU   dessus de la ligne
       hauteur                     inférieure - une marge                  supérieure + une marge


   05/06/2009 13:18               Messaoudi Hafedh , Mohamed Hichem                              13
Systèmes de
                                                Aspect                  Aspect
Introduction          reconnaissance                                              Conclusion
                                            méthodologique            technique
                        de l’écriture
                              Détection des hampes
                             Observation et traitement


         Détection des hampes à
          partir de maximums
                  locaux




   05/06/2009 13:18               Messaoudi Hafedh , Mohamed Hichem                    14
Systèmes de
                                                 Aspect                      Aspect
Introduction          reconnaissance                                                   Conclusion
                                             méthodologique                technique
                        de l’écriture
                      Impact sur le taux de reconnaissance




                                                                  Ancien taux:
                                                                      13%

                      Mot reconnu
                                                                        Nouveau
                                                                       Taux: 18%




              Le pourcentage des taux est par rapport à 6500 images traitées



   05/06/2009 13:18                Messaoudi Hafedh , Mohamed Hichem                        15
Systèmes de
                             Systèmes de                       Aspect
   Introduction                           Aspect           Aspect Aspect technique
Introduction reconnaissance de de l’écriture
                 reconnaissance                méthodologique         Conclusion
                 l’écriture        méthodologique        technique

                      Description des modules d’IKRAA
                          Présentation technique
       – Langage de
   Nom du fichier Nombre programmation : C++
                            Nombre de Nombre de                      Nombre de           Rôle
                  lignes de fonctions types de                        variables
       – Approche fonctionnelle données
                  code

       – Interface 36
    ImageBMP.h      en         MFC   2                 5                53         Saisie des images


   LectureLoop1.c       2268         48                5                260          Extraction des
         pp                                                                            primitives
    MainFrm.cpp         1120         25                5                96        Programme principal


   Normalisation1       564          13                4                 5         Normalisation par
        .h                                                                               DF
   Pretraitement1       137          1                 3                 8           Prétraitement
          .h
    RNT_Recogniti       1030         59                6                154       Fonctionnement du
    on_Words1.cp                                                                        RNT-DF
         p
   05/06/2009 13:18              Messaoudi Hafedh , Mohamed Hichem                               16
Systèmes de
                                                Aspect                    Aspect
Introduction          reconnaissance                                                Conclusion
                                            méthodologique              technique
                        de l’écriture
                               Problème de mémoire
                                            Solution
                                             Impact
                          Problème de Fuites de
                                mémoire
         Traitement de 32 000 images à la fois en un temps réduit à
         20h, comparé au fonctionnement en s’inspirant du Pattern
         Gestion centralisé de de matrices de initial du système qui ne
                     Utilisation
                                 la mémoire grandes taille
                      traitait«que 100 images à la»fois
                           du Garbage Collector
                            Certaines matrices vivent dans plusieurs
                                           fonctions
          Stockage des pointeurs sur matrices dans une liste afin de
          Faciliter la tâcheles libérer ultérieurementqui allait jusqu’à
                             d’évaluation du système
                      prendre des jourssont difficiles à gérer
                        Les pointeurs en C voire des semaines

                        Nécessité de gestion avancée de la désallocation
                                        de ces matrices

   05/06/2009 13:18                 Messaoudi Hafedh , Mohamed Hichem                    17
Systèmes de
                                              Aspect                    Aspect
Introduction          reconnaissance                                              Conclusion
                                          méthodologique              technique
                        de l’écriture
                                 Autres problèmes
                                   Stack Overflow
   • Observation
         – Généralement causé par les fonctions récursives
         – Certaines fonctions de l’application font appels à elles
           mêmes plus de 10000 fois
         – Impossible de traiter les images dont le nombre de pixels
           dépasse 30000 pixels.
   • Solution
         – Convertir les fonctions récursives en itératives
   • Impact
         – Traitement d’image allant jusqu’à (10 000 x 10 000) pixels
   05/06/2009 13:18               Messaoudi Hafedh , Mohamed Hichem                    18
Systèmes de
                                               Aspect                       Aspect
Introduction          reconnaissance                                                      Conclusion
                                           méthodologique                 technique
                        de l’écriture
                                 Autres problèmes
                                     Interfaces


                  MFC                                                     GTK
             Technologie obsolète                                     Simplicité et rapidité

       Utilisation exclusive de Visual
                    Studio                                               Open Source,
       Modèle événementiel complexe :                                   multiplateforme
      utilisation de boucle d’évènements
                   (messages)
                                                                 Modèle événementielle
         Présence obligatoire de la DLL
          MFC42.dll pour fonctionner                               Callback/listener


   05/06/2009 13:18               Messaoudi Hafedh , Mohamed Hichem                            19
Démonstration


05/06/2009 13:18      Messaoudi Hafedh , Mohamed Hichem   20
Systèmes de
                             Systèmes de                       Aspect
   Introduction                           Aspect           Aspect Aspect technique
Introduction reconnaissance de de l’écriture
                 reconnaissance                méthodologique         Conclusion
                 l’écriture        méthodologique        technique




   • Ce projet nous a permis de
         – Avoir une expérience dans le domaine du
           traitement d’image et de la reconnaissance de
           l’écriture manuscrite
         – Manipuler un système à réseaux de neurones
   • Ce présent projet a été présenté dans un
     workshop en Mars à Sousse dans le cadre des
     travaux de collaboration effectués entre l’ENIS
     l’ENIT et l’IFN allemande

   05/06/2009 13:18              Messaoudi Hafedh , Mohamed Hichem          21
Systèmes de
                             Systèmes de                       Aspect
   Introduction                           Aspect           Aspect Aspect technique
Introduction reconnaissance de de l’écriture
                 reconnaissance                méthodologique         Conclusion
                 l’écriture        méthodologique        technique


   • Perspectives
         – Améliorer les résultats d’extraction de
           caractéristiques
         – Ajouter des étapes de prétraitement (exemple:
           squelettisation)
         – Transformer l’application en P.O.O.
         – Avoir de bons résultats lors de la première
           participation arabe et tunisienne dans la
           compétition ICDAR dans le domaine de la
           reconnaissance de l’écriture arabe manuscrite

   05/06/2009 13:18              Messaoudi Hafedh , Mohamed Hichem          22
Merci pour votre
                 attention

05/06/2009 13:18   Messaoudi Hafedh , Mohamed Hichem   23

More Related Content

What's hot

Cours Internet - Messagerie électronique
Cours Internet - Messagerie électroniqueCours Internet - Messagerie électronique
Cours Internet - Messagerie électroniqueTunisie collège
 
Biométrie d'empreinte Mini Projet: Power Point
Biométrie d'empreinte Mini Projet: Power PointBiométrie d'empreinte Mini Projet: Power Point
Biométrie d'empreinte Mini Projet: Power PointIntissar Dguechi
 
Cours informatique chapitre 1 ordinateur et système d'exploitation 7ème
Cours informatique chapitre 1 ordinateur et système d'exploitation   7ème Cours informatique chapitre 1 ordinateur et système d'exploitation   7ème
Cours informatique chapitre 1 ordinateur et système d'exploitation 7ème Tunisie collège
 
Réseaux informatiques: Reseau Local LAN
Réseaux informatiques: Reseau Local  LANRéseaux informatiques: Reseau Local  LAN
Réseaux informatiques: Reseau Local LANTunisie collège
 
Architecture de l'ordinateur Et Systeme d'exploitation
Architecture de l'ordinateur Et Systeme d'exploitationArchitecture de l'ordinateur Et Systeme d'exploitation
Architecture de l'ordinateur Et Systeme d'exploitationTunisie collège
 
Les périphériques et les supports de stockage d'un PC
Les périphériques et les supports de stockage d'un PCLes périphériques et les supports de stockage d'un PC
Les périphériques et les supports de stockage d'un PCATPENSC-Group
 
Rapport se stage La banque populaire
Rapport se stage La banque populaireRapport se stage La banque populaire
Rapport se stage La banque populaireRapport de Stage
 
Diaporama GED-SAE
Diaporama GED-SAEDiaporama GED-SAE
Diaporama GED-SAEinforoutes
 
Cours système d’exploitation partie1
Cours système d’exploitation partie1Cours système d’exploitation partie1
Cours système d’exploitation partie1manou2008
 
Gestion du temps en 10 slides
Gestion du temps en 10 slidesGestion du temps en 10 slides
Gestion du temps en 10 slidesmcollin
 
Cours Info1- ST/SM/MI : introduction à l'informatique
Cours Info1- ST/SM/MI : introduction  à l'informatiqueCours Info1- ST/SM/MI : introduction  à l'informatique
Cours Info1- ST/SM/MI : introduction à l'informatiquelinuxscout
 
Introduction to Machine learning
Introduction to Machine learningIntroduction to Machine learning
Introduction to Machine learningQuentin Ambard
 
Diaporama_initiation_informatique_nimes.pdf
Diaporama_initiation_informatique_nimes.pdfDiaporama_initiation_informatique_nimes.pdf
Diaporama_initiation_informatique_nimes.pdfNawalElmez
 
Bpm business process management
Bpm  business process managementBpm  business process management
Bpm business process managementMouna Dhaouadi
 
Travaux dirigés 1: algorithme & structures de données (corrigés)
Travaux dirigés 1: algorithme & structures de données (corrigés)Travaux dirigés 1: algorithme & structures de données (corrigés)
Travaux dirigés 1: algorithme & structures de données (corrigés)Ines Ouaz
 
Essentiel sur le developpement personnel
Essentiel sur le developpement personnelEssentiel sur le developpement personnel
Essentiel sur le developpement personnelMohsin El Khamlichi
 

What's hot (20)

Cours Internet - Messagerie électronique
Cours Internet - Messagerie électroniqueCours Internet - Messagerie électronique
Cours Internet - Messagerie électronique
 
Biométrie d'empreinte Mini Projet: Power Point
Biométrie d'empreinte Mini Projet: Power PointBiométrie d'empreinte Mini Projet: Power Point
Biométrie d'empreinte Mini Projet: Power Point
 
Cadre de référence
Cadre de référenceCadre de référence
Cadre de référence
 
Cours informatique chapitre 1 ordinateur et système d'exploitation 7ème
Cours informatique chapitre 1 ordinateur et système d'exploitation   7ème Cours informatique chapitre 1 ordinateur et système d'exploitation   7ème
Cours informatique chapitre 1 ordinateur et système d'exploitation 7ème
 
Diaporama ged
Diaporama gedDiaporama ged
Diaporama ged
 
Réseaux informatiques: Reseau Local LAN
Réseaux informatiques: Reseau Local  LANRéseaux informatiques: Reseau Local  LAN
Réseaux informatiques: Reseau Local LAN
 
Architecture de l'ordinateur Et Systeme d'exploitation
Architecture de l'ordinateur Et Systeme d'exploitationArchitecture de l'ordinateur Et Systeme d'exploitation
Architecture de l'ordinateur Et Systeme d'exploitation
 
Gestion d'équipe
Gestion d'équipeGestion d'équipe
Gestion d'équipe
 
Les périphériques et les supports de stockage d'un PC
Les périphériques et les supports de stockage d'un PCLes périphériques et les supports de stockage d'un PC
Les périphériques et les supports de stockage d'un PC
 
Rapport se stage La banque populaire
Rapport se stage La banque populaireRapport se stage La banque populaire
Rapport se stage La banque populaire
 
Diaporama GED-SAE
Diaporama GED-SAEDiaporama GED-SAE
Diaporama GED-SAE
 
Cours système d’exploitation partie1
Cours système d’exploitation partie1Cours système d’exploitation partie1
Cours système d’exploitation partie1
 
Gestion du temps en 10 slides
Gestion du temps en 10 slidesGestion du temps en 10 slides
Gestion du temps en 10 slides
 
Amdec
Amdec Amdec
Amdec
 
Cours Info1- ST/SM/MI : introduction à l'informatique
Cours Info1- ST/SM/MI : introduction  à l'informatiqueCours Info1- ST/SM/MI : introduction  à l'informatique
Cours Info1- ST/SM/MI : introduction à l'informatique
 
Introduction to Machine learning
Introduction to Machine learningIntroduction to Machine learning
Introduction to Machine learning
 
Diaporama_initiation_informatique_nimes.pdf
Diaporama_initiation_informatique_nimes.pdfDiaporama_initiation_informatique_nimes.pdf
Diaporama_initiation_informatique_nimes.pdf
 
Bpm business process management
Bpm  business process managementBpm  business process management
Bpm business process management
 
Travaux dirigés 1: algorithme & structures de données (corrigés)
Travaux dirigés 1: algorithme & structures de données (corrigés)Travaux dirigés 1: algorithme & structures de données (corrigés)
Travaux dirigés 1: algorithme & structures de données (corrigés)
 
Essentiel sur le developpement personnel
Essentiel sur le developpement personnelEssentiel sur le developpement personnel
Essentiel sur le developpement personnel
 

Viewers also liked

Applications des réseaux bayésiens dynamique à la reconnaissance en ligne des...
Applications des réseaux bayésiens dynamique à la reconnaissance en ligne des...Applications des réseaux bayésiens dynamique à la reconnaissance en ligne des...
Applications des réseaux bayésiens dynamique à la reconnaissance en ligne des...Abdelhamid El hassani
 
Presentation bayesien
Presentation bayesienPresentation bayesien
Presentation bayesienJou Na
 
devoir traitement d'images
devoir traitement d'imagesdevoir traitement d'images
devoir traitement d'imagesomar bllaouhamou
 
Traitement d'image sous Matlab
Traitement d'image sous Matlab  Traitement d'image sous Matlab
Traitement d'image sous Matlab Hajer Dahech
 
TP1 Traitement d'images Génie Logiciel avec Matlab
TP1 Traitement d'images Génie Logiciel avec MatlabTP1 Traitement d'images Génie Logiciel avec Matlab
TP1 Traitement d'images Génie Logiciel avec MatlabMariem ZAOUALI
 
Présentation SBC Plus Pôle Formation
Présentation SBC Plus Pôle Formation Présentation SBC Plus Pôle Formation
Présentation SBC Plus Pôle Formation Sbc Sbc Plus
 
Port De La Ceinture
Port De La CeinturePort De La Ceinture
Port De La Ceintureguest2690286
 
Computación evolutiva no tradicional
Computación evolutiva no tradicionalComputación evolutiva no tradicional
Computación evolutiva no tradicionalJuan J. Merelo
 
Usodel Brasier
Usodel BrasierUsodel Brasier
Usodel BrasierSandraMeza
 
Primeras Jornadas de Profesores EOI
Primeras Jornadas de Profesores EOIPrimeras Jornadas de Profesores EOI
Primeras Jornadas de Profesores EOIgloria.bilbo
 
Bernard lewis hist moy ori
Bernard lewis hist moy oriBernard lewis hist moy ori
Bernard lewis hist moy oriMohamed Hamdaoui
 
Le superviseur et le y extrait 2014
Le superviseur et le y extrait 2014Le superviseur et le y extrait 2014
Le superviseur et le y extrait 2014Claude Munger
 

Viewers also liked (20)

Applications des réseaux bayésiens dynamique à la reconnaissance en ligne des...
Applications des réseaux bayésiens dynamique à la reconnaissance en ligne des...Applications des réseaux bayésiens dynamique à la reconnaissance en ligne des...
Applications des réseaux bayésiens dynamique à la reconnaissance en ligne des...
 
Presentation bayesien
Presentation bayesienPresentation bayesien
Presentation bayesien
 
Tp3 matlab
Tp3 matlabTp3 matlab
Tp3 matlab
 
Tp4 matlab
Tp4 matlabTp4 matlab
Tp4 matlab
 
devoir traitement d'images
devoir traitement d'imagesdevoir traitement d'images
devoir traitement d'images
 
Rapport pfe v1
Rapport pfe v1Rapport pfe v1
Rapport pfe v1
 
Traitement d'image sous Matlab
Traitement d'image sous Matlab  Traitement d'image sous Matlab
Traitement d'image sous Matlab
 
TP1 Traitement d'images Génie Logiciel avec Matlab
TP1 Traitement d'images Génie Logiciel avec MatlabTP1 Traitement d'images Génie Logiciel avec Matlab
TP1 Traitement d'images Génie Logiciel avec Matlab
 
Présentation SBC Plus Pôle Formation
Présentation SBC Plus Pôle Formation Présentation SBC Plus Pôle Formation
Présentation SBC Plus Pôle Formation
 
Port De La Ceinture
Port De La CeinturePort De La Ceinture
Port De La Ceinture
 
Conseils police1
Conseils police1Conseils police1
Conseils police1
 
Wiki Ruche Rennes
Wiki Ruche RennesWiki Ruche Rennes
Wiki Ruche Rennes
 
Una de puentes...
Una de puentes...Una de puentes...
Una de puentes...
 
Computación evolutiva no tradicional
Computación evolutiva no tradicionalComputación evolutiva no tradicional
Computación evolutiva no tradicional
 
Riesgos laborales
Riesgos laboralesRiesgos laborales
Riesgos laborales
 
Usodel Brasier
Usodel BrasierUsodel Brasier
Usodel Brasier
 
Primeras Jornadas de Profesores EOI
Primeras Jornadas de Profesores EOIPrimeras Jornadas de Profesores EOI
Primeras Jornadas de Profesores EOI
 
Bernard lewis hist moy ori
Bernard lewis hist moy oriBernard lewis hist moy ori
Bernard lewis hist moy ori
 
1. manejo del word
1. manejo del word1. manejo del word
1. manejo del word
 
Le superviseur et le y extrait 2014
Le superviseur et le y extrait 2014Le superviseur et le y extrait 2014
Le superviseur et le y extrait 2014
 

AméLioration Du SystèMe De Reconnaissance De L’éCriture Arabe

  • 1. 04/06/2009 Amélioration du système de reconnaissance de l’écriture arabe manuscrite, basé sur le réseau RNT-DF Présenté par: Messaoudi Hafedh Encadré par: M. Maddouri Mondher Mohamed Hichem Mme. Maddouri Samia
  • 2. 1. Introduction 2. Systèmes de reconnaissance de l’écriture manuscrite • Types de reconnaissance de l’écriture manuscrite • Etapes de reconnaissance de l’écriture manuscrite • Caractérisation de l’écriture arabe • Système RNT-DF 3. Aspect méthodologique • Détection des points diacritiques • Estimation du nombre des PAWs • Détection des hampes 4. Aspect technique • Problèmes de mémoires • Interface 5. Conclusion et perspectives 05/06/2009 13:18 Messaoudi Hafedh , Mohamed Hichem 2
  • 3. Systèmes de Systèmes de Aspect Introduction Aspect Aspect Aspect technique Introduction reconnaissance de de l’écriture reconnaissance méthodologique Conclusion l’écriture méthodologique technique • Contexte – Reconnaissance de l’écriture arabe manuscrite • Discipline récente, apparue au début des années 80 • Domaine de recherche très disputé • But – Amélioration du système de reconnaissance de l’écriture arabe manuscrite basé sur le réseau de neurones transparents RNT-DF • Améliorations méthodologique • Amélioration technique 05/06/2009 13:18 Messaoudi Hafedh , Mohamed Hichem 3
  • 4. Systèmes de Aspect Aspect Introduction reconnaissance de Conclusion l’écriture méthodologique technique Types de reconnaissance de l’écriture manuscrite • Deux types de reconnaissance – Reconnaissance en ligne: • Reconnaissance en temps réel du texte à partir de la trajectoire du stylo • Données sous forme de signal – Reconnaissance hors ligne: • Reconnaissance statique d’images • Absence d’informations temporelles Reconnaissance hors ligne est plus difficile (moins d’informations) 05/06/2009 13:18 Messaoudi Hafedh , Mohamed Hichem 4
  • 5. Systèmes de Aspect Aspect Introduction reconnaissance de Conclusion l’écriture méthodologique technique Etapes de reconnaissance Prétraitement • Dilatation Extraction des Reconnaissance • Normalisation caractéristiques •… 05/06/2009 13:18 Messaoudi Hafedh , Mohamed Hichem 5
  • 6. Systèmes de Aspect Aspect Introduction reconnaissance de Conclusion l’écriture méthodologique technique Caractérisation de l’écriture arabe Primitives Description H Hampe J Jambage B Boucle P Point diacritique au-dessus du corps du mot Q point diacritiQue au- dessous du corps du mot Rien des primitives ci- R dessus D, M, F, I Position des primitives dans le mot (D : Début, M : Milieu, F : Fin, I : Isolé) PAW 05/06/2009 13:18 Piece of Arabic WordHafedh , Mohamed Hichem Messaoudi 6
  • 7. Systèmes de Aspect Aspect Introduction reconnaissance de Conclusion l’écriture méthodologique technique Système RNT-DF: Architecture • Réseau de Neurones Transparent – Descripteurs de Fourier : Propagation : Retropropagation reconnaître Couche Couche Couche Couche reconnu Mot à Mot des des lettres des PAWs des mots primitives H J B P … … … 05/06/2009 13:18 Messaoudi Hafedh , Mohamed Hichem 7
  • 8. Systèmes de Aspect Aspect Introduction reconnaissance Conclusion méthodologique technique de l’écriture Détection des points diacritiques • Méthode existante: – Toute boucle détectée au dessus de la ligne supérieure ou au dessous de la ligne inférieure est un point diacritique 05/06/2009 13:18 Messaoudi Hafedh , Mohamed Hichem 8
  • 9. Systèmes de Aspect Aspect Introduction reconnaissance Conclusion méthodologique technique de l’écriture Détection des points diacritiques Observation Boucle au dessus de la ligne Boucle au dessus de la ligne supérieure supérieure Ligne supérieure Ligne de base Ligne inférieure Mauvaise détection Bonne détection Point diacritique entre ligne Non détection inférieure et supérieure 05/06/2009 13:18 Messaoudi Hafedh , Mohamed Hichem 9
  • 10. Systèmes de Aspect Aspect Introduction reconnaissance Conclusion méthodologique technique de l’écriture Détection des points diacritiques Observation Boucle au dessus de la ligne supérieure Mauvaise détection Bonne détection 05/06/2009 13:18 Messaoudi Hafedh , Mohamed Hichem 10
  • 11. Systèmes de Aspect Aspect Introduction reconnaissance Conclusion méthodologique technique de l’écriture Détection des points diacritiques Traitement Proportionnalité de Nombre de points la forme Remplissage interne de contour Si (largeur > hauteur) rapport = largeur / hauteur Sinon rapport = hauteur / largeur Nombre Point de contours < Seuil La boucle est considérée proportionnelle si rapport < seuil 05/06/2009 13:18 Messaoudi Hafedh , Mohamed Hichem 11
  • 12. Systèmes de Aspect Aspect Introduction reconnaissance Conclusion méthodologique technique de l’écriture Estimation du nombre des PAWs Observation Nombre PAWS correct = 5 Nombre de PAWs détectés = 6 Nombre PAWS correct = 8 Nombre de PAWs détectés = 10 05/06/2009 13:18 Messaoudi Hafedh , Mohamed Hichem 12
  • 13. Systèmes de Aspect Aspect Introduction reconnaissance Conclusion méthodologique technique de l’écriture Estimation du nombre des PAWs Traitement Un PAW est éliminé si: Sa largeur est Son plus haut point est Son plus bas point est au supérieure à sa ET au dessous de la ligne OU dessus de la ligne hauteur inférieure - une marge supérieure + une marge 05/06/2009 13:18 Messaoudi Hafedh , Mohamed Hichem 13
  • 14. Systèmes de Aspect Aspect Introduction reconnaissance Conclusion méthodologique technique de l’écriture Détection des hampes Observation et traitement Détection des hampes à partir de maximums locaux 05/06/2009 13:18 Messaoudi Hafedh , Mohamed Hichem 14
  • 15. Systèmes de Aspect Aspect Introduction reconnaissance Conclusion méthodologique technique de l’écriture Impact sur le taux de reconnaissance Ancien taux: 13% Mot reconnu Nouveau Taux: 18% Le pourcentage des taux est par rapport à 6500 images traitées 05/06/2009 13:18 Messaoudi Hafedh , Mohamed Hichem 15
  • 16. Systèmes de Systèmes de Aspect Introduction Aspect Aspect Aspect technique Introduction reconnaissance de de l’écriture reconnaissance méthodologique Conclusion l’écriture méthodologique technique Description des modules d’IKRAA Présentation technique – Langage de Nom du fichier Nombre programmation : C++ Nombre de Nombre de Nombre de Rôle lignes de fonctions types de variables – Approche fonctionnelle données code – Interface 36 ImageBMP.h en MFC 2 5 53 Saisie des images LectureLoop1.c 2268 48 5 260 Extraction des pp primitives MainFrm.cpp 1120 25 5 96 Programme principal Normalisation1 564 13 4 5 Normalisation par .h DF Pretraitement1 137 1 3 8 Prétraitement .h RNT_Recogniti 1030 59 6 154 Fonctionnement du on_Words1.cp RNT-DF p 05/06/2009 13:18 Messaoudi Hafedh , Mohamed Hichem 16
  • 17. Systèmes de Aspect Aspect Introduction reconnaissance Conclusion méthodologique technique de l’écriture Problème de mémoire Solution Impact Problème de Fuites de mémoire Traitement de 32 000 images à la fois en un temps réduit à 20h, comparé au fonctionnement en s’inspirant du Pattern Gestion centralisé de de matrices de initial du système qui ne Utilisation la mémoire grandes taille traitait«que 100 images à la»fois du Garbage Collector Certaines matrices vivent dans plusieurs fonctions Stockage des pointeurs sur matrices dans une liste afin de Faciliter la tâcheles libérer ultérieurementqui allait jusqu’à d’évaluation du système prendre des jourssont difficiles à gérer Les pointeurs en C voire des semaines Nécessité de gestion avancée de la désallocation de ces matrices 05/06/2009 13:18 Messaoudi Hafedh , Mohamed Hichem 17
  • 18. Systèmes de Aspect Aspect Introduction reconnaissance Conclusion méthodologique technique de l’écriture Autres problèmes Stack Overflow • Observation – Généralement causé par les fonctions récursives – Certaines fonctions de l’application font appels à elles mêmes plus de 10000 fois – Impossible de traiter les images dont le nombre de pixels dépasse 30000 pixels. • Solution – Convertir les fonctions récursives en itératives • Impact – Traitement d’image allant jusqu’à (10 000 x 10 000) pixels 05/06/2009 13:18 Messaoudi Hafedh , Mohamed Hichem 18
  • 19. Systèmes de Aspect Aspect Introduction reconnaissance Conclusion méthodologique technique de l’écriture Autres problèmes Interfaces MFC GTK Technologie obsolète Simplicité et rapidité Utilisation exclusive de Visual Studio Open Source, Modèle événementiel complexe : multiplateforme utilisation de boucle d’évènements (messages) Modèle événementielle Présence obligatoire de la DLL MFC42.dll pour fonctionner Callback/listener 05/06/2009 13:18 Messaoudi Hafedh , Mohamed Hichem 19
  • 20. Démonstration 05/06/2009 13:18 Messaoudi Hafedh , Mohamed Hichem 20
  • 21. Systèmes de Systèmes de Aspect Introduction Aspect Aspect Aspect technique Introduction reconnaissance de de l’écriture reconnaissance méthodologique Conclusion l’écriture méthodologique technique • Ce projet nous a permis de – Avoir une expérience dans le domaine du traitement d’image et de la reconnaissance de l’écriture manuscrite – Manipuler un système à réseaux de neurones • Ce présent projet a été présenté dans un workshop en Mars à Sousse dans le cadre des travaux de collaboration effectués entre l’ENIS l’ENIT et l’IFN allemande 05/06/2009 13:18 Messaoudi Hafedh , Mohamed Hichem 21
  • 22. Systèmes de Systèmes de Aspect Introduction Aspect Aspect Aspect technique Introduction reconnaissance de de l’écriture reconnaissance méthodologique Conclusion l’écriture méthodologique technique • Perspectives – Améliorer les résultats d’extraction de caractéristiques – Ajouter des étapes de prétraitement (exemple: squelettisation) – Transformer l’application en P.O.O. – Avoir de bons résultats lors de la première participation arabe et tunisienne dans la compétition ICDAR dans le domaine de la reconnaissance de l’écriture arabe manuscrite 05/06/2009 13:18 Messaoudi Hafedh , Mohamed Hichem 22
  • 23. Merci pour votre attention 05/06/2009 13:18 Messaoudi Hafedh , Mohamed Hichem 23