K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureMinistère de l’Enseignement Supérieur et de la R...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureSommaire                          Liste des tabl...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureVII                       Validation            ...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureListe des tableauxI.1.Liste des défauts et prétr...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureListe des figuresI.1.Exemples d’images de docume...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureVI.1.Phase de calcul des degrés d’appartenance e...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureIntroduction Générale       Traditionnellement, ...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture        Les méthodes descendantes sont basées es...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureProblématique / Contexte       La segmentation d...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureI. Au cœur des documents anciensI.1. Introductio...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texturepliures du papier, et d’autre part à leur conten...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture     Figure I.1. Exemples d’images de documents ...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureEtant réguliers et ayant une texture de caractèr...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture                        Méthodes de Segmentation...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureII. Analyse texturale des documentsII.1. Introdu...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture        donc intervenir la notion de voisinage. ...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture               Variabilité de la disposition de ...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureDans la plupart des cas, la notion de texture es...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureII.7. Segmentation d’image de documents anciens ...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureNotre travail représente une première tentative ...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture    Une fonction de Gabor 2D « h » est une onde ...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture                                                ...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureImpossible d’afficher l’image.                  ...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureDune manière pratique plus détaillée, un filtre ...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Textureefficace.       Le principe des filtres de Gabor...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Textureb) La répartition fréquentiellePour les valeurs ...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TexturePremier résultat important : Les valeurs de σx e...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture                                                ...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture         L’utilisation de filtres à des orientat...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureDiscussionLe filtre de Gabor permet de détecter ...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureEn appliquant un simple seuillage pour délimiter...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture            0°                                  ...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Textureb) Filtrage dans le domaine fréquentielUn diagra...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture                                                ...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureTableau récapitulatif des paramètres du filtre d...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureIV. Implantation        Suite aux résultats enco...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture        Avant de définir un système de Banc de F...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureEt après seuillage, on a obtenu les résultats su...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture                  f(Hz)      1√2                ...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureIV.1. Analyse des résultats de filtrage       Se...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureLe seuillage de l’histogramme des niveaux de gri...
K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture              A partir de ces résultats prélimin...
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Segmentation d images de documents anciens par approche texture - Mo…
Upcoming SlideShare
Loading in...5
×

Segmentation d images de documents anciens par approche texture - Mo…

2,890

Published on

Ce travail présente une méthode de segmentation floue des images de documents anciens. Cette méthode permet la séparation des zones de texte et de dessins d’images de documents imprimés datant de la Renaissance. L’approche proposée consiste à définir des bancs de filtres de Gabor capables de localiser les zones de textes et de dessin séparément à l’aide d’un processus de classification floue des résultats de filtrage. Une simple fusion des résultats des bancs de filtres fournit une version segmentée de l’image de document ancien en question.

Published in: Design
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
2,890
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
1,578
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Transcript of "Segmentation d images de documents anciens par approche texture - Mo…"

  1. 1. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureMinistère de l’Enseignement Supérieur et de la Recherche Scientifique Université de La Rochelle Département d’Informatique LABORATOIRE L3I – INFORMATIQUE IMAGE INTERACTION Mémoire de fin d’Etudes En vue de l’obtention du Diplôme de Master 2 – Recherche Spécialité : Informatique & Mathématiques et leurs Applications à l’Economie (IMAE) Option : « Image & Calculs » IntituléSegmentation d’Images de Documents Anciens par Approche Texture - APPLICATION du filtre de Gabor - Réalisation de : Kamel MOUATS Sous la direction de : Prof. Rémy MULLOT / Nicholas JOURNET Juillet 2006Laboratoire L3i – Université de La Rochelle Page 1
  2. 2. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureSommaire Liste des tableaux Liste des figures Introduction Générale 7 Problématique / Contexte 9 I Au cœur des documents anciens 10 I.1. Introduction 10 I.2. Traitement des images et documents anciens 10 I.2.1. Binarisatioon 11 I.2.2. Segmentation Texte/Graphique 12 II Analyse Texturale des Documents 15 II.1. Introduction 15 II.2. Définition de la texture 15 II.3. Application de la texture à la segmentation 15 II.4. Méthodes d’analyse de texture 16 II.5. Utilisation de la texture sur les images de documents anciens 17 II.6. Segmentation des images de documents anciens 17 II.7. Segmentation d’images de documents par analyse des 18 projections horizontales / verticalesIII Théorie du Filtre de Gabor 20 III.1. Paramétrisation / Calcul efficace des paramètres de Gabor 24 III.2. Les fréquences du filtre de Gabor 25 III.3. Les orientations du filtre de Gabor 26 III.4. Séparabilité des filtres de Gabor 27 III.5. Exploitation de la symétrie du filtre 27 III.6. Implémentation du filtrage 28 IV Implantation 34 IV.1. Analyse des résultats de filtrage 38 IV.1.a. Influence de l’orientation sur le résultat de filtrage 38 IV.1.b. Influence de la fréquence sur le résultat de filtrage 38 IV.1.c. Importance entre l’orientation et la fréquence 38 IV.2. Discussion 41 IV.3. Définition du banc de filtres pour le filtrage des images de 41 documents anciens IV.4. Réalisation 42 V Classification floue d’image 44 V.1. Introduction 44 V.2. Degré d’appartenance 44 V.3. L’algorithme des C-Moyennes Floues (CMF) 45 VI Classification des résultats de filtrage dans chaque Sous – 47 Banc de Filtres VI.1. Matrice de confiance associée à la classification floue 50 VI.2. Analyse du seuillage 50 VI.3. Comment fusionner les données 52Laboratoire L3i – Université de La Rochelle Page 2
  3. 3. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureVII Validation 53 Discussion 60VIII Conclusion / Perspectives 63 Références Bibliographiques 59 AnnexeLaboratoire L3i – Université de La Rochelle Page 3
  4. 4. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureListe des tableauxI.1.Liste des défauts et prétraitements appropriés des images de documents …………….5 anciens d’après L. Likfoman-SuelemIII Paramètres du filtre de Gabor…………………………………………………………27IV.1.Résultat du seuillage des résultats de filtrage par le filtre de Gabor pour ………….30 différentes valeurs de fréquence et d’orientation (exemple 1)IV.2.Résultat du seuillage des résultats de filtrage par le filtre de Gabor pour ………….31 différentes valeurs de fréquence et d’orientation (exemple 2)Laboratoire L3i – Université de La Rochelle Page 4
  5. 5. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureListe des figuresI.1.Exemples d’images de documents anciens et leurs images binaires…………………….6I.2.Familles des méthodes de segmentation Texte/Dessin des images de documents………8II.1.Verrous empêchant l’application de la méthode des projections pour ………………...12 l’analyse d’images de documentsII.2.Résultats de projection horizontale d’une image de document…………………………13II.3.Les différentes zones d’un document peuvent être simulées à un ……………………...13 agencement de textures.III.1. La fonction de Gabor dans le domaine fréquentiel……………………………………15III.2.La fonction de Gabor dans le domaine spatial…………………………………………15III.3.Ensemble de filtres de Gabor dans le domaine fréquentiel…………………………….15III.4. a)Filtres de Gabor dans une fenêtre 30x30, représentés dans le domaine ………………15 fréquentiel f=1/8 et θ=0° ; b)Filtres de Gabor dans une fenêtre 30x30, représentés dans le domaine ………………15 fréquentiel f=1/8 et θ=45°.III.5.Partie réelle des 4x4 fonction de Gabor dans le domaine spatial………………………16III.6.Couverture du domaine de Fourier par les canaux fréquentiels des ………………….. 16 fonctions de Gabor.III.7.Exemples de banc de filtres dans le domaine fréquentiel……………………………….21III.8.a) Résultat de filtrage dans le domaine spatial sur une image de synthèse…..…………22III.8.b) Résultat de filtrage dans le domaine spatial sur une image de synthèse…..…………23 avec du texte à différentes tailles de policeIII.8.c) Résultat de filtrage dans le domaine appliqué sur une image de document …………24 ancienIII.9.a) Filtrage dans le domaine fréquentiel appliqué sur une image de synthèse ..…………25III.9.b) Filtrage dans le domaine fréquentiel appliqué sur une image de document..……. ….26 ancienIV.1.Schéma du processus de segmentation d’image utilisant un banc de …………………..37 filtres de Gabor.Laboratoire L3i – Université de La Rochelle Page 5
  6. 6. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureVI.1.Phase de calcul des degrés d’appartenance et affectation des pixels ………….……. ....41 aux classes correspondantes dans chaque sous – banc de filtresVI.2.Processus d’assignation des vecteurs caractéristiques dans …………………..………...43 une classification floueVI.3.Processus de fusion des résultats de classification floue des............................................46 deux sous banc de filtresVI.4.L’analyse multirésolution pour la détection des éléments …………………….………..54 d’une image de documentLaboratoire L3i – Université de La Rochelle Page 6
  7. 7. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureIntroduction Générale Traditionnellement, le papier était la source principale pour la publication de journaux,rapports, livres etc. Cependant, la disponibilité et léconomie des ordinateurs puissantsfournissent de nouveaux supports et moyens pour le stockage, la récupération et la recherchede documents électroniques stockés. Un article situé à un endroit, peut être extrait dun autrecoin de ce monde en quelques secondes. De plus, si le texte des documents est rangé dunemanière adéquate, il sera possible de balayer le contenu de différents documents en quelquessecondes. Cependant, il nest pas évident de donner une version numérique dun documentautomatiquement. L’approche ‘Straight –forward’ (Expédition Directe), consiste à numériser l’ensembledu document et le stocker sous une représentation bitmap; cependant, cette approchenécessite une capacité de stockage importante (même en utilisant les techniques decompression d’images les plus récentes) et ne permet pas de retrouver du texte dans cesdocuments. Une méthode de représentation plus efficace des documents est de séparer le texte dugraphique, et sauvegarder le texte en texte ASCII et les images en bitmaps. De ce fait,plusieurs approches pour la segmentation texte/images ont été développées et proposées. Lanalyse de document, précisément lanalyse de limage de document, est leprocessus qui fournit une interprétation globale des images de documents. Ce processus est laréponse à la question : « Comment est combiné lensemble du langage, le formatage dudocument, le traitement dimage et la reconnaissance de caractères afin de se donner à uneapplication particulière ? ». De ce fait, lanalyse de document est concernée par les issues globales impliquées dansla reconnaissance de lécriture sur les images. Elle rajoute aux OCRs une super-structure quipermet lorganisation du document et se base sur des connaissances, ou non, pour soninterprétation. Le processus de la détermination de la structure du document peut être vu comme unprocessus guidé par un modèle, explicite ou implicite, de la classe des documents en cours. Lemodèle décrit lapparence physique et les relations qui existent entre les entités composant ledocument. Généralement un OCR est à létage finale de ce processus, cest à dire, il fournit uncodage final des symboles contenus dans des entités logiques telles que des paragraphes outables,...une fois ces derniers sont définis et isolés par une autre phase du processus.Cependant, il est important de voir quun OCR peut participer à la détermination de ladisposition du document (Layout). Par exemple, comme une partie du processus dextractiondarticles de journaux, le système peut être ramené à reconnaître des chaînes de caractères, dessignatures ou annotations en bas de limage de la page, dans le but de localiser le texte intégral(intégration de la sémantiques aux composants extraits). En pratique, un système danalyse de documents (images de documents) réalise lestâches de base dune segmentation dimage, compréhension de la disposition textuelle, lareconnaissance symbolique et lapplication de règles contextuelles dune manière intégrante. Les méthodes de segmentation ‘Texte/Dessin’ les plus connues peuvent être classéessoit en approches ascendantes (Top Down), ou en approches descendantes (Bottom Up).Laboratoire L3i – Université de La Rochelle Page 7
  8. 8. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture Les méthodes descendantes sont basées essentiellement sur la technique « Run LengthSmoothing : Lissage direct en longueur » (connue aussi sous le nom de : Constrained runlength method) et la méthode des Projetions de Profiles. Le principal inconvénient desméthodes descendantes est leur restriction sur des blocs rectangulaires donc elles ne sont pasadéquates pour des documents contenant du texte ayant une mise en forme non régulière(aléatoires / inclinaisons). Les méthodes ascendantes sont des variantes typiques de la méthode des ComposantesConnexes. Les inconvénients de cette dernière se résument dans le fait qu’elle est dépendantede la taille des caractères, elle est sensible à l’interligne et les espaces inter-caractères ainsiqu’à sa sensibilité à la résolution. Cependant, elles ne sont pas restreintes aux blocsrectangulaires comme les approches descendantes. Une nouvelle méthode, différente des approches précédentes et palliant à leurslimitations, n’ayant aucun besoin de connaissances à priori sur le document à traiter, a étéprésentée par Jain et Bhattacharjee [3]. L’idée de base de cette approche est que les zones detexte d’une image de document peuvent être considérées approximativement comme unetexture uniforme et les images forment une autre texture. Le document peut être alorssegmenté par un schéma de Segmentation de Texture. La segmentation de texture reste toujours un sujet de base et important en traitementdimages. Elle consiste à segmenter une image texturée en plusieurs régions ayant les mêmescaractéristiques de texture; elle est bien et belle appliquée à lanalyse des images aériennes,images biomédicales et des images sismiques, et récemment sur les images de documentsmais nécessitant une bonne définition et paramétrisation. Tous comme les autres problèmes de segmentation, la segmentation de texturenécessite lidentification des caractéristiques spécifiques propres à la texture avec un bonpouvoir discriminant. Généralement, les méthodes dextraction des caractéristiques peuventêtre classées en trois catégories de base : Statistique, Structurale et Spectrale. Dans les approches statistiques, les statistiques des textures à base des moments delhistogramme des niveaux de gris ou à base de la matrice de co-occurrence, sont calculéespour la discrimination entre les différentes textures. Pour les approches structurelles, uneprimitive de texture, qui est lélément de base de texture, est utilisée pour former un modèle detexture plus complexe à laide de règles grammaticales qui spécifient et guident la générationdu modèle de texture en cours. Et enfin, les approches spectrales, limage texturée esttransformée en domaine fréquentiel. Ensuite, lextraction des caractéristiques de texture peutêtre réalisée en analysant le pouvoir spectral. Le schéma de segmentation de texture utilisé par Jain et Bhattacharjee [3] estprincipalement le même que celui proposé par Jain et Farrokhnia ; une approche multicanauxutilisant un banc de filtres de Gabor pré-sélectionnés en fréquences et orientations pour filtrerune image dentrée. Les caractéristiques extraites à partir des réponses des images filtrées, eten se servant dune fonction dénergie locale et un découpage (Clustering) par un classifieurnon-supervisé, sont utilisées pour la segmentation et la classification de texture. Le filtre deGabor est le filtre le plus utilisé, par excellence, pour la segmentation de texture vu sonpouvoir discriminant paramétrable, cependant, l’inconvénient majeur de l’approchegaborienne est sa complexité de calcul [2].Laboratoire L3i – Université de La Rochelle Page 8
  9. 9. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureProblématique / Contexte La segmentation d’images de documents anciens en vue de les indexer est un sujet derecherche. Les documents anciens possèdent de nombreuses particularités qui ne permettent pasd’appliquer les techniques classiques d’analyse de documents composites et d’OCR (OpticalCharacter Recognition) sur ces ouvrages. Ils sont dégradés, reposent sur les anciennestechniques d’imprimerie et respectent donc des règles particulières de typographie et de miseen forme [32]. Les différents problèmes posés par l’analyse des documents anciens en vue de leurindexation sont assez proches de ceux que l’on trouve en analyse et interprétation d’images.La chaîne de traitement comporte généralement un ensemble d’étapes visant à construire desinformations structurées à partir des informations numériques élémentaires (pixels de limage)et d’informations contextuelles liées à la nature du document analysé. Les objectifs sont donc:1) De séparer les différents composants situés sur les pages des ouvrages (texte, illustration,lettrine,…)2) Lobjectif très ambitieux de recomposer le document, de comprendre son organisation etmême dinterpréter son contenu. Lobjet de cette étude consiste principalement à réaliser une étape primordiale danslanalyse de la structure physique des images de documents anciens à savoir leursegmentation afin dextraire les zones informatives (texte, Dessin, fond).3) D’identifier les différents styles d’écriture (gras, italique, taille, manuscrit/imprimé…) poursimplifier la tâche des systèmes d’OCR en créant des bases de modèles pour chacune desfamilles détectées. On peut alors parler de reconnaissance adaptative. Dans le présent travail, nous allons adopter l’outil Gabor pour définir un système desegmentation d’images de documents anciens, qui soit alors une première tentative et unpremier pas dans la littérature des méthodes de segmentation d’images de documents anciens. Ce mémoire se présentera comme suit : En premier lieu, nous présenterons les propriétés des documents anciens, les méthodesd’analyses qui existent dans la littérature et particulièrement l’analyse documentaire parapproche texture, ensuite nous donnerons une partie théorique complète du filtre de Gabor etde son utilisation, pour finir cette partie par un descriptif de la méthode de classification non-supervisée floue utilisée. Ensuite, nous décrivons au détail près la conception et le fonctionnement de notre systèmede segmentation d’images de documents anciens proposé que nous l’avons testé sur notre basedocumentaire (contemporains et anciens), vous trouverez ainsi des résultats de nos tests. Et enfin, nous clorons par une évaluation de notre système, et des résultats decomparaison avec un outil de classification supervisée existant, des résultats seront présentéset commentés ainsi que des perspectives et ouvertures de notre conception.Laboratoire L3i – Université de La Rochelle Page 9
  10. 10. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureI. Au cœur des documents anciensI.1. Introduction Les documents anciens sont des documents d’archives rédigés à une autre époque etobéissant donc à des règles typographiques et de composition différentes de celles appliquéessur les documents modernes. En effet, l’image d’un document ancien numérisée est souvent très tonale, à niveauxde gris ou en couleur. Elle peut comprendre des annotations dans les marges, des illustrations,des lettrines, voire même des écritures manuscrites [28]. Ces documents se caractérisent par des présentations et des écritures très variées,variations dues à la multiplicité des styles et des techniques d’impression qui ont évolué aucours du temps. L’usure du temps a de plus produit des altérations au document original etl’image numérisée qui en découle contient alors des imperfections (taches, écrituresfragmentées) qui n’existent pas dans les documents plus modernes. Les documents anciensimprimés, bien que présentant moins de variabilité, partagent un grand nombre descaractéristiques des documents manuscrits [27]. Les techniques de traitement (ou analyse) des images de documents anciens, se situentà différents niveaux : prétraitements, analyse et reconnaissance. Ces niveaux de traitementsutilisent ou produisent des structures de données à des niveaux de granularité de plus en plusélevés : de l’image jusqu’à son interprétation. Si l’objectif ultime est celui de lareconnaissance de tous les composants du document (graphiques et textuels), d’autresobjectifs concernent la visualisation de l’image pour en améliorer le déchiffrement, larecherche de structures intermédiaires : blocs, lignes ou mots, et la séparation des couchesgraphiques et symboliques. L’automatisation de la recherche des lignes de texte estnotamment une aide certaine à la création de liens texte/image dans les images de documentsanciens [27].I.2. Traitement des images et documents anciens La numérisation des documents anciens est un enjeu important pour les servicesd’archives, les bibliothèques, les historiens et les chercheurs en sciences littéraires pour lespossibilités de manipulation, de visualisation et de recherche d’information qui en découlent.La numérisation physique : scannérisation (ou digitalisation), consiste à créer une image dudocument (un tableau de pixels), à l’aide d’une caméra numérique ou d’un scanneur. Unehaute résolution est souvent nécessaire (de300à 600dpi2) pour restituer les éléments les plusfins de l’écriture et des graphismes. L’image obtenue est en couleur, en niveaux de gris oubitonale suivant les possibilités du capteur et les choix de numérisation. La question du formatde sauvegarde (ou stockage), dépend de l’application visée et de la taille du support deconservation.Quels sont les apports du traitement des images à la numérisation des documents anciens ?Ils permettent de rechercher des informations directement dans les images, d’en dégager lastructure, d’en améliorer la qualité visuelle, et cela dans un mode automatique ou semi-automatique.Prétraitement Les documents anciens posent en préambule un problème d’acquisition certain dûd’une part à leur positionnement sur le scanner, créant des inclinaisons, des bombages et desLaboratoire L3i – Université de La Rochelle Page 10
  11. 11. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texturepliures du papier, et d’autre part à leur contenu hétérogène (texte imprimé, manuscrit…). Leprocessus de vieillissement fait apparaître des taches d’humidité, la transparence de l’encresur les rectos, la fragmentation des contours fins, etc. Voici une liste de traitements usuels enfonction des types de problèmes rencontrés (voir tableau 1). Défaut PrétraitementFaible ou forte luminosité Modification d’histogramme*/Présence de taches */Filtrage passe haut **/Filtrage passe-bas**/Points parasites **/Filtrages morphologiques Calcul de l’angle par projectionRotation légère de l’image Redressement par re-échantillonnage*/Courbure de l’écriture sur un bord de */Calcul de la courbure localel’image */Re-échantillonnage **/Filtrages (passe haut, passe-bas,**/Ecriture fragmentée morphologiques)Contours de l’écriture flous Filtrage passe haut, filtrage morphologiqueEcriture du verseau apparaissant sur le recto Combinaison des images recto et versoTableauI.1. Liste des défauts et prétraitements appropriés, d’après L.Likfoman-Suelem[27].I.2.1. Binarisation L’opération de binarisation est parfois primordiale pour séparer le fond du texte sil’image originale est en niveau de gris ou en couleur. Elle consiste à produire une image àdeux tons : clair pour le fond, et noir pour le texte. Il est nécessaire de conserver à la fois tousles caractères et toutes les gravures sans toutefois récupérer trop de bruit [29]. Il existeplusieurs algorithmes de binarisation (seuillage adaptatif, multi-résolution, morphologique,classification des pixels,…). Ils apportent tous des avantages et des inconvénients en terme devitesse de calcul, de qualité de conservation des traits des caractères et de traits de gravures.La plupart des méthodes conservent efficacement les caractères mais peuvent abîmer lesgravures ou inversement. Ces méthodes restent tributaires d’un ou de plusieurs seuils àdéterminer. Dans le cas des documents anciens, en général très hétérogènes, ces seuils restenttrès difficiles à déterminer sans l’aide d’un expert.Laboratoire L3i – Université de La Rochelle Page 11
  12. 12. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture Figure I.1. Exemples d’images de documents anciens et leurs images binairesI.2.2. Segmentation Texte/Graphique Une fois l’image binarisée, et le texte séparé du fond, il faut procéder à l’extraction desmédias pour des traitements appropriés. Contrairement aux techniques de prétraitementprécédentes, celles-ci se placent aux niveaux des entités et non au niveau des pixels. Il s’agitdans le cas des images de documents de regrouper d’abord les formes en entités similaires,puis de procéder ensuite à leur classification en texte ou en graphique. Les élémentsgraphiques peuvent être suivant le document, des lettrines, des illustrations, mais aussi desparaphes, des ratures, des signes de renvoi, des grands traits, etc.Laboratoire L3i – Université de La Rochelle Page 12
  13. 13. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureEtant réguliers et ayant une texture de caractères très homogène, le texte offre une norme pourla classification. On utilise en général la largeur, la régularité et l’abondance des composantesconnexes pour la classification. Ainsi, dans un texte, les composantes connexes sont peularges, très régulières et très abondantes. Dans un graphique, les composantes connexes sonttrès larges, pas régulières et peuvent être abondantes [28]. Il existe deux approches générales de segmentation :°/La première suppose que les blocs sont homogènes (un seul média). Dans ce cas, chaquebloc est classé dans le média le plus proche en fonction des caractéristiques textuellesextraites de l’image du bloc.°/ Dans la seconde approche, on suppose qu’un bloc contient un mélange texte/non texte(mélange de graphiques et de texte). Dans ce cas, une analyse morphologique fine descomposantes connexes, aidées de connaissances a priori sur la position des éléments peutaussi aider à localiser les différentes zones homogènes du document.Les lignes de texte dans les documents anciens présentent très peu de régularité exploitable.En effet, les lignes sont de différentes longueurs, contenant un enchevêtrement decomposantes connexes. La littérature fait état de trois méthodes principales pour l’extractionde lignes dans les images binaires : les méthodes de projection ou groupement decomposantes ou de pixels le long d’une direction, les approches multi-résolution ou filtragedifférentiel, et les méthodes de groupement de points caractéristiques. Quelque soit la méthode utilisée, trois problèmes viendront toujours restreindre lesperformances de la segmentation Texte/Dessin des images de documents anciens : Le problème de l’échelle : Comment définir une zone de texte sans définir commeparamètre la taille minimale et maximale des blocs ? Comment considérer une lettrine ou destitres imprimés en grande taille comme des zones de texte ? Le problème de la quantité d’information : A partir de quel seuil de densité de traits faut-il décider de la présence d’un bloc de texte ? C’est la raison pour laquelle il est difficile desegmenter un seul caractère isolé car il n’y a pas assez d’information statistique par rapport àla zone englobante. Par conséquent, de nombreux travaux utilisent au minimum la notion deligne, car la ligne de texte est la plus petite région élémentaire suffisamment grande danslaquelle on peut trouver cette accumulation. Problème de l’orientation présumée du texte : On est obligé de faire des hypothèses surl’orientation horizontale du texte et beaucoup de méthodes sont sensibles à l’inclinaison dudocument (« skew angle). En conclusion, il existe bien des approches pour séparer les zones graphiques deszones textuelles. Une seule approche n’est pas toujours suffisante, et une combinaison deméthodes est souvent nécessaire dans les cas difficiles. La segmentation Texte/Dessin a denombreuses applications et reste la première étape incontournable pour l’interprétation etl’indexation des images de documents.Laboratoire L3i – Université de La Rochelle Page 13
  14. 14. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture Méthodes de Segmentation d’Images de documents Filtrage Morphologique Filtrage Différentiel Points forts : Points forts : °/Efficace : Eroder / Dilater °/Efficace pour la localisation °/Puissant : Isoler/Fusionner de texte à partir de seule des formes éloignées. l’orientation des caractères. °/Robuste et Simple à mettre Points faibles : en œuvre. °/Nécessite beaucoup de paramètres externes (nombre Points faibles : d’érosions,…..) °/Besoin de connaissances a °/Extrêmement coûteux en priori. temps de calcul pour de °/Coûteux à cause de la notion grandes images. de voisinage. Filtrage fréquentiel directionnel Analyse de la Texture Binaire Points forts : Points forts : °/Sélectivité du filtre °/ Facile à Réaliser (RLSA). (en fréquence et orientation) °/Trop efficace pour la détection Points faibles : de texte. °/nécessite des informations et °/Adaptatif au niveau ligne de opérations complémentaires pour texte (filtrage à des fenêtres donner un parfait résultat de glissantes). segmentation. Points faibles : °/Un long temps de calcul. °/Difficile à implémenter. °/Difficile à paramétrer. Figure I.2. Familles des méthodes de segmentation Texte/Dessin des images de documentsLaboratoire L3i – Université de La Rochelle Page 14
  15. 15. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureII. Analyse texturale des documentsII.1. Introduction Les images de document peuvent être vues comme des images texturées dans lesquelleschaque typographie correspond à une texture différente. De ce fait, la notion de texture seprésente selon deux approches : • Une approche Analyse et Reconnaissance du Document (ARD), qui examine l’imageau niveau pixel à condition qu’elle soit déjà segmentée. • Une approche traitement des images qui considère l’image dans sa globalité comme unmélange de signaux de fréquences et d’orientations différentes.Ces deux approches sont utilisées pour obtenir des mesures de texture caractéristiques etrobustes [18].II.2. Définition de la texture Il n’existe pas de définition universelle de ce que les chercheurs s’emploient àcaractériser comme texture. Chacun propose sa propre explication de ce qui apparaîtvisuellement comme une évidence en termes de granularité, régularité… en fonction del’utilisation qu’il en fait (certains s’attachent à l’aspect perceptif, alors que d’autres ladéfinissent par le domaine d’application)D’un point de vue formel, on admet généralement que la texture est une fonction desvariations d’intensité observées dans l’image. Une définition générale de la texture [14] laconsidère comme : Une mesure de la variation de lintensité dune surface, mesurant despropriétés telles que la douceur, la grossièreté et la régularité. Elle est employée souventcomme un {descripteur de région} dans le domaine de l’analyse d’image et de la vision parordinateur. Les trois principales approches employées pour décrire la texture sont statistiques,structurales et spectrales. Les techniques statistiques caractérisent la texture par lespropriétés statistiques des niveaux de gris des points comportant/composant une surface.Typiquement, ces propriétés sont calculées à partir de l’histogramme des niveaux de gris oude la matrice de cooccurrence de la surface. Les techniques structurales caractérisent latexture comme une surface composée de primitifs simples appelés les «texels» (des élémentsde texture), ils sont régulièrement arrangés sur une surface selon quelques règles. Ces règlessont formellement définies par {une ou plusieurs grammaires} de divers types. Lestechniques spectrales sont basées sur des propriétés du spectre de Fourier et décrivent lapériodicité globale des niveaux de gris dune surface en identifiant des crêtes dénergie élevéedans le spectre.II.3. Application de la texture à la segmentation La texture sert généralement à la segmentation des images et sous-entend lareconnaissance de zones homogènes au sens d’une texture donnée.La distinction aisément faite par l’œil humain entre plusieurs textures est une tâche difficile àréaliser en vision par ordinateur, dans la mesure où il existe un nombre infini de textures et oùchacune possède ses propres caractéristiques de luminance, orientation, fréquence….[18]Dans ces conditions, il n’existe pas de méthode capable de caractériser complètement chaquetexture ; l’objectif de la majeure partie d’entre elles est d’analyser l’image de manière àdécrire au mieux les impressions visuelles. Pour cela, on attribue à la texture les propriétéssuivantes [14]: La texture est une propriété de région qui ne peut pas être définie en un point, ceci faitLaboratoire L3i – Université de La Rochelle Page 15
  16. 16. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture donc intervenir la notion de voisinage. La texture est une répartition spatiale de niveaux de gris. La texture peut être appréhendée à différents niveaux ou différentes résolutions. Une région est considérée comme texturée lorsqu’elle présente un grand nombre de petits objets ou un motif élémentaire répétitif.II.4. Méthodes d’analyse de texturea) Méthode structurelle La texture est définie comme une organisation spatiale de niveaux de gris, c’est-à-direqu’elle laisse apparaître des arrangements spatiaux de motifs de base déterminés, ce qui nes’applique a priori que dans le cas de structures très régulières.La plupart des méthodes d’analyse de ces textures se décomposent en deux phases : lapremière sert à déterminer les éléments de base composant la texture, tandis que la deuxièmevise à en déterminer l’arrangement spatial.Les méthodes structurelles sont généralement peu intéressantes, dans la mesure où ellesimposent de travailler sur des textures extrêmement régulières, ce qui n’est pas notre cas (lesimages de documents anciens possèdent un grand nombre de paramètres) [18].b) Méthode statistique Ces méthodes définissent la texture en termes de distribution de niveaux de gris ; cesont les premières à avoir été utilisées en vision artificielle.La méthode des matrices de co-occurrence en niveaux de gris est la plus connue et la plusutilisée des méthodes statistiques. Le principe de cette technique est de parcourir l’image dansquatre directions privilégiées (0,π/4,π/2,3π/4) et de repérer combien de fois des pixels deluminosités différant de ∆z sont séparés d’une distance donnée D.Il s’agit d’un problème à la fois facile à mettre en œuvre (même si le choix des paramètres etla sélection des résultats les plus pertinents restent difficiles) mais largement coûteux entermes de temps de calcul et de ressources mémoire nécessaires.On peut aussi utiliser la fonction d’auto-corrélation, qui permet d’évaluer aussi bien le degréde régularité de l’image, que la finesse ou la grosseur de la texture dans l’image.D’après sa formulation mathématique, pour une image I à M lignes et N colonnes : (II.1)Si le tracé de la fonction d’auto-corrélation chute lentement, alors la texture est plutôt fine(l’image est très similaire d’un pixel d’observation à son voisin), et à l’inverse si elle chuterapidement, cela signifie que la texture est plus grossière (deux voisinages proches présententpeu de similarités) [18] [19]Laboratoire L3i – Université de La Rochelle Page 16
  17. 17. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture Variabilité de la disposition de textures dans une même imagec) Méthodes issues du traitement de signal Le but de ces méthodes est de décrire la texture comme un mélange de signaux defréquences, d’amplitudes et de directions différentes. Celles-ci sont particulièrement efficacesen général dans la mesure où elles cherchent à imiter le processus de vision humaine quiopère une décomposition fréquentielle systématique des images qui parviennent sur la rétine.Dans le domaine spatial, l’idée est de caractériser la texture par le nombre de transitions (oucontours) qu’elle affiche par unité de surface, plutôt que d’utiliser les fréquences ; Haralickparle aussi de « textural edgeness ». On peut, pour cela, utiliser des techniques de détectionde contours classiques. Parmi les plus simples, l’opérateur Laplacien ou l’opérateur deRobert [18].Dans le domaine fréquentiel, le principe consiste à repérer les fréquences et les orientationsqui composent les textures contenues dans l’image. Ces méthodes sont particulièrementadaptées aux cas des images contenant des textures régulières. Le principe est d’appliquer àl’image originale la transformation de Fourier qui permet de mettre en évidence les régularitésen passant dans le domaine fréquentiel. Le problème posé par cette opération, qui agitglobalement sur l’image, est qu’elle perd une information précieuse de localisation spatialei.e. on connaît les caractéristiques (en fréquence et en orientation) des textures qui composentl’image mais on ne peut pas les situer dans l’image originale [14].La solution à cela est d’utiliser une transformation alternative appelée transformation deFourier à fenêtre glissante, où le principe est d’appliquer la transformation de Fourier dansune fenêtre d’observation que l’on déplace dans l’image ; la formulation en 1 dimension decette opération est : (II.2)Où f désigne la fonction à laquelle on applique la transformée de Fourier, et w l’amplitude dela fenêtre d’observation. Lorsque cette dernière est gaussienne, on parle de transformée deGabor.II.5. Utilisation de la texture sur les images de documents anciens L’analyse d’images de document, telle que nous l’entendons, consiste en undécoupage (ou segmentation) de l’image en régions homogènes au sens de leur fonction.Classiquement, on considère que dans les images de documents il existe principalement troisclasses particulières à discriminer : le Texte, le Dessin et le Fond.Laboratoire L3i – Université de La Rochelle Page 17
  18. 18. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureDans la plupart des cas, la notion de texture est utilisée pour la segmentation d’images dedocuments imprimés où on cherche à classer les zones d’intérêt en deux ou trois catégories,cest-à-dire Texte/non-Texte, Texte/Dessin ou Texte/Dessin/Fond.II.6. Segmentation des images de documents anciens Quel que soit le type d’image, la séparation des zones textuelles des zones graphiquess’effectue en localisant les lignes de texte. En effet, de nombreux travaux dans différentsdomaines démontrent que la ligne de texte, grâce à sa texture régulière et son alignement,reste l’élément le moins difficile à localiser quelque soit le support. On peut définir une zonede texte comme « une région de l’image présentant une très forte densité de traits qui formentdes alignements à une échelle donnée ». Dans une image naturelle, une telle configuration esttrès rare [18]. Les méthodes utilisées sont principalement celles basées sur des opérationsmorphologiques par filtrage différentiels ou fréquentiels directionnels. Il s’agit d’approchesdites ascendantes (data-driven) où l’on cherche une interprétation sans connaissances a priorià partir seulement des seules informations sur les pixels de l’image. Les approchesdescendantes (model-driven) nécessitent des connaissances a priori sur la forme de lalocalisation des zones de texte ce qui est difficile à obtenir sur des documents anciens [29].Les images de documents anciens soulèvent trois types de difficultés. La première difficultévient de la mise en page de ces documents qui peuvent être complexes et présenter plusieurscolonnes de taille de corps et d’interlignes différents. Le second problème concernel’inévitable courbure des lignes de texte produite par la reliure des livres. Enfin la dernièredifficulté provient des faibles espaces entre les lignes qui entraîne de nombreux contacts entreles caractères appartenant à de lignes différentes [29].Cas1 : mise en page complexe Cas2 : Courbure Cas3 : connexions entre caractères Figure II.1. Verrous empêchant l’application de la méthode des projections pour l’analyse d’image [29]Laboratoire L3i – Université de La Rochelle Page 18
  19. 19. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureII.7. Segmentation d’image de documents anciens par analyse des projectionshorizontales/ verticales Cette méthode consiste à projeter les valeurs des pixels ou l’épaisseur du rectanglecirconscrit des caractères, dans les directions horizontales et verticales de façon à obtenir deuxhistogrammes. L’histogramme des projections horizontales possède des maxima quireprésentent les centres des lignes et des minima qui délimitent les bords inférieurs etsupérieurs des lignes. L’histogramme des projections verticales donne les bords extérieursgauches et droits des colonnes. Cette méthode ne marche pas pour les documents multi-colonnes (cas1) et supposent que les lignes soient correctement alignées horizontalement(cas2). Cette approche nécessite une correction préalable de la courbure et de l’inclinaison etne peut traiter que des documents de structure simple. De plus, il faut binariser correctementl’image de façon à séparer correctement les lignes. Cette méthode n’est donc pas utilisable surtoutes les images de documents anciens. Cependant, la méthode de projection peut êtreappliquées sur des morceaux de lignes de façon à réduire la sensibilité à l’inclinaison et éviterl’imbrication multiple avec des zones graphiques [29].Les méthodes de projection permettent toutefois d’extraire la ligne de base (« base-line »), lecorps du texte (« x_line – base-line ») qui délimitent les caractères sans hampes ni jambage.Ces informations importantes peuvent être extraites par projection de chaque mot du texte[18]. Motif Régulier Motif Irrégulier Motif Régulier Figure II.2. Résultat de projection horizontale d’une image de document [31]Voici un résumé de quelques travaux, portant sur la segmentation d’images de documents,utilisant de nombreuses approches intéressantes : Jain et Bhattacharjee [3] proposent une méthode directe de segmentation texte/dessin enutilisant un banc de filtres de Gabor, la méthode ainsi définie ne permet que de marquer leszones de texte des images de documents traitées. Trygve et al. [2] reposent sur les travaux de Jain et Bhattacharjee pour mettre au point unsystème de segmentation supervisé, mais plus avancé, capable de définir le texte, le dessin etle fond des images de documents fortement bruités. Mausumi et Malay [4] développe une méthode de segmentation d’images de documents àl’aide du filtre de Gabor utilisé dans un environnement à base d’ondelette. Le travail ainsidéfini opte seulement pour le marquage des zones de texte présentes dans le document.Laboratoire L3i – Université de La Rochelle Page 19
  20. 20. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureNotre travail représente une première tentative dans l’établissement d’un système desegmentation Texte / Dessin d’images de documents anciens par approche texture utilisant unbanc de filtres de Gabor. Il était une fois une Ä °àt|à âÇx yÉ|á âÇx Å°v{tÇàx méchante sorcière si áÉÜv|¢Üx á| }tÄÉâáx wx Ät uxtâà° wx jalouse de la beauté át uxÄÄx Ñxà|àx y|ÄÄx UÄtÇv{xAâÇ de sa belle petite }ÉâÜ xà Ät }xààt wtÇá âÇ fille Blanche.un jour Üâ|ááxtâA fxÑàá Ñxà|àá Çt|Çá Il était une fois une méchante sorcière si jalouse de la beauté de sa belle petite fille Blanche.un jour Figure II.3. Les différentes zones d’un document peuvent être simulées à un agencement de texturesIII. Théorie du filtre de Gabor Un filtre de Gabor est une fonction sinusoïdale à laquelle on a rajouté une enveloppegaussienne. Dans le plan fréquentiel, cette fonction se transforme en gaussienne. La fonctionsinusoïdale est caractérisée par sa fréquence et par son orientation. Ainsi appliqué sur uneimage, un filtre de Gabor peut être vu comme un détecteur de segments dorientationparticulière, puisquil réagira aux arêtes perpendiculaires à la direction de propagation dusinus. La fréquence du sinus, indique à quelles fréquences le filtre sera sensible et réagira. Il ade plus été montré que les fonctions de Gabor forment un set complet, cest à dire quenimporte quelle fonction peut être exprimée en une somme (infinie) de fonctions de Gabor,pour autant que le produit des densités fréquentielle et spatiale du set soit supérieur à 1[4]. Les techniques de filtrage multi-canal permettent lextraction des caractéristiques detexture localement, en fréquence et orientation, en dautres termes, les calculs descaractéristiques de texture (en fréquence et orientation) peuvent être effectués pour tout pixeldans une région dintérêt. Cette méthode est particulièrement intéressante vue quelle estinspirée du système de vision humain qui décompose limage projetée sur la rétine en unnombre important dimages filtrées, chacune contenant des variations dintensité fines defréquences et dorientations.Lidée de lapproche gaborienne est alors de concevoir un filtrage particulièrement sélectif enfréquence et orientation dans le but de caractériser au détail près les textures. Chaque filtre estalors appliqué à limage dorigine, et une analyse éventuelle permettra de créer un simplevecteur de caractéristiques (à base de calculs statistiques). Les fonctions de Gabor présentent les avantages suivants :• Localisation maximale dans les espaces spatial et fréquentiel;• Flexibilité: les fonctions de Gabor peuvent être positionnées librement et continuellement dans lespace, des fréquences et des orientations choisies arbitrairement sans contraintes;Laboratoire L3i – Université de La Rochelle Page 20
  21. 21. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture Une fonction de Gabor 2D « h » est une onde plane sinusoïdale modulée par une enveloppe gaussienne et orientée avec un angle θ à partir de laxe X. La formulation mathématique, dans le domaine spatial pour une fréquence fondamentale u0 tout au long de laxe X (c.à.d. θ = 0°), est : 1 x2 y2 h(x,y)= exp[- 2 2 2 ] cos (2πu0x) (III.1) x y où σx (respectivement σy) est la variance de la gaussienne selon laxe X (respectivement Y). Les filtres à orientation θ (θ≠0) sont obtenus en effectuant une rotation de léquation précédente. La sélectivité du banc de filtre en orientation et fréquence est claire dans le domaine fréquentiel, cest pour cette raison quon applique la transformée de Fourier à léquation (1), et on obtient : 2 2 2 2 1 u u0 v 1 u u0 v H(u,v)=TF(h(x,y))=A.{exp[- 2 2 2 ]+exp[- 2 2 2 ]} u v u v (III.2) avec σu = 1 / 2πσx , σv = 1 / 2πσy et A = 2πσxσy . De ce fait, dans le domaine fréquentiel, le signal est représenté par deux gaussiennes le long de laxe X, centrées en +u0 et -u0 comme montré sur la figureIII.1. Impossible d’afficher l’image. Impossible d’afficher l’image.Figure III.1. La fonction de Gabor dans le domaine fréquentiel Figure III.2. La fonction de Gabor dans le domaine SpatialDans le domaine fréquentiel, la fonction de Gabor Dans le domaine spatial, la fonction de Gaborest représentée par deux piques gaussiennes. est une fonction sinusoïdale modulée par une gaussienne Laboratoire L3i – Université de La Rochelle Page 21
  22. 22. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture Impossible d’afficher l’image.Impossible d’afficher l’image. Figure III.3. Ensemble de filtres de Gabor dans le domaine fréquentiel (le multi-canaux) Le filtre de Gabor est un filtre directionnel et modulable. Chaque filtre décrit par une orientation et une fréquence spécifiques définit un Canal de filtrage. L’association et l’agencement d’un ensemble de filtres de Gabor permet de couvrir tout l’espace fréquentiel, on parle alors de filtrage multi-canaux. Impossible d’afficher l’image. Figure III.4. (a) Filtres de Gabor dans une fenêtre 30 x 30, représentés dans le domaine spatial et fréquentiel pour u0 = 1/8 et θ=0° (b) Filtres de Gabor dans une fenêtre 30 x 30, représentés dans le domaine spatial et fréquentiel pour u0 = 1/8 et θ=45° Laboratoire L3i – Université de La Rochelle Page 22
  23. 23. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureImpossible d’afficher l’image. Figure III.5. Partie réelle des 4 x 4 fonctions de Gabor dans le domaine spatial L’aspect du filtre dépend de la fréquence, de son orientation et de ses écarts types; L’orientation du filtre définit la direction du filtre ; La fréquence définit la sensibilité du filtre ; Les écarts types définissent la réceptivité (largeur) du filtre. Impossible d’afficher l’image. Figure III.6. Couverture du domaine de Fourier par les canaux fréquentiels des fonctions de Gabor Le filtrage multi-canaux est simplement et efficacement réalisé par le filtre de Gabor qui permet de couvrir tout le domaine fréquentiel et dans de multiples orientations. Chaque canal permet d’extraire les composantes de l’image dont les valeurs correspondent aux paramètres du filtre (fréquence et orientation). Laboratoire L3i – Université de La Rochelle Page 23
  24. 24. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureDune manière pratique plus détaillée, un filtre symétrique impair de Gabor possède la formegénérale suivante dans le domaine spatial : 2 2 1 x yh(x,y,θ,f) = exp {- 2 [ 2 2 ]}cos(2π f xθ) (III.3) x yavec xθ = x cosθ + y sinθ , et yθ = -x sinθ + y cosθ .Ce filtre consiste en une enveloppe gaussienne (de paramètres σx et σy) modulée par unesinusoïde de fréquence f le long de la direction de laxe xθ . Langle θ permet la rotation de ladirection de la réponse. La fréquence f peut être vue comme linverse de la moyenne desdistances inter-directions.La valeur de θ est donnée par : θk = π(k – 1)/m, k =1...m, où m représente le nombre dedorientations.Pour chaque bloc d image (fenêtre) de taille W x W, centré au point (X,Y), avec W impair, oncalcule la grandeur de la caractéristique de Gabor comme suit, pour k = 1....m :g(X,Y,θk,f,σx,σy) = I(X+x0,Y+y0)h(x0,y0,θk,f,σx,σy) (III.4)où I(x,y) est la valeur du niveau de gris du pixel (x,y).Comme résultat, on obtient m caractéristiques gaboriennes pour chaque bloc de W x W delimage.Dans des blocs contenant un motif aigu, les valeurs dune ou de plusieurs valeurscaractéristiques gaboriennes sera (seront) plus importante(s) que les autres valeurs (cesvaleurs correspondent à langle de rotation du filtre qui coïncide avec langle directionnel dumotif ou traits du bloc en cours). Dun raisonnement similaire, pour un bruit non-orienté(aléatoire)des blocs de fond, les m valeurs caractéristiques seront similaires. De ce fait, lavariance G des m valeurs caractéristiques permet de segmenter ou de séparer le fond (arrièreplan) de lavant-plan (domaine dintérêt).Si G est inférieure à un certain seuil donné, le bloc est étiqueté comme un bloc de fond(background), sinon le bloc est étiqueté comme un bloc dintérêt (foreground). Cependant, cette méthode nest pas précise sur les bords des régions dintérêt ou desblocs ayant un faible contraste (résolution), comme on peut perdre de linformationminiaturisée en arrière plan si les paramètres ne sont pas bien ajustés. Les filtres de Gabor bidimensionnels permettent l’extraction directe de caractéristiquesde textures localisées en fréquence et en orientation, cest-à-dire que pour chaque pixel, ilspermettent le calcul de caractéristiques dans un voisinage l’englobant. Cette technique,précisément inspirée du mécanisme de la vision humaine qui opère une décompositionfréquentielle systématique des images qui parviennent sur la rétine, se révèle particulièrementLaboratoire L3i – Université de La Rochelle Page 24
  25. 25. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Textureefficace. Le principe des filtres de Gabor est donc de bâtir un banc de filtres très sélectifs enfréquence et en orientation, et de filtrer l’image à analyser avec chacun d’eux ; le calcul aposteriori de paramètres sur les images résultats, permet de caractériser les texturescontenues dans l’image à analyser. Il est à noter que lorsque la fréquence fondamentale u0 augmente, la bande passante dufiltre en fréquence augmente elle aussi : le filtre devient moins sélectif ; ce phénomèneapparaît clairement sur la représentation d’un banc de filtres de Gabor à 6 fréquences (u0=1√2,2√2, 3√2, …) et 4 orientations (θ=0°, 45°, 90° et 135°). Par ailleurs, le banc de filtres deGabor permet de couvrir la quasi-totalité de l’espace des fréquences et, dans la mesure où iln’y a que peu de recouvrement entre eux, la décomposition d’une texture dans ce plan estunique et caractéristique.III.1. Paramétrisation / Calcul efficace des paramètres de Gabor Dans ce qui suit, on présentera les méthodes de sélection et de calcul des paramètresdu filtre de Gabor.Un filtre de Gabor 2-D est un produit d’une gaussienne elliptique dans toute rotation et unexponentiel complexe représentant une onde plane sinusoïdale.La sensibilité du filtre est commandée principalement par ses écarts types, associés au grandet petit axes σx et σy respectivement. Deux autres paramètres décrivent un filtre de Gabor quisont f0 (fréquence centrale) et θ (angle d’orientation).L’allongement de la gaussienne est donné par : λ = σx / σy.Une caractéristique gaborienne consiste en le calcul de la réponse des différents filtres pourdes valeurs différentes d’orientations et de fréquences : réponse du banc de filtres.Un banc de filtres est composé de plusieurs filtres et utilisé dans le processus dereconnaissance d’objets à base de la relation existante entre les différentes réponses desfiltres.a) La répartition angulaireDans la littérature, la sélection d’angles d’orientation θl a été démontrée [3][21] ; un résultatclé annonce l’espacement uniforme des différentes orientations. θl = 2πl/n , l={0,1,2,….,n-1} (III.5)où θl est la lème orientation et « n » et le nombre total d’orientations envisagées.Le calcul peut être réduit à moitié vu que les réponses aux angles [π,2π] sont des complexesconjugués aux réponses sur [0, π] dans le cas des valeurs d’entrée réelles.Laboratoire L3i – Université de La Rochelle Page 25
  26. 26. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Textureb) La répartition fréquentiellePour les valeurs de la fréquence, elles vérifient l’expression suivante : fl = k-1fmax , l={0,1,,2,…..m-1} (III.6)k =2 pour une octave d’espacement ou bien k=√2 pour un espacement d’un demi d’octave.c) Les Vecteurs caractéristiquesEn utilisant ces schémas de sélection pour couvrir les fréquences d’intérêt f0,….,fm-1 et lesorientations pour la discrimination angulaire désirée, on construit un ensemble decaractéristiques pour tout pixel (x0,y0) de notre image, soit G cette matrice. G peut s’écriresous la forme suivante : r(x0,y0 ;f0,θ0)………………. r(x0,y0 ;f0,θn-1) r(x0,y0 ;f1,θ1)………………. r(x0,y0 ;f1,θn-1) . . . . . . . G= . . . . . . . . . . . . . . . . . . . . . r(x0,y0 ;fm-1,θ0)………………. r(x0,y0 ;fm-1,θn-1)Cette matrice caractéristique peut être utilisée comme un vecteur d’entrée dans un processusde classification.Seule la détermination des valeurs de f, θ et σ n’est pas suffisante pour travailler efficacementavec le filtrage gaborien, il faudrait trouver leurs valeurs optimales. Il existe plusieursméthodes d’optimisation, cependant, le caractère d’interdépendance des paramètres gaborienset l’hétérogénéité de leurs domaines de définition compliquent cette tâche et la rendent desfois impraticable.III.2. Les fréquences du filtre de Gabor Dans la littérature [3][4][21], il existe une multitude d’approches pour la déterminationdes valeurs des fréquences utilisées pour le filtrage. Principalement, l’adoption d’uneapproche spécifique est commandée par le domaine d’application et la nature des imagesutilisées.Les fréquences des filtres dans un banc de filtres sont : f0=fmax, f1=fmax/k, f2=fmax/k2 , ……fn=fmax/km-1. Les valeurs sélectionnées de k et σx sont interdépendantes. Elles doivent êtrechoisies de telle sorte que le banc de filtres capture toutes les fréquences utiles et descriptivespour l’application envisagée.Laboratoire L3i – Université de La Rochelle Page 26
  27. 27. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TexturePremier résultat important : Les valeurs de σx et f sont mutuellement dépendants.Sans trop s’attarder sur des démonstrations, on admet les conclusions suivantes : 1  k + 1 σx =   − ln p1 π  k −1 III.7« p1 » correspond au point de passage entre les filtres dans des fréquences adjacentes. k −1 2 − (σπ ) p1 = e k +1 III.8Pour trouver la valeur de k, étant donné f0=fmax, fm-1=fmin et m est : ln f min − ln f max 1 − f min = m −1 f max ⇒ k = e m −1 III.9 kUne valeur indicative de « m » sachant fmax, fmin et k peut être calculée comme suit : ln f min − ln f max m=− +1 III.10 ln kLa valeur retournée de « m » n’est pas directement utilisable, car m doit être un entier.III.3. Les orientations du filtre de Gabor La valeur de σy est étroitement liée aux nombres d’orientations choisies.En définissant un autre point « p2 » qui correspond au point de passage entre les filtres dansdes orientations adjacentes, la valeur de σy se calcule comme suit, avec n lenombre d’orientation du filtre: f0 − ln p 2 σy = III.11 π ub π  u b = tan  f 0 III.12  2n Laboratoire L3i – Université de La Rochelle Page 27
  28. 28. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture πf 0Si n<4 , la valeur de ub peut être rapprochée à : ub = 2nAlors : 1 − ln p2 1 − ln p2 σy = = III.13 π π  π π tan   2n  2nLa valeur de p2 peut être calculée par l’équation suivante : σ yπ 2 −( )2 p2 = e 2n III.14 (a) (b) Figure III.7. Exemples de banc de filtres dans le domaine fréquentiel, avec m=5, n=4, p=0.2, k=√2 , (a) σx = σy = 2.35 , (b) σx = 2.35 et σy = 1.03III.4. Séparabilité des filtres de Gabor Si un filtre G peut être exprimé comme une multiplication de deux vecteurs Gcol*Grow,le filtre G est dit alors Séparable. Pour les filtres séparables, la convolution peut être réaliséeséparément avec des filtres 1-D Gcol et Grow. Ceci réduit la complexité totale de calcul deO(M2N2) à O(2MN2), où N est la Largeur/Taille de l’image et M pour le filtre. Commecomparé au filtrage FFT, O(N2 Log N), il peut être noté que la convolution dans le domainespatial avec des filtres séparables est bénéfique lorsque M<Log N. Les filtres de Gabor, qui sont des filtres parallèles (horizontal et vertical) aux axes del’image sont séparables, θ=nπ/2, n=0,1,2,…. . Un filtre est une fonction sinusoïdale avec uneenveloppe gaussienne associé à d’autres enveloppes gaussiennes.Laboratoire L3i – Université de La Rochelle Page 28
  29. 29. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture L’utilisation de filtres à des orientations arbitraires implique l’utilisation des rotationsde l’image afin d’exploiter la propriété de séparabilité, ce qui entraîne une augmentation de lacomplexité des calculs. Cependant, les filtres de Gabor séparables peuvent être étendus auxfiltres à angle de 45°, θ=π/4 + nπ/2, n=0,1,2,…, ce qui permet de balayer l’image selon ladiagonale, au lieu de rester attaché aux axes principaux.III.5. Exploitation de la symétrie du filtre Les caractéristiques de symétrie et d’anti-symétrie des filtres de Gabor 2-D sontutilisées pour accélérer les calculs dans le domaine spatial. Les filtres de Gabor sont des filtressymétriques : les mêmes valeurs du filtre seront reprises dans plusieurs locations. Cespropriétés peuvent être utilisées automatiquement pour réduire le nombre de multiplicationsdans la phase de calcul des réponses des filtres.III.6. Implémentation du filtrageNous allons présenter des exemples de filtrage utilisant le filtre de Gabor. Les images quenous allons utiliser sont variées :♦ Images de synthèse contenant des traits/lignes simples à supports multiples (horizontales,verticales ou obliques) reflétant ainsi les différentes orientations qui peuvent exister dans uneimage de document ; ces mêmes lignes ont des épaisseurs différentes simulant les différentestailles que peut avoir une ligne de texte. Ce type d’images va nous permettre d’étudierl’influence de l’orientation et de la fréquence dans l’opération de filtrage ;♦ Images de synthèse contenant des lignes de texte avec des tailles de polices différentes. Cetype d’images va nous permettre d’analyser l’effet de la fréquence dans l’opération defiltrage ;♦ et des Images de documents anciens sur lesquels on va essayer d’analyser et étudier lesmêmes effets de la fréquence et de l’orientation étudiés sur les images de synthèse.a) Filtrage dans le domaine spatial Filtres de Gabor f=16√2 Image θ = 0° Convolution * f=16√2 θ = 30° f=16√2 θ = 90°Laboratoire L3i – Université de La Rochelledans le domaine spatial sur une image de synthèse Figure III.8.a) Résultat de filtrage Page 29
  30. 30. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureDiscussionLe filtre de Gabor permet de détecter les segments et discontinuités (lignes) qui correspondentà son support d’orientation, et principalement pour 0° et 90°.Dans le cas de traits trop épais, Gabor permet de détecter le contour de ces traits, ceci étantlogique vu que la propriété de discontinuité s’applique ici, et l’épaisseur du trait représenteune zone homogène (absence de transitions de niveaux de gris) et il n’est pas dans sa portée ladétection de telles régions (zones de basses fréquences). Filtres de Gabor f=2√2 θ = 0° Convolution f=8√2 * θ = 0° f=32√2 θ = 0°Figure III.8.b) Résultat de filtrage dans le domaine spatial sur une image de synthèse avec du texte à différentes tailles de police. Nous remarquons que pour une basse fréquence, seul (presque) le texte de plus grandetaille était le résultat de filtrage. Ceci s’explique par le fait que ce texte contient des zones(fragments de textes) homogènes. En augmentant la valeur de la fréquence, d’autres élémentsapparaissent ; il s’agit essentiellement des lignes de textes de petites tailles, et tant qu’onaugmente la fréquence, des structures plus fines se tracent et apparaissent pour le petit texte,contrairement au gros textes qui perdent de leur précision au fur et à mesure.Laboratoire L3i – Université de La Rochelle Page 30
  31. 31. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureEn appliquant un simple seuillage pour délimiter les zones qui ont répondu le plus, dansl’ordre cité ci-dessus, nous obtenons ce qui suit : Effet de la fréquence croissante sur le résultat de filtrage (apparition de détails)Ces derniers résultats vérifient ce qu’on venait d’expliquer auparavant. Filtres de Gabor f=16√2 θ = 0° Convolution * f=16√2 θ = 30° f=16√2 θ = 90° Figure III.8.c) Filtrage dans le domaine spatial appliqué sur une image de document ancienLaboratoire L3i – Université de La Rochelle Page 31
  32. 32. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture 0° 30° 90° Lignes horizontales Lignes obliques Lignes verticales Effet de l’orientation sur une région d’une image de document ancienSur ces dernières images, on remarque que pour une fréquence donnée, l’orientation du filtrepermet de détecter les composantes (traits) ayant un support qui coïncide avec cetteorientation. Il est à remarquer que quelque soit l’orientation choisie, il existe toujours deséléments de nos images de documents anciens qui répondant à ce filtre. De plus, la présenced’un grand nombre de traits d’orientation correspondante à celle du filtre fait que la réponsede ce dernier soit plus importante comparée à celles des autres orientations.Un diagramme de filtrage dans le domaine spatial est présenté dans la figure III.8. a, b et c.La complexité de la convolution dépend directement de la taille du Masque de convolution,qui est dans ce cas le filtre de Gabor. La complexité pour calculer la réponse du filtre pour unpixel est O(M2), où M est la largeur /taille du masque. Si le filtrage est appliqué sur toutel’image, la complexité est O(M2N2) où N désigne la longueur et la largeur de l’image.Il est important, pour accélérer le calcul, que la taille du filtre M soit la plus petite quepossible.Laboratoire L3i – Université de La Rochelle Page 32
  33. 33. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Textureb) Filtrage dans le domaine fréquentielUn diagramme de filtrage dans le domaine fréquentiel est présenté dans la figure III.9-a et b. Filtres f=16√2 Multiplication avec les filtres Image Après FFT θ = 0° Transformée de Fourier Inverse f=16√2 θ = 30° f=16√2 θ = 90° Figure III.9. a) Filtrage dans le domaine fréquentiel appliqué sur une image de synthèseEn premier, l’image est convertie au domaine fréquentiel avec FFT, l’image résultante de latransformée de Fourier est multipliée par le filtre de Gabor et les réponses subissent uneconversion inverse au domaine spatial en utilisant la FFT inverse.La complexité de FFT 2-D et IFFT est O(N2 Log N), à un facteur multiplicatif près. Cefacteur dépend des dimensions de l’image et de l’implémentation de la transformée deFourier.Laboratoire L3i – Université de La Rochelle Page 33
  34. 34. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture Filtres f=16√2 Multiplication avec les filtres Image Après FFT θ = 0° Transformée de Fourier Inverse f=16√2 θ = 30° f=16√2 θ = 90° Figure III.9. b) Filtrage dans le domaine fréquentiel appliqué sur une image de document ancienRemarqueUne propriété très importante à tenir en compte est celle qui est donnée par la proportionnalitéinverse de la largeur du filtre de Gabor dans les deux domaines. Cette propriété est à la racinede la physique et c’est le principe d’incertitude. Il faudra en toute application faire le choixentre avoir une haute résolution en fréquence ou avoir une haute résolution en espace mais ilne sera jamais possible d’avoir les deux au même temps.On peut déduire aussi la relation d’orthogonalité entre la direction de représentation d’uneligne dans le domaine spatial et dans le domaine fréquentiel. Sur cette base, on peut voird’une façon intuitive que les lignes des contours qui seront trouvées avec le filtrage aurontune orientation de 90° en relation avec l’orientation correspondante dans le domainefréquentiel.Laboratoire L3i – Université de La Rochelle Page 34
  35. 35. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureTableau récapitulatif des paramètres du filtre de GaborParamètre Description Point d’intersection entre filtres pour des fréquences adjacentesP1 (espacement fréquentiel). Point d’intersection entre filtres pour des orientations adjacentesP2 (espacement angulaire).K Facteur d’échelle pour les fréquences du filtre.σx Longueur d’étendue du filtre (selon l’axe X)m Nombre de filtres pour chaque fréquence.fmin Valeur minimale de la fréquence de réponse du filtre.fmax Valeur maximale de la fréquence de réponse du filtre.σy Largeur d’étendue du filtre (selon l’axe Y).n Nombre de filtres pour chaque orientation.Laboratoire L3i – Université de La Rochelle Page 35
  36. 36. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureIV. Implantation Suite aux résultats encourageants de la segmentation de textures et celle dutexte/dessin, utilisant le filtre de Gabor [2] [6], nous avons implémenté ce filtre et nousl’avons testé sur les images de notre base de documents anciens (contenant 80 images).Le but est d’appliquer ce filtre sur les images de documents anciens et définir ainsi un outil desegmentation par approche texture pour ce type d’images. L’idée qui soutient cette approche, est que les zones de texte peuvent être considéréescomme des textures spécifiques. Il en est de même pour les zones graphiques qui sontconsidérées comme des textures mais avec des propriétés différentes de celles des zones detexte. Les zones de texte sont des zones riches en transitions, de ce fait, elles sont riches enhautes fréquences, contrairement aux zones graphiques, qui sont des zones relativementhomogènes, et par conséquent caractérisées par des basses fréquences. En se basant sur ce constat, le filtre de Gabor est trop "sensible" (réponse importantedu filtre) aux zones de texte pour les hautes fréquences, et il est relativement plus sensible auxzones graphiques pour des fréquences basses ; notez que si les zones graphiques comportentdes zones riches en transitions, le choix de la fréquence adéquate pour le filtrage demeure unetache relativement complexe et non évidente. Nous constatons, d’après les tableaux IV.1 et IV.2 que le filtre de Gabor est sensibleaux valeurs d’entrée de ses paramètres, et le résultat de filtrage dépend étroitement de celles-ci. Les résultats sont obtenus après un seuillage des images résultantes après le filtrage. Le butde ce seuillage est principalement pour des fins de visualisation, afin de montrer la variationdes réponses des différents pixels pour un seul filtre. L’opération de seuillage est appliquéecomme suit : ♦ Si Ndg [p(i,j)] > Seuil p(i,j) ε Classe Active (réponse importante du filtre de Gabor) ♦ Si Ndg [p(i,j)] < Seuil p(i,j) ε Classe Passive (réponse négligeable du filtre de Gabor) Nous avons constaté aussi que la sensibilité du filtre de Gabor, pour la détection desegments et de discontinuités, l’empêche d’être très efficace pour la segmentation texte/dessinà cause de la présence d’éléments fins détectables, par le filtre de Gabor, dans les zonesgraphiques, et cela pour des basses fréquences. La même constatation pour des hautesfréquences, dans le traitement des zones de texte contenant des zones homogènes et uniformes(gros textes), le filtre de Gabor est alors incapable de détecter de tels composants. Pour remédier à cette insuffisance du filtre de Gabor, on définit des Banc de filtresdont le but consiste à définir une combinaison de plusieurs fréquences et orientations quiservent à extraire les différentes composantes de l’image ; chaque instance de fréquence etd’orientation définit un Canal, qui sert à conduire, filtrer et ressortir les éléments de l’imagedont les caractéristiques correspondent à ces valeurs. On parle alors dans ce cas de FiltrageMulticanaux.Laboratoire L3i – Université de La Rochelle Page 36
  37. 37. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture Avant de définir un système de Banc de Filtres pour la segmentation Texte/Dessind’images de documents anciens, nous allons montrer l’existence d’un ou de plusieurs pointsde rupture fréquentielle, qui permet (tent) de distinguer la réponse du filtre de Gabor pour descomposantes de basses et hautes fréquences (distinction d’éléments de l’image répondants àde hautes (basses) fréquences). Pour cela, on se sert de l’histogramme des niveaux de gris del’image filtrée, pour une fréquence donnée, sur lequel on applique un seuillage ; le choix duseuil doit permettre de partitionner les pixels de l’image filtrée en deux classes : Une première classe englobant les pixels présentant une réponse importante au filtre enquestion ; Une deuxième classe englobant les pixels qui n’ont pas réagit au filtre en question. Il est à noter que le paramétrage effectué jusqu’à présent est purement manuel, et lechoix de la fréquence et de l’orientation a été décidé, après une série de jeux d’essais, afind’analyser le comportement fréquentiel et angulaire du filtre et donner un aspect plus concretà l’opération de filtrage et de la segmentation Texte/Dessin.Laboratoire L3i – Université de La Rochelle Page 37
  38. 38. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureEt après seuillage, on a obtenu les résultats suivants : f(Hz) 1√2 8√2 16√2 64√2 θ (rad) 0° π/6 π/3 π/2Tableau IV.1 : Résultat du seuillage des résultats de filtrage par le filtre de Gabor pour différentes valeurs de fréquence et d’orientation (exemple1)Laboratoire L3i – Université de La Rochelle Page 38
  39. 39. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture f(Hz) 1√2 8√2 16√2 64√2 θ (rad) 0° π/6 π/3 π/2Tableau IV.2 : Résultat du seuillage des résultats de filtrage par le filtre de Gabor pour différentes valeurs de fréquence et d’orientation (exemple 2)Laboratoire L3i – Université de La Rochelle Page 39
  40. 40. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureIV.1. Analyse des résultats de filtrage Selon les résultats des tableaux IV.1 et IV.2, on peut constater que : Le résultat de filtrage diffère selon la valeur de f et θ et chaque couple (f,θ) donne lieu àun résultat de filtrage spécifique. Pour chaque orientation, on peut définir deux familles de fréquences : la première oùseules des zones homogènes (ou presque) répondent au filtre en question, et la deuxièmecorrespond aux zones fortement texturées et qui répondent seules au filtre en question. Les fréquences de réponse des zones homogènes sont relativement basses comparées auxfréquences de réponse des zones texturées (hautes fréquences). On constate facilement que les zones répondant aux basses fréquences représentent leszones graphiques de l’image d’entrée, cependant, les zones qui répondent en hautesfréquences, sont principalement des zones de texte. Il est à noter aussi qu’en augmentant la valeur de la fréquence, des détails apparaissent deplus en plus, et les zones de plus en plus homogènes disparaissent. Pour une fréquence spécifique, le résultat du filtrage n’est pas toujours le même pour dedifférentes valeurs de θ. On constate que pour une fréquence donnée, des détails apparaissent ou disparaissent, touten conservant généralement la nature de l’élément en question : Texte ou Dessin. Ceci estexpliqué par le fait que les images de documents anciens sont des images de traits àorientations multiples, ce qui implique la présence d’éléments (traits) qui répondent au filtreen question quelque soit l’orientation choisie. L’abondance de traits pour une orientationspécifique fait que la réponse du filtre soit plus importante pour cette direction.IV.1.a) Influence de l’orientation sur le résultat de filtrage L’orientation du filtre de Gabor permet de détecter les éléments primitifs de l’image(traits) dont leur support correspond à cette orientation.IV.1.b) Influence de la fréquence sur le résultat de filtrage La fréquence du filtre de Gabor permet de déceler les éléments dont leur fréquencecoïncide à celle du filtre.Une image de document peut être vu comme une composition multi-fréquentielles (plusieurstextures dont chacune est décrite par une fréquence spécifique), et le filtrage permet desélectionner seuls les composants de l’image dont leur fréquence correspond à celle du filtre.IV.1.c) Importance entre l’orientation et la fréquence Des résultats précédents, on peut confirmer l’importance et la complétude des deuxprincipaux paramètres d’un filtre de Gabor : la fréquence et l’orientation. Cependant, dansnotre cas, des images de documents anciens, on favorise l’importance de la fréquence, vu queles images de traits sont riches en éléments dans les différentes orientations ; de ce fait,quelque soit l’orientation choisie, on est certain d’avoir cibler des éléments de l’image enquestion, et seule la fréquence décide sur la qualité de la réponse du filtre et la précision desrésultats obtenus.Laboratoire L3i – Université de La Rochelle Page 40
  41. 41. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche TextureLe seuillage de l’histogramme des niveaux de gris est une astuce pour visualiser lescomposantes de l’image répondant positivement au filtre en question, pour des paramètresspécifiques:Résultat du Seuillage pour des hautes fréquences :Pour des basses fréquences, on a obtenu les résultats suivants :Laboratoire L3i – Université de La Rochelle Page 41
  42. 42. K.MOUATS - Segmentation d’Images de Documents Anciens par Approche Texture A partir de ces résultats préliminaires, nous avons bien confirmé qu’il est possible de discriminer les zones de texte dans des gammes de hautes fréquences, contrairement aux zones graphiques qui le sont pour des basses fréquences. Il est à noter également que l’opération de seuillage jouait un rôle complémentaire pour déceler les zones graphiques (basses fréquences) des zones textuelles (hautes fréquences). Cependant, même avec un seuillage précis, il existe des composants textuels qu’on n’a pas pu être étiquetés en tant que zones de texte (idem pour des parties graphiques). De ce fait, seule l’opération de seuillage des résultats de filtrage n’est pas suffisante pour fournir une segmentation efficace des images de documents anciens. La détermination d’un seuil adéquat se fait d’une manière heuristique, à partir de l’histogramme des niveaux de gris, en essayent de détecter un point de passage entre les pixels ayant une très bonne réponse pour le filtre en question, des pixels ayant une réponse moins bonne ou nulle pour le même filtre. Pour l’image qui suit, on va utiliser un filtre de Gabor avec f=16√2 et θ=π/2Pixels graphiquesétiquetés en tantque pixels de texte. Laboratoire L3i – Université de La Rochelle Page 42

×