SlideShare une entreprise Scribd logo
1  sur  56
Télécharger pour lire hors ligne
JADT 2010 - 11/06/2010
                  Rome


Utilisation de la visualisation
       en nuage arboré
   pour l'analyse littéraire
               Delphine Amstutz
  (CELLF – Université Paris-Sorbonne Paris 4 / CNRS)
               Philippe Gambette
      (LIRMM – Université Montpellier 2 / CNRS)
Plan

• Le nuage arboré : occurrence + cooccurrence
• Des couleurs pour guider la lecture
• Processus de construction
• Implémentations
• Emplois du nuage arboré
• Illustration sur Cinna et Othon
• Perspectives
Plan

• Le nuage arboré : occurrence + cooccurrence
• Des couleurs pour guider la lecture
• Processus de construction
• Implémentations
• Emplois du nuage arboré
• Illustration sur Cinna et Othon
• Perspectives
Nuage arboré, une information double




 hiérarchie
 des mots
 occurrences

                                                  hiérarchie
                                               des concepts
                     cooccurrences

                                SplitsTree : Huson 1998,
construit avec                     Huson & Bryant 2006
                         TreeCloud en Python, license GPL
                       disponible sur http://www.treecloud.fr
Nuages de tags

• Construits depuis un ensemble de tags
• Taille de police liée à la fréquence




                                         Ce qui est habituellement cité comme
                                              le premier nuage de tags, dans
                                                   Microserfs de D. Coupland,
                                                 HarperCollins, Toronto, 1995
Nuages de mots

• Construits depuis l'ensemble des mots d'un texte
• Taille de police liée à la fréquence
• Se sont popularisés avec Wordle
• Donnent un bon aperçu d'un texte




                                                                  Nuages Wordle des mots les plus utilisés
                                                                   début 2009 dans les blogs des Top 100
                                                                            politique et high-tech de Wikio
                                     http://aixtal.blogspot.com/2009/04/web-de-quoi-parlent-les-blogs.html

         Extrait d'un nuage des mots des titres
          des 800 articles présentés à ce jour
                          aux conférences JADT
http://www.ledonline.it/ledonline/jadt-2010.html
Extraire l'information sémantique d'un texte
• analyse arborée                       Brunet (Hyperbase)
• graphe de coocurrence                 Brunet (Hyperbase)
• graphe sémantique                Grimmer (Wordmapper)
• lexicogramme récursif                     Martinez (Coocs)
• désambiguïsation lexicale               Véronis (Hyperlex)
• réseau Phrasenet            Viegas et al. (IBM Many Eyes)
• projection géodésique                      Viprey (Astartex)
Extraire l'information sémantique d'un texte
• analyse arborée                       Brunet (Hyperbase)
• graphe de coocurrence                 Brunet (Hyperbase)
• graphe sémantique                Grimmer (Wordmapper)
• lexicogramme récursif                     Martinez (Coocs)
• désambiguïsation lexicale               Véronis (Hyperlex)
• réseau Phrasenet            Viegas et al. (IBM Many Eyes)
• projection géodésique                      Viprey (Astartex)




                                    Brunet, Les séquences (suite),
                                                        JADT'08
Extraire l'information sémantique d'un texte
• analyse arborée                       Brunet (Hyperbase)
• graphe de coocurrence                 Brunet (Hyperbase)
• graphe sémantique                Grimmer (Wordmapper)
• lexicogramme récursif                     Martinez (Coocs)
• désambiguïsation lexicale               Véronis (Hyperlex)
• réseau Phrasenet            Viegas et al. (IBM Many Eyes)
• projection géodésique                      Viprey (Astartex)




                                    Mayaffre, Quand travail, famille,
                                      et patrie cooccurrent dans le
                                                discours de Nicolas
                                                  Sarkozy, JADT'08
Extraire l'information sémantique d'un texte
• analyse arborée                       Brunet (Hyperbase)
• graphe de coocurrence                 Brunet (Hyperbase)
• graphe sémantique                Grimmer (Wordmapper)
• lexicogramme récursif                     Martinez (Coocs)
• désambiguïsation lexicale               Véronis (Hyperlex)
• réseau Phrasenet            Viegas et al. (IBM Many Eyes)
• projection géodésique                      Viprey (Astartex)




                                                   Peyrat-Guillard,
                                             Analyse du discours
                                          syndical sur l’entreprise,
                                                           JADT'08
Extraire l'information sémantique d'un texte
• analyse arborée                       Brunet (Hyperbase)
• graphe de coocurrence                 Brunet (Hyperbase)
• graphe sémantique                Grimmer (Wordmapper)
• lexicogramme récursif                     Martinez (Coocs)
• désambiguïsation lexicale               Véronis (Hyperlex)
• réseau Phrasenet            Viegas et al. (IBM Many Eyes)
• projection géodésique                      Viprey (Astartex)




                                                Leblanc, Martinez
                                         L'analyse contrastive des
                                         réseaux de cooccurrence
                                                      JADT 2006.
Extraire l'information sémantique d'un texte
• analyse arborée                       Brunet (Hyperbase)
• graphe de coocurrence                 Brunet (Hyperbase)
• graphe sémantique                Grimmer (Wordmapper)
• lexicogramme récursif                     Martinez (Coocs)
• désambiguïsation lexicale               Véronis (Hyperlex)
• réseau Phrasenet            Viegas et al. (IBM Many Eyes)
• projection géodésique                      Viprey (Astartex)




                                         Désambiguïsation du mot
                                                       “barrage”.

                                                Véronis, HyperLex:
                                            Lexical Cartography for
                                        Information Retrieval, 2004
Extraire l'information sémantique d'un texte
• analyse arborée                                                    Brunet (Hyperbase)
• graphe de coocurrence                                              Brunet (Hyperbase)
• graphe sémantique                                             Grimmer (Wordmapper)
• lexicogramme récursif                                                  Martinez (Coocs)
• désambiguïsation lexicale                                            Véronis (Hyperlex)
• réseau Phrasenet                                         Viegas et al. (IBM Many Eyes)
• projection géodésique                                                   Viprey (Astartex)




                                                                      Visualisation PhraseNet de
                                                                              paroles des Beatles
                                                                      créé avec Many Eyes (IBM)
                                                                            http://many-eyes.com




http://visualthinkmap.ning.com/photo/phrasenet_beatles-many-eyes
Extraire l'information sémantique d'un texte
• analyse arborée                       Brunet (Hyperbase)
• graphe de coocurrence                 Brunet (Hyperbase)
• graphe sémantique                Grimmer (Wordmapper)
• lexicogramme récursif                     Martinez (Coocs)
• désambiguïsation lexicale               Véronis (Hyperlex)
• réseau Phrasenet            Viegas et al. (IBM Many Eyes)
• projection géodésique                      Viprey (Astartex)




                                                      Barry, Viprey,
                                            Approche comparative
                                         des résultats d'exploration
                                             textuelle des discours
                                          de deux leaders africains
                                                     Keita et Touré,
                                                           JADT'08
Plan

• Le nuage arboré : occurrence + cooccurrence
• Des couleurs pour guider la lecture
• Processus de construction
• Implémentations
• Emplois du nuage arboré
• Illustration sur Cinna et Othon
• Perspectives
Des couleurs pour guider la lecture

• coloration selon les fréquences

• coloration chronologique

• coloration de la dispersion

• coloration ciblée sur un mot

• coloration grammaticale
Des couleurs pour guider la lecture

• coloration selon les fréquences

• coloration chronologique

• coloration de la dispersion

• coloration ciblée sur un mot

• coloration grammaticale


       Nuage arboré des mots
        apparaissant 5 fois ou
          plus dans cet article
       JADT, distance Liddell,
          fenêtre de 20 mots,
             coloration Yahoo
Des couleurs pour guider la lecture
                                    rouge :
                                    début de l'article
• coloration selon les fréquences   bleu :
                                    fin de l'article
• coloration chronologique

• coloration de la dispersion

• coloration ciblée sur un mot

• coloration grammaticale


       Nuage arboré des mots
        apparaissant 5 fois ou
           plus dans cet article
       JADT, distance Liddell,
           fenêtre de 20 mots,
      coloration chronologique
Des couleurs pour guider la lecture
                                      rouge :
                                      peu dispersé
• coloration selon les fréquences     bleu :
                                      dispersé
• coloration chronologique

• coloration de la dispersion

• coloration ciblée sur un mot

• coloration grammaticale


       Nuage arboré des mots
        apparaissant 5 fois ou
          plus dans cet article
       JADT, distance Liddell,
          fenêtre de 20 mots,
         coloration dispersion
Des couleurs pour guider la lecture
                                    rouge :
                                    cooccurrents de
• coloration selon les fréquences   “cooccurrence”

• coloration chronologique

• coloration de la dispersion

• coloration ciblée sur un mot

• coloration grammaticale


       Nuage arboré des mots
         apparaissant 5 fois ou
           plus dans cet article
       JADT, distance Liddell,
            fenêtre de 20 mots,
           coloration ciblée sur
        le mot “cooccurrence”
Des couleurs pour guider la lecture
                                      noms
                                      adjectifs
• coloration selon les fréquences     verbes
                                      noms propres
• coloration chronologique

• coloration de la dispersion

• coloration ciblée sur un mot

• coloration grammaticale


         Nuage arboré des mots
           apparaissant 5 fois ou
              plus dans cet article
          JADT, distance Liddell,
              fenêtre de 20 mots,
coloration personnalisée, à partir
     d'un étiquetage TreeTagger
Plan

• Le nuage arboré : occurrence + cooccurrence
• Des couleurs pour guider la lecture
• Processus de construction
• Implémentations
• Emplois du nuage arboré
• Illustration sur Cinna et Othon
• Perspectives
Processus de construction
       Import/export
       Concordance d'un mot, lemmatisation
                ou remplacements divers...           Texte


                                       Suppression des mots vides


                                               Sélection des mots


                                      Recherche des cooccurrences


                                        Calcul des cooccurrences


                                             Construction de l'arbre


                                                Tailles des mots


                                               Couleurs des mots


                                         Dessin du nuage arboré
Processus de construction
       Import/export                                                   Proposé dans TreeCloud
       Concordance d'un mot, lemmatisation
                ou remplacements divers...           Texte


                                       Suppression des mots vides      antidico anglais, français


                                                                       n mots les plus fréquents, mots
           Mots significatifs                  Sélection des mots      apparaissant plus de n fois, ou
                                                                       liste personnalisée

                                                                       Fenêtre de cooccurrence paramétrée
                 Liste de mots        Recherche des cooccurrences      par taille et pas de glissement, ou
                 et occurrences                                        caractère séparateur


                  Matrice CSV           Calcul des cooccurrences       12 formules de cooccurrence



        Méthodes UPGMA, NJ                   Construction de l'arbre   Appel transparent à SplitsTree



                                                Tailles des mots       Fréquences ou valeurs personnalisées

           Mots significatifs
                                                                       Fréquences, chronologie, dispersion,
                                               Couleurs des mots       ciblées sur la cooccurrence d'un
                                                                       mot, ou valeurs personnalisées


        Export à divers formats          Dessin du nuage arboré        Appel à SplitsTree ou Dendroscope
Construction – les cooccurrences
De nombreuses formules de distance sémantique utilisent la
cooccurrence.
 Texte
 fenêtre
 glissante S Pas de
             glissement s
 largeur w

 matrices de cooccurrence                matrice de dissimilarité
 O11, O12, O21, O22                      sémantique
                                         chi squared, mutual
                                         information, liddel, dice,
                                         jaccard, gmean, hyperlex,
                                         minimum sensitivity, odds
                                         ratio, zscore, log likelihood,
                                         poisson-stirling...

                            Evert, Statistics of words cooccurrences, thèse, 2005
                                     Gambette, User manual for TreeCloud, 2009
Plan

• Le nuage arboré : occurrence + cooccurrence
• Des couleurs pour guider la lecture
• Processus de construction
• Implémentations
• Emplois du nuage arboré
• Illustration sur Cinna et Othon
• Perspectives
Implémentations
Logiciel libre TreeCloud (Python/Delphi) + SplitsTree (Java)




 www.treecloud.org                    www.splitstree.org
Implémentations
Logiciel libre TreeCloud (Python/Delphi) + SplitsTree (Java)
Interface web
                 www.treecloud.org
                Interface basée sur le logiciel
                libre NuageArboré de Jean-
                Charles Bontemps, en C,
                CGI/Python, et JavaScript.

                http://sourceforge.net/projects/
                nuagearbor/
Interface web
                www.treecloud.org
Plan

• Le nuage arboré : occurrence + cooccurrence
• Des couleurs pour guider la lecture
• Processus de construction
• Implémentations
• Emplois du nuage arboré
• Illustration sur Cinna et Othon
• Perspectives
Emplois du nuage arboré

 • susciter, formaliser et étayer des hypothèses de travail

 • comparer des textes selon leur représentation arborée

 • hiérarchiser l'utilisation d'autres outils textométriques

 • représenter les résultats de l'analyse
Plan

• Le nuage arboré : occurrence + cooccurrence
• Des couleurs pour guider la lecture
• Processus de construction
• Implémentations
• Emplois du nuage arboré
• Illustration sur Cinna et Othon
• Perspectives
Illustration sur Cinna et Othon




 Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon
 (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au
 début, bleu à la fin)
Illustration sur Cinna et Othon




 Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon
 (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au
 début, bleu à la fin)
Illustration sur Cinna et Othon




 Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon
 (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au
 début, bleu à la fin)
Illustration sur Cinna et Othon




 Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon
 (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au
 début, bleu à la fin)
Illustration sur Cinna et Othon




    Spécificités d'emploi de
    « Rome », « liberté » et
         « empire » chez les
 différents personnages de
        Cinna dans Lexico3.
Illustration sur Cinna et Othon




 Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon
 (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au
 début, bleu à la fin)
Illustration sur Cinna et Othon




 Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon
 (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au
 début, bleu à la fin)
Illustration sur Cinna et Othon




 Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon
 (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au
 début, bleu à la fin)
Illustration sur Cinna et Othon




 Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon
 (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au
 début, bleu à la fin)
Illustration sur Cinna et Othon




 Nuage arboré des 50 mots les plus fréquents des paroles d'Auguste dans Cinna
Illustration sur Cinna et Othon




 Nuage arboré des 50 mots les plus fréquents des paroles d'Auguste dans Cinna
Illustration sur Cinna et Othon




 Carte des sections Lexico3 et contextes de « amis » dans les paroles d'Auguste
 dans Cinna.
 1. Voilà, mes chers amis, ce qui me met en peine.
 2. Quoi ! mes plus chers amis ! quoi ! Cinna ! quoi ! Maxime !
 3. Reprenez le pouvoir que vous m'avez commis, Si donnant des sujets il ôte les amis
 4. Soyons amis, Cinna, c'est moi qui t'en convie
 5. Il nous a trahis tous ; mais ce qu'il a commis Vous conserve innocents, et me rend mes amis.
Illustration sur Cinna et Othon




 Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon
 (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au
 début, bleu à la fin)
Illustration sur Cinna et Othon




Nuage arboré des 30 mots les plus fréquents de la pièce Othon, coloré à gauche
par rapport aux cooccurrences avec « Othon », à droite par rapport à celles avec
« Galba »
Illustration sur Cinna et Othon




Nuage arboré des 30 mots les plus fréquents de la pièce Othon, coloré à gauche
par rapport aux cooccurrences avec « Othon », à droite par rapport à celles avec
« Galba »
Illustration sur Cinna et Othon




Nuage arboré des 30 mots les plus fréquents de la pièce Othon, coloré à gauche
par rapport aux cooccurrences avec « Othon », à droite par rapport à celles avec
« Galba »
Illustration sur Cinna et Othon




Nuages arborés des mots spécifiques de Cinna et Othon, dimensionnés et colorés
d'après leur spécificité calculée dans Lexico3.
Illustration sur Cinna et Othon




mots spécifiques de
Cinna et Othon d'après
Lexico3
                                      Cinna                Othon
Lieu du pouvoir et objet de la        Rome (« liberté »)   Empire (« trône »)
confrontation entre les personnages
Souverain en place                    tyran                Empereur
Membres du corps politique            amis                 maîtres / seigneurs

Moyens au service de la cause         gloire               amour matrimonial (« amour »,
politique                                                  « hymen », « choix »)
Caractérisation de la pièce           Pièce de FONDATION   Pièce de SUCCESSION DYNASTIQUE
Illustration sur Cinna et Othon




mots spécifiques de
Cinna et Othon d'après
Lexico3
                                      Cinna                Othon
Lieu du pouvoir et objet de la        Rome (« liberté »)   Empire (« trône »)
confrontation entre les personnages
Souverain en place                    tyran                Empereur
Membres du corps politique            amis                 maîtres / seigneurs

Moyens au service de la cause         gloire               amour matrimonial (« amour »,
politique                                                  « hymen », « choix »)
Caractérisation de la pièce           Pièce de FONDATION   Pièce de SUCCESSION DYNASTIQUE
Illustration sur Cinna et Othon




mots spécifiques de
Cinna et Othon d'après
Lexico3
                                      Cinna                Othon
Lieu du pouvoir et objet de la        Rome (« liberté »)   Empire (« trône »)
confrontation entre les personnages
Souverain en place                    tyran                Empereur
Membres du corps politique            amis                 maîtres / seigneurs

Moyens au service de la cause         gloire               amour matrimonial (« amour »,
politique                                                  « hymen », « choix »)
Caractérisation de la pièce           Pièce de FONDATION   Pièce de SUCCESSION DYNASTIQUE
Plan

• Le nuage arboré : occurrence + cooccurrence
• Des couleurs pour guider la lecture
• Processus de construction
• Implémentations
• Emplois du nuage arboré
• Illustration sur Cinna et Othon
• Perspectives
Perspectives

 • intégration de la visualisation en nuages arborés
     • dans les outils de textométrie existants
     • par des interfaces d'import/export adaptées
     • pour faciliter le retour au texte

 • amélioration des méthodes de construction
    • transformée de Farris pour le calcul des distances
    • algorithme de Luong pour le calcul de l'arbre




                                     http://www.treecloud.org
Question

 Limites sur la taille du corpus pour utiliser TreeCloud ?




 30 secondes pour la construction du nuage arboré de
 l'ensemble des discours de campagne de Barack Obama
 (>300 000 mots)

Contenu connexe

Plus de Philippe Gambette

Quadruplets et réseaux non enracinés de niveau k
Quadruplets et réseaux non enracinés de niveau kQuadruplets et réseaux non enracinés de niveau k
Quadruplets et réseaux non enracinés de niveau kPhilippe Gambette
 
Géolocalisation de données et conception de cartes interactives
Géolocalisation de données et conception de cartes interactivesGéolocalisation de données et conception de cartes interactives
Géolocalisation de données et conception de cartes interactivesPhilippe Gambette
 
Reconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiquesReconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiquesPhilippe Gambette
 
The Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksThe Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksPhilippe Gambette
 
Estimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues CarambarEstimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues CarambarPhilippe Gambette
 
On restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsOn restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsPhilippe Gambette
 
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Philippe Gambette
 
Visualising a text with a tree cloud
Visualising a text with a tree cloudVisualising a text with a tree cloud
Visualising a text with a tree cloudPhilippe Gambette
 

Plus de Philippe Gambette (8)

Quadruplets et réseaux non enracinés de niveau k
Quadruplets et réseaux non enracinés de niveau kQuadruplets et réseaux non enracinés de niveau k
Quadruplets et réseaux non enracinés de niveau k
 
Géolocalisation de données et conception de cartes interactives
Géolocalisation de données et conception de cartes interactivesGéolocalisation de données et conception de cartes interactives
Géolocalisation de données et conception de cartes interactives
 
Reconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiquesReconstruction combinatoire de réseaux phylogénétiques
Reconstruction combinatoire de réseaux phylogénétiques
 
The Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic NetworksThe Structure of Level-k Phylogenetic Networks
The Structure of Level-k Phylogenetic Networks
 
Estimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues CarambarEstimation du nombre de citations de papillotes et de blagues Carambar
Estimation du nombre de citations de papillotes et de blagues Carambar
 
On restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphsOn restrictions of balanced 2-interval graphs
On restrictions of balanced 2-interval graphs
 
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
Reconstruction de reseaux phylogenetiques a structure arboree depuis un ensem...
 
Visualising a text with a tree cloud
Visualising a text with a tree cloudVisualising a text with a tree cloud
Visualising a text with a tree cloud
 

Dernier

Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxikospam0
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetJeanYvesMoine
 
Cours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiquesCours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiquesMohammedAmineHatoch
 
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...Universidad Complutense de Madrid
 
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxIntégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxabdououanighd
 
les_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkles_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkRefRama
 
STRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdf
STRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdfSTRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdf
STRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdfGamal Mansour
 
Les roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxLes roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxShinyaHilalYamanaka
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfAmgdoulHatim
 
L'expression du but : fiche et exercices niveau C1 FLE
L'expression du but : fiche et exercices  niveau C1 FLEL'expression du but : fiche et exercices  niveau C1 FLE
L'expression du but : fiche et exercices niveau C1 FLElebaobabbleu
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxhamzagame
 
658708519-Power-Point-Management-Interculturel.pdf
658708519-Power-Point-Management-Interculturel.pdf658708519-Power-Point-Management-Interculturel.pdf
658708519-Power-Point-Management-Interculturel.pdfMariaClaraAlves46
 
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANKRAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANKNassimaMdh
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...Nguyen Thanh Tu Collection
 
Formation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxFormation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxrajaakiass01
 
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Technologia Formation
 
Neuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean EudesNeuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean EudesUnidad de Espiritualidad Eudista
 
La mondialisation avantages et inconvénients
La mondialisation avantages et inconvénientsLa mondialisation avantages et inconvénients
La mondialisation avantages et inconvénientsJaouadMhirach
 
Télécommunication et transport .pdfcours
Télécommunication et transport .pdfcoursTélécommunication et transport .pdfcours
Télécommunication et transport .pdfcourshalima98ahlmohamed
 

Dernier (20)

Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
 
Cours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiquesCours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiques
 
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
 
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxIntégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
 
les_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkles_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhk
 
STRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdf
STRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdfSTRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdf
STRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdf
 
Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024
 
Les roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxLes roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptx
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
 
L'expression du but : fiche et exercices niveau C1 FLE
L'expression du but : fiche et exercices  niveau C1 FLEL'expression du but : fiche et exercices  niveau C1 FLE
L'expression du but : fiche et exercices niveau C1 FLE
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptx
 
658708519-Power-Point-Management-Interculturel.pdf
658708519-Power-Point-Management-Interculturel.pdf658708519-Power-Point-Management-Interculturel.pdf
658708519-Power-Point-Management-Interculturel.pdf
 
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANKRAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
Formation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxFormation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptx
 
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
 
Neuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean EudesNeuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean Eudes
 
La mondialisation avantages et inconvénients
La mondialisation avantages et inconvénientsLa mondialisation avantages et inconvénients
La mondialisation avantages et inconvénients
 
Télécommunication et transport .pdfcours
Télécommunication et transport .pdfcoursTélécommunication et transport .pdfcours
Télécommunication et transport .pdfcours
 

Utilisation de la visualisation en nuage arboré pour l'analyse littéraire

  • 1. JADT 2010 - 11/06/2010 Rome Utilisation de la visualisation en nuage arboré pour l'analyse littéraire Delphine Amstutz (CELLF – Université Paris-Sorbonne Paris 4 / CNRS) Philippe Gambette (LIRMM – Université Montpellier 2 / CNRS)
  • 2. Plan • Le nuage arboré : occurrence + cooccurrence • Des couleurs pour guider la lecture • Processus de construction • Implémentations • Emplois du nuage arboré • Illustration sur Cinna et Othon • Perspectives
  • 3. Plan • Le nuage arboré : occurrence + cooccurrence • Des couleurs pour guider la lecture • Processus de construction • Implémentations • Emplois du nuage arboré • Illustration sur Cinna et Othon • Perspectives
  • 4. Nuage arboré, une information double hiérarchie des mots occurrences hiérarchie des concepts cooccurrences SplitsTree : Huson 1998, construit avec Huson & Bryant 2006 TreeCloud en Python, license GPL disponible sur http://www.treecloud.fr
  • 5. Nuages de tags • Construits depuis un ensemble de tags • Taille de police liée à la fréquence Ce qui est habituellement cité comme le premier nuage de tags, dans Microserfs de D. Coupland, HarperCollins, Toronto, 1995
  • 6. Nuages de mots • Construits depuis l'ensemble des mots d'un texte • Taille de police liée à la fréquence • Se sont popularisés avec Wordle • Donnent un bon aperçu d'un texte Nuages Wordle des mots les plus utilisés début 2009 dans les blogs des Top 100 politique et high-tech de Wikio http://aixtal.blogspot.com/2009/04/web-de-quoi-parlent-les-blogs.html Extrait d'un nuage des mots des titres des 800 articles présentés à ce jour aux conférences JADT http://www.ledonline.it/ledonline/jadt-2010.html
  • 7. Extraire l'information sémantique d'un texte • analyse arborée Brunet (Hyperbase) • graphe de coocurrence Brunet (Hyperbase) • graphe sémantique Grimmer (Wordmapper) • lexicogramme récursif Martinez (Coocs) • désambiguïsation lexicale Véronis (Hyperlex) • réseau Phrasenet Viegas et al. (IBM Many Eyes) • projection géodésique Viprey (Astartex)
  • 8. Extraire l'information sémantique d'un texte • analyse arborée Brunet (Hyperbase) • graphe de coocurrence Brunet (Hyperbase) • graphe sémantique Grimmer (Wordmapper) • lexicogramme récursif Martinez (Coocs) • désambiguïsation lexicale Véronis (Hyperlex) • réseau Phrasenet Viegas et al. (IBM Many Eyes) • projection géodésique Viprey (Astartex) Brunet, Les séquences (suite), JADT'08
  • 9. Extraire l'information sémantique d'un texte • analyse arborée Brunet (Hyperbase) • graphe de coocurrence Brunet (Hyperbase) • graphe sémantique Grimmer (Wordmapper) • lexicogramme récursif Martinez (Coocs) • désambiguïsation lexicale Véronis (Hyperlex) • réseau Phrasenet Viegas et al. (IBM Many Eyes) • projection géodésique Viprey (Astartex) Mayaffre, Quand travail, famille, et patrie cooccurrent dans le discours de Nicolas Sarkozy, JADT'08
  • 10. Extraire l'information sémantique d'un texte • analyse arborée Brunet (Hyperbase) • graphe de coocurrence Brunet (Hyperbase) • graphe sémantique Grimmer (Wordmapper) • lexicogramme récursif Martinez (Coocs) • désambiguïsation lexicale Véronis (Hyperlex) • réseau Phrasenet Viegas et al. (IBM Many Eyes) • projection géodésique Viprey (Astartex) Peyrat-Guillard, Analyse du discours syndical sur l’entreprise, JADT'08
  • 11. Extraire l'information sémantique d'un texte • analyse arborée Brunet (Hyperbase) • graphe de coocurrence Brunet (Hyperbase) • graphe sémantique Grimmer (Wordmapper) • lexicogramme récursif Martinez (Coocs) • désambiguïsation lexicale Véronis (Hyperlex) • réseau Phrasenet Viegas et al. (IBM Many Eyes) • projection géodésique Viprey (Astartex) Leblanc, Martinez L'analyse contrastive des réseaux de cooccurrence JADT 2006.
  • 12. Extraire l'information sémantique d'un texte • analyse arborée Brunet (Hyperbase) • graphe de coocurrence Brunet (Hyperbase) • graphe sémantique Grimmer (Wordmapper) • lexicogramme récursif Martinez (Coocs) • désambiguïsation lexicale Véronis (Hyperlex) • réseau Phrasenet Viegas et al. (IBM Many Eyes) • projection géodésique Viprey (Astartex) Désambiguïsation du mot “barrage”. Véronis, HyperLex: Lexical Cartography for Information Retrieval, 2004
  • 13. Extraire l'information sémantique d'un texte • analyse arborée Brunet (Hyperbase) • graphe de coocurrence Brunet (Hyperbase) • graphe sémantique Grimmer (Wordmapper) • lexicogramme récursif Martinez (Coocs) • désambiguïsation lexicale Véronis (Hyperlex) • réseau Phrasenet Viegas et al. (IBM Many Eyes) • projection géodésique Viprey (Astartex) Visualisation PhraseNet de paroles des Beatles créé avec Many Eyes (IBM) http://many-eyes.com http://visualthinkmap.ning.com/photo/phrasenet_beatles-many-eyes
  • 14. Extraire l'information sémantique d'un texte • analyse arborée Brunet (Hyperbase) • graphe de coocurrence Brunet (Hyperbase) • graphe sémantique Grimmer (Wordmapper) • lexicogramme récursif Martinez (Coocs) • désambiguïsation lexicale Véronis (Hyperlex) • réseau Phrasenet Viegas et al. (IBM Many Eyes) • projection géodésique Viprey (Astartex) Barry, Viprey, Approche comparative des résultats d'exploration textuelle des discours de deux leaders africains Keita et Touré, JADT'08
  • 15. Plan • Le nuage arboré : occurrence + cooccurrence • Des couleurs pour guider la lecture • Processus de construction • Implémentations • Emplois du nuage arboré • Illustration sur Cinna et Othon • Perspectives
  • 16. Des couleurs pour guider la lecture • coloration selon les fréquences • coloration chronologique • coloration de la dispersion • coloration ciblée sur un mot • coloration grammaticale
  • 17. Des couleurs pour guider la lecture • coloration selon les fréquences • coloration chronologique • coloration de la dispersion • coloration ciblée sur un mot • coloration grammaticale Nuage arboré des mots apparaissant 5 fois ou plus dans cet article JADT, distance Liddell, fenêtre de 20 mots, coloration Yahoo
  • 18. Des couleurs pour guider la lecture rouge : début de l'article • coloration selon les fréquences bleu : fin de l'article • coloration chronologique • coloration de la dispersion • coloration ciblée sur un mot • coloration grammaticale Nuage arboré des mots apparaissant 5 fois ou plus dans cet article JADT, distance Liddell, fenêtre de 20 mots, coloration chronologique
  • 19. Des couleurs pour guider la lecture rouge : peu dispersé • coloration selon les fréquences bleu : dispersé • coloration chronologique • coloration de la dispersion • coloration ciblée sur un mot • coloration grammaticale Nuage arboré des mots apparaissant 5 fois ou plus dans cet article JADT, distance Liddell, fenêtre de 20 mots, coloration dispersion
  • 20. Des couleurs pour guider la lecture rouge : cooccurrents de • coloration selon les fréquences “cooccurrence” • coloration chronologique • coloration de la dispersion • coloration ciblée sur un mot • coloration grammaticale Nuage arboré des mots apparaissant 5 fois ou plus dans cet article JADT, distance Liddell, fenêtre de 20 mots, coloration ciblée sur le mot “cooccurrence”
  • 21. Des couleurs pour guider la lecture noms adjectifs • coloration selon les fréquences verbes noms propres • coloration chronologique • coloration de la dispersion • coloration ciblée sur un mot • coloration grammaticale Nuage arboré des mots apparaissant 5 fois ou plus dans cet article JADT, distance Liddell, fenêtre de 20 mots, coloration personnalisée, à partir d'un étiquetage TreeTagger
  • 22. Plan • Le nuage arboré : occurrence + cooccurrence • Des couleurs pour guider la lecture • Processus de construction • Implémentations • Emplois du nuage arboré • Illustration sur Cinna et Othon • Perspectives
  • 23. Processus de construction Import/export Concordance d'un mot, lemmatisation ou remplacements divers... Texte Suppression des mots vides Sélection des mots Recherche des cooccurrences Calcul des cooccurrences Construction de l'arbre Tailles des mots Couleurs des mots Dessin du nuage arboré
  • 24. Processus de construction Import/export Proposé dans TreeCloud Concordance d'un mot, lemmatisation ou remplacements divers... Texte Suppression des mots vides antidico anglais, français n mots les plus fréquents, mots Mots significatifs Sélection des mots apparaissant plus de n fois, ou liste personnalisée Fenêtre de cooccurrence paramétrée Liste de mots Recherche des cooccurrences par taille et pas de glissement, ou et occurrences caractère séparateur Matrice CSV Calcul des cooccurrences 12 formules de cooccurrence Méthodes UPGMA, NJ Construction de l'arbre Appel transparent à SplitsTree Tailles des mots Fréquences ou valeurs personnalisées Mots significatifs Fréquences, chronologie, dispersion, Couleurs des mots ciblées sur la cooccurrence d'un mot, ou valeurs personnalisées Export à divers formats Dessin du nuage arboré Appel à SplitsTree ou Dendroscope
  • 25. Construction – les cooccurrences De nombreuses formules de distance sémantique utilisent la cooccurrence. Texte fenêtre glissante S Pas de glissement s largeur w matrices de cooccurrence matrice de dissimilarité O11, O12, O21, O22 sémantique chi squared, mutual information, liddel, dice, jaccard, gmean, hyperlex, minimum sensitivity, odds ratio, zscore, log likelihood, poisson-stirling... Evert, Statistics of words cooccurrences, thèse, 2005 Gambette, User manual for TreeCloud, 2009
  • 26. Plan • Le nuage arboré : occurrence + cooccurrence • Des couleurs pour guider la lecture • Processus de construction • Implémentations • Emplois du nuage arboré • Illustration sur Cinna et Othon • Perspectives
  • 27. Implémentations Logiciel libre TreeCloud (Python/Delphi) + SplitsTree (Java) www.treecloud.org www.splitstree.org
  • 28. Implémentations Logiciel libre TreeCloud (Python/Delphi) + SplitsTree (Java)
  • 29. Interface web www.treecloud.org Interface basée sur le logiciel libre NuageArboré de Jean- Charles Bontemps, en C, CGI/Python, et JavaScript. http://sourceforge.net/projects/ nuagearbor/
  • 30. Interface web www.treecloud.org
  • 31. Plan • Le nuage arboré : occurrence + cooccurrence • Des couleurs pour guider la lecture • Processus de construction • Implémentations • Emplois du nuage arboré • Illustration sur Cinna et Othon • Perspectives
  • 32. Emplois du nuage arboré • susciter, formaliser et étayer des hypothèses de travail • comparer des textes selon leur représentation arborée • hiérarchiser l'utilisation d'autres outils textométriques • représenter les résultats de l'analyse
  • 33. Plan • Le nuage arboré : occurrence + cooccurrence • Des couleurs pour guider la lecture • Processus de construction • Implémentations • Emplois du nuage arboré • Illustration sur Cinna et Othon • Perspectives
  • 34. Illustration sur Cinna et Othon Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au début, bleu à la fin)
  • 35. Illustration sur Cinna et Othon Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au début, bleu à la fin)
  • 36. Illustration sur Cinna et Othon Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au début, bleu à la fin)
  • 37. Illustration sur Cinna et Othon Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au début, bleu à la fin)
  • 38. Illustration sur Cinna et Othon Spécificités d'emploi de « Rome », « liberté » et « empire » chez les différents personnages de Cinna dans Lexico3.
  • 39. Illustration sur Cinna et Othon Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au début, bleu à la fin)
  • 40. Illustration sur Cinna et Othon Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au début, bleu à la fin)
  • 41. Illustration sur Cinna et Othon Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au début, bleu à la fin)
  • 42. Illustration sur Cinna et Othon Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au début, bleu à la fin)
  • 43. Illustration sur Cinna et Othon Nuage arboré des 50 mots les plus fréquents des paroles d'Auguste dans Cinna
  • 44. Illustration sur Cinna et Othon Nuage arboré des 50 mots les plus fréquents des paroles d'Auguste dans Cinna
  • 45. Illustration sur Cinna et Othon Carte des sections Lexico3 et contextes de « amis » dans les paroles d'Auguste dans Cinna. 1. Voilà, mes chers amis, ce qui me met en peine. 2. Quoi ! mes plus chers amis ! quoi ! Cinna ! quoi ! Maxime ! 3. Reprenez le pouvoir que vous m'avez commis, Si donnant des sujets il ôte les amis 4. Soyons amis, Cinna, c'est moi qui t'en convie 5. Il nous a trahis tous ; mais ce qu'il a commis Vous conserve innocents, et me rend mes amis.
  • 46. Illustration sur Cinna et Othon Nuages arborés globaux des 60 mots les plus fréquents dans Cinna et Othon (distance Liddell, fenêtre de largeur 20), colorés chronologiquement (rouge au début, bleu à la fin)
  • 47. Illustration sur Cinna et Othon Nuage arboré des 30 mots les plus fréquents de la pièce Othon, coloré à gauche par rapport aux cooccurrences avec « Othon », à droite par rapport à celles avec « Galba »
  • 48. Illustration sur Cinna et Othon Nuage arboré des 30 mots les plus fréquents de la pièce Othon, coloré à gauche par rapport aux cooccurrences avec « Othon », à droite par rapport à celles avec « Galba »
  • 49. Illustration sur Cinna et Othon Nuage arboré des 30 mots les plus fréquents de la pièce Othon, coloré à gauche par rapport aux cooccurrences avec « Othon », à droite par rapport à celles avec « Galba »
  • 50. Illustration sur Cinna et Othon Nuages arborés des mots spécifiques de Cinna et Othon, dimensionnés et colorés d'après leur spécificité calculée dans Lexico3.
  • 51. Illustration sur Cinna et Othon mots spécifiques de Cinna et Othon d'après Lexico3 Cinna Othon Lieu du pouvoir et objet de la Rome (« liberté ») Empire (« trône ») confrontation entre les personnages Souverain en place tyran Empereur Membres du corps politique amis maîtres / seigneurs Moyens au service de la cause gloire amour matrimonial (« amour », politique « hymen », « choix ») Caractérisation de la pièce Pièce de FONDATION Pièce de SUCCESSION DYNASTIQUE
  • 52. Illustration sur Cinna et Othon mots spécifiques de Cinna et Othon d'après Lexico3 Cinna Othon Lieu du pouvoir et objet de la Rome (« liberté ») Empire (« trône ») confrontation entre les personnages Souverain en place tyran Empereur Membres du corps politique amis maîtres / seigneurs Moyens au service de la cause gloire amour matrimonial (« amour », politique « hymen », « choix ») Caractérisation de la pièce Pièce de FONDATION Pièce de SUCCESSION DYNASTIQUE
  • 53. Illustration sur Cinna et Othon mots spécifiques de Cinna et Othon d'après Lexico3 Cinna Othon Lieu du pouvoir et objet de la Rome (« liberté ») Empire (« trône ») confrontation entre les personnages Souverain en place tyran Empereur Membres du corps politique amis maîtres / seigneurs Moyens au service de la cause gloire amour matrimonial (« amour », politique « hymen », « choix ») Caractérisation de la pièce Pièce de FONDATION Pièce de SUCCESSION DYNASTIQUE
  • 54. Plan • Le nuage arboré : occurrence + cooccurrence • Des couleurs pour guider la lecture • Processus de construction • Implémentations • Emplois du nuage arboré • Illustration sur Cinna et Othon • Perspectives
  • 55. Perspectives • intégration de la visualisation en nuages arborés • dans les outils de textométrie existants • par des interfaces d'import/export adaptées • pour faciliter le retour au texte • amélioration des méthodes de construction • transformée de Farris pour le calcul des distances • algorithme de Luong pour le calcul de l'arbre http://www.treecloud.org
  • 56. Question Limites sur la taille du corpus pour utiliser TreeCloud ? 30 secondes pour la construction du nuage arboré de l'ensemble des discours de campagne de Barack Obama (>300 000 mots)