Traduction automatique en
        logiciel libre pour les

        entreprises



Bordeaux, 6 juillet 2010
Garbiñe Aranbar...
Présentation




                                                                      ELEKA
TA et logiciel libre
Apertium...
Moteurs de traduction
                                                                   en logiciel libre
Présentation


...
Basé sur les
                                                                                                       techno...
Présentation
TA et logiciel libre
Apertium et Matxin
Apertium
         Modules
         Adaptations
                   Lin...
Pratique et accessible
Présentation
TA et logiciel libre
Apertium et Matxin
Apertium
         Modules
         Adaptations...
Qualité: réviser toujours!

Présentation
TA et logiciel libre
Apertium et Matxin
Apertium
         Modules
         Adapta...
TA : accélère la traduction

                                        Logiciel libre
Présentation
TA et logiciel libre     ...
Moteurs de traduction
                                                                   en logiciel libre
Présentation


...
Apertium au début
Présentation
TA et logiciel libre
Apertium et Matxin
Apertium
         Modules
         Adaptations
    ...
Modules de transfert superficiel d'Apertium
                              Texte source                 De-formatage



Pré...
ES: He recibido un pagaré.
...
Modules
Texte source
Deformatage
Analyse morphol.
Désambiguïsation
Transfert
Générateur
Pos...
De-formatage:

                                             He recibido un pagaré.
...
Modules
Texte source
Deformatage
An...
Analyse morphologique:
                   He: He/Haber, verbe, pŕes. indic., 1er p. sg.

                   recibido: reci...
Désambiguïsation lexique:
                   He: Haber, verbe indic., 1er p. sg.

                   recibido: recibir, ve...
Transfert structurel et lexical
                   He: (haber) pp1, sg – (avoir) pp1, sg.

                   recibido: (r...
Génération morphologique

...
Modules
Texte source
                                         ~Je ai reçu un billet à ordre~...
Post-génération

...
Modules
Texte source
                                         J'ai reçu un billet à ordre.
Deformatag...
Reformatage

...
Modules
Texte source
Deformatage
                                  J'ai reçu un billet à ordre.
Analyse m...
...
Modules
Texte source
Deformatage
Analyse morphol.
Désambiguïsation
Transfert
Générateur
Postgenerador
Reformatage
Trad...
Apertium aujourd'hui
                                       Paires de langues de
Présentation


                          ...
Adaptations linguistiques

Présentation
TA et logiciel libre                   Objectifs
Apertium et Matxin
Apertium
     ...
scie/sierra - sierra (fr-es)
                                       sierra-sierra
Présentation
TA et logiciel libre
      ...
Une maison d'édition
Présentation
TA et logiciel libre
Apertium et Matxin
Apertium
         Modules
         Adaptations
 ...
Plusieurs domaines:
                                                   es-ca / es-gl
Présentation
TA et logiciel libre
Ape...
Une association de
                                                           « trainières »
Présentation
TA et logiciel l...
Terminologie spécifique:
                                         Remo-oar
Présentation
TA et logiciel libre              ...
Une société financière
Présentation
TA et logiciel libre
Apertium et Matxin
Apertium
         Modules
         Adaptations...
Terminologie financière (multiwords):

                                       payer en espèces -

Présentation            ...
Intégrations
Présentation
TA et logiciel libre
Apertium et Matxin
Apertium
         Modules
                              ...
Mise en œuvre

Présentation
TA et logiciel libre
                                       Intégrer Apertium dans le SGC
Aper...
Moteurs de traduction
                                                                   en logiciel libre
Présentation
TA...
RBMT
                                                         ES                                            EU
Présentatio...
Modules de transfert profond de Matxin
                              Texte source                 De-formatage


Présentat...
Apertium (transfert superficiel)                                             Matxin

                                     ...
Différences entre ES et EU
Présentation
TA et logiciel libre
Apertium et Matxin
Apertium
         Modules
         Adaptat...
«para los de la casa = etxekoentzako»
                                                 (« pour ceux de la maison »)

Prése...
Adaptation terminologique
Présentation
TA et logiciel libre
Apertium et Matxin
Apertium
         Modules
         Adaptati...
Polysémie
Présentation
TA et logiciel libre
Apertium et Matxin                                ES                          ...
Signifiants semblables en espagnol et en

Présentation                           basque:
TA et logiciel libre
Apertium et ...
Multiwords
                                       NP: Pilar del Castillo => gazteluko mugarri

Présentation               ...
SMT
                                                   EU                                                  ES
Présentation...
Défis
                                       Matxin: ES<->EU productif

Présentation
TA et logiciel libre
Apertium et Matx...
Basé sur les
                                                                                                       techno...
Merci beaucoup!

garbine@eleka.net | www.eleka.net




     Traduction automatique en logiciel libre pour les entreprises ...
Upcoming SlideShare
Loading in …5
×

Ta logiciel libre pour les entreprises fr

1,029 views

Published on

Published in: Technology, Business
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,029
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
6
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Ta logiciel libre pour les entreprises fr

  1. 1. Traduction automatique en logiciel libre pour les entreprises Bordeaux, 6 juillet 2010 Garbiñe Aranbarri Traduction automatique en logiciel libre pour les entreprises 09/07/2010 1/45
  2. 2. Présentation ELEKA TA et logiciel libre Apertium et Matxin Apertium Modules Adaptations Linguistiques édition sports finance Intégrations www.eleka.net info@eleka.net Matxin ES-EU Modules ESǂEU Adaptations EU-ES Conclusion Traduction automatique en logiciel libre pour les entreprises 09/07/2010 2/45
  3. 3. Moteurs de traduction en logiciel libre Présentation Apertium TA et logiciel libre Apertium et Matxin Apertium Modules Adaptations Linguistiques http://sourceforge.net/projects/apertium/files/ édition sports finance Matxin Intégrations Matxin ES-EU Modules http://sourceforge.net/projects/matxin/files/ ESǂEU Adaptations EU-ES Conclusion Traduction automatique en logiciel libre pour les entreprises 09/07/2010 3/45
  4. 4. Basé sur les technologies Apertium Présentation TA et logiciel libre Matxin Traduction automatique en Apertium et Matxin Apertium Modules code source libre Adaptations Linguistiques édition sports finance Intégrations Matxin ES-EU www.opentrad.com Modules ESǂEU Adaptations EU-ES Conclusion Traduction automatique en logiciel libre pour les entreprises 09/07/2010 4/45
  5. 5. Présentation TA et logiciel libre Apertium et Matxin Apertium Modules Adaptations Linguistiques édition sports finance Intégrations Matxin ES-EU Modules ESǂEU Adaptations EU-ES Conclusion Traduction automatique en logiciel libre pour les entreprises 09/07/2010 5/45
  6. 6. Pratique et accessible Présentation TA et logiciel libre Apertium et Matxin Apertium Modules Adaptations Linguistiques édition sports finance Intégrations Matxin ES-EU Modules ESǂEU Adaptations EU-ES Conclusion Traduction automatique en logiciel libre pour les entreprises 09/07/2010 6/45
  7. 7. Qualité: réviser toujours! Présentation TA et logiciel libre Apertium et Matxin Apertium Modules Adaptations Linguistiques édition sports finance Intégrations Matxin ES-EU Modules ESǂEU Adaptations EU-ES Conclusion Traduction automatique en logiciel libre pour les entreprises 09/07/2010 7/45
  8. 8. TA : accélère la traduction Logiciel libre Présentation TA et logiciel libre améliorations continuels Apertium et Matxin Apertium Modules Adaptations souplesse pour les adaptations Linguistiques édition sports finance Intégrations Matxin ES-EU Modules ESǂEU Adaptations EU-ES Conclusion Traduction automatique en logiciel libre pour les entreprises 09/07/2010 8/45
  9. 9. Moteurs de traduction en logiciel libre Présentation Apertium TA et logiciel libre Apertium et Matxin Apertium Modules Adaptations Linguistiques http://sourceforge.net/projects/apertium/files/ édition sports finance Matxin ES-EU Intégrations Matxin Modules http://sourceforge.net/projects/matxin/files/ ESǂEU Adaptations EU-ES Conclusion Traduction automatique en logiciel libre pour les entreprises 09/07/2010 9/45
  10. 10. Apertium au début Présentation TA et logiciel libre Apertium et Matxin Apertium Modules Adaptations Linguistiques édition sports finance Intégrations Matxin ES-EU Modules ESǂEU Adaptations Paires de langues de la même famille EU-ES Conclusion Transfert superficiel Traduction automatique en logiciel libre pour les entreprises 09/07/2010 10/45
  11. 11. Modules de transfert superficiel d'Apertium Texte source De-formatage Présentation Analyse morphologique TA et logiciel libre Apertium et Matxin Apertium Modules Désambiguïsation lexique Adaptations Linguistiques édition sports Transfert structurel Transfert lexical finance Intégrations Matxin ES-EU Génération morphologique Modules ESǂEU Adaptations EU-ES Post-génération Conclusion Reformatage Traduction Traduction automatique en logiciel libre pour les entreprises 09/07/2010 11/45
  12. 12. ES: He recibido un pagaré. ... Modules Texte source Deformatage Analyse morphol. Désambiguïsation Transfert Générateur Postgenerador Reformatage Traduction ... Traduction automatique en logiciel libre pour les entreprises 09/07/2010 12/45
  13. 13. De-formatage: He recibido un pagaré. ... Modules Texte source Deformatage Analyse morphol. Désambiguïsation Transfert Générateur Postgenerador Reformatage Traduction ... Traduction automatique en logiciel libre pour les entreprises 09/07/2010 13/45
  14. 14. Analyse morphologique: He: He/Haber, verbe, pŕes. indic., 1er p. sg. recibido: recibido/recibido, adj, m. sg. / recibir, verbe, participe, m. sg. ... Modules Texte source Deformatage un: un/uno, det, ind, m. sg. Analyse morphol. Désambiguïsation pagaré: pagaré/pagaré, n, m. sg. / pagar, verbe, futur indic, 1er p. sg. Transfert Générateur Postgenerador Reformatage Traduction ... Traduction automatique en logiciel libre pour les entreprises 09/07/2010 14/45
  15. 15. Désambiguïsation lexique: He: Haber, verbe indic., 1er p. sg. recibido: recibir, verbe, participe, m. sg. ... Modules Texte source Deformatage un: uno, det., ind, m. sg. Analyse morphol. Désambiguïsation pagaré: pagaré, n, m. sg. Transfert Générateur Postgenerador Reformatage Traduction ... Traduction automatique en logiciel libre pour les entreprises 09/07/2010 15/45
  16. 16. Transfert structurel et lexical He: (haber) pp1, sg – (avoir) pp1, sg. recibido: (recibir) participe, m, sg – (recevoir) participe,m, sg. ... Modules Texte source un: (uno) det, ind, m, sg – (un) det, ind, m, sg. Deformatage Analyse morphol. pagaré: (pagaré) n, m, sg – billet (m, sg) à ordre Désambiguïsation Transfert Générateur Postgenerador Reformatage Traduction ... Traduction automatique en logiciel libre pour les entreprises 09/07/2010 16/45
  17. 17. Génération morphologique ... Modules Texte source ~Je ai reçu un billet à ordre~.~ Deformatage Analyse morphol. Désambiguïsation Transfert Générateur Postgenerador Reformatage Traduction ... Traduction automatique en logiciel libre pour les entreprises 09/07/2010 17/45
  18. 18. Post-génération ... Modules Texte source J'ai reçu un billet à ordre. Deformatage Analyse morphol. Désambiguïsation Transfert Générateur Postgenerador Reformatage Traduction ... Traduction automatique en logiciel libre pour les entreprises 09/07/2010 18/45
  19. 19. Reformatage ... Modules Texte source Deformatage J'ai reçu un billet à ordre. Analyse morphol. Désambiguïsation Transfert Générateur Postgenerador Reformatage Traduction ... Traduction automatique en logiciel libre pour les entreprises 09/07/2010 19/45
  20. 20. ... Modules Texte source Deformatage Analyse morphol. Désambiguïsation Transfert Générateur Postgenerador Reformatage Traduction ... FR: J'ai reçu un billet à ordre. Traduction automatique en logiciel libre pour les entreprises 09/07/2010 20/45
  21. 21. Apertium aujourd'hui Paires de langues de Présentation familles différentes TA et logiciel libre Apertium et Matxin Apertium Modules Adaptations Linguistiques Transfert profond édition sports finance Entraînement statistique Intégrations Matxin ES-EU Modules des dictionnaires ESǂEU Adaptations EU-ES Conclusion Traduction automatique en logiciel libre pour les entreprises 09/07/2010 21/45
  22. 22. Adaptations linguistiques Présentation TA et logiciel libre Objectifs Apertium et Matxin Apertium Modules Adaptations Contexte Linguistiques édition sports finance Intégrations Matxin ES-EU Ex.: médias Modules ESǂEU Adaptations Compréhensible EU-ES Conclusion Général Traduction automatique en logiciel libre pour les entreprises 09/07/2010 22/45
  23. 23. scie/sierra - sierra (fr-es) sierra-sierra Présentation TA et logiciel libre scie-sierra (LR) Apertium et Matxin Apertium Modules Adaptations Linguistiques édition sports MULTIWORDS finance Intégrations Matxin ES-EU scie circulaire – sierra circular Modules ESǂEU Adaptations scie à archet – sierra de arco EU-ES Conclusion scie à ruban – sierra de cinta etc. Traduction automatique en logiciel libre pour les entreprises 09/07/2010 23/45
  24. 24. Une maison d'édition Présentation TA et logiciel libre Apertium et Matxin Apertium Modules Adaptations Linguistiques édition sports finance Intégrations Matxin ES-EU Modules ESǂEU Adaptations EU-ES Conclusion Traduction automatique en logiciel libre pour les entreprises 09/07/2010 24/45
  25. 25. Plusieurs domaines: es-ca / es-gl Présentation TA et logiciel libre Apertium et Matxin mitocondria-mitòcondria, … Apertium Modules alejandrino-alexandrí, … Adaptations Linguistiques califato-califat, … édition sports blues-blues finance Intégrations Pitágoras-Pitàgores Matxin ES-EU Modules etc ESǂEU Adaptations EU-ES Conclusion Traduction automatique en logiciel libre pour les entreprises 09/07/2010 25/45
  26. 26. Une association de « trainières » Présentation TA et logiciel libre Apertium et Matxin Apertium Modules Adaptations Linguistiques édition sports finance Intégrations Matxin ES-EU Modules ESǂEU Adaptations EU-ES Conclusion Traduction automatique en logiciel libre pour les entreprises 09/07/2010 26/45
  27. 27. Terminologie spécifique: Remo-oar Présentation TA et logiciel libre club de remo-rowing club Apertium et Matxin Apertium Modules Caja Madrid-Caja Madrid Adaptations Linguistiques édition sports (pas “Box Madrid”) finance Intégrations Matxin Zarauzko estropadak- ES-EU Modules ESǂEU Zarauzko estropadak Adaptations EU-ES Conclusion Traduction automatique en logiciel libre pour les entreprises 09/07/2010 27/45
  28. 28. Une société financière Présentation TA et logiciel libre Apertium et Matxin Apertium Modules Adaptations Linguistiques édition sports finance Intégrations Matxin ES-EU Modules ESǂEU Adaptations EU-ES Conclusion Traduction automatique en logiciel libre pour les entreprises 09/07/2010 28/45
  29. 29. Terminologie financière (multiwords): payer en espèces - Présentation pagar en metálico TA et logiciel libre Apertium et Matxin Apertium Modules Adaptations Linguistiques édition payer en liquide – sports finance Intégrations pagar en metálico (LR) Matxin ES-EU Modules ESǂEU Adaptations EU-ES billet à ordre - pagaré Conclusion Traduction automatique en logiciel libre pour les entreprises 09/07/2010 29/45
  30. 30. Intégrations Présentation TA et logiciel libre Apertium et Matxin Apertium Modules Besoins? Adaptations Linguistiques édition sports finance Quel procédure de Intégrations Matxin ES-EU Modules ESǂEU traduction? Adaptations EU-ES Conclusion Traduction automatique en logiciel libre pour les entreprises 09/07/2010 30/45
  31. 31. Mise en œuvre Présentation TA et logiciel libre Intégrer Apertium dans le SGC Apertium et Matxin Apertium Modules Adaptations Linguistiques édition Définir un API sports finance Intégrations Matxin ES-EU Modules Réadapter l'encodage ESǂEU Adaptations EU-ES Conclusion Traduction automatique en logiciel libre pour les entreprises 09/07/2010 31/45
  32. 32. Moteurs de traduction en logiciel libre Présentation TA et logiciel libre Apertium Apertium et Matxin Apertium Modules Adaptations Linguistiques édition http://sourceforge.net/projects/apertium/files/ sports finance Intégrations Matxin ES-EU Modules Matxin ESǂEU http://sourceforge.net/projects/matxin/files/ Adaptations EU-ES Conclusion Traduction automatique en logiciel libre pour les entreprises 09/07/2010 32/45
  33. 33. RBMT ES EU Présentation TA et logiciel libre Apertium et Matxin Apertium Modules Adaptations Linguistiques édition sports finance Intégrations Matxin ES-EU Modules ESǂEU Basée sur des règles Adaptations EU-ES Conclusion Transfert profond Traduction automatique en logiciel libre pour les entreprises 09/07/2010 33/45
  34. 34. Modules de transfert profond de Matxin Texte source De-formatage Présentation Analyse TA et logiciel libre Apertium et Matxin Apertium Modules Transfert structurel Transfert lexical Adaptations Linguistiques édition sports Génération syntaxique finance Intégrations Matxin ES-EU Génération morphologique Modules ESǂEU Adaptations EU-ES Post-édition Conclusion Reformatage Traduction Traduction automatique en logiciel libre pour les entreprises 09/07/2010 34/45
  35. 35. Apertium (transfert superficiel) Matxin TS Deformatage TS Deformatage Introduction Analyse morphologique Analyse profond MT and free software Apertium and Matxin Apertium Modules Désambiguïsation léxique TS TL Adaptations Linguistic A. publish sports TS TL Génération syntaxique finance Integrations Matxin ES-EU Génération morphologique Génération morphologique Modules ESǂEU Adaptations EU-ES Post-génération Post-génération Conclusion Reformatage T Reformatage T Traduction automatique en logiciel libre pour les entreprises 09/07/2010 35/45
  36. 36. Différences entre ES et EU Présentation TA et logiciel libre Apertium et Matxin Apertium Modules Adaptations ES EU Linguistiques édition flexionnelle agglutinante sports finance Matxin Intégrations flexions et prépositions mots= lexèmes + affixes ES-EU Modules ESǂEU Adaptations EU-ES Conclusion Traduction automatique en logiciel libre pour les entreprises 09/07/2010 36/45
  37. 37. «para los de la casa = etxekoentzako» (« pour ceux de la maison ») Présentation TA et logiciel libre para (prep.) etxe- (n) Apertium et Matxin Apertium Modules Adaptations los (art./m/pl) -koentzako Linguistiques édition sports (morphème= finance Intégrations de (prep.) « pour ceux de la ») Matxin ES-EU Modules ESǂEU la (art./f/sg) Adaptations EU-ES Conclusion casa (SN/f/sg) Traduction automatique en logiciel libre pour les entreprises 09/07/2010 37/45
  38. 38. Adaptation terminologique Présentation TA et logiciel libre Apertium et Matxin Apertium Modules Adaptations Améliorer le choix lexique Linguistiques édition sports Méthodologie sur les finance Intégrations Matxin corpus ES-EU Modules ESǂEU Adaptations EU-ES Conclusion Traduction automatique en logiciel libre pour les entreprises 09/07/2010 38/45
  39. 39. Polysémie Présentation TA et logiciel libre Apertium et Matxin ES EU_1 EU_2 Apertium Modules capital (m / f) hiriburu (la ville la kapitala (ensemble Adaptations Linguistiques plus imp. d'un pays) des biens) édition sports formación (f) alderdi (formation trebakuntza finance politique) (formation continue) Intégrations Matxin ES-EU Modules ESǂEU Adaptations EU-ES Conclusion Traduction automatique en logiciel libre pour les entreprises 09/07/2010 39/45
  40. 40. Signifiants semblables en espagnol et en Présentation basque: TA et logiciel libre Apertium et Matxin Apertium Modules capital => kapital Adaptations Linguistiques édition formación => formazio sports finance Intégrations Matxin ES-EU Modules ESǂEU Multiwords Adaptations EU-ES Conclusion Traduction automatique en logiciel libre pour les entreprises 09/07/2010 40/45
  41. 41. Multiwords NP: Pilar del Castillo => gazteluko mugarri Présentation (pilier du château) TA et logiciel libre Apertium et Matxin Apertium Autres: ministro de educación, política social y deporte Modules Adaptations Linguistiques édition (ministre d'éducation, politique social et sports) sports finance Intégrations recinto cerrado => esparru itxi Matxin ES-EU Modules (enceinte fermée) ESǂEU Adaptations EU-ES recinto ferial => azoka barruti Conclusion (enceinte de l'exposition) Traduction automatique en logiciel libre pour les entreprises 09/07/2010 41/45
  42. 42. SMT EU ES Présentation TA et logiciel libre Apertium et Matxin Apertium Modules Adaptations Linguistiques édition sports finance Intégrations Matxin ES-EU Modules ESǂEU Adaptations EU-ES Moses Conclusion Moins travaillée que ES-EU Traduction automatique en logiciel libre pour les entreprises 09/07/2010 42/45
  43. 43. Défis Matxin: ES<->EU productif Présentation TA et logiciel libre Apertium et Matxin Apertium : Apertium Modules Adaptations Linguistiques édition Suivre les améliorations sports finance Intégrations Créer de nouveaux paires Matxin ES-EU Modules ESǂEU Adaptations EU-ES Conclusion Suivre la recherche technologique Traduction automatique en logiciel libre pour les entreprises 09/07/2010 43/45
  44. 44. Basé sur les technologies Apertium Présentation TA et logiciel libre Matxin Traduction automatique en Apertium et Matxin Apertium Modules code source libre Adaptations Linguistiques édition sports finance Matxin Intégrations www.opentrad.com ES-EU Modules ESǂEU Adaptations EU-ES Conclusion Traduction automatique en logiciel libre pour les entreprises 09/07/2010 44/45
  45. 45. Merci beaucoup! garbine@eleka.net | www.eleka.net Traduction automatique en logiciel libre pour les entreprises 09/07/2010 45/45

×