Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Traduction des SMS

11,262 views

Published on

L’évolution des technologie de l’information et de la communication a modifié la nature de la communication.
Transmission des informations plus facile grâce aux diversités des moyens de communications utilisés tel que le SMS.

Published in: Technology
  • Be the first to comment

Traduction des SMS

  1. 1. Ecole Supérieure des Sciences et Techniques de Tunis Département : INFORMATIQUE Traduction des SMS Réalisé Par équipe n 2: khaled FAYALA Yosra HASNAOUI Blakiss HAMAD Encadré par: Taeib SADDEM Asma MDAINI Takwa LAAMIRI 2012-2013 Emna SOUISSI
  2. 2. Plan 1 Introduction 2 Problématique 3 Le langage SMS 4 Dictionnaires et corpus 5 Spécification des besoins 6 Réalisation 7 Evaluation 8 Conclusion et perspectives 2
  3. 3. Introduction  L’évolution des technologie de l’information et de la communication a modifié la nature de la communication.  Transmission des informations plus facile grâce aux diversités des moyens de communications utilisés tel que le SMS.  SMS « Short Message Service » appelé aussi texto.  Suite de caractères transmis d’un téléphone mobiles ou un terminal informatique vers un ou plusieurs autres téléphones. 3
  4. 4. Introduction Contexte du projet  Besoin d’un outil pour la traduction des mots SMS  Permet d’eclaircir la signification du message Traducteur SMS 4
  5. 5. Plan 1 Introduction 2 Problématique 5
  6. 6. Problématique  La longueur d’un SMS est limitée  Nombre de caractères réduits  La ponctuation et les espaces sont comptés  Le coût en terme du temps et d’argent  Les difficultés de saisie  Chaque touche correspond à un ensemble de caractères. Langage SMS 6
  7. 7. Problématique Objectif du projet  Etude théorique du langage SMS  Développement d’un traducteur SMS 7
  8. 8. Plan 1 Introduction 2 Problématique 3 Langage SMS 8
  9. 9. Langage SMS Définition du langage SMS  Modifie les caractéristiques orthographiques voire grammaticales de la langue française.  Réduit la longueur des messages écrits.  Vise à respecter le seuil maximum des caractères imposé par le système de la téléphonie. 9
  10. 10. Langage SMS Les procédés utilisés par le langage SMS La phonétique Le rebus typographique Procédés L’abréviation Les émotions Etirement 10
  11. 11. Langage SMS Les procédés utilisés par le langage SMS  Phonétique  Etude scientifique des sons du langage humain.  Remplace un son par une lettre ou chiffre dont ils ont la même valeur sonore 11
  12. 12. Langage SMS Les procédés utilisés par le langage SMS  Le rebus typographique  Remplace les séquences de lettres par un arrangement de chiffres, de lettres et signes divers.  Basé essentiellement sur la phonétique 12
  13. 13. Langage SMS Les procédés utilisés par le langage SMS  L’abréviation  Réduire les mots par retranchement des lettres moins pertinentes.  Les mots restent clairs et compréhensibles. 13
  14. 14. Langage SMS Les procédés utilisés par le langage SMS  Les émotions  Les émotions est la combinaison de plusieurs caractères  Exprime l’état de l’esprit d’une personne 14
  15. 15. Langage SMS Les procédés utilisés par le langage SMS  Etirement  Répétition des ponctuations et lettres  Exprime l’intensité des émotions je t’aiiiiiiiiiiiiiiiiime !!!!!!!! 15
  16. 16. Langage SMS  Les intérêts du langage SMS  La simplicité d’écriture  La rapidité de la communication  Procure un sentiment de plaisir lors de rédaction des messages. Les risques du langage SMS  Affaiblit le niveau d’orthographe.  L’oublie graduelle des règles de grammaire.  Problème de distinction entre le langage SMS et la langue française.  Difficulté de déchiffrer le langage SMS. 16
  17. 17. Plan 1 Introduction 2 Problématique 3 Langage SMS 4 Dictionnaires et corpus 17
  18. 18. Dictionnaires et corpus Les dictionnaires SMS  Le langage SMS a donné lieu à plusieurs dictionnaires spécifiques.  Un dictionnaire permet d’obtenir la signification d’un mot écrit en langage SMS.  Il existe différents dictionnaires qui sont accessibles depuis internet :  Le dictionnaires langage SMS  Le dictionnaire-sms  Le dictionnaire deblok 18
  19. 19. Dictionnaires et corpus Le dictionnaire-sms  Propose 300 mots français.  Classe par ordre alphabétique. 19
  20. 20. Dictionnaires et corpus Le dictionnaires  Interface simple et claire  Liste limitée des mots traduit 20
  21. 21. Dictionnaires et corpus Les corpus SMS  Le corpus SMS est une collection d’un grand nombre des SMS.  Rédigés par un grand nombre de personnes différentes.  Constitue une référence qui puisse servir pour des études linguistiques  Il existe différents corpus :  Le Corpus SMS de Caroline Tagg  Le Corpus du DELI  Le Projet « SMS4science » 21
  22. 22. Langage SMS Les corpus SMS  Corpus SMS de Caroline Tagg  Analyser l’orthographe, la grammaire et les abréviations dans les SMS.  Contient environ 11 000 SMS soit près de 190 000 mots.  Projet « du DELI Corpus SMS4science »  Il compte plus de 75 000 SMS grâce à 3200 participants. Ce corpus compte 13 400 SMS pour environ 156 620 mots.  Il est partie des SMS ont été récoltés par des étudiants et l’autre partie Une homogène concerne seulement les SMS d’utilisateurs d’Orange  Il est diversifié puisque les participants sont différents. 22
  23. 23. Plan 1 Introduction 2 Problématique 3 Langage SMS 3 Dictionnaires et corpus 5 Spécification des besoins 23
  24. 24. Spécification des besoins Objectif de l’application  L’application permet de traduire un SMS vers la langue française.  Permet de visualiser le pourcentage de traduction correcte.  Elle doit être  Simple  Ergonomique  Rapide 24
  25. 25. Spécification des besoins Analyse Consulter l'interface Saisir le texte en langage SMS <<include>> Utilisateur T raduire le texte saisi du langage SMS vers la langue française <<include>> Consulter le résultat de la traduction 25
  26. 26. Plan 1 Introduction 2 Problématique 3 Langage SMS 4 Dictionnaires et corpus 5 Spécification des besoins 6 Réalisation 26
  27. 27. Réalisation  La phase de réalisation consiste à : Réalisation Construction des dictionnaires Traduction.xml Dico-fr.xml Dico-fo.xml Interfaces de l’application Etapes: Découpage en tokens Traduction mots connus Traduction mots inconnus 27
  28. 28. Réalisation La construction des dictionnaires  Traduction.xml  Contient des mots SMS et leurs équivalents en français.  Dico-fr.xml  Contient que des mots français.  Dico-fo.xml  Contient des caractères alphabétiques et leurs transcriptions phonétique. 28
  29. 29. Réalisation Interfaces de l’application  Les étapes du développement de l’application sont :  Le découpage en tokens  La traduction des mots SMS connus  La traduction des mots inconnus 29
  30. 30. Réalisation Interfaces de l’application  Découpage en tokens  Le rôle de cette étape est de convertir la phrase SMS en une suite de tokens. 30
  31. 31. Réalisation Interfaces de l’application  Traduction des mots connus  Remplacer les séquences des caractères correspondant à un mot SMS présent dans le fichier « traductions.xml » en sa traduction en français.  Contient 2 étapes :  Identifier les mots  Traduire les mots 31
  32. 32. Réalisation Interfaces de l’application  Traduction des mots inconnus  Essayer de « déchiffrer » des mots SMS absents de « traduction.xml ». 32
  33. 33. Plan 1 Introduction 2 Problématique 3 Langage SMS 4 Analyse des besoins 5 Réalisation 6 Evaluation 33
  34. 34. Evaluation Objectif de l’évaluation  Evaluer le taux de réussite de traduction de notre application.  Vérifier si le projet a Objectif objectifs atteint ses  Déterminer quelles sont les forces et faiblesses de l’application. Pourquoi évaluer notre traducteur SMS ?  Émettre des recommandations pour une amélioration future 34
  35. 35. Evaluation Démarche d’évaluation  Evaluation par rapport au corpus  Utilisation d’un corpus de test « corpus-sms-test.txt » Objectif  Comparaison par rapport aux autres traducteurs existants  Traducteur 1 de site : www.TraducteurSMS.com  Traducteur 2 de site : www.Traducteur-sms.com  Traducteur 3 de site : www.aidoweb.com  Traducteur 4 de site : www.1fo.co 35
  36. 36. Evaluation Démarche d’évaluation  Evaluation par rapport au corpus Le « corpus-fr-test.txt » donne comme résultat " Mais pourquoi t'es debout? Non, j'éteins jamais mon GSM :-) " La comparaison de notre résultat et celle de corpus permet de faire les constatations suivantes :  La traduction des mots SMS connus (pq ,nan ) est correcte et identique aux résultats de « corpus-frtest.txt» .  L’apport de notre application est la signification des smileys :-) : sourire  Notre traducteur connaît le sigle GSM. 36
  37. 37. Evaluation Démarche d’évaluation  Evaluation par rapport au corpus Le « corpus-fr-test.txt » donne comme résultat "Lol... Pourquoi pas venu today? Problème d'érection ??". Notre traducteur donne :  un résultat pareil au résultat de corpus  La signification de l’abréviation lol(lot of laugh) 37
  38. 38. Evaluation  Comparaison par rapport aux autres traducteurs existants  Exemple: lé enfon manj dé pom de terrrrrrrrrr elles sont bn ;)  Traduction: les enfants mangent des pommes de terre elles sont bonnes ;) Objectif 38
  39. 39. Evaluation  Comparaison par rapport aux autres traducteurs existants  www.1fo.co  www.TraducteurSMS.com www.aidoweb.com  www.Traducteur-sms.com Observation: Observation: Traduction érronée Aucune traduction de mot « bn » des mots. Objectif 39
  40. 40. Plan 1 Introduction 2 Problématique 3 Langage SMS 4 Analyse des besoins 5 Réalisation 6 Evaluation 7 Conclusion et perspectives 40
  41. 41. Conclusion et Perspectives  Le SMS a connu un grand succès aux prés de ses usagers.  Le langage SMS est très pratique pour échanger des textos entres personnes.  Les traducteurs SMS permettent de traduire des SMS vers langage naturel.  Pas de traducteur performant jusqu’à maintenant 41
  42. 42. Conclusion et Perspectives Perspectives  Optimisation de la construction des dictionnaires  Automatisation de la construction des dictionnaires  Traitement de tous les règles orthographiques voire grammaticales. 42
  43. 43. Bibliographie http://www.linguistik-online.de/48_11/cougnonFrancois.pdf http://outils.diesenet.conseil-recherche-innovation.net/doc/Etude-Telephone-Mobile-Insertion.pdf http://dumas.ccsd.cnrs.fr/docs/00/56/19/95/PDF/CHABERT_Gaelle_M2R.pdf http://fr.wikipedia.org/wiki/Orthographes_alternatives_du_français https://forge.info.unicaen.fr/attachments/382/Rapport_final.pdf http://post.queensu.ca/~lessardg/Cours/215/chap2.html http://www.linternaute.com/dictionnaire/fr/definition/abreviation/ http://www.texto.exionnaire.com/annuaire-sites-sms.php http://www.sms4science.org/?q=fr%2Fnode%2F2 43
  44. 44. Merci Pour Votre Attention 44

×