Fdi
Upcoming SlideShare
Loading in...5
×
 

Like this? Share it with your network

Share

Fdi

on

  • 1,873 views

Conférence au Forum des droits sur l'Internet le 25 juin 2009.

Conférence au Forum des droits sur l'Internet le 25 juin 2009.
Sujet : gestion linguistique dans Wikipédia.

Statistics

Views

Total Views
1,873
Views on SlideShare
1,873
Embed Views
0

Actions

Likes
1
Downloads
9
Comments
0

0 Embeds 0

No embeds

Accessibility

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Fdi Presentation Transcript

  • 1. Gestion linguistique dans Wikip´dia e Julien Fayolle Wikim´dia France e julien.fayolle@wikimedia.fr http://www.wikimedia.fr
  • 2. Wikip´dia e « Encyclop´die ; e « Ouverte ` tous, ´crite collaborativement (Web 2.0) ; a e « Neutralit´ de point de vue ; e « Licence libre. Á Participation de tout le monde ` la cr´ation d’un corpus ency- a e clop´dique (quasiment tout le monde sait quelque chose). e Á Tout le monde est le relecteur de l’autre. Á Processus continu de correction, de remise en cause, d’ajustement et de pr´sentation du savoir. e mars 2009 : 14 M de visiteurs uniques, 9e site en France (m´diam´trie). e e
  • 3. Acteurs Wikimedia Foundation, Inc. (WMF) © h´berge les sites, pas e ´diteur. e Wikip´dia et ses e contributeurs b´n´voles ; e e © mod´ration a e posteriori ; © auto-gestion. Wikim´dia France. e © promotion des projets, connaissance libre.
  • 4. Multilinguisme ª Disponible en 266 langues. ª Degr´s divers de maturit´ (nombre de locuteurs, date de e e cr´ation). e en : 2 889 962 ; de : 907 851 ; fr : 807 347, ; ja : 588 518 ; es : 475 384 ; zh : 254 123 ; ar : 99 662 ; lg (ganda, luganda) : 33.
  • 5. Versions linguistiques
  • 6. Acc`s aux versions linguistiques e ¬ soit www.wikipedia.org, sans langue pr´d´finie e e ¬ soit les versions linguistiques xx.wikipedia.org ¬ xx est le code ISO-639 de la langue. ¬ Sur chaque article : liens interwiki : permettent de passer ` a l’article « ´quivalent » sur une autre version linguistique. e Pas de d´termination automatique de la langue. e Flexibilit´, mais il faut connaˆ le code langue (port´e mondiale, e ıtre e pas uniquement langues dominantes). Langue du contenu et de l’interface a priori diff´rentes. La langue e de l’interface (logiciel) est sp´cifi´e par l’utilisateur. e e
  • 7. Cr´ation de version linguistique e 1 pt et pt-br (br´silien) ; e 2 sib´rien (ru-sib) ; e 3 klingon (tlh) ; 4 lobjan (jbo), esperanto (eo), volap¨k (vo), interlingua (ia, ie) ; u 5 latin (la) ; 6 Conditions : avoir une communaut´ potentielle suffisante e (3-5 personnes) ; 7 Coordination et d´cision de cr´ation d’une Wikip´dia sur e e e meta, (plateforme d’organisation meta-linguistique, pas seulement les questions linguistiques) ; 8 L’ouverture technique d’une version (la cr´ation d’une url, e base MySQL, MediaWiki) est faite par un technicien de la WMF.
  • 8. Version linguistiques D´bats politiques et linguistiques sur moldave/roumain, e serbe (sr)/croate (hr)/serbo-croate (sh)/mac´donien (mk). e Arabe litt´ral (ar), masri (arz), shami (levantin), khalidji, e furati (Iraq), darija (Maghreb) ; Variantes d’alphabet : © sr : ћирилица et latinica ; © ku : latˆ ı et erebˆ ; ınˆ ı © zh-sg, zh-hk, zh-cn, zh-tw, zh-hans, zh-hant ; © az : articles en alphabet latin, interface en latin + arabe ; Simple English (simple). Texto ? Fran¸ais facile ? c Risque de morcellement : utilit´ de l’alsacien (als), du breton e (br), du walon (wa), du haut-normand (nrm), arpitan (francoproven¸al, frp), flamand occidental (vls). c
  • 9. Cr´ation de contenu e Les versions linguistiques sont ind´pendantes les unes des autres. e Il n’y a pas de traduction automatique d`s que des ajouts sont e effectu´s sur une version. Les articles sont cr´´s dans des versions ` e ee a des dates et avec des contenus a priori diff´rents, selon l’int´rˆt des e ee contributeurs de la version linguistique. Les b´n´voles ont d´fini plusieurs strat´gies lors de la cr´ation d’un e e e e e article : traduction d’un article pr´existant dans une autre version e linguistique, cr´ation ex nihilo, m´lange des deux : difficile de e e faire une traduction exacte quand on connaˆ le sujet, plus facile de ıt se servir du plan d’un article d´j` ´crit. eae Hi´rarchie de wikip´dias (pour la traduction) : anglais, langues e e mondiales (langues de diffusion), langues r´gionales (pas langue e maternelle ou de diffusion), versions symboliques.
  • 10. Traduction ½ Centralisation des bonnes pratiques, demande d’aide, de relecture de traduction (sur chaque grosse version linguistique). http://fr.wikipedia.org/wiki/Projet:Traduction ½ Organisation : comment signaler une demande de traduction, une traduction en cours, une demande de relecture, ´valuation e de la qualit´ de la relecture, comment cr´diter une traduction e e (droit d’auteur). ½ Contributeurs int´ress´s par organiser la th´matique, d’autres e e e par suivre le processus, d’autres font leurs traductions sans passer par ces ´tapes. e ½ Les contributeurs identifient les langues qu’ils peuvent traduire ou vers lesquelles ils peuvent traduire. Traduction automatique : Google Translator Toolkit. Outil tr`s e int´ressant. Est-ce que ¸a sera utilis´ par la communaut´ ? e c e e
  • 11. Travail collaboratif ¶ Traduire en « plusieurs couches » : ª traduction grossi`re (mot ` mot, pas de recul ou de e a connaissance sp´cifique du traducteur, m´connaissance des termes e e techniques ou du domaine), ª raffinements successifs. ª La source originale n’est qu’` un clic via les liens interwikis. a ¶ Coordination centralis´e ou non (i.e., entre individus : e communaut´ d’utilisateurs). e ¶ Parfois plus facile d’am´liorer une traduction incr´mentalement, e e parfois il faut recommencer tout le paragraphe.
  • 12. Place du fran¸ais c http://fr.wikipedia.org ´ Rencontre des francophones (France, Belgique, Suisse, Qu´bec, Afrique, expatri´s) ; e e ´ Chicon/endive (pol´mique de nommage) ; e ´ Pas de demande de s´cession, pas de grosse tension ; e ´ 3e encyclop´die par le nombre d’article. e
  • 13. Commons È Probl´matique historique : redondance des m´dias (photos, e e cartes, sch´mas, vid´os, sons tous sous licence libre) ; e e È commons.wikimedia.org centralise ces m´dias (h´berg´ par e e e WMF) ; È Plus de 4 millions de documents (2009). È Un seul site, une seule URL, mais utilisateurs de langues diff´rentes. e È L’utilisateur sp´cifie sa langue (param`tre). Par d´faut, e e e anglais.
  • 14. Translatewiki Le logiciel derri`re Wikip´dia s’appelle MediaWiki (CMS sous e e licence libre). Il est possible d’avoir l’interface en polonais sur la wikip´dia en e fran¸ais. Mais seulement l’interface, le contenu reste en fran¸ais. c c L’ouverture d’une version linguistique est li´e ` l’adaptation des e a messages du logiciel par les utilisateurs et par cons´quent ` e a internationaliser MediaWiki. Le site translatewiki.net centralise l’internationalisation du logiciel. D´veloppement de MediaWiki ”en anglais”, commentaire en e anglais. Communaut´ sur mediawiki.org. e