Recherche sans frontières: la Text Encoding Initiative et la coopération internationale dans les Digital Humanities
Recherche sans frontières: la
Text Encoding Initiative et la
coopération internationale dans
les Digital Humanities
Elena Pierazzo
King’s College London
Department of Digital Humanities
Présentations
Qui suis-je, Qui êtes-vous
Le séminaire
- Travail d’équipe
- Présentations
- Collaboration
- Collaboration en TEI
- Le naissance du balisage pour le document
- Discussion
Un exercice de collaboration
• Travail d’équipe: Vous êtes une équipe de
la BML et vous devez numériser une
collection de manuscrits et préparer un
site web avec des fonctionnalités user-
friendly pour vos utilisateurs
• L’un d’entre vous sera un observateur
• Après 30 minutes, l’équipe présentera son
projet
Présentations
• Tout le monde a contribué?
• Est-ce que quelqu'un a émergé come
leader?
• Les résultats obtenus sont de bonne
qualité?
• Est-ce qu’il au eu des problèmes entre les
membres de l’équipe?
• Qu’est-ce qu’on aura pu faire de mieux?
Collaboration
• Pourquoi est-ce si difficile?
• Plus difficile dans les lettres que dans le
sciences dures?
• Qu’est-ce que la collaboration?
It’s a team if you use ‘‘reply all’’
• Article par Lynne Siemens, 2010
• Equipes multidisciplinaires et multi-
hiérarchiques dans le Digital Humanities
Problèmes/Questions
• Communication (Répondre à tous)
• Organisation
• Prendre ses responsabilités
• Leadership
• Respect
Problèmes supplémentaires pour
les collaborations internationales
• Langage
• Créneau horaires
• Paiements internationaux (fluctuation du
marché, difficultés avec les banques, les
taxes…)
Mais, enfin, ça vaut la peine??
• Oui.
• Les ressources numériques ont besoin de:
– Beaucoup de connaissances diversifiées
– Beaucoup d’expérience
– Beaucoup de ressources
– Beaucoup d’argent
En plus…
• La recherche collaborative permet de
traiter des corpus plus grands
• Elle va plus loin
• Elle explore l’inconnu et le nouveau
Collaboration avant l’internet
• La chercheuse A fait une recherche
– 20 ans plus tard elle écrit un livre avec beaucoup des
citations
– Le livre est publié
• 30 ans plus tard, la chercheuse B lit le livre
– Elle recherche la source des citations
– Elle reproduit les expériences/les méthodologies
– Elle n’est pas d’accord avec les résultats
– Elle fait une nouvelle recherche
– 20 ans plus tard elle écrit un livre
– Elle cite Chercheuse A parmi les citations
• Et ça c’est de la collaboration!
Méthode
Académique/Scientifique
• Physique expérimentale
– Citer expériences précédentes
– Citer les collaborateurs
– Documente l’ expériences pour la rendre
reproductible
• Théorie et critique littéraire
– Citer les chercheurs précédents (pour montrer
qu’ils sont fous)
– Citer tous les chercheurs qui partagent la théorie
– Documenter l’argumentation en détail
– Centaines de notes
Collaboration éclatée
• La communication est encore plus
essentielle
• Il y a la nécessité de se mettre d’accord
d’avance sur la méthode et les principes
• Ce sera encore mieux si les principes sont
établis par un organisme reconnu et qui
fait autorité
La Text Encoding Initiative: une
entreprise collaborative
• Principes de Poughkeepsie: 1987
• Première version: 1990 (P1)
• Première version usable: 1994 (P3)
• Dernière version: 2007 (P5)
– Dernière sortie: Décembre 2011 P5 v.2
Qu’est-ce que c’est la TEI?
• Un standard pour le codage des textes
(dans les Humanités)
• Un ensemble de 500 ca. balises
• Des Guidelines (deux gros volumes) pour
l’utilisation de ces balises
Pourquoi la TEI nous intéresse?
• Utilisée dans le monde entier pour le
codage et l’échange des textes et de
données
• Elle offre un riche vocabulaire partagé
pour nommer des phénomènes textuels
« a new data description language that
substantially improves our ability to
describe textual features » (Renear 2004)
Pourquoi la TEI nous intéresse?
• Combinée avec les possibilités offertes
par l’internet, elle a rendu possible la
communication et l’échange international
• Elle est à la base de nombreuses
collaborations internationales
Collaboration en TEI
• Création et rédaction de la TEI (les
Guidelines, les balises): membres du TEI
Council élus tous les deux ans
• Inspiration de la TEI: la communauté (TEI-
L), le SIGs (Special Interest Groups), les
utilisateurs
Temps et argent
• Travailler pour le Council ou contribuer à
un SIG prend du temps, beaucoup de
temps
• Qui paye pour ce temps?
• Et pour voyager?
• Et pour le développement des logiciels
associés?
Partenaires
• La TEI a une trentaine de partenaires
institutionnels (Universités, Archives,
Bibliothèques, Projets) qui paient une
contribution volontaire
• Les institutions contribuent à la TEI avec
le travail/temps des personnes qui sont
élues dans le Council (ou le Board) ou
travaillent dans les SIGs
Le travail fait pour la TEI
… n’est pas crédité, au niveau institutionnel,
ni au niveau individuel: toute contribution
devient la TEI
Un cas d’étude: La TEI pour les
éditions génétiques
• L’idée est née en 2003 pendant la
première réunion du SIG Manuscrits
• Le SIG a été revitalisé en 2007 et l’idée a
été renouvelé
• Une équipe de travail a été formée en
2008 avec Fotis Jannidis comme président
• Première réunion de l’équipe en 2009
L’équipe de travail
• Fotis Jannidis - Germany
• Elena Pierazzo - UK
• Malte Rehbein – Ireland/Germany
• Lou Burnard – UK/France
• (Paolo D’Iorio) – France / UK
• Gregor Middell – Germany / USA
• Moritz Wissenbach - Gemany
Le problème
• La TEI n’offrait que la possibilité de
considérer les mots écrits comme un flux
sémantique cohérent et les manuscrits
comme codes linguistiques
• Le concept de page et de ligne était
secondaire
• Les séquences temporelles n’étaient que
marginalement supportées
Méthodologie
• Communauté TEI (SIG meeting, Mailing List)
• Premier brouillon: pseudo-code
• Atelier avec des experts internationaux (Paris)
• Second brouillon: Correspondance avec la TEI
• Circulation internationale: email, ateliers (Oxford,
Zadar)
• Troisième brouillon: présentation au TEI Council
• Approbation et réélaboration par le Council: comment
introduire cette révolution dans la TEI sans la casser?
• Nouvelle version de la TEI (décembre 2011), nouvelle
phase de corrections
Atelier à l’ITEM (Paris)
• Financé par ALLC, ACH, TEI, Moore Institute
• Présents: Anne Bohnenkamp (DE), John
Bryant (US), Aurèle Crasson (FR), Jean-
Daniel Fekete (FR), Daniel Ferrer (FR),
Hans Walter Gabler (DE), Axel Gellhaus
(DE), Almuth Grésillon (FR), Claus Huitfeldt
(NO), Dirk van Hulle (BE), Jean-Louis
Lebrave (FR), Wolfgang Lukas (DE),
Kenneth M. Price (US), Kathryn Sutherland
(UK)
Distribution Thématique
• Anne Bohnenkamp (DE): Goethe
• John Bryant (US): Melville
• Aurèle Crasson (FR): chercheuse informaticienne - ITEM
• Jean-Daniel Fekete (FR): chercheur informaticien - ITEM
• Daniel Ferrer (FR): Joyce
• Hans Walter Gabler (DE): Joyce
• Axel Gellhaus (DE), théorie de la genèse
• Almuth Grésillon (FR): Flaubert, critique génétique
• Claus Huitfeldt (NO): Wittgenstein, théorie du codage
• Dirk van Hulle (BE), Beckett
• Jean-Louis Lebrave (FR), Heine, éditions génétiques
électroniques
• Wolfgang Lukas (DE), Correspondance du XXe siècle
• Kenneth M. Price (US), Whitman
• Kathryn Sutherland (UK): Austen
Plus grand est le groupe,
meilleur est le résultat
• Pour être acceptable par la communauté
la proposition doit se présenter comme le
résultat d’un processus académique
Pourquoi on le fait, donc
• La TEI comme communauté savante
• La TEI comme un produit académique
• La TEI comme force agrégative
C’est parfait, donc?
Presque…
Problèmes ouverts
• Gouvernance: la TEI a grandi en termes
d’utilisateurs, mais s’est réduite en termes
de contributeurs institutionnels
• Représentation des, et support aux
individus (formation, logiciels)
• Problème d’attitude