Your SlideShare is downloading. ×
Travailler avec des archives audiovisuels numériques. Première partie : Le fonds audiovisuel des AAR et sa publication-diffusion
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Travailler avec des archives audiovisuels numériques. Première partie : Le fonds audiovisuel des AAR et sa publication-diffusion

275
views

Published on

Les sujets traités dans cette conférence : …

Les sujets traités dans cette conférence :
1) Le Programme Archives Audiovisuelles de la Recherche (AAR) – présentation, enjeux et objectifs, réalisations et positionnement actuel.
2) La banque des données ouvertes des AAR.
3) La publication-diffusion de la banque des données ouvertes des AAR.
4) Le genre de publication « portail ».
5) Une nouvelle génération de portails réalisée avec le Studio ASA, l’environnement de travail (le « lab ») des AAR.

Published in: Education

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
275
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
5
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Travailler avec des archives audiovisuels numériques.Première partie :Le fonds audiovisuel des AAR et sa publication-diffusionPeter Stockinger, P.U.Fondation Masion des Sciences de l’Homme (FMSH) - ESCoMInstitut National des Langues et Civilisations Orientales (INALCO)Université de la Manouba (UMA)Institut Supérieur de Documentation de TunisUnité de Recherche « Bibliothèque numérique et patrimoine »Tunis, 24 Avril 2013
  • 2. 1. Le Programme Archives Audiovisuelles de la Recherche (AAR) –présentation, enjeux et objectifs, réalisations et positionnement actuel2. La banque des données ouvertes des AAR3. La publication-diffusion de la banque des données ouvertes des AAR4. Le genre de publication « portail »5. Une nouvelle génération de portails réalisée avec le Studio ASA,l’environnement de travail (le « lab ») des AARLes principauxpoints
  • 3. Le Programme « Archives Audiovisuelles de la Recherche » (AAR)
  • 4. Le Programme Archives Audiovisuelles de la Recherche (AAR):= programme de « recherche appliquée » …… dans le contexte des archives/bibliothèques numériques pour larecherche, l’enseignement et la valorisation de patrimoinesscientifiques et culturels… élaboré en 2000 et mis en place concrètement à partir du moisd’avril 2002 …… par l’ESCoM (Equipe Sémiotique Cognitive et Nouveaux Médias)à la FMSH (Fondation Maison des Sciences de l’Homme) à Paris.Le programmeAAR
  • 5. 2 objectifs sous-tendent le programme AAR:Premier objectif:Projet d’archivage audiovisuel numérique en SHS (scienceshumaines et sociales)a) Constituer et préserver des corpus audiovisuels numériquesqui documentent le patrimoine scientifique dans lesdifférentes « disciplines » en SHS– patrimoine scientifique réalisé par une communautéinternationale de chercheurs et enseignants-chercheurs …b) Publier et diffuser en ligne une partie des corpus archivés …sous forme d’événements (conférences, séminaires,entretiens, recherches de terrain, …)et de collections (« dossiers ») d’événementsscientifiques en français et dans d’autres langues (=portail AAR en accès libre).Le programmeAAR
  • 6. Deuxième objectif:Environnement numérique de travail (le « Lab(oratoire) »)Deux aspects1) Définir et valider une méthodologie et des procéduresexplicites (documentées) …1. … de production et de gestion-diffusion d’archivesaudiovisuelles numériques en SHS.2. … d’exploitation (« repurposing ») des données archivéesLe programmeAAR
  • 7. Deuxième objectif:Environnement numérique de travail (« Lab(oratoire) »)2) Développer un ensemble d’outils, d’instruments pour …I. … la conception et définition de l’organisation d’une archive(collections, classements thématiques, thesaurus, …).II. … la constitution de banques de données audiovisuellesnumériques (d’ « ingestion » de données audiovisuelles dansune archive) .III. … l’analyse personnalisée (de segmentation, de description etd’indexation) de corpus AV archivés.IV. … la publication/republication et de diffusion personnalisées desdonnées AV et des métadonnées ainsi que d’une archive elle-même sous forme d’un portail web adaptable.Le programmeAAR
  • 8. Aujourd’hui, les Archives Audiovisuelles de la Recherche (AAR) forment à lafois :1) une archive numérique enligne stricto sensu: Les « AAR »une banque de données ouvertes et d’accès ouvert qui est l’objetd’un projet d’archivage spécifiqueobjectif du projet d’archivage: constituer un patrimoine scientifiquereprésentatif des recherches en SHS (>9000 heures de vidéos)2) et un environnement de travail – un « laboratoire »: Studio ASA(Atelier de Sémiotique Audiovisuelle) …sous forme d’une série d’Ateliers spécialisés (de logiciels, deressources métalinguistiques, de guides, …) qui instrumentent unprojet d’archivage AAR ainsi que son exploitation.Le programmeAAR
  • 9. La banque des données des AAR
  • 10. Banque des données numériques (= le fonds des AAR):Quelques caractéristiques (des « ressources » au sens de DC/OAIS) :a) types de données• Données vidéos• enregistrements bruts,• enregistrements traités a posteriori,• enregistrements montés,• documents filmiques édités (reportages, documentaires, …)• Données visuelles statiques• captures brutes,• captures traitées à posteriori,• Données textuelles• (pré-)publications des contributeurs• CV, bibliographies, …• Données structurées• Sur les contributeurs (> 2500),• Sur les abonnés à la newsletter AAR (> 10.000),• Sur les visteurs/utilisateurs des AAR: questionnaires enligne (> 500)• Données à caractère juridique• contrats de mise en ligneLa banque desdonnées des AAR…
  • 11. Banque des données numériques (= le fonds des AAR):Quelques caractéristiques (des « ressources » au sens de DC/OAI) :b) volume du fonds (vidéos seulement)• environ 9000 heures de vidéos produites et/ou co-produitespar la FMSH-ESCoM et un réseau national et international departenaires;• quelques 5600 heures de ressources AV en accès libre (« openaccess ») sur le portail général du programme AAR;• des milliers d’heures de ressources AV également librementaccessibles sur une série de portails plus spécialisés (cf. plusloin);c) formats des fichiers vidéo• données vidéos: wmv, flash, en partie avi,• en cours: encodage en mpeg4La banque desdonnées des AAR…
  • 12. Banque des données numériques (= le fonds des AAR):Quelques caractéristiques (des « ressources » au sens de DC/OAI) :d) contributeurs: communauté internationale• environ 2600 chercheurs-enseignants, artistes, journalistes, …• de quelques 85 pays du mondee) fonds AAR par langue:• une très grande partie des vidéos est monolingue,• une petite partie est monolingue assorti d’un résumé en uneou plusieurs autres langues,• une grande partie des vidéos est en français,• vidéos également en anglais, espagnol, allemand, chinois, etc.La banque desdonnées des AAR…
  • 13. La publication-diffusion de la banque des données ouvertes AAR
  • 14. Publications de la banque des données audiovisuelles ouvertes des AAR:4 Genres de publication:1. Genre principal: l’événement:• site d’événement ou encore site événementiel2. Collections de sites d’événements• corpus par discipline ou thème3. Portails (portail général; portail à thème)• points d’accès aux événements et/ou collections d’événements4. Publications expérimentales (issues de projets de R&D européenset français)• nouvelles formes spécialisées d’accès aux et d’explorations deressources audiovisuellesLa publication-diffusion desdonnées AAR
  • 15. Publication:1) Genre central de publication: Evénement (site d’événement)Un événement =• toute occasion de collecte d’informations,• occasion doit posséder une valeur patrimoniale,• « valeur patrimoniale »: définie par les missions/objectifs duprojet d’archivage numériqueGenres d’événements filmés (dans le cadre des AAR):• Manifestations scientifiques: entretiens, conférences, colloques,workshops, …• Manifestations culturelles: concerts, expositions, …• Terrains de recherche: sociologiques, linguistiques, ;…• Et aussi: produits édités (reportages, documentaires, films defiction, …)La publication-diffusion desdonnées AAR
  • 16. Publication:1) Genre central de publication: Evénement (site d’événement)Exemple concret:• La fabrication du pain domestique au Portugal (15 juin 2006)Structure typique d’un événement:1. un événement = un site (dynamique) aussi appelé « mini-site »,2. page d’accueil identifiant l’événement,3. accès aux ressources (vidéos, textes, images, …) documentantl’événement,4. « page vidéo » de lecture et d’exploration d’une ressourcevidéo.Sur portail AAR:• environ 670 sites (« mini-sites ») événementiels,• en tout: 960 sites sur tous les portails du programme AAR …La publication-diffusion desdonnées AAR
  • 17. Publication:2) Le genre Collections (d’événements)« Collection » = ensemble cohérent de sites d’événements• Un ensemble de sites d’événements constitue un corpus publié(enligne) d’événements• Attention: corpus publié ≠ corpus collecté ≠ corpus indexé !!Dans le cadre des AAR:• notamment corpora publiés par discipline et/ou domaine derecherche (environ 40 « grands corpus »)Exemple:• Grand corpus « Sociologie »: 160 sites d’événements• 46 corpus spécialisés qui font partie du grand corpus « Sociologie »• Sociologie urbaine (8);• Sociologie de la culture (27),• Sociologie des migrations (11), …La publication-diffusion desdonnées AAR
  • 18. Un corpus AAR est composé d’enregistrements divers …• … d’entretiens (avec chercheurs, experts, journalistes, témoins, …),• … de séminaires et/ou de colloques (tables rondes, journées d’étude,…),mais aussi:• … de documentaires AV, …• … d’enregistrements de terrain documentant le thème/le sujet,• … d’enregistrements d’événements culturels (expositions, concerts,…)• … de prises de vue de « scène de vie ».Un corpus:• est en général multilingue,• reflète la recherche actuelle au niveau internationalLa publication-diffusion desdonnées AAR
  • 19. Publication:3) Le genre Portails (d’archive)« Portail » =1. lieu d’accès aux événements et/ou au corpus publiésd’événements d’une archive,2. lieu d’exploration des ressources documentant un événement(notamment des ressources vidéos),3. lieu de visualisation du fonds d’une archiveLa publication-diffusion desdonnées AAR
  • 20. Publication:Les portails dans le cadre du programme AAR:1) Portail web central• Le portail des Archives Audiovisuelles de la Recherche(AAR) en huit langues2) Portails thématiquement spécialisés:• Averroès – la médiathèque France-Maghreb,• Portail DLC – Diversité Culturelle et Linguistique,• Portail PCM – Peuples et Cultures du Monde,• Portail SCC – Semiotica, Cultura e Comunicazione(coopération avec l’Università di Roma – Sapienza)Exemples concrets – cf. ci-après …La publication-diffusion desdonnées AAR
  • 21. Publication:4) Le genre Publications expérimentalesDifférents genres de publications expérimentales:4.1) Les vidéo-lexiques• Corpus de segments assez brefs de vidéos qui illustrent unterme, une notion, un domaine, …• Exemple:• Le vidéo-lexique « Peuples du monde »4.2) Dossiers bilingues• Republication d’une vidéo (ou d’une partie d’une vidéo) dansune langue-cible différente à la langue-source• Exemples:• Republication (en arabe, chinois, anglais, italien, ….) d’unentretien en français avec Sabine Trebinjac (CNRS) consacré à lamusique ouïgoure• Tous les dossiers bilingues français – arabe.La publication-diffusion desdonnées AAR
  • 22. Publication:4) Le genre Publications expérimentales4.3) Dossiers thématiques• analyse et explication des grandes thématiques dans uneprestation (entretien, séminaire, …)les vidéos sont totalement délinéarisées!• Exemples:• Republication d’une conférence de Joëlle Allouche-Benayoun(02/04/2008) sur La place de la femme dans le judaïsme(passages thématiques – encyclopédie – lexique)• Accès à l’ensemble des dossiers thématiques (par discipline).La publication-diffusion desdonnées AAR
  • 23. Publication:4) Le genre Publications expérimentalesQuelques explications …• Publications pas intégrées dans le « processus standard de production– diffusion.• Ce sont des republications de données archivées et publiées(« repurposing »).• Objectifs:• Adaptations à des contextes d’usage spécifiques (notamment:enseignement et valorisation).La publication-diffusion desdonnées AAR
  • 24. Présentation plus détaillée:Le genre de publication « portail »
  • 25. L’interface du portail général du programme AAR : principal point d’accès à etde visualisation de la banque des données AAR (5600 heures de vidéos enaccès libre)Le genre depublication « portail »
  • 26. L’interface de la page d’accueil du portail général des AAR:Les accès …Accès « standards » à la banque des données ouvertes AAR :1. accès par « nouveautés »:publications les plus récentes; les « grands titres », …2. accès par domaines et disciplines : évènements publiés en …> sociologie (160)> développement (11) ; mouvement social, groupes sociaux;conflits, …3. accès par types d’événements:> entretiens (360); séminaires (72); colloques (180); reportages (50);documentations audiovisuelles (20 = « archives provoquées »);4. accès par langue (version originale des vidéos): évènements publiés en …> français (682); anglais (107); espagnol (59); chinois, russe, arabe, …Le genre depublication « portail »
  • 27. L’interface de la page d’accueil du portail général des AAR…Accès « standards » à la banque des données ouvertes AAR :5. accès par auteurs (2448):liste alphabétique + descriptif6. accès à l’ensemble des événements (682):par date d’enregistrement7. accès à des dossiers hypermédias spécialisés issus d’un processus derepublication de corpus audiovisuels ;> dossiers par discipline> anthropologie culturelle; anthropologie de la santé;linguistique; musicologie; …8. accès à un ensemble de portails spécialisés (i.e. de portails proposant à leurtour des accès communs et/ou spécifiques à une sélection du fondsaudiovisuel de la banque des données ouvertes AAR) sous forme d’événements(scientifiques, culturels, …):1. > AVERROES – La médiathèque France-Maghreb2. > DLC – Diversité Linguistique et Culturelle3. > PCM – Peuples et Cultures du Monde4. > SCC – Semiotica, Cultura e Comunicazione (avec Univ. di Roma)5. > MDD – Mondialisation et Développement Durable6. > …Le genre depublication « portail »
  • 28. L’interface de la page d’accueil du portail Averroès – La médiathèque France –MaghrebMême type de publication que le portail général AARLe genre depublication « portail »
  • 29. Une « nouvelle génération » de portails réalisés avec le Studio ASA (le « lab »du Programme AAR)
  • 30. Grace à un ensemble de projets de R&D européens et français (ANR) depuis2006, le programme AAR a mis en place …… une nouvelle « génération » de portails (bientôt en ligne, i.e. dès le 20mai 2013):Caractéristiques:Accès sémantique à des corpora audiovisuels choisis (par thesaurus,thèmes ou sujets de discours, localisations géographiques et temporelles,références culturelles, etc.);Descriptions et indexations très riches et détaillées des vidéos pour desusages dans l’enseignement et la recherche;Republications « auteurs » totalement intégrées dans le processus degestion éditorial d’un portail;Customisation de l’interface physique et graphique et des accès auxcorpus audiovisuels;Intégration des médias sociaux dans chaque portail et chaque « pagevidéo »;Environnement de travail « unifié »: Studio ASA (cf. plus loin)Une nouvellegénération deportails
  • 31. Illustration: L’interface de la page d’accueil du portail AMSUR = un corpus AVd’environ 360 heuresUne nouvellegénération deportails
  • 32. Illustration: La « Page vidéo » page permet l’exploration systématique d’uneressource vidéoUne nouvellegénération deportails
  • 33. Illustration: La Page « vidéo » s’adapte aux métadonnées disponiblesUne nouvellegénération deportails
  • 34. Illustration: La Page « vidéo » donne accès aux « vidéos similaires »Une nouvellegénération deportails
  • 35. Illustration: Accès à un corpus publié de vidéos (!!) via le thesaurus propre àl’archive (« Lexique »)Une nouvellegénération deportails
  • 36. Illustration: Accès par localisation géographique:Une nouvellegénération deportails
  • 37. Illustration: Accès par collections filmiques:• Ressources [(re)publiées] ….Vidéos par genre > Documentaires et reportages [(re)publiés]Une nouvellegénération deportails
  • 38. Illustration: Accès non-structuré à l’ensemble du corpus publiéUne nouvellegénération deportails
  • 39. Remarques au sujet du corpus audiovisuel AMSUR
  • 40. Quelques remarques:Le portail AMSUR donne accès à un corpus audiovisuel qui:provient de la banque de données ouvertes AAR,est consacré à l’histoire et aux cultures de l’Amérique Latine.Ce corpus:… constitue donc une partie du fonds commun de la banque desdonnées des AAR (> 360 heures)Il est également accessible via le portail général des AAR …… mais uniquement par le biais des accès généraux du portail (qui« valent » pour toutes les vidéos composant la banque des donnéesAAR)Sur le portail AMSUR, le corpus en question se présente …sous une forme profondément retravaillé selon les objectifs éditoriauxpropres au portail AMSUR.Au sujet du corpusAMSUR
  • 41. Un corpus audiovisuel « profondément retravaillé » veut dire que …… les vidéos qui font partie du corpus sont ….… localisées dans le fonds (AAR) et sélectionnées selon leurpertinence pour la politique éditoriale du portail… redécoupées en segments pertinents (selon la politiqueéditoriale propre au portail)… reclassées à l’aide d’un métalangage propre au portail (cf. lesaccès de ce portail: sujets, thesaurus, …)… re-décrites et re-indexées à l’aide d’une bibliothèque demodèles de description propre au portail… re-contextualisées (i.e. « mises en relation » avec d’autresdonnées selon la politique éditoriale du portail)… « mélangées » avec d’autres données afin de donner lieu à denouvelles publicationsCi-après la problématique du « Repurposing » de données numériques archivées!Au sujet du corpusAMSUR
  • 42. Le « Repurposing » de corpus audiovisuels –un usage complètement central pour toutes archives numériques
  • 43. « Repurposing »:Réutilisation de données numériques archivées.Problématique centrale pour l’exploitation d’archives numériques dansle contexte de la recherche, de l’enseignement, de la communication, ….Cas particuliers:1. Ré-description et ré-indexation de données archivées (cf. le corpusAMSUR)2. Ré-publication de données archivées:1. Ré-publication concurrente d’une donnée numériques archivéesur deux ou plusieurs portails2. « Réunir, mélanger » différentes données numériques archivéespour faire une nouvelle publication (« dossier thématique)Le « repurposing »de corpusaudiovisuels
  • 44. Exemple 1: Dossier thématique « Linguistique et langues amérindiennes » -dossier réunissant un corpus de vidéos autour de ce sujetLe « repurposing »de corpusaudiovisuels
  • 45. Exemple 2: Analyse, description et publication concurrente d’une mêmevidéo sur deux portails différentsAnalyse et publication concurrentes d’un entretien avec Luiz CarlosBresser-Pereira sur trois portails différents:… sur le portail général des AAR : publication « de base »… sur le portail AMSUR (cf. ci-après)…. et sur le portail FMSH-AAR (cf. ci-après)Le « repurposing »de corpusaudiovisuels
  • 46. Republication sur AMSUR (réalisée par Manuela Papino, webmestre du portailAMSUR):Le « repurposing »de corpusaudiovisuels
  • 47. Republication sur FMSH-AAR (réalisée par Muriel Chemouny):Le « repurposing »de corpusaudiovisuels
  • 48. Caractéristiques d’une analyse/publication concurrente …1. Découpage qui varie systématiquement (l’analyste décide des segments– chapitres – dont il a besoin).2. Métalangages utilisés sont différents (thesaurus par portail +bibliothèque de modèles de description propre à chaque portail).3. Informations pragmatiques et mises en relation différentes.4. Accès différents (et propres à chaque portail).5. Interface partiellement différente.Le « repurposing »de corpusaudiovisuels
  • 49. Pour terminer: Les trois niveaux d’une archive numérique
  • 50. Schéma simplifié les 3 niveaux à distinguer dans une archive numérique:Données – Corpus – PublicationBanque de données ouvertes 1AARCorpus 1 ≅Fonds AARCorpus 2 = SélectionthématiqueCorpus n =SélectionVisualisationAccès 1(portail généraldes AAR)VisualisationAccès 2(= portailAMSUR)VisualisationAccès 3(= portailAMSUD)Banque de données ouvertes 2 (N)HAL (Canal U, …)Les trois niveauxd’une archivenumérique