SlideShare a Scribd company logo
1 of 29
LA SONDOTHEQUE DU
CEVIPOF
Diego Antolinos-Basso, développeur data-scientist
Odile Gaultier-Voituriez, responsable de la documentation et des archives
Centre de recherches politiques de Sciences Po (CEVIPOF)
RASAD, Angoulême, 2 février 2018
Une coopération fructueuse entre un spécialiste
du traitement des données numériques et
une responsable de la documentation et des
archives
Plan
 Introduction
 Sciences Po
 Le CEVIPOF
 Laboratoire
 Projet scientifique
 Le centre de documentation
 La sondothèque
 En chiffres
 Traitement
 Histoire
 Un cas d’étude
 Conclusion
Introduction
 Coopération
 Dans un laboratoire de recherche
 À tous les niveaux
 Une histoire d’« archéologie numérique »
 Conserver, consolider et valoriser
 Projet exploratoire et inédit
Nous espérons que cela
vous sera utile !
Sciences Po
 L’Ecole libre des sciences politiques (ELSP) puis
la Fondation nationale des sciences politiques
(FNSP) et l’Institut d’études politiques (IEP) de
Paris
 Deux dates fondatrices : 1872 et 1945
 Quatre missions :
 Enseignement
 Recherche
 Documentation
 Edition
Le CEVIPOF
 Un laboratoire de recherche en science politique,
à Paris
 Fondé en 1960 par la Fondation nationale des
sciences politiques (FNSP)
 Unité mixte de recherche (UMR) du CNRS en
1968
 Deux axes de recherche interdisciplinaires :
Pensée politique
Partis, comportement politique et élections
=> besoin de documentation et de sources
Le CEVIPOF
 Projets et questions de recherche
 Travailler avec et pour les chercheurs
 Archives par et pour la recherche
 Objectivité parfaite et exhaustivité utopiques
 Mise à disposition de tous
 Volonté du directeur de recruter un spécialiste
des données (compétences intellectuelles et
techniques)
 Documentation :
Production scientifique des chercheurs : ouvrages,
rapports, thèses, mémoires, chapitres et articles
Ouvrages de référence
 Résultats électoraux et livres blancs
 Archives électorales
 Tracts politiques hors élections
 Archives d’enquêtes
 Archives administratives
 « Sondothèque »
Le centre de documentation
 Sondages d’opinion en France
 Domaine politique, économique et social
 Co-construction par et pour la recherche
 Fonds unique en France car les instituts ont
très mal conservé leurs sondages
 Années 1950 à aujourd’hui
 Différents instituts : BVA, CSA, ELABE, Harris
Interactive, IFOP, IPSOS, Louis Harris,
SOFRES
 Papier (1958 à 2000) numérique (depuis 2004)
 Rapports, presse et publications scientifiques
La sondothèque
La sondothèque : un rapport
 25.000 sondages d’opinion
 800 cartons d’archives
 80 mètres linéaires
 579 thématiques
 53 ans
La sondothèque : en papier
 9000 sondages
 600 à 700 sondages par an
 depuis 17 ans
La sondothèque : numérique
La sondothèque : équipe
Missions
Nadia Dehan
Guy Michelat
Diégo Antolinos-Basso
Odile Gaultier-Voituriez
Émilie Fromont
Lauren Clark
Martial Foucault
Années 70 à 2010 2014-2018
 Classement par institut de sondage
Chronologiquement, sauf pour certaines séries
spécifiques, à part : baromètre politique, images des
personnalités politiques
 Fonds ouvert : s’enrichit quotidiennement
 Description documentaire & classement
Type de document : rapport, presse, livre, web
Numérisé ou papier
Institut
La sondothèque : traitement
 Alimentation : ~1970 à décembre 2010
 Logiciel Fox Pro (outil de bases de données)
 Chaque pièce (unité intellectuelle et matérielle)
dispose également d’un code
sur le document et dans la base
 Plan de classement thématique qui a
progressivement évolué (579 thèmes en 2008)
 Dates de collecte et de publication pas toujours
évidentes à identifier
La sondothèque : données
 Problèmes techniques :
Développement d’un outil spécifique : la version de
Fox Pro a été modifiée par Guy Michelat
Obsolescence de l’outil : ni maintenance, ni mise à
jour, ni migration en temps voulu
 Projet lié à une personne :
Alimentation au long de sa carrière
Seule à maîtriser la base, à en connaître les détails
 Problèmes intrinsèques aux données :
Identification des informations du document
Qualification thématique
La sondothèque : écueils
 Pendant 4 ans après le départ à la retraite de
la documentaliste chargée de la sondothèque
 Combat pour récupérer les données et les
métadonnées car conscience de leur intérêt
 Problème d’accès pour le public : uniquement
via les impressions papier de la base
 Traitement documentaire et non archivistique
(pas de cote ; code correspond à la pièce et non
au carton)
La sondothèque : pause
 Besoin de compétences en« archéologie
numérique »
Compréhension du problème
Connaissance des données : repérage des champs,
etc.
Identification et propositions de solutions techniques
 Discussions et échanges nourris à chaque étape
du projet de récupération
 Les choix intellectuels et techniques ont des
conséquences bien réelles
La sondothèque : renaissance
 Migrer une base de données prisonnière d’un
outil obsolète : sauver l’existant sans détruire
 Extraction du disque dur de la machine
 Récupération des données brutes de la base
 Conversion des fichiers obsolètes
 Itérations : nettoyage-sauvegarde, etc.
 Résultats : un tableau Excel de 25000 lignes
La sondothèque : récupération
Open Refine
 Index : numéro de document
 Type de document : rapport, presse, livre
 Numérisé : parfois entre 2000 et 2008
 Titre et complément : encore souvent inversé
 Dates de publication : deux dates possibles
 Date de collecte : début de collecte
 Institut chargé de réaliser le sondage
 Commanditaire du sondage
 Type d’échantillon
 Âge des membres de l’échantillon
 Codes thématiques
La sondothèque : variables
 Travail effectué par une archiviste
professionnelle
Récolement du fonds
Cotation du fonds : sous-séries par institut de
sondage
Inventaire sommaire sous Excel
La sondothèque : version n°2
La sondothèque : version n°2
 Volonté du directeur du CEVIPOF de valoriser la
sondothèque
Cas d’étude dans le cadre de la présidentielle 2017
Projet Enquête électorale française (ENEF) 2017
Repérer les sondages d’intentions de vote à la
présidentielle depuis 1965 dans la sondothèque
Saisir les données
Prototyper une visualisation des données extraites
Mettre en ligne sur Internet ces visualisations
La sondothèque : cas d’étude
Les sondages d’intention de vote pour
l’élection présidentielle depuis 1965
 Extraction des sondages d’intentions de vote par
requêtes dans la base par Diego Antolinos-
Basso : dates, mots-clefs, thématiques
 Repérage physique des sondages dans le fonds
d’archives par Émilie Fromont, archiviste
 Saisie des données contenues dans les
sondages d’intentions de vote par Lauren Clark,
stagiaire en science politique
La sondothèque : cas d’étude
Les sondages d’intention de vote pour
l’élection présidentielle depuis 1965
 Exemples de problèmes posés lors de la saisie
 Quand il y a plusieurs hypothèses de candidats,
laquelle retenir ?
 18 mois avant la présidentielle, certaines hypothèses
ne contiennent aucun candidat réellement présent au
2d tour, que faire ?
 Combien de candidats retenir quand liste d’une
vingtaine de candidats potentiels ?
=> risque de biais méthodologique
La sondothèque : cas d’étude
Les sondages d’intention de vote pour
l’élection présidentielle depuis 1965
 Autres problèmes posés par la mise en ligne
 Juridiques : ne pas mettre en ligne les rapports de
sondages eux-mêmes, propriété du commanditaire,
mais une visualisation à valeur ajoutée
 Graphiques : difficile de tout représenter (date,
candidat, institut, plusieurs sondages à la même date)
=> choix
La sondothèque : cas d’étude
Les sondages d’intention de vote pour
l’élection présidentielle depuis 1965
La sondothèque : cas d’étude
Intentions de vote pour l’élection présidentielle de
1974
Conclusion
 Complémentarité :
Entre les différentes personnes
Entre les compétences de chacun
 Compréhension et reconnaissance :
Mutuelles des personnes (permanents et ponctuels)
De l’apport du travail des autres
Les choix techniques et intellectuels ont des
conséquences en termes archivistiques mais
également pour la recherche scientifique.

More Related Content

What's hot

Bibdoc 2014 - Bnf
Bibdoc 2014 - Bnf Bibdoc 2014 - Bnf
Bibdoc 2014 - Bnf Bibdoc 37
 
IST et Documentation du point de vue du MESR : continuité et nouvel élan
IST et Documentation du point de vue du MESR : continuité et nouvel élanIST et Documentation du point de vue du MESR : continuité et nouvel élan
IST et Documentation du point de vue du MESR : continuité et nouvel élanABES
 
Implanter une politique d'open access dans une universite? L'exemple de l'INP...
Implanter une politique d'open access dans une universite? L'exemple de l'INP...Implanter une politique d'open access dans une universite? L'exemple de l'INP...
Implanter une politique d'open access dans une universite? L'exemple de l'INP...Institut National Polytechnique de Toulouse
 
Jabes 2019 - Session parallèle "Calames, au service d'une politique de valori...
Jabes 2019 - Session parallèle "Calames, au service d'une politique de valori...Jabes 2019 - Session parallèle "Calames, au service d'une politique de valori...
Jabes 2019 - Session parallèle "Calames, au service d'une politique de valori...ABES
 
JABES 2017 - La ruée vers le cloud des bibliothèques universitaires suisses
JABES 2017 - La ruée vers le cloud des bibliothèques universitaires suissesJABES 2017 - La ruée vers le cloud des bibliothèques universitaires suisses
JABES 2017 - La ruée vers le cloud des bibliothèques universitaires suissesABES
 
Data sprint des archives
Data sprint  des archives   Data sprint  des archives
Data sprint des archives AssociationAF
 
Le réseau du sudoc
Le réseau du sudocLe réseau du sudoc
Le réseau du sudocBibUnicaen
 
Plan de conservation partagée des périodiques en Aquitaine
Plan de conservation partagée des périodiques en Aquitaine Plan de conservation partagée des périodiques en Aquitaine
Plan de conservation partagée des périodiques en Aquitaine BibUnicaen
 
Présentation de la bibliotheque patrimoniale
Présentation de la bibliotheque patrimonialePrésentation de la bibliotheque patrimoniale
Présentation de la bibliotheque patrimonialeLibrarian
 
Manioc seminaire contes_guyane_avr2014
Manioc seminaire contes_guyane_avr2014Manioc seminaire contes_guyane_avr2014
Manioc seminaire contes_guyane_avr2014Tony Tresor
 
Le crowdsourcing à la BnF, est-ce correct ?
Le crowdsourcing à la BnF, est-ce correct ?Le crowdsourcing à la BnF, est-ce correct ?
Le crowdsourcing à la BnF, est-ce correct ?AssociationAF
 
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...kmichel69
 
Pécha Kucha - Marion TULANE
Pécha Kucha - Marion TULANEPécha Kucha - Marion TULANE
Pécha Kucha - Marion TULANEMarion TULANE
 
Exposer en bibliothèque patrimoniale
Exposer en bibliothèque patrimonialeExposer en bibliothèque patrimoniale
Exposer en bibliothèque patrimonialeStéphane Dufournet
 
Table ronde "L’accès aux archives numériques natives : où en sont les service...
Table ronde "L’accès aux archives numériques natives : où en sont les service...Table ronde "L’accès aux archives numériques natives : où en sont les service...
Table ronde "L’accès aux archives numériques natives : où en sont les service...AssociationAF
 
Les publications en série dans le Sudoc - Journées MEDICI, sept. 2019
Les publications en série dans le Sudoc - Journées MEDICI, sept. 2019Les publications en série dans le Sudoc - Journées MEDICI, sept. 2019
Les publications en série dans le Sudoc - Journées MEDICI, sept. 2019ABES
 
5Jpro CTLes : intervention Albert Poirot
5Jpro CTLes : intervention Albert Poirot5Jpro CTLes : intervention Albert Poirot
5Jpro CTLes : intervention Albert PoirotCTLes
 

What's hot (20)

Actualité des bibliothèques - 2014
Actualité des bibliothèques - 2014Actualité des bibliothèques - 2014
Actualité des bibliothèques - 2014
 
Bibdoc 2014 - Bnf
Bibdoc 2014 - Bnf Bibdoc 2014 - Bnf
Bibdoc 2014 - Bnf
 
Lice printemps2017 n14
Lice printemps2017 n14Lice printemps2017 n14
Lice printemps2017 n14
 
IST et Documentation du point de vue du MESR : continuité et nouvel élan
IST et Documentation du point de vue du MESR : continuité et nouvel élanIST et Documentation du point de vue du MESR : continuité et nouvel élan
IST et Documentation du point de vue du MESR : continuité et nouvel élan
 
Implanter une politique d'open access dans une universite? L'exemple de l'INP...
Implanter une politique d'open access dans une universite? L'exemple de l'INP...Implanter une politique d'open access dans une universite? L'exemple de l'INP...
Implanter une politique d'open access dans une universite? L'exemple de l'INP...
 
Td doctorants all_2016
Td doctorants all_2016Td doctorants all_2016
Td doctorants all_2016
 
Jabes 2019 - Session parallèle "Calames, au service d'une politique de valori...
Jabes 2019 - Session parallèle "Calames, au service d'une politique de valori...Jabes 2019 - Session parallèle "Calames, au service d'une politique de valori...
Jabes 2019 - Session parallèle "Calames, au service d'une politique de valori...
 
JABES 2017 - La ruée vers le cloud des bibliothèques universitaires suisses
JABES 2017 - La ruée vers le cloud des bibliothèques universitaires suissesJABES 2017 - La ruée vers le cloud des bibliothèques universitaires suisses
JABES 2017 - La ruée vers le cloud des bibliothèques universitaires suisses
 
Data sprint des archives
Data sprint  des archives   Data sprint  des archives
Data sprint des archives
 
Le réseau du sudoc
Le réseau du sudocLe réseau du sudoc
Le réseau du sudoc
 
Plan de conservation partagée des périodiques en Aquitaine
Plan de conservation partagée des périodiques en Aquitaine Plan de conservation partagée des périodiques en Aquitaine
Plan de conservation partagée des périodiques en Aquitaine
 
Présentation de la bibliotheque patrimoniale
Présentation de la bibliotheque patrimonialePrésentation de la bibliotheque patrimoniale
Présentation de la bibliotheque patrimoniale
 
Manioc seminaire contes_guyane_avr2014
Manioc seminaire contes_guyane_avr2014Manioc seminaire contes_guyane_avr2014
Manioc seminaire contes_guyane_avr2014
 
Le crowdsourcing à la BnF, est-ce correct ?
Le crowdsourcing à la BnF, est-ce correct ?Le crowdsourcing à la BnF, est-ce correct ?
Le crowdsourcing à la BnF, est-ce correct ?
 
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
 
Pécha Kucha - Marion TULANE
Pécha Kucha - Marion TULANEPécha Kucha - Marion TULANE
Pécha Kucha - Marion TULANE
 
Exposer en bibliothèque patrimoniale
Exposer en bibliothèque patrimonialeExposer en bibliothèque patrimoniale
Exposer en bibliothèque patrimoniale
 
Table ronde "L’accès aux archives numériques natives : où en sont les service...
Table ronde "L’accès aux archives numériques natives : où en sont les service...Table ronde "L’accès aux archives numériques natives : où en sont les service...
Table ronde "L’accès aux archives numériques natives : où en sont les service...
 
Les publications en série dans le Sudoc - Journées MEDICI, sept. 2019
Les publications en série dans le Sudoc - Journées MEDICI, sept. 2019Les publications en série dans le Sudoc - Journées MEDICI, sept. 2019
Les publications en série dans le Sudoc - Journées MEDICI, sept. 2019
 
5Jpro CTLes : intervention Albert Poirot
5Jpro CTLes : intervention Albert Poirot5Jpro CTLes : intervention Albert Poirot
5Jpro CTLes : intervention Albert Poirot
 

Similar to Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF

Centre de Données Socio-Politique - inauguration Medialab
Centre de Données Socio-Politique - inauguration MedialabCentre de Données Socio-Politique - inauguration Medialab
Centre de Données Socio-Politique - inauguration MedialabmedialabSciencesPo
 
Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Pierre Naegelen
 
Les « Données de la recherche » : définitions, enjeux et perspectives pour...
Les « Données de la recherche » : définitions, enjeux et perspectives pour...Les « Données de la recherche » : définitions, enjeux et perspectives pour...
Les « Données de la recherche » : définitions, enjeux et perspectives pour...Cairn.info
 
Veille, visibilité et communication : les atouts des réseaux sociaux pour le ...
Veille, visibilité et communication : les atouts des réseaux sociaux pour le ...Veille, visibilité et communication : les atouts des réseaux sociaux pour le ...
Veille, visibilité et communication : les atouts des réseaux sociaux pour le ...URFIST de Paris
 
#AAFSaintÉ19 : L'open data : source d'injonctions contradictoires pour le par...
#AAFSaintÉ19 : L'open data : source d'injonctions contradictoires pour le par...#AAFSaintÉ19 : L'open data : source d'injonctions contradictoires pour le par...
#AAFSaintÉ19 : L'open data : source d'injonctions contradictoires pour le par...AssociationAF
 
Présentation de J. Valluy du 03/11/11
Présentation de J. Valluy du 03/11/11Présentation de J. Valluy du 03/11/11
Présentation de J. Valluy du 03/11/11EPIN-COSTECH
 
L'identité numérique du chercheur : problématique, enjeux et outils
L'identité numérique du chercheur : problématique, enjeux et outilsL'identité numérique du chercheur : problématique, enjeux et outils
L'identité numérique du chercheur : problématique, enjeux et outilsJulien PIERRE
 
Des outils numériques pour la recherche
Des outils numériques pour la rechercheDes outils numériques pour la recherche
Des outils numériques pour la rechercheJohanna Daniel
 
Rapport humanités numériques
Rapport humanités numériquesRapport humanités numériques
Rapport humanités numériquesOpenEdition
 
Réflexions éditoriales sur l'administration de la preuve en ligne
Réflexions éditoriales sur l'administration de la preuve en ligneRéflexions éditoriales sur l'administration de la preuve en ligne
Réflexions éditoriales sur l'administration de la preuve en ligneOpenEdition
 
Let's talk about policy! Politiques publiques pour l’ouverture des données sc...
Let's talk about policy! Politiques publiques pour l’ouverture des données sc...Let's talk about policy! Politiques publiques pour l’ouverture des données sc...
Let's talk about policy! Politiques publiques pour l’ouverture des données sc...Rayna Stamboliyska
 
Sociologiedespublics abf2017
Sociologiedespublics abf2017Sociologiedespublics abf2017
Sociologiedespublics abf2017Carole Parisot
 
Pour une documentologie digitale : La vie numérique de Robert Escarpit de 200...
Pour une documentologie digitale : La vie numérique de Robert Escarpit de 200...Pour une documentologie digitale : La vie numérique de Robert Escarpit de 200...
Pour une documentologie digitale : La vie numérique de Robert Escarpit de 200...Amar LAKEL, PhD
 
Ecrire et publier en sciences humaines et sociales
Ecrire et publier en sciences humaines et socialesEcrire et publier en sciences humaines et sociales
Ecrire et publier en sciences humaines et socialesCairn.info
 
Les publics dans les politiques culturelles locales
Les publics dans les politiques culturelles locales Les publics dans les politiques culturelles locales
Les publics dans les politiques culturelles locales Xavier Galaup
 

Similar to Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF (20)

UE ISSM 7.309 GCF2019
UE ISSM 7.309 GCF2019UE ISSM 7.309 GCF2019
UE ISSM 7.309 GCF2019
 
Centre de Données Socio-Politique - inauguration Medialab
Centre de Données Socio-Politique - inauguration MedialabCentre de Données Socio-Politique - inauguration Medialab
Centre de Données Socio-Politique - inauguration Medialab
 
Introduction aux données de la recherche
Introduction aux données de la rechercheIntroduction aux données de la recherche
Introduction aux données de la recherche
 
Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...
 
UE ISSM 7309 GCF2023.pptx
UE ISSM 7309 GCF2023.pptxUE ISSM 7309 GCF2023.pptx
UE ISSM 7309 GCF2023.pptx
 
Les « Données de la recherche » : définitions, enjeux et perspectives pour...
Les « Données de la recherche » : définitions, enjeux et perspectives pour...Les « Données de la recherche » : définitions, enjeux et perspectives pour...
Les « Données de la recherche » : définitions, enjeux et perspectives pour...
 
Veille, visibilité et communication : les atouts des réseaux sociaux pour le ...
Veille, visibilité et communication : les atouts des réseaux sociaux pour le ...Veille, visibilité et communication : les atouts des réseaux sociaux pour le ...
Veille, visibilité et communication : les atouts des réseaux sociaux pour le ...
 
#AAFSaintÉ19 : L'open data : source d'injonctions contradictoires pour le par...
#AAFSaintÉ19 : L'open data : source d'injonctions contradictoires pour le par...#AAFSaintÉ19 : L'open data : source d'injonctions contradictoires pour le par...
#AAFSaintÉ19 : L'open data : source d'injonctions contradictoires pour le par...
 
Présentation de J. Valluy du 03/11/11
Présentation de J. Valluy du 03/11/11Présentation de J. Valluy du 03/11/11
Présentation de J. Valluy du 03/11/11
 
L'identité numérique du chercheur : problématique, enjeux et outils
L'identité numérique du chercheur : problématique, enjeux et outilsL'identité numérique du chercheur : problématique, enjeux et outils
L'identité numérique du chercheur : problématique, enjeux et outils
 
UE ISSM 7.309 GCF2018bis
UE ISSM 7.309 GCF2018bisUE ISSM 7.309 GCF2018bis
UE ISSM 7.309 GCF2018bis
 
20111128rechercheinfo_slsh
20111128rechercheinfo_slsh20111128rechercheinfo_slsh
20111128rechercheinfo_slsh
 
Des outils numériques pour la recherche
Des outils numériques pour la rechercheDes outils numériques pour la recherche
Des outils numériques pour la recherche
 
Rapport humanités numériques
Rapport humanités numériquesRapport humanités numériques
Rapport humanités numériques
 
Réflexions éditoriales sur l'administration de la preuve en ligne
Réflexions éditoriales sur l'administration de la preuve en ligneRéflexions éditoriales sur l'administration de la preuve en ligne
Réflexions éditoriales sur l'administration de la preuve en ligne
 
Let's talk about policy! Politiques publiques pour l’ouverture des données sc...
Let's talk about policy! Politiques publiques pour l’ouverture des données sc...Let's talk about policy! Politiques publiques pour l’ouverture des données sc...
Let's talk about policy! Politiques publiques pour l’ouverture des données sc...
 
Sociologiedespublics abf2017
Sociologiedespublics abf2017Sociologiedespublics abf2017
Sociologiedespublics abf2017
 
Pour une documentologie digitale : La vie numérique de Robert Escarpit de 200...
Pour une documentologie digitale : La vie numérique de Robert Escarpit de 200...Pour une documentologie digitale : La vie numérique de Robert Escarpit de 200...
Pour une documentologie digitale : La vie numérique de Robert Escarpit de 200...
 
Ecrire et publier en sciences humaines et sociales
Ecrire et publier en sciences humaines et socialesEcrire et publier en sciences humaines et sociales
Ecrire et publier en sciences humaines et sociales
 
Les publics dans les politiques culturelles locales
Les publics dans les politiques culturelles locales Les publics dans les politiques culturelles locales
Les publics dans les politiques culturelles locales
 

More from AssociationAF

RASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - SupportsRASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - SupportsAssociationAF
 
RASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - SupportsRASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - SupportsAssociationAF
 
RASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - SupportsRASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - SupportsAssociationAF
 
RASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - SupportsRASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - SupportsAssociationAF
 
Presentation_RASAD_AMICHI_V1_20230126.pdf
Presentation_RASAD_AMICHI_V1_20230126.pdfPresentation_RASAD_AMICHI_V1_20230126.pdf
Presentation_RASAD_AMICHI_V1_20230126.pdfAssociationAF
 
20231019.1.2_TransitionDroitsCulturels_Conference.pdf
20231019.1.2_TransitionDroitsCulturels_Conference.pdf20231019.1.2_TransitionDroitsCulturels_Conference.pdf
20231019.1.2_TransitionDroitsCulturels_Conference.pdfAssociationAF
 
Les archives de AIDES militer agir transformer
Les archives de AIDES militer agir transformerLes archives de AIDES militer agir transformer
Les archives de AIDES militer agir transformerAssociationAF
 
Chacun cherche son SAE table ronde colloque
Chacun cherche son SAE table ronde colloqueChacun cherche son SAE table ronde colloque
Chacun cherche son SAE table ronde colloqueAssociationAF
 
Quand sobriété rencontre archives table ronde
Quand sobriété rencontre archives table rondeQuand sobriété rencontre archives table ronde
Quand sobriété rencontre archives table rondeAssociationAF
 
20231018.1_RecolerLogicielsApplis_Conference.pptx
20231018.1_RecolerLogicielsApplis_Conference.pptx20231018.1_RecolerLogicielsApplis_Conference.pptx
20231018.1_RecolerLogicielsApplis_Conference.pptxAssociationAF
 
Le fabuleux destin des archivistes communiquants : les archives de la MEL
Le fabuleux destin des archivistes communiquants : les archives de la MELLe fabuleux destin des archivistes communiquants : les archives de la MEL
Le fabuleux destin des archivistes communiquants : les archives de la MELAssociationAF
 
Les archives municipales et métropolitaines d'Orléans
Les archives municipales et métropolitaines d'OrléansLes archives municipales et métropolitaines d'Orléans
Les archives municipales et métropolitaines d'OrléansAssociationAF
 
la valorisation des archives sur les réseaux sociaux, l'exemple du CDG24
la valorisation des archives sur les réseaux sociaux, l'exemple du CDG24la valorisation des archives sur les réseaux sociaux, l'exemple du CDG24
la valorisation des archives sur les réseaux sociaux, l'exemple du CDG24AssociationAF
 
table ronde j'archive bien ne t'en fais pas
table ronde j'archive bien ne t'en fais pastable ronde j'archive bien ne t'en fais pas
table ronde j'archive bien ne t'en fais pasAssociationAF
 
20231017_ArchivesWallonie_Conference.ppt
20231017_ArchivesWallonie_Conference.ppt20231017_ArchivesWallonie_Conference.ppt
20231017_ArchivesWallonie_Conference.pptAssociationAF
 
A la poursuite de l'intelligence artificielle
A la poursuite de l'intelligence artificielleA la poursuite de l'intelligence artificielle
A la poursuite de l'intelligence artificielleAssociationAF
 
2023_Valenciennes_2023OdysseeTransTer_V2.pptx
2023_Valenciennes_2023OdysseeTransTer_V2.pptx2023_Valenciennes_2023OdysseeTransTer_V2.pptx
2023_Valenciennes_2023OdysseeTransTer_V2.pptxAssociationAF
 
DUBOIS_Presentation_cyberattaque_Bondy_vf.pdf
DUBOIS_Presentation_cyberattaque_Bondy_vf.pdfDUBOIS_Presentation_cyberattaque_Bondy_vf.pdf
DUBOIS_Presentation_cyberattaque_Bondy_vf.pdfAssociationAF
 
MEIGNEN_Presentation-AAF-SAE-sécurité.pdf
MEIGNEN_Presentation-AAF-SAE-sécurité.pdfMEIGNEN_Presentation-AAF-SAE-sécurité.pdf
MEIGNEN_Presentation-AAF-SAE-sécurité.pdfAssociationAF
 
SEGURET_presentation_secur_Lyon_seguret.pdf
SEGURET_presentation_secur_Lyon_seguret.pdfSEGURET_presentation_secur_Lyon_seguret.pdf
SEGURET_presentation_secur_Lyon_seguret.pdfAssociationAF
 

More from AssociationAF (20)

RASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - SupportsRASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - Supports
 
RASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - SupportsRASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - Supports
 
RASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - SupportsRASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - Supports
 
RASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - SupportsRASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - Supports
 
Presentation_RASAD_AMICHI_V1_20230126.pdf
Presentation_RASAD_AMICHI_V1_20230126.pdfPresentation_RASAD_AMICHI_V1_20230126.pdf
Presentation_RASAD_AMICHI_V1_20230126.pdf
 
20231019.1.2_TransitionDroitsCulturels_Conference.pdf
20231019.1.2_TransitionDroitsCulturels_Conference.pdf20231019.1.2_TransitionDroitsCulturels_Conference.pdf
20231019.1.2_TransitionDroitsCulturels_Conference.pdf
 
Les archives de AIDES militer agir transformer
Les archives de AIDES militer agir transformerLes archives de AIDES militer agir transformer
Les archives de AIDES militer agir transformer
 
Chacun cherche son SAE table ronde colloque
Chacun cherche son SAE table ronde colloqueChacun cherche son SAE table ronde colloque
Chacun cherche son SAE table ronde colloque
 
Quand sobriété rencontre archives table ronde
Quand sobriété rencontre archives table rondeQuand sobriété rencontre archives table ronde
Quand sobriété rencontre archives table ronde
 
20231018.1_RecolerLogicielsApplis_Conference.pptx
20231018.1_RecolerLogicielsApplis_Conference.pptx20231018.1_RecolerLogicielsApplis_Conference.pptx
20231018.1_RecolerLogicielsApplis_Conference.pptx
 
Le fabuleux destin des archivistes communiquants : les archives de la MEL
Le fabuleux destin des archivistes communiquants : les archives de la MELLe fabuleux destin des archivistes communiquants : les archives de la MEL
Le fabuleux destin des archivistes communiquants : les archives de la MEL
 
Les archives municipales et métropolitaines d'Orléans
Les archives municipales et métropolitaines d'OrléansLes archives municipales et métropolitaines d'Orléans
Les archives municipales et métropolitaines d'Orléans
 
la valorisation des archives sur les réseaux sociaux, l'exemple du CDG24
la valorisation des archives sur les réseaux sociaux, l'exemple du CDG24la valorisation des archives sur les réseaux sociaux, l'exemple du CDG24
la valorisation des archives sur les réseaux sociaux, l'exemple du CDG24
 
table ronde j'archive bien ne t'en fais pas
table ronde j'archive bien ne t'en fais pastable ronde j'archive bien ne t'en fais pas
table ronde j'archive bien ne t'en fais pas
 
20231017_ArchivesWallonie_Conference.ppt
20231017_ArchivesWallonie_Conference.ppt20231017_ArchivesWallonie_Conference.ppt
20231017_ArchivesWallonie_Conference.ppt
 
A la poursuite de l'intelligence artificielle
A la poursuite de l'intelligence artificielleA la poursuite de l'intelligence artificielle
A la poursuite de l'intelligence artificielle
 
2023_Valenciennes_2023OdysseeTransTer_V2.pptx
2023_Valenciennes_2023OdysseeTransTer_V2.pptx2023_Valenciennes_2023OdysseeTransTer_V2.pptx
2023_Valenciennes_2023OdysseeTransTer_V2.pptx
 
DUBOIS_Presentation_cyberattaque_Bondy_vf.pdf
DUBOIS_Presentation_cyberattaque_Bondy_vf.pdfDUBOIS_Presentation_cyberattaque_Bondy_vf.pdf
DUBOIS_Presentation_cyberattaque_Bondy_vf.pdf
 
MEIGNEN_Presentation-AAF-SAE-sécurité.pdf
MEIGNEN_Presentation-AAF-SAE-sécurité.pdfMEIGNEN_Presentation-AAF-SAE-sécurité.pdf
MEIGNEN_Presentation-AAF-SAE-sécurité.pdf
 
SEGURET_presentation_secur_Lyon_seguret.pdf
SEGURET_presentation_secur_Lyon_seguret.pdfSEGURET_presentation_secur_Lyon_seguret.pdf
SEGURET_presentation_secur_Lyon_seguret.pdf
 

Odile Gaultier Voituriez et Diego Antolinos-Basso_La sondothèque du CEVIPOF

  • 1. LA SONDOTHEQUE DU CEVIPOF Diego Antolinos-Basso, développeur data-scientist Odile Gaultier-Voituriez, responsable de la documentation et des archives Centre de recherches politiques de Sciences Po (CEVIPOF) RASAD, Angoulême, 2 février 2018 Une coopération fructueuse entre un spécialiste du traitement des données numériques et une responsable de la documentation et des archives
  • 2. Plan  Introduction  Sciences Po  Le CEVIPOF  Laboratoire  Projet scientifique  Le centre de documentation  La sondothèque  En chiffres  Traitement  Histoire  Un cas d’étude  Conclusion
  • 3. Introduction  Coopération  Dans un laboratoire de recherche  À tous les niveaux  Une histoire d’« archéologie numérique »  Conserver, consolider et valoriser  Projet exploratoire et inédit Nous espérons que cela vous sera utile !
  • 4. Sciences Po  L’Ecole libre des sciences politiques (ELSP) puis la Fondation nationale des sciences politiques (FNSP) et l’Institut d’études politiques (IEP) de Paris  Deux dates fondatrices : 1872 et 1945  Quatre missions :  Enseignement  Recherche  Documentation  Edition
  • 5. Le CEVIPOF  Un laboratoire de recherche en science politique, à Paris  Fondé en 1960 par la Fondation nationale des sciences politiques (FNSP)  Unité mixte de recherche (UMR) du CNRS en 1968  Deux axes de recherche interdisciplinaires : Pensée politique Partis, comportement politique et élections => besoin de documentation et de sources
  • 6. Le CEVIPOF  Projets et questions de recherche  Travailler avec et pour les chercheurs  Archives par et pour la recherche  Objectivité parfaite et exhaustivité utopiques  Mise à disposition de tous  Volonté du directeur de recruter un spécialiste des données (compétences intellectuelles et techniques)
  • 7.  Documentation : Production scientifique des chercheurs : ouvrages, rapports, thèses, mémoires, chapitres et articles Ouvrages de référence  Résultats électoraux et livres blancs  Archives électorales  Tracts politiques hors élections  Archives d’enquêtes  Archives administratives  « Sondothèque » Le centre de documentation
  • 8.  Sondages d’opinion en France  Domaine politique, économique et social  Co-construction par et pour la recherche  Fonds unique en France car les instituts ont très mal conservé leurs sondages  Années 1950 à aujourd’hui  Différents instituts : BVA, CSA, ELABE, Harris Interactive, IFOP, IPSOS, Louis Harris, SOFRES  Papier (1958 à 2000) numérique (depuis 2004)  Rapports, presse et publications scientifiques La sondothèque
  • 10.  25.000 sondages d’opinion  800 cartons d’archives  80 mètres linéaires  579 thématiques  53 ans La sondothèque : en papier
  • 11.  9000 sondages  600 à 700 sondages par an  depuis 17 ans La sondothèque : numérique
  • 12. La sondothèque : équipe Missions Nadia Dehan Guy Michelat Diégo Antolinos-Basso Odile Gaultier-Voituriez Émilie Fromont Lauren Clark Martial Foucault Années 70 à 2010 2014-2018
  • 13.  Classement par institut de sondage Chronologiquement, sauf pour certaines séries spécifiques, à part : baromètre politique, images des personnalités politiques  Fonds ouvert : s’enrichit quotidiennement  Description documentaire & classement Type de document : rapport, presse, livre, web Numérisé ou papier Institut La sondothèque : traitement
  • 14.  Alimentation : ~1970 à décembre 2010  Logiciel Fox Pro (outil de bases de données)  Chaque pièce (unité intellectuelle et matérielle) dispose également d’un code sur le document et dans la base  Plan de classement thématique qui a progressivement évolué (579 thèmes en 2008)  Dates de collecte et de publication pas toujours évidentes à identifier La sondothèque : données
  • 15.  Problèmes techniques : Développement d’un outil spécifique : la version de Fox Pro a été modifiée par Guy Michelat Obsolescence de l’outil : ni maintenance, ni mise à jour, ni migration en temps voulu  Projet lié à une personne : Alimentation au long de sa carrière Seule à maîtriser la base, à en connaître les détails  Problèmes intrinsèques aux données : Identification des informations du document Qualification thématique La sondothèque : écueils
  • 16.  Pendant 4 ans après le départ à la retraite de la documentaliste chargée de la sondothèque  Combat pour récupérer les données et les métadonnées car conscience de leur intérêt  Problème d’accès pour le public : uniquement via les impressions papier de la base  Traitement documentaire et non archivistique (pas de cote ; code correspond à la pièce et non au carton) La sondothèque : pause
  • 17.  Besoin de compétences en« archéologie numérique » Compréhension du problème Connaissance des données : repérage des champs, etc. Identification et propositions de solutions techniques  Discussions et échanges nourris à chaque étape du projet de récupération  Les choix intellectuels et techniques ont des conséquences bien réelles La sondothèque : renaissance
  • 18.  Migrer une base de données prisonnière d’un outil obsolète : sauver l’existant sans détruire  Extraction du disque dur de la machine  Récupération des données brutes de la base  Conversion des fichiers obsolètes  Itérations : nettoyage-sauvegarde, etc.  Résultats : un tableau Excel de 25000 lignes La sondothèque : récupération
  • 20.
  • 21.  Index : numéro de document  Type de document : rapport, presse, livre  Numérisé : parfois entre 2000 et 2008  Titre et complément : encore souvent inversé  Dates de publication : deux dates possibles  Date de collecte : début de collecte  Institut chargé de réaliser le sondage  Commanditaire du sondage  Type d’échantillon  Âge des membres de l’échantillon  Codes thématiques La sondothèque : variables
  • 22.  Travail effectué par une archiviste professionnelle Récolement du fonds Cotation du fonds : sous-séries par institut de sondage Inventaire sommaire sous Excel La sondothèque : version n°2
  • 24.  Volonté du directeur du CEVIPOF de valoriser la sondothèque Cas d’étude dans le cadre de la présidentielle 2017 Projet Enquête électorale française (ENEF) 2017 Repérer les sondages d’intentions de vote à la présidentielle depuis 1965 dans la sondothèque Saisir les données Prototyper une visualisation des données extraites Mettre en ligne sur Internet ces visualisations La sondothèque : cas d’étude Les sondages d’intention de vote pour l’élection présidentielle depuis 1965
  • 25.  Extraction des sondages d’intentions de vote par requêtes dans la base par Diego Antolinos- Basso : dates, mots-clefs, thématiques  Repérage physique des sondages dans le fonds d’archives par Émilie Fromont, archiviste  Saisie des données contenues dans les sondages d’intentions de vote par Lauren Clark, stagiaire en science politique La sondothèque : cas d’étude Les sondages d’intention de vote pour l’élection présidentielle depuis 1965
  • 26.  Exemples de problèmes posés lors de la saisie  Quand il y a plusieurs hypothèses de candidats, laquelle retenir ?  18 mois avant la présidentielle, certaines hypothèses ne contiennent aucun candidat réellement présent au 2d tour, que faire ?  Combien de candidats retenir quand liste d’une vingtaine de candidats potentiels ? => risque de biais méthodologique La sondothèque : cas d’étude Les sondages d’intention de vote pour l’élection présidentielle depuis 1965
  • 27.  Autres problèmes posés par la mise en ligne  Juridiques : ne pas mettre en ligne les rapports de sondages eux-mêmes, propriété du commanditaire, mais une visualisation à valeur ajoutée  Graphiques : difficile de tout représenter (date, candidat, institut, plusieurs sondages à la même date) => choix La sondothèque : cas d’étude Les sondages d’intention de vote pour l’élection présidentielle depuis 1965
  • 28. La sondothèque : cas d’étude Intentions de vote pour l’élection présidentielle de 1974
  • 29. Conclusion  Complémentarité : Entre les différentes personnes Entre les compétences de chacun  Compréhension et reconnaissance : Mutuelles des personnes (permanents et ponctuels) De l’apport du travail des autres Les choix techniques et intellectuels ont des conséquences en termes archivistiques mais également pour la recherche scientifique.