L'atelier "Mutualisation et exploitation des données des structures culturelles" avait pour objectif d'expliquer comment la plateforme de mutualisation des données des structures culturelles – Data&Musée – permet de créer de nouveaux outils de pilotage pour aider au développement de leurs activités.
--
www.datamusee.fr
@DataMusee
Contact :
Sandra Davené, coordinatrice Data&Musée
sandra@orpheo.fr
01 86 27 51 89
5. PB: LA PLUPART DES TECHNOLOGIES
SONT BASÉES SUR DES DONNÉES STRUCTURÉES
6. T14h-14h30 // INTRODUCTION A DATA&MUSEE
DATA
SOURCES
Data storage
Real time
messaging
computing
Static Data
Processing
Data Flow
Processing
Machine
learning
Analysis
Reporting
KPI
generation
BIG DATA PROCESSING
7. T Construire la 1ère vue à 360° de l’activité des institutions culturelles
8. T ORGANISATIONT
LE COMITÉ DE PILOTAGE
En charge des orientations stratégiques de
Data&Musée. Animé par le chef de file Orpheo et
appuyé par l’Institut Mines-Telecom, il se réunit
tous les 3 mois en séance plénière. Il est
composé d’un représentant de chacun des 10
partenaires du projet : Orpheo, l’IMT, reciproque,
Tech4team, Kernix, MyOrpheo, GuestViews, la
FMSH, le CMN et Paris Musées.
LE COMITÉ SCIENTIFIQUE
Animé par l’Institut Mines-Telecom, il se réunit
tous les 6 mois en séance plénière.
Il est composé d’experts d’horizons différents
croisant culture, innovation numérique, big data
et protection des données personnelles. Le
comité fournit un forum de partage de
connaissances et d’expériences.
9. 55 LOTS ESSENTIELST
Cas d’usages et spécifications de la plateforme
Collecte de données Développements
Méthodes et analyse de données
Services
Dissémination
Organisation
Expérimentations
10. T CALENDRIER PREVISIONNEL : 01/09/17 > 27/08/20T
4
M
ars
2019
-Novem
bre
2019
>M
ÉTHODE
ET
ANALYSE
DES
DONNÉES
>RENDRE
ACCESSIBLES
LES
DONNÉES
DE
LA
PLATEFORM
E
VIA
DES
API
>RÉFLEXION
SUR
LES
BUSINESS
M
ODELS
3
Septem
bre
2018
-Février2019
>COLLECTE
DE
DONNÉES
DU
CM
N,DE
PARIS
M
USÉES
ET
DES
STRUCTURES
EXTÉRIEURES
Avril-Septem
bre
2018
>ETABLISSEM
ENT
DE
L’ACCORD
DE
CONSORTIUM
>GESTION
DES
ACCÈS
SUR
LA
PLATEFORM
E
ET
SÉCURISATION
>M
ISE
EN
PLACE
DE
FLUX
DE
DONNÉES
HISTORIQUES
BILLETTERIE
21
Septem
bre
2017-Septem
bre
2018
>PROPOSITION
ET
ÉVALUATION
DES
CAS
D’USAGES
>SPÉCIFICATIONS
FONCTIONNELLES
DE
LA
PLATEFORM
E
>COLLECTE
DE
DONNÉES
(OPEN
DATA,LIVRES
D’OR
GUEST
VIEW
S...)
5
Juillet2019
-Août2020
>M
ISE
EN
PLACE
DES
SERVICES
>EXPÉRIM
ENTATIONS
DE
LA
PLATEFORM
E
:
CONNEXION
DES
APIAVEC
LES
SYSTÈM
ES
TIERS
DES
INSTITUTIONS
CULTURELLES...
11. T Mutualisation des données dans le secteur culturel à l’international T
PÔLE SUR LES DONNÉES MASSIVES EN CULTURE (CANADA)
● Initiative menée au sein du quartier des spectacles à Montréal : 80 lieux culturels,
40 festivals, +100 spectacles par mois
● Mettre en commun les données pour mieux définir les besoins et les attentes des
publics : créer une culture du partage
● Hackaton : mars 2017 : 20 structures / 120 Data scientist > sur 48h rendre des
données de billetterie interopérables
○ Exemple de résultats :
■ vision de l’offre culturelle (quels types de spectacles) par jour de la
semaine, par heure
■ vision des périodes auxquelles les billets sont achetés
● Juin 2018 : création d’une structure pérenne “Le Pôle sur les données massives en
culture”
12. T Mutualisation des données dans le secteur culturel à l’international T
THE AUDIENCE AGENCY (ROYAUME-UNI) / https://www.theaudienceagency.org
● Depuis 2012 : mandatée et financée par l’organisme public Art Council England pour
aider les acteurs culturels dans la connaissance et le développement des publics.
● The Audience Finder, un outil d’analyse des publics à l’échelle du Royaume-Uni
(patrimoine et spectacle vivant)
>> Chiffres clés : 800 organisations culturelles ~ 170 millions de billets ~ 280 000 études
des publics traitées
13. T Mutualisation des données dans le secteur culturel à l’international T
KULTURMONITORING (ALLEMAGNE)
https://about.visitberlin.de/en/cultural-monitoring-visitor-research-and-evaluation
● Projet lancé à Berlin en 2008
● Piloté par l’Office du Tourisme de Berlin VisitBerlin et soutenu par une
administration publique - équivalent Ministère de la Culture
● Financé en partie par des fonds européens, centralise les études des publics
d‘institutions culturelles (musées, théâtres, opéras).
● Chiffres : 250 000 questionnaires menés auprès des visiteurs des musées in situ
et d’habitants à Berlin (raisons de leur visite, l’organisation de leurs séjours, leurs
modes d’achat de tickets etc)
● Expérimentation sur le territoire de Berlin avec 7 institutions majeures (Deutsche
Oper, Neues Museum, Alte Nationalgalerie…) >> méthode en cours d’expansion
dans de nouvelles villes et régions en Allemagne ainsi qu’à l’étranger – en Autriche.
14. TPARTICIPER A UN PROJET COLLABORATIF R&D en cours d’élaborationT
Projet de recherche applicative
● vise à offrir des services opérationnels à l’issue du projet
Exploratoire
(question récurrente: qu’allez-vous faire de nos données?)
● nous allons faire le mieux possible avec les données que nous aurons
● nous avons un peu de temps pour tester des hypothèses
Nous avons les méthodes de collecte et traitement des données
● méthodes plus efficaces si nous avons du volume
Vous avez :
● les données : vous pouvez les rendre accessibles
● les usages : vous pouvez contribuer à définir des objectifs
15. T CHARTE D’ENGAGEMENT T
● Fixer les modalités de collaboration entre la Structure extérieure fournisseuse de
données et les Membres du consortium dans le cadre du Projet.
● Droits et obligations des Membres du consortium :
○ Produire des analyses qui ne permettent pas d’individualiser les résultats en
fonction d’une structure fournisseur de Données
○ Produire des résultats communs issus des Données fournies par les
structures fournisseurs de Données et des résultats propres à la Structure
extérieure.
● Droits et obligations de la Structure extérieure :
○ Transmettre ses Données respectant le cadre légal relatif à la protection des
Données à caractère personnel ;
○ Ne pas diffuser les résultats issus de ses propres Données ou des Données
d’autres structures.
16. T CHARTE D’ENGAGEMENT T
● Contreparties :
○ Un nettoyage et une structuration de ses Données transmises ;
○ Un accès à la plateforme pendant la durée du FUI ;
○ A des résultats issus des traitements effectués par Data&Musée ;
○ A un accès gracieux, pendant la durée du projet, à Arenametrix plateforme
d’analyse des données de billetterie développée par Tech4Team, partenaire
du projet ;
○ Une communication sur son implication dans le projet ;
○ Une participation aux réflexions sur les cas d’usages, les spécifications de la
plateforme et sur la mise en forme des résultats intégrés sur la plateforme.
17. COMMENT PARTICIPER A DATA MUSÉE ?
Vestibulum congue tempus
lorem ipsum nec dolor
Lorem ipsum dolor sit amet, dolor at
consectetur adipiscing elit, sed do
eiusmod tempor. Lorem ipsum dolor sit
amet, consectetur adipiscing elit, sed do
eiusmod tempor. Lorem ipsum dolor sit
amet, consectetur adipiscing elit, sed do
eiusmod tempor.
Vestibulum congue
tempus
Lorem ipsum dolor sit amet,
consectetur adipiscing elit,
sed do eiusmod tempor.
Vestibulum congue
tempus
Lorem ipsum dolor sit amet,
consectetur adipiscing elit,
sed do eiusmod tempor.
Vestibulum congue
tempus
Lorem ipsum dolor sit amet,
consectetur adipiscing elit,
sed do eiusmod tempor.
Vestibulum congue
tempus
Lorem ipsum dolor sit amet,
consectetur adipiscing elit,
sed do eiusmod tempor.
Quels indicateurs ?
Dans le cadre du projet Recherche &
Développement Data&Musée, notre
objectif est de démontrer que
l’agrégation de données de diverses
sources permet d’obtenir de nouveaux
indicateurs de performance.
Types de données
transmises
Déterminer les formats utilisés,
organisation des données,
transfert de fichiers ou APIs,
périodicité des transferts
Charte d’engagement
Signer les modalités de
collaboration entre le
Musée extérieur et les
Membres du consortium
dans le cadre du Projet.
Réunions avec les
institutions extérieures
Première réunion après la
phase Collecte de données
en juin 2019.
Accès à la
plateforme
Dès disponibilité, vous
pourrez accéder à une
première visualisation des
indicateurs issus du
croisement des données.
Nous sommes à la recherche d’institutions désireuses de suivre ce projet,
d’être informés des différents résultats et de partager d’éventuelles données.
18. 14h30-15h15
Qu’est-ce que l’analyse et le croisement de données ?
Intervenants :
● François-Xavier Bois, co-fondateur / Kernix
● Ludovic Bordes, co-fondateur / Arenametrix
● Camille Caubrière, co-fondatrice / GuestViews
● Jean-Claude Moissinac, Maître de conférences / Institut Mines-Telecom, Telecom
Paristech
19. QU’EST-CE QUE L’ANALYSE ET LE CROISEMENT DE DONNÉES ?
Gagner en performance
- Optimiser les processus de production
- Améliorer le pilotage stratégique
- Innover
Développer le business
- Détecter de nouvelles opportunités
- Monétiser et valoriser les données
- Réduire et anticiper les risques
Améliorer la relation client
- Meilleure connaissance client
- Affiner l’offre
- Meilleure recommandation
Un objectif COMMUN,
à tous les PROJETS :
le retour sur
INVESTISSEMENT
21. QU’EST-CE QUE L’ANALYSE ET LE CROISEMENT DE DONNÉES ?
Compréhension
business
Identification et
préparation des données
Modélisation et analyse
Démonstration de la
création de valeur et
mise en production
01 02
03 04
23. Kernix
→ Non structuré (Salon des radiologues)
23
Scoring
de risque
Natixis est banque internationale de
financement. L’une de ses filiales est en
charge des prêts à la consommation et
souhaite améliorer l’octroi de ces prêts
aux jeunes de 18 à 28 ans.
Nous avons développé pour cette
problématique un outil de prédiction
de risque, ainsi qu’une interface à
destination des conseillers bancaires.
24. Recommandation
de programmes
Nous avons développé pour le site 6play.fr
(replay de M6), un moteur de
recommandation de programmes basé
sur le contenu des descriptions de ces
programmes (calcul de similarité
sémantique via techniques de text mining)
et sur l’historique du comportement de
plusieurs millions d’utilisateurs
(problématique Big Data forte).
25. Kernix
→ Non structuré (Salon des radiologues)
25
Le Challenge « Top 100 usages
culinaires » consiste en la réalisation
d'un outil d'identification des usages
culinaires d'un marché donné à partir
de données disponibles sur le Web en
mettant en évidence les dynamiques
qui impactent ces usages :
saisonnalité, semaine/weekend,
événement particulier, marché, etc.
Cartographies des usages
culinaires d’un marché
26. QU’EST-CE QUE L’ANALYSE ET LE CROISEMENT DE DONNÉES ?
Arenametrix
■ Données disponibles dans vos musées/structures culturelles à mobiliser:
○ Données billetterie (web, guichet, revendeurs…)
○ Données de contrôle d’accès
○ Données audio guides
○ Données enquêtes
○ Données interactions web
■ Ressources humaines nécessaires pour ce type de projet : insister sur la
simplicité de l’intégration d’un projet data
27. QU’EST-CE QUE L’ANALYSE ET LE CROISEMENT DE DONNÉES ?e
Arenametrix - Use case 1 : segmentation des publics (Culturespaces)
Analyser en quelques clics le comportement
très fin des publics individuels
28. QU’EST-CE QUE L’ANALYSE ET LE CROISEMENT DE DONNÉES ?
Arenametrix Segmentation très fine des contacts et envoi de campagnes
mails
29. QU’EST-CE QUE L’ANALYSE ET LE CROISEMENT DE DONNÉES ?
Arenametrix
Analyse et optimisation du Retour Sur Investissement des campagnes marketing
30. QU’EST-CE QUE L’ANALYSE ET LE CROISEMENT DE DONNÉES ?
Arenametrix : Use case 2 - acquisition digitale de publics cibles en utilisant des
données des visiteurs passés
Toucher de nouveaux publics
en cherchant des jumeaux statistiques des acheteurs dans la sphère sociale
31. QU’EST-CE QUE L’ANALYSE ET LE CROISEMENT DE DONNÉES ?
GuestViews
■ Startup qui donne la parole aux visiteurs des institutions culturelles
pour mieux les connaître et mieux les fidéliser
■ Solution permettant de collecter à chaud, d'analyser et de valoriser
des données visiteurs à forte valeur ajoutée
○ Données quali : commentaires
○ Données quanti : infos de profil, niveau de satisfaction, QCM/QCU
○ Données personnelles : prénom, nom, email, consentement (opt-in)
32. QU’EST-CE QUE L’ANALYSE ET LE CROISEMENT DE DONNÉES ?
GuestViews
■ Application intégrée en fin de parcours
■ Données collectées en continu
Maison Victor Hugo Château de Vincennes Panthéon Musée Cognacq-Jay
33. QU’EST-CE QUE L’ANALYSE ET LE CROISEMENT DE DONNÉES ?
GuestViews
■ Tableau de bord qui centralise les informations collectées
■ Données accessibles et analysées en temps réel
34. QU’EST-CE QUE L’ANALYSE ET LE CROISEMENT DE DONNÉES ?
GuestViews
■ Tableau de bord qui centralise les informations collectées
■ Données accessibles et analysées en temps réel
35. QU’EST-CE QUE L’ANALYSE ET LE CROISEMENT DE DONNÉES ?
GuestViews
■ Tableau de bord qui centralise les informations collectées
■ Données accessibles et analysées en temps réel
36. QU’EST-CE QUE L’ANALYSE ET LE CROISEMENT DE DONNÉES ?
GuestViews
■ Tableau de bord qui centralise les informations collectées
■ Données accessibles et analysées en temps réel
37. QU’EST-CE QUE L’ANALYSE ET LE CROISEMENT DE DONNÉES ?
GuestViews
■ Cas d’usage
○ “Page avis” (communication externe et SEO)
○ “Alerte email mauvaise note” (réactivité dans la gestion du mécontentement)
○ “Filtres” (segmentation de la base)
○ “Campagnes intelligentes” (emailing ciblé par profils-types)
○ “Reporting automatique” (aide à la décision)
■ Bénéfices
○ Mettre en place des standards internes en matière d’accueil des publics
○ Maximiser la satisfaction des publics concernant leur expérience de visite
○ Augmenter la fréquentation et diversifier les publics
■ Equipes concernées
○ Développement des publics
○ Marketing
○ Communication
○ Conservation
38. QU’EST-CE QUE L’ANALYSE ET LE CROISEMENT DE DONNÉES ?
Réunir les données des institutions
● Collecter les données en respectant la vie privée
● Adopter des représentations homogènes pour rendre les données comparables
● Choix d’un modèle qui permet de représenter des liens entre les données
S’appuyer sur des données externes
● DataTourisme, données des offices de tourisme sur les lieux et les événements
● OpenAgenda, et autres agenda d’événements
● Base Joconde et autres données culturelles
● Bases de connaissances généralistes: DBPedia, Wikidata, …
● Bases de connaissances géographiques: geonames, données sur data.gouv.fr...
39. Un exemple (simpliste) de liens
Livre d’Or
Visiteur
QU’EST-CE QUE L’ANALYSE ET LE CROISEMENT DE DONNÉES ?
40. Visiteur
QU’EST-CE QUE L’ANALYSE ET LE CROISEMENT DE DONNÉES ?
7d240ddbc2bfe3c3890e122dfbd
589f39e7e03641275fe1028a52b
ac79491de1
Un exemple de liens dans les données actuelles
vient de
a acheté (en ligne)
Livre d’Or
a renseigné
26-2-2017
23-9-2018
41. QU’EST-CE QUE L’ANALYSE ET LE CROISEMENT DE DONNÉES ?e
Nombre de commentaires laissés
dans un musée de Paris Musées
en 2018 (jan-sept)
par origine du visiteur
Score moyen par origine
(-1 négatif, 0 neutre, +1 positif)
42. QU’EST-CE QUE L’ANALYSE ET LE CROISEMENT DE DONNÉES ?
Apports de la mutualisation
● Mutualisation de la collecte de sources de données externes
○ pour enrichir l'exploitation des données de chaque partenaire
● Enrichissement de l'exploitation des données de chaque partenaire
○ par la connaissance des données des autres partenaires
44. 15h30-16h15 :
Quelles sont les besoins des structures culturelles ?
Intervenants :
● François Forge, fondateur et directeur / reciproque
● Gaëlle Lesaffre, Ingénieure de recherche / Chaire Unesco-ITEN
● Jean-Claude Moissinac, Maîtres de conférences / Institut Mines-Telecom,
Telecom Paristech
45. QUELS SONT LES BESOINS DES STRUCTURES CULTURELLES ?
Chaire Unesco-ITEN, reciproque
● Élaboration des cas d’usages
1 - Interrogation des professionnels des établissements culturels
=> Échange autour des pratiques, des données, des outils, des besoins, des
attentes en ateliers collectifs
2 - Élaboration des cas d’usages à partir des besoins recensés
=> Description des suites d’actions dans un système menant à un objectif
=> Priorité aux cas d’usages relevant du croisement de données entre
établissements
48. PILOTAGE EN TEMPS RÉEL
1a.
PRÉVISION DE LA
FRÉQUENTATION
Prévoir la fréquentation
à court terme
1b.
PRÉVISION des FLUX
& FILES D’ATTENTE
Anticiper l’engorgement
des files d’attente
1c.
MONITORING DES
FLUX DE VISITEURS
Suivre et rediriger les
visiteurs dans les espaces
selon l’affluence
3a.
FRÉQUENTATION ;
SEGMENTATION
Analyser les publics, identifier
segments à fort taux de
pénétration
QUELS SONT LES BESOINS DES STRUCTURES CULTURELLES ?
49. ANALYSE POSTÉRIEURE
1a.
FRÉQUENTATION
Bilan de fréquentation de
l’exposition
1b.
SEGMENTATION,
DIVERSIFICATION
Analyse des segments de
public, par activité
1c.
FLUX DE PUBLICS
Tracer flux de publics
entre établissements
QUELS SONT LES BESOINS DES STRUCTURES CULTURELLES ?
50. QUELLES SONT LES BESOINS DES STRUCTURES CULTURELLES ? e
● Les résultats actuels de Data&Musée en matière de données
○ Grande quantité de données collectées et en cours d’unification
■ Billetteries, livres d’or, utilisation des guides de visite
■ Base Joconde, Données HDA, DBPedia
■ DataTourisme, OpenAgenda
■ et bien d’autres: geonames, liste des musées,...
○ Construction de modèles numériques en cours permettant de trouver des
similarités (ex: entre expositions), des rapprochements (ex: entre un lieu et
un événement comme un concert, une conférence…)
● Prise en compte du GDPR
○ Problème général de la donnée partagée
○ Solution mises en oeuvre dans Data&Musée: pseudonymisation à la source
○ Solutions à l’étude
51. 16h15-17h :
TABLE RONDE
RETOUR SUR EXPÉRIENCE SUR LA CRÉATION D’UNE
PLATEFORME DE MUTUALISATION DE DONNÉES
Quels sont les enjeux du Big Data et de la mutualisation des données pour les musées ?
Intervenants : David Kolin, Chef du pôle numérique / CMN
Philippe Rivière, Chef du service numérique / Paris Musées
Jean-Claude Moissinac, Maître de conférences / Institut
Mines-Telecom, Telecom Paristech
Paul Bouzol, CTO / Affluences
Omer Pesquer, Consultant expert en usages numériques
Modérateur : François Forge, fondateur et directeur / reciproque