Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Mégadonnées : kit de survie

72 views

Published on

Présentation au Colloque IRSST 2017 de Guillaume Chicoisne, directeur des programmes scientifiques d'IVADO

http://www.irsst.qc.ca/colloque-2017

Published in: Technology
  • Be the first to comment

  • Be the first to like this

Mégadonnées : kit de survie

  1. 1. Mégadonnées : Kit de survie Guillaume Chicoisne, IVADO
  2. 2. TL;DR • Vous avez besoin de professionnels pour traiter les données; les professionnels ont besoin de vous pour les comprendre. • Avec de grandes données viennent de grands pouvoirs, de grands problèmes et de grandes responsabilités • Le monde des données n’est pas le monde réel
  3. 3. Les projets avec mégadonnées posent les mêmes problèmes que tout projet impliquant des données… mais amplifiés, et d’autres plus spécifiques.
  4. 4. Données? Les données sont une façon de numériser le monde. • Ce qui nous intéresse n’est pas forcément mesurable. • Ce qui est facilement mesurable n’est pas forcément ce qui nous intéresse. • Les mesures indirectes doivent générer d’autant plus de méfiance. Le monde des données n’est pas le monde réel.
  5. 5. Structure classique Acquisition Traitement Interprétation Monde des données Monde réel Création Annotation Nettoyage Collecte Traduction Validation ... Analyse Intégration Fusion Généralisation Exploration Modélisation ... Décision Exploration Compréhension Prédiction Description Mesure Valorisation Utilisation ...
  6. 6. Créer, acquérir, accéder (le 80 % laborieux) (un banquier et son client) - C'est quoi l'problème ? Mes dollars m'appartiennent; j'suis supposé pouvoir les retirer facilement ?! - Non! - Quoi ? - Vos fémurs aussi vous appartiennent, pis vous ne pouvez pas les retirer facilement! (François Pérusse, philosophe québécois)
  7. 7. Traitement • Grand choix de méthodes, depuis les modèles statistiques simples, jusqu’à l’apprentissage profond. • Toujours commencer par les méthodes les plus simples.
  8. 8. Interprétation • Confronter les analyses au monde réel : • Prendre ou appuyer une décision, mesurer une progression, explorer… • Valider les résultats!
  9. 9. Visualisation
  10. 10. Big data — Une définition parmi d’autres
  11. 11. Approches basées sur les données • Attention aux modèles récents (p. ex. : l’apprentissage profond) • Nécessite des experts rares • Complexité pour justifier les résultats • Approche parfois disproportionnée pour le problème • Sensibilité aux données non pertinentes • Prolongation de l’historique, risque de limiter l’innovation • Mais : exploration de solutions “non humaines”
  12. 12. Accès aux données : pas seulement des défis techniques Aspects techniques : volume de données, réseau rapide, accès aux sources, distribution des données et du calcul, etc. Aspects non techniques : vie privée, droits d’utilisation, conformité, confidentialité, sécurité… Responsabilité. Trois notions parmi d’autres : • Quasi-identificateurs • Mi data es su data... • Sécurité : attaques, défaillances, accidents, bévues…
  13. 13. TL;DR • Vous avez besoin de professionnels pour traiter les données; les professionnels ont besoin de vous pour les comprendre. • Avec de grandes données viennent de grands pouvoirs, de grands problèmes et de grandes responsabilités • Le monde des données n’est pas le monde réel
  14. 14. Merci! Besoin de détails ? guillaume.chicoisne@ivado.ca ivado.ca

×