Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Big data: alchimie ou science ?

687 views

Published on

Présentation 19 janvier 2016
Mise en boîte de la Complexité
Chaire ESSEC Edgar Morin

Les mégadonnées, ou Big Data, constituent un nouvel outil à la disposition des entreprises et des chercheurs. Pour qu’elles soient utilisables de manière effective pour la prévision, il est essentiel de prendre du recul et de comprendre leur spécificité. Deux éléments les caractérisent : (i) ces données mesurent une activité d’origine humaine (ii) elles ne sont pas, pour la plupart, issues d’expériences contrôlées et reproductibles, mais au contraire, ont été enregistrées au fil de l’activité et constituent donc une référence historique.

Lors de leur analyse et de la modélisation de leur pouvoir prédictif. Nous devons par conséquent répondre à trois questions : quels sont les comportements reproductibles ? Quels sont ceux qui ressortissent à des circonstances spécifiques ? Quels sont ceux qui sont actionnables ? Dans cette «mise en boîte» de la complexité, je montrerai l’apport de la méthodologie développée au cours d’un demi-siècle d’analyses économétriques en sciences économiques et sociales afin d’appréhender de manière constructive le foisonnement actuel du Big Data et proposer des pistes en Business Analytics.

Published in: Data & Analytics
  • Be the first to like this

Big data: alchimie ou science ?

  1. 1. Big Data: alchimie ou science ? Janvier 2015 - GUILLAUME CHEVILLON Professeur of Statistics & Econometrics, ESSEC Business School CoDirecteur ESSEC-CentraleSupélec MSc Data Sciences & Business Analytics PierreBismuth
  2. 2. BIG DATA: QUELLES DONNEES ? PREVOIR APPORT DES SCIENCES SOCIALES UNE SCIENCE ?
  3. 3. Big Data is not about the Data! Gary King Harvard University (2015) The End of Theory: The Data Deluge Makes the Scientific Method Obsolete Chris Anderson Wired (2008)
  4. 4. MÉTHODE SCIENTIFIQUE? Anderson: induction Observation Hypothèse Test TsangKin-Wah
  5. 5. MÉTHODE SCIENTIFIQUE? Anderson: induction Observation Hypothèse Test Popper? falsification Data science: améliorer l’induction Cross-validation Régularisation TsangKin-Wah
  6. 6. MÉTHODE SCIENTIFIQUE? Anderson: induction Observation Hypothèse Test Popper? falsification Data science: améliorer l’induction Cross-validation Régularisation Hendry (approche LSE) formulation sélection évaluation “computation” TsangKin-Wah
  7. 7. ANALYTICS DECRIRE ET CLASSER PAR MESURES ET VISUALISATION PREVOIR PAR ANALOGIE PRESCRIRE PAR CRITERES DE DECISION Dirk Skreber OUTILS PROBABILITES STATISTIQUES CODING ALGORITHMIQUE OPTIMISATION … Jules de Balincourt
  8. 8. Big Data, are we making a big mistake ? Tim Harford Financial Times April 2014
  9. 9. Erik
  10. 10. Big Data, are we making a big mistake ? Tim Harford Financial Times April 2014 • False positive
  11. 11. Big Data, are we making a big mistake ? Tim Harford Financial Times April 2014 • False positive • N = all ?
  12. 12. Detection influenza epidemics using search engine query data Nature, 2009
  13. 13. Detection influenza epidemics using search engine query data Nature, 2009
  14. 14. QUELLES DONNÉES ? NON STRUCTURÉES, HAUTE FREQUENCE RESEAUX non pas N mais NK x T voire NN! x T Andreas Gursky
  15. 15. QUELLES DONNÉES ? NON STRUCTURÉES, HAUTE FREQUENCE RESEAUX non pas N mais NK x T voire NN! x T DONNÉES NON EXPERIMENTALES LE MODÈLE DEFINIT L’ERREUR Andreas Gursky
  16. 16. QUELLES DONNÉES ? NON STRUCTURÉES, HAUTE FREQUENCE RESEAUX non pas N mais NK x T voire NN! x T DONNÉES NON EXPERIMENTALES LE MODÈLE DEFINIT L’ERREUR NON-STATIONNAIRES/ÉVOLUTION Andreas Gursky
  17. 17. QUELLES DONNÉES ? NON STRUCTURÉES, HAUTE FREQUENCE RESEAUX non pas N mais NK x T voire NN! x T DONNÉES NON EXPERIMENTALES LE MODÈLE DEFINIT L’ERREUR NON-STATIONNAIRES/ÉVOLUTION ORIGINE: ACTIVITÉ HUMAINEAndreas Gursky
  18. 18. EXPERT BUSINESS ANALYTICS N’EST PAS QU’UN DATA SCIENTIST - HUMAINS VS MACHINES INPUT/OUTPUT, ACTIONS DEPENDENT DE 1/ passé et présent observable 2/ croyances, espoirs, anticipations, 3/ réseau (infini?) d’interactions Andreas Gursky Julien Prévieux
  19. 19. EXPERT BUSINESS ANALYTICS N’EST PAS QU’UN DATA SCIENTIST - HUMAINS VS MACHINES INPUT/OUTPUT, ACTIONS DEPENDENT DE 1/ passé et présent observable 2/ croyances, espoirs, anticipations, 3/ réseau (infini?) d’interactions - FEEDBACK Andreas Gursky ANTICIPATIONS AVENIR & ACTIONS DES AUTRES ACTIONS LE PRESENT OBSERVE Julien Prévieux
  20. 20. EXPERT BUSINESS ANALYTICS N’EST PAS QU’UN DATA SCIENTIST - HUMAINS VS MACHINES INPUT/OUTPUT, ACTIONS DEPENDENT DE 1/ passé et présent observable 2/ croyances, espoirs, anticipations, 3/ réseau (infini?) d’interactions - FEEDBACK - SEULES LES ACTIONS SONT OBSERVABLES A “l’équilibre” les croyances et actions sont alignées Analyste observe et comprend les “lois de comportement” - MALHEUREUSEMENT L’équilibre n’existe pas réellement et fluctue Les actions passées ne sont pas suffisantes pour prévoir le comportement Andreas Gursky Julien Prévieux
  21. 21. MACROECONOMISTES : EXPERIENCE ET REPONSES EXPERIENCE “BIG DATA” HISTORIQUE KEYNES puis Hicks Après WW2: US Cowles Commission (L. Klein) - données deviennent disponibles - mettre l’économie en équations - bonnes prévisions à court terme TsangKin-Wah Olafur Eliasson
  22. 22. MACROECONOMISTES : EXPERIENCE ET REPONSES EXPERIENCE “BIG DATA” HISTORIQUE KEYNES puis Hicks Après WW2: US Cowles Commission (L. Klein) - données deviennent disponibles - mettre l’économie en équations - bonnes prévisions à court terme 1950s Courbe de Phillips - rôle pour le gouvernement ? TsangKin-Wah Olafur Eliasson
  23. 23. MACROECONOMISTES : EXPERIENCE ET REPONSES EXPERIENCE “BIG DATA” HISTORIQUE KEYNES puis Hicks Après WW2: US Cowles Commission (L. Klein) - données deviennent disponibles - mettre l’économie en équations - bonnes prévisions à court terme 1950s Courbe de Phillips - rôle pour le gouvernement ? 1970s modèles de Klein et Phillips s'écroulent - stagflation TsangKin-Wah Olafur Eliasson
  24. 24. EXPERIENCE “BIG DATA” HISTORIQUE UNE REPONSE exemple: modèle Cobweb formation des anticipations ? dynamique ? loi perçue vs loi effective TsangKin-Wah Olafur Eliasson MACROECONOMISTES : EXPERIENCE ET REPONSES
  25. 25. EXPERIENCE “BIG DATA” HISTORIQUE UNE REPONSE exemple: modèle Cobweb formation des anticipations ? dynamique ? loi perçue vs loi effective Muth (1960) puis Lucas: Anticipations rationnelles - lien entre croyances individuelles et comportement agrégé - évite les hypothèses arbitraires (erreurs systématiques) - Une manière de comprendre le rôle des interventions: la critique de Lucas (1976) TsangKin-Wah Olafur Eliasson MACROECONOMISTES : EXPERIENCE ET REPONSES
  26. 26. EXPERIENCE “BIG DATA” HISTORIQUE UNE REPONSE exemple: modèle Cobweb formation des anticipations ? dynamique ? loi perçue vs loi effective Muth (1960) puis Lucas: Anticipations rationnelles - lien entre croyances individuelles et comportement agrégé - évite les hypothèses arbitraires (erreurs systématiques) - Une manière de comprendre le rôle des interventions: la critique de Lucas (1976) Concept limité mais généralisable TsangKin-Wah Olafur Eliasson MACROECONOMISTES : EXPERIENCE ET REPONSES
  27. 27. EXPERIENCE “BIG DATA” HISTORIQUE UNE REPONSE MODELES ECONOMETRIQUES - Eviter les boîtes noires préférer les petits modèles interprétables (structurels?) équilibre partiel vs général TsangKin-Wah Olafur Eliasson MACROECONOMISTES : EXPERIENCE ET REPONSES
  28. 28. EXPERIENCE “BIG DATA” HISTORIQUE UNE REPONSE MODELES ECONOMETRIQUES - Eviter les boîtes noires préférer les petits modèles interprétables (structurels?) équilibre partiel vs général - prévisions stabilité robustesse TsangKin-Wah Olafur Eliasson MACROECONOMISTES : EXPERIENCE ET REPONSES
  29. 29. EXPERIENCE “BIG DATA” HISTORIQUE UNE REPONSE MODELES ECONOMETRIQUES DIFFICULTES STATISTIQUES - coordination des anticipations prévoir les prévisions d'autrui hétérogénéité TsangKin-Wah Olafur Eliasson MACROECONOMISTES : EXPERIENCE ET REPONSES
  30. 30. EXPERIENCE “BIG DATA” HISTORIQUE UNE REPONSE MODELES ECONOMETRIQUES DIFFICULTES STATISTIQUES - coordination des anticipations prévoir les prévisions d'autrui hétérogénéité - inférence impossible ? simulations, validation reposent sur des hypothèses lois fractales ex: apprentissage ou si N −>∞ TsangKin-Wah Olafur Eliasson MACROECONOMISTES : EXPERIENCE ET REPONSES
  31. 31. How can the current disquiet of our time be properly grasped, made comprehensible, examined, and articulated? Over the course of the last two centuries the radical changes […] have made fascinating subject matter for artists The principal question the exhibition will pose is this: How can artists, thinkers […] make sense of the current upheaval? Okwui Enwezor, Curator of “All the World’s Futures” 2015 Venice Biennale
  32. 32. PREVOIR EN PRESENCE DE DISRUPTION DES QUESTIONS (BIG DATA) COMMUNES EN SCIENCES, SCIENCES SOCIALES, ARTS... COMPRENDRE comprendre les croyances (esprit) besoin d'une vue exhaustive des futurs possibles éviter l'auto-censure Muybridge
  33. 33. PREVOIR EN PRESENCE DE DISRUPTION DES QUESTIONS (BIG DATA) COMMUNES EN SCIENCES, SCIENCES SOCIALES, ARTS... COMPRENDRE comprendre les croyances (esprit) besoin d'une vue exhaustive des futurs possibles éviter l'auto-censure COMPARER prendre en compte les croyances des autres quelle est la mesure pour décider de la similarité et de la proximité ? pour le classement ? Muybridge
  34. 34. PREVOIR EN PRESENCE DE DISRUPTION DES QUESTIONS (BIG DATA) COMMUNES EN SCIENCES, SCIENCES SOCIALES, ARTS... COMPRENDRE comprendre les croyances (esprit) besoin d'une vue exhaustive des futurs possibles éviter l'auto-censure COMPARER prendre en compte les croyances des autres quelle est la mesure pour décider de la similarité et de la proximité ? pour le classement ? EVALUER quel est le code (angage) pour enregistrer et décrire ? qu'est ce qu'une description précise, exacte ? comment évaluer les prévisions ? Muybridge
  35. 35. ACHAB VS ULYSSE N.CWyeth
  36. 36. MERCI

×