Confidentialité des données michel béra

•

2 likes•1,448 views

Kezhan SHI

Education

Michel BERA
Professeur du Conservatoire national des arts et métiers
Chaire de modélisation statistique du risque, département IMATH
Mardi 9 juillet 2014
Université d’été de l’Institut des actuaires
Confidentialité des données

Ce dont je ne parlerai pas (extraits)
•  La data science -> voir exposé suivant!
•  Le juridique -> voir la conférence au Groupe Big Data de
Fabrice Naftalski (partner, E&Y)
•  La CNIL : de nombreuses actions sur les données
personnelles sont parfaitement interdites, mais peu le
savent (ex : arrêt pages jaunes, banque avec filiale
assurantielle captive, données génétiques)
•  L’audit demandé à l’Institut des données de santé par le
rapport Bras (2013) : Gouvernance et utilisation des
données de santé

Le « Snowden Point »
(6 juin 2013)
•  C’est un « tipping point » (point de basculement
sociologique)
•  Brutalement toute la « population » se rend
compte que des données massives sont
collectées et utilisées à des fins commerciales,
voire mystérieuses (militaires, etc.)
•  Besoin de protection, de « confidentialité des
données » : sorte d’approche Amish face aux
données..

Esther Dyson (USA)
•  Toute personne devrait être en mesure de
« négocier » librement la mise à disposition par
elle des données qui la concerne (PC Forum -
1995 ?)
•  C’était avant la « découverte » de la théorie des
réseaux sociaux! (Barabasi, Linked)
•  Problème du « banc de poissons »
•  Problème de la mutualisation
•  Problème de la cohorte (permet la « preuve »)

De quoi peut-on parler : de la protection des
données personnelles (1)
•  Première question: que font les américains?
•  rechercher des solutions « technologiques » (ici
data science) – cf Rapport Obama (mai14)
•  construire (et breveter) des méthodes
scientifiques
–  La k-anonymisation (Latanya Sweeney, Professor of
Government and Technology in Residence at Harvard
University) – 2002
–  La K-indistinguability (micro-aggregation) : clusters -> Defays
–  Le floutage (confidentialité différentielle) Cynthia Dwork
•  Mettre en place des standards mondiaux (ex : MIT Open
PDS)

De quoi peut-on parler : de la protection des
données personnelles (2)
•  Seconde question: que font les français?
•  chercher des solutions « technologiques » : ex :
La « bulle » du CASD : Antoine Frachot/GENES
•  Construire des algorithmes de cryptage (FOIN :
Fonction d’occultation des informations
nominatives) – Catherine Quantin
•  Les systèmes souverains d’hébergement de
données et de puissance de calcul (ex :
Cloudwatt, Thalès)
•  Définir et gérer des stratégies « open data »

Un focus sur les données de santé US
•  Gros travail sur les notions de « statistical de-
identification » (HIPAA – Health Insurance
Portability and Accountability Act)
•  Papiers « terrifiants » réguliers en grand public:
–  En génomique (ré-identification)
–  En données de comportement (géolocalisation, 5
points pour identifier à 95% une personne, etc.)
–  Attaques de ré-identification (Laura Sweeney again)
–  etc.

Conclusion
•  Le modèle français peut faire école européenne a
minimis (CNIL et al.)
•  Il est sot de se priver d’avancées extraordinaires pour le
bien-être des peuples par un excès de précautions/
floutage/anonymisation (ex : sida)
•  Principe d’un ordre de travail sur les données, qui rend
la main à l’homme en final : Data Driven -> Evidence
Based -> commission d’experts statuant sur les
recommandations de la machine, pour que l’homme
reste au centre
•  Application à la confidentialité des données
personnelles : le « data driven open data » (DDOD)

Viewers also liked

Norme IFRS - Pierre Thérond - Université d'été de l'Institut des ActuairesKezhan SHI

Arbres de régression et modèles de duréeKezhan SHI

Eurocroissance arnaud cohenKezhan SHI

Loi hamon sébastien bachellierKezhan SHI

Big data analytics focus technique et nouvelles perspectives pour les actuairesKezhan SHI

Big data en (ré)assurance régis delayetKezhan SHI

Détection de profils, application en santé et en économétrie geisslerKezhan SHI

Insurance fraud through collusion - Pierre PicardKezhan SHI

Machine learning pour les données massives algorithmes randomis´es, en ligne ...Kezhan SHI

Les enjeux de la dépendance – laure de montesquieu, scorKezhan SHI

Optimal discretization of hedging strategies rosenbaumKezhan SHI

From data and information to knowledge : the web of tomorrow - Serge abitboul...Kezhan SHI

Cours reflexologietempodicrisi

Panorama des offres NoSQL disponibles dans AzureMicrosoft Décideurs IT

Presentación de un ejemplo de Teorema de PitagorasEvelyn Moncada

Comment intégrer une application dans Azure Active DirectoryMicrosoft Décideurs IT

Habito 1Guadalupe Guel

Conceptos básicos de redes en generalviri78

Calendario 1ª Regional Femenina 15/16Alberto Aguilera

Le Data guide de Data PublicaKezhan SHI

Viewers also liked (20)

Norme IFRS - Pierre Thérond - Université d'été de l'Institut des Actuaires

Arbres de régression et modèles de durée

Eurocroissance arnaud cohen

Loi hamon sébastien bachellier

Big data analytics focus technique et nouvelles perspectives pour les actuaires

Big data en (ré)assurance régis delayet

Détection de profils, application en santé et en économétrie geissler

Insurance fraud through collusion - Pierre Picard

Machine learning pour les données massives algorithmes randomis´es, en ligne ...

Les enjeux de la dépendance – laure de montesquieu, scor

Optimal discretization of hedging strategies rosenbaum

From data and information to knowledge : the web of tomorrow - Serge abitboul...

Cours reflexologie

Panorama des offres NoSQL disponibles dans Azure

Presentación de un ejemplo de Teorema de Pitagoras

Comment intégrer une application dans Azure Active Directory

Habito 1

Conceptos básicos de redes en general

Calendario 1ª Regional Femenina 15/16

Le Data guide de Data Publica

Similar to Confidentialité des données michel béra

Miettes de données - Keynote BDA 2015Amélie Marian

4. AlgorithmesBenoit Lacherez

BigDataBx #1 - BigData et Protection de Données PrivéesExcelerate Systems

Sfsic14 140605-ibekwe-san juan-big scienceSFSIC Association

CGT-digital-week.pptxolivier

vie privée en 2013 Prof. Jacques Folon (Ph.D)

CASD -données statistique publique française insee mai 2011 (http://www.insee...Ministère de l'Économie et des Finances

Web 2.0, média sociaux et vie privée Prof. Jacques Folon (Ph.D)

Vie privée et RHProf. Jacques Folon (Ph.D)

Programme colloque Open Data & données personnelles Perspectives scientifiquesliberTIC

Marketing digital et données personnellesProf. Jacques Folon (Ph.D)

Open Data - Rencontre Bi-départementale des EPN 26-07Garlann Nizon

Prism: Voir avant, Voir aprèsbrpaul Paul

PRIVACY 2.0Prof. Jacques Folon (Ph.D)

Open data - Comité de direction de l'OCSTATPatrick Genoud

Cyber-attaques: mise au pointAntonio Fontes

JIES 2014 A. Giordan - IntroductionGroupe Traces

Introduction aux données de la rechercheIST IRD - Service IST de l'Institut de Recherche pour le Développement

Séminaire EHESS "Etudier les cultures du numérique" - Les controverses de l’o...Samuel Goëta

Open Data & Big Data au sein du SI RHHubert Herberstein

Similar to Confidentialité des données michel béra (20)

Miettes de données - Keynote BDA 2015

4. Algorithmes

BigDataBx #1 - BigData et Protection de Données Privées

Sfsic14 140605-ibekwe-san juan-big science

CGT-digital-week.pptx

vie privée en 2013

CASD -données statistique publique française insee mai 2011 (http://www.insee...

Web 2.0, média sociaux et vie privée

Vie privée et RH

Programme colloque Open Data & données personnelles Perspectives scientifiques

Marketing digital et données personnelles

Open Data - Rencontre Bi-départementale des EPN 26-07

Prism: Voir avant, Voir après

PRIVACY 2.0

Open data - Comité de direction de l'OCSTAT

Cyber-attaques: mise au point

JIES 2014 A. Giordan - Introduction

Introduction aux données de la recherche

Séminaire EHESS "Etudier les cultures du numérique" - Les controverses de l’o...

Open Data & Big Data au sein du SI RH

Recently uploaded

gestion des conflits dans les entreprisesMajdaKtiri2

Boléro. pptx Film français réalisé par une femme.Txaruka

Cours ofppt du Trade-Marketing-Présentation.pdfachrafbrahimi1

Evaluación Alumnos de Ecole Victor HugoIES Turina/Rodrigo/Itaca/Palomeras

Bolero. pptx . Film de A nnne FontaineTxaruka

Computer Parts in French - Les parties de l'ordinateur.pptxRayane619450

Apolonia, Apolonia.pptx Film documentaireTxaruka

Sidonie au Japon . pptx Un film françaisTxaruka

GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...Nguyen Thanh Tu Collection

L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...Faga1939

La nouvelle femme . pptx Film françaisTxaruka

COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfabatanebureau

Cours Préparation à l’ISO 27001 version 2022.pdfssuserc72852

Recently uploaded (13)

gestion des conflits dans les entreprises

Boléro. pptx Film français réalisé par une femme.

Cours ofppt du Trade-Marketing-Présentation.pdf

Evaluación Alumnos de Ecole Victor Hugo

Bolero. pptx . Film de A nnne Fontaine

Computer Parts in French - Les parties de l'ordinateur.pptx

Apolonia, Apolonia.pptx Film documentaire

Sidonie au Japon . pptx Un film français

GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...

L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...

La nouvelle femme . pptx Film français

COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf

Cours Préparation à l’ISO 27001 version 2022.pdf

Confidentialité des données michel béra

1. Michel BERA Professeur du Conservatoire national des arts et métiers Chaire de modélisation statistique du risque, département IMATH Mardi 9 juillet 2014 Université d’été de l’Institut des actuaires Confidentialité des données

3. Ce dont je ne parlerai pas (extraits) •  La data science -> voir exposé suivant! •  Le juridique -> voir la conférence au Groupe Big Data de Fabrice Naftalski (partner, E&Y) •  La CNIL : de nombreuses actions sur les données personnelles sont parfaitement interdites, mais peu le savent (ex : arrêt pages jaunes, banque avec filiale assurantielle captive, données génétiques) •  L’audit demandé à l’Institut des données de santé par le rapport Bras (2013) : Gouvernance et utilisation des données de santé

4. Le « Snowden Point » (6 juin 2013) •  C’est un « tipping point » (point de basculement sociologique) •  Brutalement toute la « population » se rend compte que des données massives sont collectées et utilisées à des fins commerciales, voire mystérieuses (militaires, etc.) •  Besoin de protection, de « confidentialité des données » : sorte d’approche Amish face aux données..

5. Esther Dyson (USA) •  Toute personne devrait être en mesure de « négocier » librement la mise à disposition par elle des données qui la concerne (PC Forum - 1995 ?) •  C’était avant la « découverte » de la théorie des réseaux sociaux! (Barabasi, Linked) •  Problème du « banc de poissons » •  Problème de la mutualisation •  Problème de la cohorte (permet la « preuve »)

6. De quoi peut-on parler : de la protection des données personnelles (1) •  Première question: que font les américains? •  rechercher des solutions « technologiques » (ici data science) – cf Rapport Obama (mai14) •  construire (et breveter) des méthodes scientifiques –  La k-anonymisation (Latanya Sweeney, Professor of Government and Technology in Residence at Harvard University) – 2002 –  La K-indistinguability (micro-aggregation) : clusters -> Defays –  Le floutage (confidentialité différentielle) Cynthia Dwork •  Mettre en place des standards mondiaux (ex : MIT Open PDS)

7. De quoi peut-on parler : de la protection des données personnelles (2) •  Seconde question: que font les français? •  chercher des solutions « technologiques » : ex : La « bulle » du CASD : Antoine Frachot/GENES •  Construire des algorithmes de cryptage (FOIN : Fonction d’occultation des informations nominatives) – Catherine Quantin •  Les systèmes souverains d’hébergement de données et de puissance de calcul (ex : Cloudwatt, Thalès) •  Définir et gérer des stratégies « open data »

8. Un focus sur les données de santé US •  Gros travail sur les notions de « statistical de- identification » (HIPAA – Health Insurance Portability and Accountability Act) •  Papiers « terrifiants » réguliers en grand public: –  En génomique (ré-identification) –  En données de comportement (géolocalisation, 5 points pour identifier à 95% une personne, etc.) –  Attaques de ré-identification (Laura Sweeney again) –  etc.

9. Conclusion •  Le modèle français peut faire école européenne a minimis (CNIL et al.) •  Il est sot de se priver d’avancées extraordinaires pour le bien-être des peuples par un excès de précautions/ floutage/anonymisation (ex : sida) •  Principe d’un ordre de travail sur les données, qui rend la main à l’homme en final : Data Driven -> Evidence Based -> commission d’experts statuant sur les recommandations de la machine, pour que l’homme reste au centre •  Application à la confidentialité des données personnelles : le « data driven open data » (DDOD)

10. Merci pour votre attention …

Confidentialité des données michel béra

Recommended

Recommended

More Related Content

Viewers also liked

Viewers also liked (20)

Similar to Confidentialité des données michel béra

Similar to Confidentialité des données michel béra (20)

More from Kezhan SHI

More from Kezhan SHI (15)

Recently uploaded

Recently uploaded (13)

Confidentialité des données michel béra