Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
L’exception TDM dans la
loi numérique
Mérites, limites et perspectives…
Par Lionel Maurel
Université Paris Lumières
Colloq...
La première loi 2.0
(et elle en porte les traces…)
Mais un « syndrome de Frankenstein »…
- Proposition initiale du Consortium
Couperin ;
- Amendements NKM, I. Attard, C. Pau...
Attention à ne pas céder au mythe
de la « bataille décisive »…
Le législateur français est un
grand spécialiste du vote
d’...
Article 38 de la loi
Le code de la propriété intellectuelle est ainsi modifié :
1° Après le second alinéa du 9° de l'artic...
Qui peut faire du TDM ?
Exception DA : « pour les besoins de la recherche publique »
VS
Exception BDD : «dans un cadre de ...
Qui peut faire du TDM ?
« à l’exclusion de toute finalité commerciale »
Avec toutes les difficultés d’interprétation sur l...
En quoi consiste l’activité de TDM couverte
par l’exception ?
Exception DA : « Lorsque l'oeuvre a été divulguée, l'auteur ...
En quoi consiste l’activité de TDM couverte
par l’exception ?
Exception BDD : « Lorsqu'une base de données est mise à la
d...
En quoi consiste l’activité de TDM couverte
par l’exception ?
Exception DA : « en vue de l'exploration de textes et de don...
Définitions du TDM données à l’étranger et au
niveau communautaire
• UK : « copie d’une œuvre réalisée dans le but de cond...
Sur quoi peut porter l’activité de TDM ?
l'exploration ou la fouille de « textes et de données incluses ou
associées aux é...
Sur quoi peut porter l’activité de TDM ?
l'exploration ou la fouille de « textes et de données incluses ou
associées aux é...
Sur quoi peut porter l’activité de TDM ?
Données incluses dans les
écrits scientifiques ???
Projet Text2Genome : extractio...
Sur quoi peut porter l’activité de TDM ?
l'exploration ou la fouille de « textes et de données incluses ou
associées aux é...
Sur quoi peut porter l’activité de TDM ?
Grand hiatus entre le périmètre des
textes et des données concernées…
- Les texte...
Dans quelles conditions pourront s’exercer les
activités de Text et Data Mining ?
Exception DA : Un décret fixe les condit...
Dans quelles conditions pourront s’exercer les
activités de Text et Data Mining ?
Dans la proposition de directive europée...
Un grand absent dans le texte :
le caractère d’ordre public des dispositions
Pourtant présent à l’article 30 sur le libre ...
Dans la première version adoptée par le Sénat
Portée limitée aux contenus sous abonnement, mais caractère
d’ordre public g...
Quelle articulation avec les limitations
contractuelles (licences, CGU) ?
Pour l’exception BDD : L’exception TDM pas oppos...
Le précédent de l’affaire « Mullholland Drive »
Quelle articulation avec les limitations
techniques (MTP) ?
La Cour de Cas...
L’exception TDM en dehors du champ de la
compétence régulatrice de la Hadopi
D’où l’intérêt de créer une
Agence Nationale ...
Le danger (mortel) de la
jurisprudence Ryanair (CJUE)
Même lorsqu’une base de
données n’est pas
protégeable par le droit s...
Mais une protection contre les exclusivités sur
les données de recherche dans l’article 30
Dès lors que les données issues...
Quelle communication et quelle conservation
pour les « archives du Text et Data Mining » ?
Au Royaume-Uni :
Lorsque qu’une...
Exception DA : « Un décret fixe les conditions dans lesquelles l'exploration des
textes et des données est mise en œuvre, ...
Ces fichiers constitue des données
de la recherche (cf. article 30) ???
Dès lors que les données issues d'une activité de ...
Les autres copies ou reproductions
sont détruites ???
 Comprendre les copies qui n’auraient pas été transmises à des
orga...
Quatre cas pratiques de mise en œuvre de
l’exception TDM
Numériser des contenus protégés pour effectuer des
opérations de...
Numériser des contenus protégés pour effectuer
des opérations de TDM ?
Possible, mais à condition :
- Que les contenus num...
Exploiter le contenu d’une base de données
fournie par un opérateur commercial pour
effectuer des opérations de TDM ?
Poss...
Exploiter des données de recherche publiées pour
effectuer des opérations de TDM ?
Possible, sur la base de l’article 30 d...
Exploiter des contenus librement
accessibles sur Internet ?
Possible, mais uniquement :
- Sur des textes (de toute nature)...
Exemples : faire du TDM à partir de HAL, de
Persée, de Revues.org ?
Ou de Gallica intra muros ? Ou des archives du web ?
L...
Upcoming SlideShare
Loading in …5
×

L'exception TDM dans la loi numérique : mérites, limites et perspectives

13,209 views

Published on

Analyse et interprétation de l'exception en faveur du Text et Data Mining introduite dans la loi "République numérique".

Published in: Science
  • Be the first to comment

L'exception TDM dans la loi numérique : mérites, limites et perspectives

  1. 1. L’exception TDM dans la loi numérique Mérites, limites et perspectives… Par Lionel Maurel Université Paris Lumières Colloque «La loi numérique, et après ? » Meudon, 09/11/2016r
  2. 2. La première loi 2.0 (et elle en porte les traces…)
  3. 3. Mais un « syndrome de Frankenstein »… - Proposition initiale du Consortium Couperin ; - Amendements NKM, I. Attard, C. Paul ; - Version adoptée par l’Assemblée ; - Version adoptée au Sénat ; - Version issue de la CMP. Un texte qui porte les marques des controverses au sujet du TDM…
  4. 4. Attention à ne pas céder au mythe de la « bataille décisive »… Le législateur français est un grand spécialiste du vote d’exceptions au droit d’auteur « en trompe-l’œil » Le texte de l’exception comporte de nombreuses failles et beaucoup de ce qui a été gagné peut être perdu via les décrets d’application.
  5. 5. Article 38 de la loi Le code de la propriété intellectuelle est ainsi modifié : 1° Après le second alinéa du 9° de l'article L. 122-5, il est inséré un 10° ainsi rédigé : « 10° Les copies ou reproductions numériques réalisées à partir d'une source licite, en vue de l'exploration de textes et de données incluses ou associées aux écrits scientifiques pour les besoins de la recherche publique, à l'exclusion de toute finalité commerciale. Un décret fixe les conditions dans lesquelles l'exploration des textes et des données est mise en œuvre, ainsi que les modalités de conservation et de communication des fichiers produits au terme des activités de recherche pour lesquelles elles ont été produites ; ces fichiers constituent des données de la recherche ; » 2° Après le 4° de l'article L. 342-3, il est inséré un 5° ainsi rédigé : « 5° Les copies ou reproductions numériques de la base réalisées par une personne qui y a licitement accès, en vue de fouilles de textes et de données incluses ou associées aux écrits scientifiques dans un cadre de recherche, à l'exclusion de toute finalité commerciale. La conservation et la communication des copies techniques issues des traitements, au terme des activités de recherche pour lesquelles elles ont été produites, sont assurées par des organismes désignés par décret. Les autres copies ou reproductions sont détruites. » Deux exceptions aux droits de propriété intellectuelle : - Une exception au droit d’auteur ; - Une exception au droit sui generis de producteur de bases de données.
  6. 6. Qui peut faire du TDM ? Exception DA : « pour les besoins de la recherche publique » VS Exception BDD : «dans un cadre de recherche » Une exception (DA) n’est ouverte qu’aux institutions publiques de recherche. L’autre (BDD) est ouverte plus largement… (recherche privée, science citoyenne ?)
  7. 7. Qui peut faire du TDM ? « à l’exclusion de toute finalité commerciale » Avec toutes les difficultés d’interprétation sur la distinction entre le commercial et le non-commercial… - Même chose dans l’exception anglaise (« dans le seul but de conduire une recherche non-commerciale ») - Mais pas aux Etats-Unis où le TDM est couvert par le fair use, invocable par les entreprises (cf. Affaire Google Books), ni en Chine ou au Japon.
  8. 8. En quoi consiste l’activité de TDM couverte par l’exception ? Exception DA : « Lorsque l'oeuvre a été divulguée, l'auteur ne peut interdire […] Les copies ou reproductions numériques réalisées à partir d'une source licite » Exception BDD : « Lorsqu'une base de données est mise à la disposition du public par le titulaire des droits, celui-ci ne peut interdire […] Les copies ou reproductions numériques de la base réalisées par une personne qui y a licitement accès » Le critère de la source licite n’a pas tout à fait la même signification dans les deux cas.
  9. 9. En quoi consiste l’activité de TDM couverte par l’exception ? Exception BDD : « Lorsqu'une base de données est mise à la disposition du public par le titulaire des droits, celui-ci ne peut interdire […] Les copies ou reproductions numériques de la base réalisées par une personne qui y a licitement accès » Etrange formulation, car les exceptions au droit de producteur des bases de données portent normalement sur les extractions et réutilisations de la base.
  10. 10. En quoi consiste l’activité de TDM couverte par l’exception ? Exception DA : « en vue de l'exploration de textes et de données incluses ou associées aux écrits scientifiques » Exception BDD : « en vue de fouilles de textes et de données incluses ou associées aux écrits scientifiques » Exploration ? Fouilles ? Une définition explicite de l’activité de TDM à préciser par décret ?
  11. 11. Définitions du TDM données à l’étranger et au niveau communautaire • UK : « copie d’une œuvre réalisée dans le but de conduire une analyse computationelle » • USA : TDM couvert par la notion « d’usages transformatifs » du fair use. Proposition de directive européenne : Article 2 : “‘text and data mining’ means any automated analytical technique aiming to analyse text and data in digital form in order to generate information such as patterns, trends and correlations; Article 3 : “reproductions and extractions made by research organisations in order to carry out text and data mining of works or other subject matter to which they have lawful access for the purposes of scientific research”.
  12. 12. Sur quoi peut porter l’activité de TDM ? l'exploration ou la fouille de « textes et de données incluses ou associées aux écrits scientifiques » Restriction aux seuls « textes », donc va interdire le TDM conduit sur des œuvres graphiques, audiovisuelles, musicales, etc. - Restriction absente en GB et aux USA. - Dans le projet de directive européenne : « New technologies enable the automated computational analysis of information in digital form, such as text, sounds, images or data, generally known as text and data mining.”
  13. 13. Sur quoi peut porter l’activité de TDM ? l'exploration ou la fouille de « textes et de données incluses ou associées aux écrits scientifiques » Données incluses aux écrits scientifiques ? - Aucune raison que les « données » figurent dans l’exception DA, car soit les données incluses ou associées constituent une base de données protégées et cela relève de l’autre exception ; soit ce n’est pas le cas et les données ne sont pas protégeables par le droit d’auteur. - Couvre les données incluses par exemple sous forme de tableaux dans le texte ? - Couvre le fait d’utiliser le texte d’un écrit comme une donnée (opération d’indexation) ? - Couvre le fait de collecter des séquences d’information incluses dans du texte (exemple projet Text To Genom) ?
  14. 14. Sur quoi peut porter l’activité de TDM ? Données incluses dans les écrits scientifiques ??? Projet Text2Genome : extraction de chaînes de caractères correspondant à des séquences génétiques en vue d’opérer une cartographie cherchable du génome d’un grand nombre d’espèces.
  15. 15. Sur quoi peut porter l’activité de TDM ? l'exploration ou la fouille de « textes et de données incluses ou associées aux écrits scientifiques » Données associées aux écrits scientifiques ? - Soit des données fournies en annexe à une publication scientifique (supplementary material) ? => lien avec article 30 sur Open Access. - Soit les données « sous-jacentes » à une recherche ayant donné lieu à publication ? - Soit des métadonnées associées à des écrits scientifiques ?
  16. 16. Sur quoi peut porter l’activité de TDM ? Grand hiatus entre le périmètre des textes et des données concernées… - Les textes concernés peuvent être de toute nature : scientifiques, littéraires, d’information (presse), pages web, etc. - Les données par contre ne peuvent être « qu’incluses ou associées à des écrits scientifiques ». - Donc seulement des données de recherche, mais pas toutes les données de recherche. - Laisse de côté un grand nombre de données qui pourraient faire l’objet de pratiques de Data Mining (statistiques, relevés, etc.)
  17. 17. Dans quelles conditions pourront s’exercer les activités de Text et Data Mining ? Exception DA : Un décret fixe les conditions dans lesquelles l'exploration des textes et des données est mise en œuvre. En réalité, c’est surtout pour l’exception BDD qu’on aurait eu besoin des précisions d’un décret… - En effet, une chose est de pouvoir accéder légalement à une base de données, une autre de pouvoir effectuer des extractions en vue d’une opération de TDM. - Nécessite que la possibilité technique soit ouverte (API, formats interopérables, etc.) - Quelle articulation avec les Mesures Techniques de Protection (DRM) ? - Quelle articulation avec les licences et les conditions générales d’utilisation (CGU) ?
  18. 18. Dans quelles conditions pourront s’exercer les activités de Text et Data Mining ? Dans la proposition de directive européenne Any contractual provision contrary to the exception provided for in paragraph 1 shall be unenforceable. Rightholders shall be allowed to apply measures to ensure the security and integrity of the networks and databases where the works or other subject-matter are hosted. Such measures shall not go beyond what is necessary to achieve that objective. Member States shall encourage rightholders and research organisations to define commonly-agreed best practices concerning the application of the measures referred to in paragraph 3.
  19. 19. Un grand absent dans le texte : le caractère d’ordre public des dispositions Pourtant présent à l’article 30 sur le libre accès aux publications scientifiques : « Les dispositions du présent article sont d'ordre public et toute clause contraire à celles-ci est réputée non écrite. » Une telle précision garantit que le jeu de la disposition ne sera pas entravée par des restrictions contractuelles, par exemple les clauses d’une licence ou des CGU.
  20. 20. Dans la première version adoptée par le Sénat Portée limitée aux contenus sous abonnement, mais caractère d’ordre public garanti + neutralisation des restrictions techniques. Des dispositions similaires devraient être reprises dans le décret.
  21. 21. Quelle articulation avec les limitations contractuelles (licences, CGU) ? Pour l’exception BDD : L’exception TDM pas opposable aux clauses contraires ?
  22. 22. Le précédent de l’affaire « Mullholland Drive » Quelle articulation avec les limitations techniques (MTP) ? La Cour de Cassation estime que le bénéfice d’une exception ne constitue pas un véritable « droit » opposable en justice. Les titulaires de droits peuvent utiliser des Mesures Techniques de Protection pour supprimer complètement le bénéfice d’une exception. Quel impact sur l’exception TDM, via les limitations techniques imposées par les fournisseurs de bases de données ?
  23. 23. L’exception TDM en dehors du champ de la compétence régulatrice de la Hadopi D’où l’intérêt de créer une Agence Nationale pour la Science Ouverte.
  24. 24. Le danger (mortel) de la jurisprudence Ryanair (CJUE) Même lorsqu’une base de données n’est pas protégeable par le droit sui generis ou un droit d’auteur, la CJUE considère qu’il est possible d’en restreindre la réutilisation simplement par le biais de conditions d’utilisation. Et les exceptions ne peuvent pas alors jouer…
  25. 25. Mais une protection contre les exclusivités sur les données de recherche dans l’article 30 Dès lors que les données issues d'une activité de recherche financée au moins pour moitié par des dotations de l'Etat, des collectivités territoriales, des établissements publics, des subventions d'agences de financement nationales ou par des fonds de l'Union européenne ne sont pas protégées par un droit spécifique ou une réglementation particulière et qu'elles ont été rendues publiques par le chercheur, l'établissement ou l'organisme de recherche, leur réutilisation est libre. L'éditeur d'un écrit scientifique mentionné au I ne peut limiter la réutilisation des données de la recherche rendues publiques dans le cadre de sa publication. Les dispositions du présent article sont d'ordre public et toute clause contraire à celles-ci est réputée non écrite. - Possède un caractère d’ordre public. - Semble opposable aux limitations techniques. - Peut sans doute aussi neutraliser la jurisprudence Ryanair. - Donc même incluse dans la base d’un fournisseur des données de recherche devraient pouvoir librement être réutilisées.
  26. 26. Quelle communication et quelle conservation pour les « archives du Text et Data Mining » ? Au Royaume-Uni : Lorsque qu’une copie de l’oeuvre a été effectuée en vertu de cette section, le droit d’auteur est enfreint si : (a) La copie est transférée à une autre personne, à moins que ce transfert soit autorisé par le titulaire de droits Aux Etats-Unis, le fair use permet de : - Conserver ces corpus sans limite dans le temps et sans obligation de les détruire une fois utilisés ; - Les transmettre à des tiers, comme l’a fait Google avec ses bibliothèques partenaires, les mutualiser au sein d’entrepôts partagés comme le fait Hathi Trust ; - Afficher de courts extraits des contenus pour illustrer une recherche.
  27. 27. Exception DA : « Un décret fixe les conditions dans lesquelles l'exploration des textes et des données est mise en œuvre, ainsi que les modalités de conservation et de communication des fichiers produits au terme des activités de recherche pour lesquelles elles ont été produites ; ces fichiers constituent des données de la recherche » Exception BDD : « La conservation et la communication des copies techniques issues des traitements, au terme des activités de recherche pour lesquelles elles ont été produites, sont assurées par des organismes désignés par décret. Les autres copies ou reproductions sont détruites. » Quelle communication et quelle conservation pour les « archives du Text et Data Mining » ? Aucune mention d’une possibilité de « représentation », donc impossible d’afficher des extraits des contenus reproduits (sauf dans le cadre de l’exception de courte citation ?) Enorme faute de grammaire… il faut lire « ils » et pas « elles », sinon la phrase n’a pas de sens…
  28. 28. Ces fichiers constitue des données de la recherche (cf. article 30) ??? Dès lors que les données issues d'une activité de recherche financée au moins pour moitié par des dotations de l'Etat, des collectivités territoriales, des établissements publics, des subventions d'agences de financement nationales ou par des fonds de l'Union européenne ne sont pas protégées par un droit spécifique ou une réglementation particulière et qu'elles ont été rendues publiques par le chercheur, l'établissement ou l'organisme de recherche, leur réutilisation est libre. L'éditeur d'un écrit scientifique mentionné au I ne peut limiter la réutilisation des données de la recherche rendues publiques dans le cadre de sa publication. Les dispositions du présent article sont d'ordre public et toute clause contraire à celles-ci est réputée non écrite. Par contre, les fichiers produits dans le cadre de l’exception BDD ne seraient pas des « données de la recherche » ???
  29. 29. Les autres copies ou reproductions sont détruites ???  Comprendre les copies qui n’auraient pas été transmises à des organismes de conservation désignés par décret. Donc les chercheurs ont l’obligation de détruire leurs propres archives… Réponse du gouvernement sur la plateforme de consultation : « La voie législative, qui introduirait une nouvelle exception au droit d’auteur, supposerait pour sa part de mettre en place des garanties permettant de répondre aux inquiétudes des éditeurs, en particulier face au risque de dissémination des copies numériques. Cette garantie pourrait être offerte par l’intermédiation d’un tiers de confiance. A cet égard, il est à noter que la Bibliothèque nationale de France (BnF) s’est d’ores et déjà portée candidate pour jouer un tel rôle. » Mais ces archives devraient pouvoir être communiquées (seulement sur place dans les emprises des organismes de conservation désignés ?)  Ressemblerait beaucoup aux conditions de consultations des archives du web à la BnF
  30. 30. Quatre cas pratiques de mise en œuvre de l’exception TDM Numériser des contenus protégés pour effectuer des opérations de TDM ? Exploiter le contenu d’une base de données fournie par un opérateur commercial pour effectuer des opérations de TDM ? Exploiter des données de recherche publiées pour effectuer des opérations de TDM ? Exploiter des contenus librement accessibles sur Internet ?
  31. 31. Numériser des contenus protégés pour effectuer des opérations de TDM ? Possible, mais à condition : - Que les contenus numérisés soient uniquement des textes ; - Pour tous les autres type de contenus, des licences devront être signées ; - Articulable avec l’exception « conservation » dont bénéficient les bibliothèques, archives et musées ? A noter : Pour les œuvres numérisées à des fins de TDM, le décret peut ne pas imposer le passage obligé par un organisme désigné par décret pour la conservation.
  32. 32. Exploiter le contenu d’une base de données fournie par un opérateur commercial pour effectuer des opérations de TDM ? Possible, mais à condition : Que la base contienne seulement des textes ; Ou des données incluses ou associées à des écrits scientifiques Donc pas des statistiques, des relevés, etc.  Les fichiers doivent être transmis à des organismes de conservation et les autres copies détruites. - Mais incertitudes notables sur l’articulation avec les limitations techniques et contractuelles imposées par le fournisseur de la base. - Beaucoup plus simple à gérer si acquisition « en dur » des fichiers et pas seulement d’un accès à la base (ex : licences nationales ISTEX)
  33. 33. Exploiter des données de recherche publiées pour effectuer des opérations de TDM ? Possible, sur la base de l’article 30 de la loi (notamment à partir des entrepôts de données de recherche) Dès que des données de recherche sont publiées, leur réutilisation est libre (sous réserve de respecter les droits des tiers) Plus besoin de se référer aux licences de réutilisation, la permission est donnée par la loi Valable pour les données publiées dans Huma-Num, Zenodo, FigShare, Dryad, etc. Autres sources mobilisables : les très nombreux jeux de données publiques qui vont être publiés par l’effet du principe « d’Open Data par défaut » instauré par la loi.
  34. 34. Exploiter des contenus librement accessibles sur Internet ? Possible, mais uniquement : - Sur des textes (de toute nature) - Ou des données incluses ou accompagnant des écrits scientifiques.  Va laisser de côté de très nombreux jeux de données accessibles en ligne. L’accès libre constitue bien une « source licite », si la mise en ligne a été effectuée avec l’accord des ayants droit.
  35. 35. Exemples : faire du TDM à partir de HAL, de Persée, de Revues.org ? Ou de Gallica intra muros ? Ou des archives du web ? L’exception TDM sera bien applicable aux contenus figurant sur ces sites, car il s’agit bien de « sources licites »

×