Douleur douleur et methodologie d'essais cliniques

1,657 views

Published on

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,657
On SlideShare
0
From Embeds
0
Number of Embeds
4
Actions
Shares
0
Downloads
49
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Douleur douleur et methodologie d'essais cliniques

  1. 1. 17/10/02 16:12 Page 1 MÉTHODOLOGIE DES ESSAIS CLINIQUES DANS LE DOMAINE DE LA DOULEUR UPSA couv Méthodologie MÉTHODOLOGIE DES ESSAIS CLINIQUES DANS LE DOMAINE DE LA DOULEUR
  2. 2. Upsa Méthodo essais 2002 18/10/02 15:57 Page 1 MÉTHODOLOGIE DES ESSAIS CLINIQUES DANS LE DOMAINE DE LA DOULEUR
  3. 3. Upsa Méthodo essais 2002 18/10/02 15:57 Page 2 MÉTHODOLOGIE DES ESSAIS CLINIQUES DANS LE DOMAINE DE LA DOULEUR Dr Jacques Wrobel, Coordinateur INSTITUT UPSA DE LA DOULEUR 3, rue Joseph Monier - BP325 92506 Rueil-Malmaison Cedex Tél : 01 58 83 89 94 Fax : 01 58 83 89 01 E-mail : institut.upsa@bms.com Site : institut-upsa-douleur.org Les notions exposées dans ce livre sont destinées à compléter et non à remplacer les connaissances médicales des professionnels formés en la matière. Les auteurs et le coordinateur déclinent toute responsabilité directe ou indirecte dans l’usage pouvant être fait de cet ouvrage. ISBN : 2 - 910844 - 10 - 2 Conception A Éditorial Paris 01 42 40 23 00 Illustration de couverture d’après René Descartes Dépôt légal 4e trimestre 2002
  4. 4. Upsa Méthodo essais 2002 18/10/02 15:57 Page 3 MÉTHODOLOGIE DES ESSAIS CLINIQUES DANS LE DOMAINE DE LA DOULEUR “En médecine, ce qui n’est pas scientifique n’est pas éthique” Pr Jean Bernard
  5. 5. Upsa Méthodo essais 2002 18/10/02 15:57 Page 4 LES AUTEURS Nadine ATTAL C.E.T.D., Hôpital Ambroise Paré, 92104 Boulogne-Billancourt cedex Éric BOCCARD Laboratoire BMS-UPSA, 92506 Rueil-Malmaison cedex François BOUREAU C.E.T.D., Hôpital Saint-Antoine, 75012 Paris Paul DESJARDINS SCIREX Corp. Austin,Texas, U.S.A. Jules DESMEULES Division de Pharmacologie Clinique, Hôpital Cantonal 1211 Genève, Suisse Claude DUBRAY Laboratoire de Pharmacologie, Faculté de médecine 63001 Clermont-Ferrand cedex Jocelyne FEINE Faculté de médecine dentaire, Université McGill, H3A2B2, Montréal PQ, Canada Dominique FLETCHER C.E.T.D., Hôpital Ambroise Paré, 92104 Boulogne-Billancourt cedex Hervé GANRY Laboratoire BMS-UPSA, 92506 Rueil-Malmaison cedex Annie GAUVAIN-PIQUARD Unité de Psychiatrie et d'Onco-Psychologie, Institut Gustave Roussy 94805 Villejuif cedex Michel LANTERI-MINET C.E.T.D., Hôpital Pasteur, 06002 Nice cedex Jacques WROBEL Institut UPSA de la Douleur, 92506 Rueil-Malmaison cedex Remerciements : au Dr François CHAST et à Dorothée WROBEL pour leur relecture “méthodique” concernant le fond et la forme. 4
  6. 6. Upsa Méthodo essais 2002 18/10/02 15:57 Page 5 SOMMAIRE I 1. Introduction ----------------------------------------------------------------------------------------------------------------------------------------------------- 7 Jean-Marie Besson I 2. Principes méthodologiques généraux des essais cliniques ----------------------------------------------------------------------------Claude Dubray 9 I 3. Évaluation de la douleur --------------------------------------------------------------------------------------- 29 • Évaluation de la douleur provoquée chez le volontaire sain Claude Dubray • Évaluation de la douleur clinique chez l'adulte - - - - - - - - - - - 43 François Boureau • Évaluation de la douleur clinique chez l'enfant - - - - - - - - - - - - 55 Annie Gauvain-Piquard • Le soulagement : indice de la douleur - - - - - - - - - - - - - - - - - - - - 63 ou de la qualité de vie Jocelyne Feine • Place de la pharmacocinétique dans les essais cliniques des antalgiques Jules Desmeules • Le développement clinique des antalgiques - - - - - - - - - - - - - - - - 73 Hervé Ganry • Les paramètres de quantification de l'efficacité - - - - - - - - - - - - - 85 clinique des antalgiques Paul Desjardins • Les standards de quantification de l'efficacité - - - - - - - - - - - - - - 91 clinique des antalgiques Claude Dubray • L'antalgique de secours dans les essais cliniques - - - - - - - - - - - - 97 Éric Boccard • Les contraintes des essais cliniques en pédiatrie - - - - - - - - - - - 109 Jacques Wrobel SOMMAIRE I 4. Essais cliniques des antalgiques -------------------------------------------------- 67 …/… 5
  7. 7. Upsa Méthodo essais 2002 18/10/02 15:57 Page 6 I 5. Essais cliniques dans les pathologies douloureuses ---------------------------------------- 115 • Évaluation de la douleur post-opératoire Dominique Fletcher • Exigences méthodologiques pour les essais - - - - - - - - - - - - - - 121 thérapeutiques dans les douleurs neuropathiques Nadine Attal • Méthodes de développement clinique - - - - - - - - - - - - - - - - - - 129 des anti-migraineux Michel Lantéri-Minet 6
  8. 8. Upsa Méthodo essais 2002 18/10/02 15:57 Page 7 1. INTRODUCTION Jean-Marie Besson Unité 161, INSERM, Paris Président du Conseil Scientifique, Institut UPSA de la Douleur De nouvelles méthodes ont permis d’améliorer sensiblement l’évaluation et le traitement de la douleur. Cependant, en raison des impératifs de maîtrise des dépenses de santé, les laboratoires pharmaceutiques doivent évaluer les substances antalgiques qu’ils commercialisent avec une rigueur croissante. Une rigueur identique est exigée pour l’évaluation des traitements non pharmacologiques, par exemple certaines techniques de neurostimulation. Dans ce domaine, les sanctions ne se font pas attendre puisque les compagnies d’assurances de certains États américains refusent d’ores et déjà de financer la neurostimulation. Par ailleurs, il faut savoir qu’au Royaume-Uni, les dépenses afférentes au traitement journalier d’un douloureux chronique sont chiffrées au dixième de livre près. Mon expérience m’a appris que le traitement de la douleur était un domaine thérapeutique très sensible aux phénomènes de mode. Régulièrement, de nouvelles substances connaissent leur heure de gloire dans toutes les publications et dans tous les pays. Mais ces produits miracles présentés dans les congrès ne se révèlent pas toujours aussi efficaces sur le terrain, ce qui explique que nous accordions une importance croissante à l’évaluation. Il faut tenir compte des différences entre les pathologies dans l’évaluation des substances et des techniques antidouleur. Par exemple, si l’on ne prend pas en considération le fait que la douleur neuropathique revêt des tableaux très différents selon les syndromes dont souffrent les patients, les données obtenues sont très hétérogènes. Dès lors, on comprend très bien pourquoi l’utilisation de certaines substances pharmacologiques dans les neuropathies est si controversée. Dans l’intérêt des patients, il faut espérer que nous saurons isoler les syndromes de la neuropathie pour lesquels des molécules spécifiques présenteront une action bénéfique. INTRODUCTION I LES PROGRÈS CONSTATÉS DANS L’ÉVALUATION DE LA DOULEUR 7
  9. 9. Upsa Méthodo essais 2002 8 18/10/02 15:57 Page 8
  10. 10. Upsa Méthodo essais 2002 18/10/02 15:57 Page 9 2. PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX DES ESSAIS CLINIQUES Claude Dubray I LA MÉTHODOLOGIE ◗ Définition La méthodologie appliquée aux essais cliniques est un ensemble de règles qui a pour objectif d’en garantir la validité scientifique. La valeur des conclusions que l’on tire d’une étude dépend donc étroitement de la méthodologie qui a été mise en œuvre. Schématiquement, on distingue deux grandes catégories que sont les études descriptives et les études explicatives. Les études descriptives On classe dans cette catégorie les comptes rendus de cas, les séries de cas cliniques ou les enquêtes démographiques. Leur objectif vise essentiellement à révéler et à documenter des observations cliniques, de faire partager des idées nouvelles ou de générer des hypothèses. On ne doit pas leur en demander plus et, dès que l’on veut raisonner en termes de causalité, il faut avoir recours à des études explicatives. Les études explicatives Elles peuvent être fondées sur l’observation ou sur une expérimentation véritable. PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX ◗ Choix d’un type d’étude adapté aux objectifs de la recherche 9
  11. 11. Upsa Méthodo essais 2002 18/10/02 15:57 Page 10 • Les études explicatives basées sur l’observation Elles recouvrent essentiellement le domaine de l’épidémiologie. Selon le mode de recueil des données, on parle d’études “cas-témoins”, d’études en cohorte ou d’analyses transversales. Dans tous les cas, les données sont recueillies et analysées sans intervenir sur la situation des sujets observés. Le plus souvent, on a recours à ces études pour faire apparaître une relation entre un facteur d’exposition, un indice biologique, un signe clinique… et la survenue d’une maladie. Le simple constat de cette relation ne signifie en aucune manière qu’il existe un lien de causalité entre les deux phénomènes observés ! PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX Dans le cas des études d’observation “cas-témoins”, le mode d’entrée se fait par la maladie. On identifie des groupes de sujets qui présentent ou ne présentent pas une pathologie spécifique et, grâce à une enquête rétrospective, on recherche ensuite dans chacun de ces groupes la présence ou l’exposition à un facteur de risque particulier. 10 Dans les études d’observation en cohorte, encore appelées études d’incidence, le mode d’entrée est l’exposition à un facteur de risque qui est supposé intervenir dans la survenue d’une maladie spécifique. On va donc constituer des échantillons de la population, regroupés en cohortes (d’où le nom de ce type d’étude), qui seront suivies dans le temps pour mettre en évidence la survenue de la pathologie étudiée. On réalise simultanément ce suivi sur un groupe qui présente le facteur de risque et sur un autre groupe, en tous points identique au premier (autant que faire se peut), mais qui ne présente pas ce facteur de risque. Ce deuxième échantillon constitue le groupe témoin. Les études d’observation transversales ou études de prévalence ont comme mode d’entrée l’exposition à un facteur de risque supposé intervenir dans la survenue d’une maladie spécifique. Toutefois, à la différence des études en cohorte, le comptage des sujets présentant la pathologie étudiée se fait à un moment donné, à la fois dans le groupe à risque et dans un groupe témoin. Il n’y a pas ici de suivi des patients dans le temps.
  12. 12. Upsa Méthodo essais 2002 18/10/02 15:57 Page 11 • Les études explicatives basées sur l’expérimentation À la différence des situations précédentes,il faut ici établir un plan expérimental qui, d’une manière ou d’une autre, interfère sur la situation des sujets observés. On inclut dans cette catégorie : les essais cliniques, les interventions éducatives, les stratégies de prise en charge médicale. - L’intervention pédagogique : elle permet d’étudier ici l’influence de différents types de recommandations adressées à un échantillon de population (par exemple : habitudes alimentaires, exercices physiques, hygiène bucco-dentaire…) sur la survenue ou l’évolution d’une pathologie spécifique. - Les essais sur les stratégies de soins ou modalités de prise en charge médicale : ces essais consistent à étudier l’influence d’un mode de prise en charge médicale (structure de soins,qualification des soignants, modalités de surveillance clinique…) sur la survenue ou sur l’évolution d’une pathologie spécifique. ◗ Les essais thérapeutiques Ils ont pour objectif de mettre en évidence les effets d’un traitement sur l’évolution d’une pathologie, sur un critère de substitution, voire sur un critère purement pharmacodynamique. Comme on l’a vu précédemment, si l’on veut pouvoir mesurer l’effet propre d’un médicament, il faut avoir recours à une étude explicative du type essai clinique. On PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX - Les essais cliniques : dans ce cas, le mode d’entrée est l’exposition à un facteur qui est supposé modifier l’évolution d’une maladie spécifique. Ce facteur peut, par exemple, être la prise d’un médicament. L’approche est ici très voisine de celle des études en cohorte, mais avec une différence essentielle qui tient à l’attribution aléatoire du facteur pouvant modifier l’évolution de la maladie étudiée. On passe donc d’une situation de simple observation à une situation d’intervention. Comme dans les études en cohorte, on suit dans chacun des deux groupes (exposés et non-exposés) l’évolution, soit de la maladie (en termes de morbidité ou de mortalité), soit d’un indice reflétant l’évolution de la maladie (à l’aide d’un ou plusieurs critères de substitution). Cette approche expérimentale permet d’établir s’il existe un lien de causalité entre le facteur étudié et l’évolution de la maladie. 11
  13. 13. Upsa Méthodo essais 2002 18/10/02 15:57 Page 12 devra donc constituer deux groupes de sujets, un recevant le traitement à étudier (groupe traité) et l’autre un médicament de référence ou un placebo (groupe témoin). À la fin de l’étude,il est vraisemblable que l’on montrera certaines différences entre le groupe traité et le groupe témoin et, très naturellement, on aura tendance à penser que les différences observées sont le résultat de l’action pharmacologique directe du médicament étudié. En fait, il ne s’agit que d’un effet apparent qui est la somme de l’effet pharmacologique du médicament et de multiples facteurs appelés facteurs confondants. Ceux-ci incluent l’état initial du patient,l’évolution spontanée de la maladie,des facteurs non spécifiques (généralement impossibles à identifier de façon exhaustive) et les variabilités individuelles aléatoires. La méthodologie, mise en œuvre dans les essais thérapeutiques, a pour objectif de supprimer ou d’atténuer ces facteurs “parasites”, de manière à ce que l’effet apparent, qui est le seul observable, reflète le plus fidèlement possible les propriétés pharmacologiques intrinsèques du médicament que l’on étudie. PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX Les moyens pour supprimer les facteurs confondants 12 • Prise en compte de l’état initial et l’évolution spontanée de la maladie. On comprend intuitivement que ces deux facteurs peuvent avoir une influence considérable sur l’effet apparent du traitement. Le moyen le plus commode pour atténuer l’influence de ces facteurs est de faire en sorte que le groupe traité et le groupe témoin soient aussi comparables que possible. Pour cela, on sélectionne les patients inclus dans l’étude à l’aide de critères d’inclusion et d’exclusion qui permettent de constituer des groupes aussi comparables que possible. À l’issue de l’étude, au moment où on analyse les résultats, on vérifie soigneusement les caractéristiques physiologiques et physiopathologiques de chacun des groupes pour s’assurer qu’il n’y a pas de différence significative entre les deux populations. Si c’était le cas, ce constat pourrait remettre totalement en cause les conclusions de l’étude. • Prise en compte des facteurs non-spécifiques. Certains sont identifiables, d’autres sont soupçonnés, mais la plupart restent totalement méconnus. Bien que masqués, ces facteurs peuvent avoir parfois une influence considérable sur l’évolution d’une pathologie,que l’on impute à tort à l’effet du médicament. Ces facteurs étant pour la plupart nonidentifiables, on ne peut pas les éliminer à l’aide des critères d’inclusion
  14. 14. Upsa Méthodo essais 2002 18/10/02 15:57 Page 13 qui sélectionnent les sujets admis dans une étude. Le moyen le plus efficace que l’on ait trouvé pour atténuer l’influence de ces facteurs est de faire en sorte que les deux groupes de sujets inclus dans l’essai thérapeutique se trouvent dans un environnement (au sens large du terme) aussi identique que possible. Pour répondre à cette exigence, il faut qu’au moment de leur inclusion dans l’essai thérapeutique, les patients soient tirés au sort pour être affectés dans le groupe traité ou dans le groupe témoin. La méthodologie que l’on utilise dans les essais cliniques doit mettre en œuvre les recommandations énumérées précédemment pour que la différence des effets apparents, observés entre le groupe témoin et le groupe traité, reflète le plus fidèlement possible l’effet propre du médicament étudié. ◗ Quelques autres principes qui guident la méthodologie appliquée aux essais thérapeutiques Lorsque l’on s’engage dans un essai thérapeutique, il faut accepter trois règles principales : • le principe de comparaison : le nouveau médicament que l’on teste est-il meilleur (du point de vue de l’efficacité, de la tolérance, de la commodité d’emploi…) que ceux qui existent déjà sur le marché ? • le principe de causalité : l’effet observé est-il bien lié aux propriétés pharmacologiques du médicament ou résulte-t-il des facteurs confondants dont nous avons parlé précédemment ? PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX • Prise en compte des facteurs de variabilité individuelle aléatoires. La variabilité est inhérente au monde biologique. Au sein d’une même espèce, aucun individu n’a le même patrimoine génétique et donc le même phénotype. Cette variabilité biologique, plus ou moins importante selon la nature du paramètre étudié, est à l’origine d’un “bruit de fond” qui parasite la mesure de nos critères d’évaluation. Le seul moyen de surpasser cette variabilité individuelle est de la prendre en compte en travaillant sur un échantillon de population qui ait une taille suffisante pour que le bruit de fond devienne négligeable par rapport à l’effet propre du produit que l’on étudie. 13
  15. 15. Upsa Méthodo essais 2002 18/10/02 15:57 Page 14 • le principe de signification : le résultat observé a-t-il bien été obtenu grâce au médicament étudié ou est-il le fruit du hasard ? La comparaison Dans le domaine des essais cliniques, on travaille toujours de façon comparative.On peut comparer la situation actuelle à une situation antérieure (c’est ce que l’on appelle un “essai rétrospectif”). Mais le plus souvent, on va comparer un nouveau traitement à une situation sans traitement (lorsque l’on donne un placebo, par exemple), ou à un autre traitement (traitement dit de “référence”). Mais pour qu’une comparaison puisse être extrapolée, il est essentiel qu’elle ait une valeur générale. Pour cela, il faut travailler sur un échantillon véritablement représentatif des patients auxquels s’adresse le traitement à l’étude. PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX La causalité 14 Il est essentiel que les groupes comparés soient véritablement comparables. Ce principe est à la base de la démarche expérimentale qui vise à rattacher les différences observées à la fin de l’essai à l’effet du traitement. La seule solution est donc de constituer un groupe témoin et un groupe traité parfaitement identiques du point de vue de leurs caractéristiques physiologiques et physiopathologiques. Cette comparabilité entre les deux groupes est fondamentale. Elle n’est pas très difficile à obtenir au départ, pour peu que l’on prenne certaines précautions dans la présélection puis le tirage au sort des sujets. Toutefois, il est tout aussi important que cette comparabilité soit maintenue tout au long de l’essai. La meilleure solution, pour ne pas introduire de biais, consiste à travailler au minimum en simple aveugle (seul le patient ne connaît pas la nature du médicament administré) ou, de préférence, en double aveugle (ni le patient ni le médecin ne connaissent la nature du médicament administré). Il est nécessaire que cette règle soit maintenue jusqu’à la fin de l’analyse statistique. La signification On ne peut imputer un effet thérapeutique à un traitement que si la randomisation a été parfaitement respectée, sinon, on s’expose à des
  16. 16. Upsa Méthodo essais 2002 18/10/02 15:57 Page 15 I LES QUESTIONS À SE POSER AVANT D’ENGAGER UN TRAVAIL DE RECHERCHE CLINIQUE ◗ Quels objectifs ? On s’aperçoit très souvent que les objectifs fixés lors de la mise en place d’un protocole ne sont pas assez clairement définis. Beaucoup de chercheurs cliniciens fixent plusieurs objectifs à une seule étude, dans l’espoir de recueillir un maximum d’informations. Ceci peut paraître tout à fait louable d’un point de vue éthique, mais est souvent désastreux au plan méthodologique. On peut dire aujourd’hui que, pour chaque essai, il faut se fixer un objectif prioritaire, sous peine de parvenir à des résultats totalement inexploitables car trop compliqués à analyser. Il faut également éviter de refaire des études qui ont déjà été réalisées. Il faut enfin pouvoir justifier le projet sur le plan scientifique. PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX biais majeurs qui peuvent fausser totalement les résultats et leur enlever toute pertinence.Grâce à un test statistique qui est choisi en fonction du plan expérimental utilisé,des caractéristiques du critère de jugement,de la taille de l’échantillon, on conclut que les effets observés dans le groupe témoin et le groupe traité sont significativement différents ou qu’ils ne le sont pas. Compte tenu de la variabilité biologique et de l’interférence possible des facteurs confondants que nous avons évoqués précédemment, on ne peut jamais exclure que la différence observée soit le seul fait du hasard. Dans la communauté scientifique, il y a un consensus pour considérer que l’effet du médicament A est différent de celui du médicament B lorsque le test statistique sort le presque mythique “p ≤ 0,05”. En fait ce “p ≤ 0,05” signifie simplement qu’il y a 95 % de chances que la conclusion que l’on tire à partir de l’échantillon sur lequel on a travaillé corresponde bien à la “réalité”. On accepte aussi le risque de conclure à tort dans 5 % des cas. Si l’on est plus exigeant, on peut n’accepter qu’un risque à 1 % ou 0,1 % de se tromper dans les conclusions. Cette “barrière” du “p ≤ 0,05” est trop souvent érigée en dogme sans que les utilisateurs des tests statistiques ou les lecteurs des rapports d’études en comprennent correctement le sens. 15
  17. 17. Upsa Méthodo essais 2002 18/10/02 15:57 Page 16 ◗ Quelle population étudier ? La pathologie concernée PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX Lorsque l’on réalise une étude sur un médicament, il faut savoir précisément à quelle pathologie on s’adresse et souvent même à quel stade d’évolution de cette pathologie. Par exemple, les médicaments utiles pour traiter une insuffisance cardiaque de stade I ne sont pas les mieux adaptés au traitement d’une insuffisance cardiaque au stade IV. Les efforts accomplis dans le domaine de la recherche thérapeutique ont d’ailleurs fait progresser de façon incontestable la nosologie. Nous en avons une excellente illustration dans le domaine des psychotropes. Pour étudier cette famille de médicaments, nous avions besoin d’avoir une classification très précise des maladies psychiques, notamment pour inclure des groupes de patients homogènes et pouvoir comparer les résultats d’études réalisées par différentes équipes. Ce travail nosographique a débouché sur la classification DSM III puis DSM IV qui est devenue un outil quasi indispensable, bien sûr dans le cadre des essais cliniques, mais aussi en pratique psychiatrique quotidienne. 16 Constitution de l’échantillon et critères d’inclusion Il faut sélectionner les malades sur des critères bien précis et définir la taille de l’échantillon. En effet, lorsque l’on réalise un essai clinique, il ne faut jamais perdre de vue, même si l’on doit inclure plusieurs centaines de patients, que l’on travaille sur un petit échantillon, si l’on se rapporte à l’ensemble de la population à laquelle s’adresse potentiellement le médicament. Pour que l’on puisse extrapoler les résultats obtenus à partir des patients inclus dans un essai à l’ensemble de la population cible, il est donc indispensable que cet échantillon soit véritablement représentatif de l’ensemble de la population à laquelle est destiné le traitement. Les caractéristiques physiologiques et physiopathologiques de cette population doivent donc se retrouver dans l’échantillon et vice versa. Ce problème est loin d’être simple. Dans le domaine des antihypertenseurs par exemple, on a découvert tardivement que la population noire répond moins bien aux inhibiteurs d’enzymes de conversion ou aux bêta-bloquants que la population blanche. On observe par ailleurs une sous-représentativité chronique des femmes dans les essais thérapeutiques. Cela tient au fait que l’on veut éviter, à juste titre, que
  18. 18. Upsa Méthodo essais 2002 18/10/02 15:57 Page 17 Avant de commencer une étude, il faut clairement définir la procédure de sélection. Pour cela, on s’appuie sur des critères d’inclusion et d’exclusion qui sont spécifiés dans le protocole d’étude. Cette sélection a pour but de constituer des groupes homogènes, notamment par rapport au (x) critère(s) d’évaluation, ce qui en diminue la variabilité et permet de conclure sur un échantillon de plus petite taille. Mais il faut savoir que ce principe de sélection est un mal nécessaire. Certes, en sélectionnant, on constitue un échantillon homogène, mais cet échantillon risque de ne plus vraiment être représentatif de la population globale. C’est classiquement le cas des études réalisées sur des populations de malades très sélectionnées en milieu hospitalier. Il faut également avoir une approche réaliste du recrutement. Lorsque l’on souhaite lancer un essai thérapeutique, on demande généralement aux cliniciens d’estimer combien ils sont capables d’inclure de patients présentant une pathologie donnée. En règle générale, ces cliniciens affirment voir en consultation ou en hospitalisation un nombre considérable de patients répondant aux critères attendus et ils en concluent qu’il devrait être possible de recruter très rapidement le nombre de patients requis. Malheureusement, dans cette première approximation, ils oublient que certains de leurs patients n’accepteront pas de participer à l’essai, que d’autres ont des pathologies associées, prennent des traitements qui sont contre-indiqués, autant de facteurs qui ne permettent pas in fine de les inclure dans un protocole. C’est pour cela qu’il faut conserver une approche réaliste car les capacités réelles de recrutement ne représentent parfois que 10 % de l’estimation de départ. Enfin, il est important de respecter des principes éthiques quand on sélectionne des sujets, notamment lorsque l’on souhaite réaliser des PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX survienne une grossesse chez des femmes à qui l’on administre un nouveau médicament encore très imparfaitement évalué. Cela impose que la femme ait une contraception efficace, que l’on fasse des tests de grossesse répétés… Autant de facteurs qui font qu’il est plus simple de n’inclure que des hommes ! Cette commodité a son revers, car sauf si l’on étudie un médicament destiné au traitement de l’adénome de la prostate, peut-on extrapoler à l’ensemble de la population les résultats exclusivement obtenus sur un échantillon d’hommes ? La réponse est clairement non ! 17
  19. 19. Upsa Méthodo essais 2002 18/10/02 15:57 Page 18 essais médicamenteux. Le fait de participer à un essai clinique ne doit pas entraîner pour le malade “une perte de chance” en termes de guérison ou de survie par rapport aux possibilités thérapeutiques du moment. Nombre de sujets nécessaires Pour calculer le nombre de sujets nécessaires, en considérant que l’on a défini un plan expérimental et choisi un test statistique précis, quatre paramètres doivent être pris en considération. PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX • Il faut tout d’abord se demander quelle sera,sur le critère d’évaluation, la différence que l’on considère comme cliniquement pertinente entre les deux groupes à l’issue du traitement. Sur une population en insuffisance cardiaque de stade IV par exemple, gagner 15 jours de survie a-t-il une signification sur le plan clinique ? On peut penser que non. On se fixe donc pour objectif de gagner au moins trois mois de survie. Contrairement à ce que croient la plupart des investigateurs, plus la différence recherchée est faible, plus il faut inclure de patients. 18 • Le deuxième paramètre est la variabilité du critère principal d’évaluation. Pour reprendre l’exemple de l’insuffisance cardiaque, le critère d’évaluation est le temps de survie exprimé en semaines.Mais ce temps de survie varie d’un sujet à l’autre, même lorsque les malades se trouvent au même stade. C’est pour cela que l’on parle de variabilité du critère d’évaluation. Or, plus la variabilité de ce critère est grande, plus il faut inclure de sujets pour pouvoir conclure du point de vue statistique. • Le troisième paramètre est le risque de “première espèce α”. Il s’agit du risque de conclure à une différence entre deux traitements alors qu’en réalité, elle n’existe pas. En général, on fixe ce risque à 5 %, mais on peut être plus exigeant et l’abaisser à 1 % ou 0,1 %. Naturellement, plus on est exigeant, plus il faut inclure de sujets dans l’échantillon. • Le quatrième paramètre est la puissance du test de comparaison qui est l’inverse du risque de “deuxième espèce β”. Ce risque β correspond au risque que l’on s’accorde de conclure à une absence de différence entre deux traitements lorsque celle-ci existe vraiment. Dans ce
  20. 20. 18/10/02 15:57 Page 19 domaine, on accepte généralement un risque β de 0,20 à 0,05 (ce qui correspond à une puissance du test de 80 % à 95 %). Assez logiquement, plus on exige une forte puissance du test de comparaison, plus il faut de sujets. Ce risque β est essentiel lorsque l’on compare des traitements dont on pense a priori que leur efficacité est très voisine et que l’on cherche à démontrer l’équivalence des deux médicaments. On ne peut affirmer cette équivalence que si l’on dispose d’une puissance de test suffisante. Pour illustrer cette problématique du nombre de sujets, prenons l’exemple d’une comparaison entre deux hypnotiques. On retient pour critère d’évaluation principal la durée du sommeil, exprimée en heures. On considère qu’une différence peut être mise en évidence si l’un de ces deux traitements fait dormir deux heures de plus que l’autre. Si l’on se fixe par ailleurs un risque α à 5 %, une puissance de test à 95 % et si l’on considère que la variance de la durée du sommeil dans la population globale est de 3 heures, il faut, d’après nos calculs, inclure au minimum 39 sujets dans chaque groupe – soit 78 personnes au total – pour aboutir à des conclusions significatives sur le plan statistique. Mais, si l’on veut montrer que l’un de ces traitements ne fait dormir qu’une heure et demie de plus que l’autre, il faut porter le nombre de sujets à 52 par groupe, soit 104 au total. Le choix du plan expérimental et du test statistique a également une incidence sur le nombre de sujets nécessaires. Ainsi, au cours d’un essai croisé dans lequel chaque sujet est son propre témoin (il reçoit successivement les différents traitements testés), on gomme la variabilité intraindividuelle et on peut ainsi diminuer le nombre de sujets par un facteur trois à quatre (dans le meilleur des cas). De même, en reprenant l’exemple précédent relatif à l’essai d’un hypnotique, si l’on n’utilise plus un test de comparaison bilatéral (dans lequel on ne préjuge pas que le traitement A est supérieur à B ou l’inverse) mais un test unilatéral (où l’on se fixe pour hypothèse de départ que l’un des traitements est plus efficace que l’autre),les tests permettent d’observer des différences statistiquement intéressantes avec moins de sujets, à savoir 32 au lieu de 38. Enfin, le fait d’utiliser un test statistique paramétrique (lorsque les conditions l’y autorisent) permet habituellement d’avoir la même puissance statistique avec un peu moins de sujets. Mais, ici, le gain en effectifs n’est pas aussi important que le croient beaucoup de cliniciens. PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX Upsa Méthodo essais 2002 19
  21. 21. Upsa Méthodo essais 2002 18/10/02 15:57 Page 20 ◗ Quels traitements comparer ? Si nous nous plaçons dans le cas où nous avons à tester un nouveau médicament.Il faut savoir si on le compare à un placebo ou à un produit de référence. Le placebo présente un avantage incontestable : il permet de mettre en évidence l’efficacité intrinsèque du médicament. Dans le cas d’une comparaison avec un produit de référence, on ne peut que comparer l’efficacité relative des deux produits. PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX Le choix du produit de référence est souvent beaucoup plus complexe qu’il y paraît. Quand il s’agit d’un médicament que l’on souhaite faire enregistrer pour une mise sur le marché, on n’a pas vraiment le choix. En effet,pour que le dossier d’enregistrement soit analysé par la commission d’AMM (Autorisation de Mise sur le Marché), celle-ci exige que le nouveau médicament soit comparé à un produit récent, reconnu comme étant le plus efficace et le mieux toléré au sein de sa classe thérapeutique.Or,les médicaments très récents sont rarement commercialisés simultanément dans tous les pays où l’on avait prévu de faire les essais thérapeutiques, ce qui entraîne bien des complications. 20 Le deuxième problème est le choix de la posologie du produit de référence. On peut décider de l’administrer à une posologie relativement faible. Dans ce cas, lors de la comparaison, on favorise le produit testé au plan de l’efficacité, mais on risque de le défavoriser sur le plan de la tolérance. À l’inverse, si l’on administre le produit de référence à une posologie forte, on risque de pénaliser le produit testé sur le plan de l’efficacité, même si sa tolérance apparaît meilleure que celle du produit de référence. Ces choix qui engagent fortement l’avenir du produit, sont souvent difficiles à faire. L’usage d’un placebo n’est pas toujours possible.C’est notamment le cas dans les pathologies qui présentent un risque vital à court terme,où cela poserait des problèmes éthiques évidents. La comparaison à un placebo est particulièrement intéressante chaque fois que l’on cherche à mettre en évidence l’effet pharmacologique propre d’un produit, qui correspond à la différence entre l’effet observé et l’effet placebo. On néglige trop souvent que cet effet placebo peut atteindre 50 % à 60 % dans certains domaines thérapeutiques, notamment dans les traitements antimigraineux.Ne pas le prendre en compte pose donc de réels problèmes
  22. 22. Upsa Méthodo essais 2002 18/10/02 15:57 Page 21 d’interprétation.Par ailleurs,cet effet placebo peut varier en fonction du centre d’essai,de l’investigateur,de la couleur de la gélule,etc.Il est donc toujours souhaitable de pouvoir le quantifier. ◗ Quel plan expérimental ? Ils peuvent être très nombreux et le choix dépend d’un ensemble d’éléments tels que : les objectifs d’études, la durée du traitement, l’évolution spontanée de la maladie, sa prévalence dans la population, etc. Ces essais ont été beaucoup utilisés pour rechercher les posologies qui apportent le meilleur rapport efficacité/tolérance. Ils ne posent pas de problèmes particuliers lorsqu’on les utilise pour évaluer l’effet d’un traitement administré à dose unique mais leur usage est beaucoup plus périlleux lorsqu’ils s’appliquent à un traitement en prises répétées. Le principe des essais de titration est fondé sur une augmentation individuelle des doses (à intervalles réguliers s’il s’agit d’un traitement prolongé) et selon des paliers prédéfinis. Si le sujet réagit comme attendu au traitement, on le laisse poursuivre l’essai à la même posologie ; s’il ne réagit pas suffisamment, on lui administre une posologie plus forte. On répète la même procédure pour différents paliers de doses prédéfinis et, à la fin de l’étude, on peut déterminer la ou les posologie(s) efficace(s) à laquelle ou auxquelles le plus grand nombre de sujets a répondu au traitement. Ces plans ont été très largement utilisés dans les années soi, notamment pour étudier l’efficacité des anti-hypertenseurs. À l’époque, on évaluait l’efficacité des différentes posologies toutes les deux semaines. L’application à large échelle de ces essais de titration a fait que la plupart des anti-hypertenseurs qui ont été mis sur le marché dans les années soixante-dix et au début des années quatre-vingt étaient surdosés. L’explication de cette dérive est venue tardivement. Il a fallu en effet de très nombreuses études pour que l’on découvre que lorsque l’on institue un traitement anti-hypertenseur, il faut attendre en moyenne entre six et huit semaines (et non quelques jours comme on le pensait !) pour en obtenir le plein effet. On voit donc immédiatement le biais que pouvaient présenter les évaluations sur deux semaines : PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX Les essais de “titration” 21
  23. 23. Upsa Méthodo essais 2002 18/10/02 15:57 Page 22 certains patients, loin d’avoir le plein effet de leur traitement au bout de cette période, étaient, à tort, passés à une posologie plus forte ce qui tirait artificiellement vers le haut les doses d’anti-hypertenseurs considérées comme efficaces. La difficulté de connaître, pour beaucoup de traitements, la durée nécessaire pour obtenir le plein effet justifie qu’aujourd’hui ces plans soient utilisés avec beaucoup de prudence. Les plans expérimentaux en groupes parallèles PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX Ces plans expérimentaux sont certainement les plus utilisés actuellement. Leur principe est extrêmement simple. On commence par prendre un échantillon représentatif de la population et on le divise en autant de groupes que de traitements à comparer.Puis,par tirage au sort, on affecte un traitement déterminé à chaque groupe, l’un d’entre eux pouvant éventuellement recevoir un placebo. Au bout d’une période définie, on évalue l’effet thérapeutique obtenu sur chacun de ces groupes. 22 Au cours des études de ce type, on prévoit parfois une période dite de “run-in” durant laquelle les patients reçoivent un placebo. Certains la mettent à profit pour éliminer les “placebo-répondeurs”, en arguant du fait que ces sujets génèrent un “bruit de fond” qui diminue la puissance des comparaisons statistiques. Mais en éliminant ces patients, il faut savoir que l’échantillon devient moins représentatif de la population globale. Par conséquent, tout le monde n’adhère pas à cette solution. Nous pensons qu’il faut arrêter le choix en fonction des objectifs de chaque étude. Au cours d’un essai en groupes parallèles, on peut comparer entre eux plusieurs traitements, on peut aussi comparer les effets de différentes posologies d’un même médicament avec un traitement de référence ou un placebo. Les plans expérimentaux en groupes parallèles présentent de nombreux avantages. Si on les utilise beaucoup, c’est essentiellement parce qu’ils sont simples à organiser ou à analyser et parce qu’ils présentent peu de risques de biais. Ils ont aussi quelques inconvénients. Notamment, compte tenu que chaque sujet ne reçoit qu’un seul type de traitement, la mesure du critère d’évaluation est entachée de la variabilité interindividuelle. Si cette variabilité est forte, cela peut affaiblir considéra-
  24. 24. Upsa Méthodo essais 2002 18/10/02 15:57 Page 23 blement la puissance des tests statistiques, que l’on devra compenser en augmentant le nombre de patients dans chaque groupe.Un risque de biais peut venir de ce que les différents groupes ne sont pas comparables du point de vue de leurs caractéristiques physiologiques, physiopathologiques ou d’autres facteurs individuels pouvant interférer avec l’effet du traitement étudié. Ce risque est en principe évité si l’on a pris soin d’inclure les patients après tirage au sort et si l’on dispose d’un échantillon suffisamment grand. Il n’en reste pas moins que, parfois, le hasard fait mal les choses… et que cela ne se révèle malheureusement qu’après le dépouillement des résultats. Dans ces plans expérimentaux, les sujets sont leur propre témoin car ils reçoivent, successivement et dans un ordre aléatoire, les différents traitements ou les différentes posologies qui sont à l’étude. Lorsque l’on répète les comparaisons chez un même patient,on parle alors de “carrés latins”, de “blocs incomplets” ou “d’essais croisés répétés intensifs”. Comment se déroulent ces essais croisés ? Prenons un cas simple, dans lequel on compare deux traitements. Le principe général est le même que pour les plans en groupes parallèles. La différence est que 50 % des sujets vont d’abord recevoir le traitement A, puis le traitement B, alors que les 50 % restants vont d’abord recevoir le traitement B, puis le traitement A. Le fait que, dans ce type de plan expérimental, chaque sujet soit son propre témoin élimine la variabilité inter-individuelle dont nous avons parlé précédemment. Cette approche permet d’avoir la même puissance de comparaison statistique avec, dans le meilleur des cas, quatre fois moins de patients. Mais les plans expérimentaux de ce type présentent également des faiblesses. Ainsi, l’effet du premier traitement peut retentir sur les effets du deuxième (c’est ce que l’on appelle la “rémanence de l’effet thérapeutique”). On peut remédier partiellement à ce problème en introduisant, entre les deux périodes de traitement, une “fenêtre thérapeutique” ou “période de wash-out” durant laquelle les sujets reçoivent un placebo. Le principe est simple, mais on est alors confronté au même problème que dans les essais de titration : quelle doit être la durée de la fenêtre thérapeutique pour être sûr que les sujets sont PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX Les plans expérimentaux croisés ou par comparaisons intra-individuelles 23
  25. 25. Upsa Méthodo essais 2002 18/10/02 15:57 Page 24 effectivement revenus à leur niveau basal ? C’est une question à laquelle il est malheureusement souvent difficile de répondre précisément, en particulier lorsque l’on étudie des molécules vraiment nouvelles. À l’extrême,on peut réaliser ce que l’on appelle un “essai intensif”avec deux ou trois patients voire un seul, en répétant plusieurs fois et dans un ordre aléatoire, les traitements étudiés. Le champ d’application de ce type d’essais reste toutefois extrêmement limité. On le réserve habituellement aux pathologies rares pour lesquelles on ne peut recruter que quelques sujets. PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX D’une manière générale, les études en permutation croisée présentent un certain nombre d’avantages. Elles permettent de gommer la variabilité interindividuelle car chaque sujet est son propre témoin. Avec le même effectif,on gagne donc beaucoup de puissance statistique pour la comparaison. Cela peut s’avérer intéressant d’un point de vue éthique, mais aussi au plan pratique, lorsque l’on a affaire à une pathologie pour laquelle les malades sont particulièrement difficiles à recruter. 24 Mais les essais croisés présentent aussi quelques inconvénients : • Leur organisation est plus complexe. • Ils durent plus longtemps car chaque sujet reçoit successivement les différents médicaments à tester. Dans ces conditions, les durées de chacun des traitements et des fenêtres thérapeutiques s’additionnent dans le temps. • Le risque de biais est important et ils sont parfois difficiles à déceler. • Ces essais ne peuvent pas s’appliquer aux pathologies spontanément évolutives. Par exemple, les rhinites aiguës qui guérissent spontanément en quatre jours. • Ils ne peuvent pas s’appliquer aux traitements curatifs. Les plans factoriels Le plan factoriel est le plan expérimental de référence lorsque l’on souhaite étudier l’effet de l’association de deux traitements, ou évaluer l’influence du stade évolutif d’une maladie, d’une pathologie associée, de caractéristiques physiologiques particulières… sur l’efficacité d’un traitement.
  26. 26. Upsa Méthodo essais 2002 18/10/02 15:57 Page 25 Les courbes de survie L’utilisation des comparaisons basées sur les “courbes de survie”ne peut s’adresser qu’à certaines pathologies pour lesquelles on peut caractériser de façon simple un événement précis. C’est le cas, par exemple, pour la survenue d’un accident vasculaire cérébral, d’un infarctus, d’une fracture du col du fémur… Souvent, mais il y a des exceptions, on utilise cette méthode pour l’évaluation de traitements sur des périodes relativement longues, de plusieurs mois, voire plusieurs années. Le terme de “courbes de survie” vient du fait que ces approches étaient initialement destinées à étudier l’efficacité des traitements anti-néoplasiques en suivant effectivement la survie des patients dans les différents groupes traités et en comparant ces courbes à l’aide de tests statistiques appropriés. Leur usage s’est aujourd’hui étendu à bien d’autres domaines de la thérapeutique. Ces plans constituent une des avancées méthodologiques les plus intéressantes de ces dernières années. Il existe différentes méthodes pour travailler en plans séquentiels, mais elles sont toutes basées sur le même principe relativement simple. On fixe a priori des limites au-delà desquelles on peut conclure que l’un des traitements est supérieur à l’autre et une zone dans laquelle on considère que l’on ne peut pas conclure à une différence entre les traitements. Après chaque observation, ou chaque paire d’observations, on en analyse soigneusement les résultats et, selon que la réponse au traitement est considérée satisfaisante ou non,le statisticien attaché à l’essai indique au clinicien la marche à suivre pour les observations suivantes. Comme dans les autres types de plans expérimentaux, le clinicien doit travailler en “aveugle” pour ce qui concerne la nature ou la posologie du produit administré. Cette approche a bien des avantages,notamment sur le plan éthique,car elle permet d’inclure le minimum de patients requis pour comparer les traitements. Contrairement aux autres plans expérimentaux que nous avons vus précédemment,on ne définit plus a priori le nombre de sujets à inclure, mais on inclut de nouveaux patients jusqu’au moment où l’on peut apporter des conclusions statistiquement significatives. PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX Les plans séquentiels 25
  27. 27. Upsa Méthodo essais 2002 18/10/02 15:57 Page 26 Les plans séquentiels étant basés sur une analyse “en temps réel” des résultats, ils ne peuvent raisonnablement s’appliquer qu’à l’étude de traitements dont l’efficacité peut être jugée en quelques heures ou quelques jours. Ils sont beaucoup utilisés en pédiatrie, notamment pour évaluer des antibiotiques, car les délais de réponse à ces traitements sont courts. PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX ◗ Quels critères de jugement ? 26 Les traitements sont avant tout destinés à améliorer la qualité de vie des patients ou à prolonger leur durée de vie. Sur cette base, il serait logique d’évaluer et de comparer tous les traitements en mesurant les bénéfices qu’ils apportent en termes de morbidité et de mortalité. Dans la pratique, il est assez peu fréquent que l’efficacité d’un traitement soit évaluée directement sur ces critères. Ceci tient à plusieurs facteurs : • fort heureusement, toutes les pathologies ne mettent pas immédiatement en jeu la vie du patient ; • les indices de morbidité sont souvent difficiles à quantifier ; même si l’on fait aujourd’hui beaucoup d’efforts pour en synthétiser les multiples facettes dans des scores de qualité de vie ; • dans beaucoup de cas, la maladie constitue simplement un facteur de risque pour la survenue de complications qui sont directement responsables de la morbidité et de la mortalité. Un exemple classique est l’hypertension artérielle (HTA). Lorsqu’elle est légère à modérée, elle ne gène aucunement la personne qui est un malade qui s’ignore. Grâce à des études épidémiologiques lourdes, on a pourtant pu établir que l’HTA augmente significativement le risque de mortalité par accidents vasculaires cérébraux. Cette affection est également à l’origine de nombreuses autres complications (qui sont autant de causes directes de morbidité et de mortalité). Ce risque de complications est la seule justification de la normalisation d’une pression artérielle trop élevée. À partir de ce constat, la logique voudrait que l’on évalue l’efficacité des traitements antihypertenseurs sur leur aptitude à diminuer l’incidence de telle ou telle de ces complications ou sur le taux de mortalité.Le problème est que la réalisation de telles études demande d’inclure plusieurs dizaines de milliers de patients et de les suivre pendant 5 ou 10 ans ! Pour des raisons de faisabilité, on doit se rabattre sur ce que l’on appelle un critère de substitution. Le chiffre de la pression artérielle est un critère de substitution très largement
  28. 28. Upsa Méthodo essais 2002 18/10/02 15:57 Page 27 utilisé. C’est même un des rares critères de substitution validé par la démonstration d’une relation directe entre l’élévation de la pression artérielle et le risque de survenue d’un accident vasculaire cérébral. La première qualité requise pour un critère de jugement est d’être médicalement pertinent. Il revient aux experts de juger de cette pertinence et les critères retenus font souvent l’objet d’un consensus international. Il faut bien sûr s’assurer des qualités métrologiques du critère que l’on utilise, que celui-ci repose sur des échelles d’évaluation, des questionnaires ou des mesures recueillies à partir d’appareils plus ou moins sophistiqués. Cette standardisation des méthodes de mesures par la définition de normes est indispensable pour que des résultats puissent être comparés d’un centre d’étude à l’autre. Naturellement, les mesures doivent s’inscrire dans un calendrier extrêmement précis et identique chez tous les patients, sous peine de ne pouvoir réaliser aucune comparaison valable. Enfin, il est indispensable de hiérarchiser les critères de jugement et, si possible, de définir pour chaque protocole un critère d’évaluation principal qui reflète le plus fidèlement l’effet thérapeutique étudié et présente les qualités métrologiques requises. C’est autour de ce critère d’évaluation principal que l’on doit bâtir un protocole d’étude,choisir le PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX D’autres exemples nous rappellent les limites des critères de substitution.C’est le cas des antiarythmiques que l’on a longtemps évalués sur leur aptitude à normaliser un tracé ECG, jusqu’au jour où l’on s’est aperçu qu’il y avait plus de décès chez les patients traités que chez ceux recevant un placebo ! Depuis cette étude, l’ECG n’est plus accepté comme critère de substitution pour évaluer un antiarythmique et, dans cette classe de médicaments, les agences d’enregistrement exigent des essais comportant un suivi au long cours de la survie des patients. Face à ces exigences, bien peu de laboratoires pharmaceutiques se sont lancés dans le développement de nouveaux antiarythmiques. À côté de ces deux exemples,l’un blanc,l’autre noir,combien de zones grisées qui concernent des pathologies pour lesquelles on s’interroge sur la validité des critères de substitution ! Ceci n’empêche pas qu’on les utilise quotidiennement dans les essais thérapeutiques mais, au minimum, il faut essayer de n’avoir recours qu’à ceux qui sont acceptés (sinon validés) par la communauté scientifique et médicale. 27
  29. 29. Upsa Méthodo essais 2002 18/10/02 15:57 Page 28 plan expérimental, calculer le nombre de sujets nécessaires… et que l’on peut véritablement conclure sur l’efficacité du traitement étudié. Ceci n’interdit pas d’observer les effets du nouveau médicament sur d’autres critères, que l’on qualifie de secondaires. I CONCLUSION PRINCIPES MÉTHODOLOGIQUES GÉNÉRAUX La rigueur méthodologique est un élément essentiel pour donner du crédit aux conclusions que l’on tire d’un essai thérapeutique.Toutefois, une méthodologie irréprochable ne suffit pas à faire un bon essai clinique. Pour atteindre cet objectif, il faut aussi garantir une parfaite fiabilité des données recueillies et c’est là tout le domaine des Bonnes Pratiques Cliniques. 28
  30. 30. Upsa Méthodo essais 2002 18/10/02 3. ÉVALUATION 15:57 Page 29 DE LA DOULEUR Évaluation de la douleur provoquée chez le volontaire sain Les tests basés sur une douleur provoquée sont utilisés chez le volontaire sain dans deux contextes assez différents qui sont, d’une part, les recherches fondamentales sur la physiologie de la douleur, d’autre part, l’évaluation pharmacodynamique des médicaments antalgiques. Les tests utilisables sont extrêmement nombreux, mais leur mise en œuvre est souvent beaucoup plus délicate qu’il n’y paraît et peu ont fait l’objet d’un travail de validation approfondi. Ce constat explique que leur place en pharmacologie clinique reste encore largement débattue et qu’à la différence d’autres domaines thérapeutiques, le développement des antalgiques ne bénéficie pas aujourd’hui d’outils d’évaluation aussi performants que nous le souhaiterions pour étudier de nouvelles molécules dès les premiers essais chez l’homme (études de phase I). À un moment où les connaissances fondamentales sur les mécanismes de la douleur ont fait des progrès considérables, ouvrant ainsi des perspectives nombreuses pour le développement de molécules nouvelles, les difficultés rencontrées ne doivent pas faire baisser les bras mais, au contraire, inciter chercheurs et cliniciens à poursuivre un travail de validation minutieux pour mieux définir les modalités optimales d’utilisation et améliorer leur sensibilité. ÉVALUATION DE LA DOULEUR Claude Dubray 29
  31. 31. Upsa Méthodo essais 2002 18/10/02 15:57 Page 30 I LES PRINCIPALES TECHNIQUES DE STIMULATIONS NOCICEPTIVES APPLICABLES À L’HOMME ◗ Induction d’une douleur aiguë ou ponctuelle Stimulus mécanique Les méthodes utilisées consistent le plus souvent à exercer une pression sur une surface cutanée, plus ou moins étendue, en regard de tissus mous ou de crêtes osseuses. D’autres techniques permettent d’obtenir un pincement des téguments ou une pression plus ponctuelle à type de piqûre. Dans tous les cas, il est indispensable de disposer d’appareils qui indiquent précisément la pression exercée, exprimée en newtons ou kilopascals. Ces appareils doivent aussi permettre d’augmenter la pression d’une manière régulière et parfaitement calibrée, seul moyen de déterminer précisément les seuils de douleur et de tolérance au stimulus mécanique. Ces tests sont habituellement assez faciles à mettre en œuvre mais leur répétition rapprochée dans le temps peut poser quelques problèmes, dans la mesure où ils peuvent entraîner des microtraumatismes cutanés provoquant une inflammation locale. ÉVALUATION DE LA DOULEUR Stimulus thermique 30 Les tests basés sur la stimulation thermique sont parmi les plus utilisés dans le domaine de la douleur provoquée. Ils reposent essentiellement sur l’utilisation de petites plaques dont on fait varier la température (thermodes) lorsqu’elles sont appliquées sur la peau ou les muqueuses. On peut élever la température de ces thermodes (stimulus chaud) ou,au contraire, la faire baisser (stimulus froid). Les autres techniques sont essentiellement basées sur la chaleur radiante (lampe au xénon) ou le faisceau laser CO2. Les stimulations à l’aide de thermodes sont certainement les plus utilisées,du fait de leur facilité de mise en œuvre.Ces thermodes fondées sur le système Pelletier sont en effet très faciles à piloter à l’aide d’un ordinateur.L’ajustement thermique se fait au 10e de degré et elles permettent d’obtenir pratiquement tous les schémas de stimulation que l’on souhaite : pente régulièrement croissante ou décroissante, plateau thermique, pulses thermiques de forme pyramidale ou sinusoïde, etc. Ces
  32. 32. Upsa Méthodo essais 2002 18/10/02 15:57 Page 31 thermodes ont toutefois l’inconvénient d’une certaine inertie. Ce n’est pas le cas du laser CO2 qui permet de délivrer un stimulus thermique sur une zone très ponctuelle et surtout pendant des durées très brèves. Beaucoup d’auteurs privilégient les stimulations thermiques dans le domaine des douleurs provoquées, considérant qu’aux seuils nociceptifs, on stimule sélectivement les fibres C. Leur application en pharmacologie clinique pose toutefois un problème de sensibilité, car il est difficile de faire varier significativement les seuils de douleur ou de tolérance à ces stimuli après administration de médicaments antalgiques. Stimulus électrique ◗ Induction d’une douleur tonique ou soutenue (de quelques minutes à quelques heures) La plupart des méthodes reposent sur l’injection sous-cutanée ou intramusculaire d’une solution : soit acide, soit hypertonique, soit contenant des substances qui activent les nocicepteurs, telles que la bradykinine, la sérotonine… Elles permettent de provoquer une douleur qui persiste pendant quelques minutes ou quelques heures. D’autres techniques sont capables d’induire une douleur prolongée telles que le “tourniquet” qui consiste à créer une douleur ischémique au niveau d’un membre, en appliquant un brassard tensionnel gonflé au-dessus de la pression artérielle systolique. Dans le domaine des douleurs toniques, il faut réserver une place à part aux modèles de douleur viscérale expérimentale applicables à l’homme sain. Ces techniques reposent ÉVALUATION DE LA DOULEUR Les méthodes de douleur provoquée reposant sur ce type de stimulus consistent essentiellement à appliquer des électrodes cutanées sur le trajet d’un nerf périphérique et faire passer un courant de faible intensité. Une technique plus sophistiquée s’appuie sur une stimulation électrique de la pulpe dentaire. Ces stimulations électriques offrent l’avantage d’être très facilement modulables et de délivrer un stimulus de durée brève. Leur principal inconvénient est lié au fait qu’il s’agit d’un stimulus “non naturel” qui provoque souvent plus une sensation désagréable,voire anxiogène,qu’une véritable douleur.En conséquence, il est particulièrement important de prévoir des séances d’entraînement durant lesquelles le sujet se familiarisera progressivement avec ce type de stimulus. 31
  33. 33. Upsa Méthodo essais 2002 18/10/02 15:57 Page 32 essentiellement sur des dilatations gastriques, coliques ou rectales à l’aide de ballonnets gonflables, combinées éventuellement avec l’instillation locale de substances irritantes pour les muqueuses digestives. ◗ Induction d’une hyperalgésie ou d’une allodynie transitoire ÉVALUATION DE LA DOULEUR La technique la plus utilisée pour induire une hyperalgésie ou/et une allodynie transitoire est l’application cutanée de capsaïcine. Cette substance irritante (extraite du paprika) est facile à utiliser mais son action est relativement brève (2 à 3 heures). Ceci présente un inconvénient majeur lorsque l’on veut étudier des médicaments dont la durée d’action dépasse celle de l’hyperalgésie induite par la capsaïcine. C’est une des principales raisons pour lesquelles on a de plus en plus recours à des stimulations thermiques (chaudes ou froides) ou à une exposition à des U.V. pour provoquer une brûlure du premier degré. On observe alors une inflammation locale qui s’accompagne d’une libération locale de médiateurs pro-nociceptifs qui induisent une hyperalgésie et/ou une allodynie transitoire. L’avantage ici est que cette hyperalgésie ou allodynie induite va persister pendant plusieurs jours, ce qui permet de tester plusieurs antalgiques ou différentes doses d’un produit chez un même sujet qui devient ainsi son propre témoin. 32 D’un point de vue pratique, nous avons une préférence pour la stimulation par le froid qui nous semble beaucoup plus confortable pour les volontaires que la stimulation par le chaud. En effet, il est moins désagréable de se voir appliquer sur le bras une petite barre de cuivre à –28 °C pendant 8 secondes que de supporter pendant 8 à 10 minutes une thermode chauffée à 47 °C ! Quelle que soit la méthode,on observe dans les heures qui suivent l’exposition au chaud ou au froid, une rougeur cutanée dans la zone d’application et une hyperalgésie qui déborde largement cette zone. L’hyperalgésie reste stable dans la zone “lésionnelle”, pendant plusieurs jours, mais la zone d’hyperalgésie “périlésionnelle” tend à se rétrécir progressivement. Peu de travaux publiés utilisent cette technique pour évaluer l’effet antalgique des médicaments, mais l’expérience récente que nous en avons semble indiquer que cette approche est nettement plus sensible que les tests psychophysiques sur peau saine pour mettre en évidence un effet antalgique chez le sujet sain.
  34. 34. Upsa Méthodo essais 2002 18/10/02 15:57 Page 33 ◗ Modalités d’utilisation de ces techniques de stimulation nociceptive Les différentes techniques de stimulation nociceptive que nous venons de voir peuvent être utilisées de manière isolée ou combinée. Dans le cadre de l’évaluation des médicaments analgésiques, de nombreuses équipes ont donné leur préférence à l’utilisation de batteries de tests relativement lourdes. Cette approche est motivée par deux principales raisons. Premièrement, il n’existe pas de relation évidente entre les réponses obtenues avec les différents types de stimuli. Deuxièmement, on a observé que certains antalgiques modifient préférentiellement les seuils de douleur en réponse à tel type de stimulus plutôt qu’à tel autre. Dans ces conditions, surtout lorsque l’on doit tester un nouvel antalgique, beaucoup ont estimé que seules des batteries de tests combinant plusieurs types de stimulation nociceptive permettent d’analyser correctement le profil de la nouvelle molécule. Cette approche a cependant ses limites dans la mesure où la répétition de nombreux tests exige un effort de concentration considérable de la part des volontaires. Dans ces conditions, on risque de privilégier la quantité d’information au détriment de la qualité. Sur la base de notre propre expérience, nous avons tendance actuellement à réduire le nombre de tests. En 1985, Gracely a défini les critères auxquels devrait répondre un tel stimulus nociceptif : • déclenchement et fin rapides ; • caractère naturel (ce qui n’est pas le cas du stimulus électrique) ; • aptitude à se renouveler avec un effet temps négligeable afin de pouvoir répéter les tests de manière rapprochée, sans hyposensibilité ou hypersensibilité des réponses ; • caractère “objectif”, ce qui implique que les réponses au stimulus soient similaires chez l’ensemble des sujets participant aux tests ; • mise en jeu d’un nombre restreint de neurones afférents primaires. ÉVALUATION DE LA DOULEUR ◗ Existe-t-il un stimulus idéal pour induire une douleur expérimentale ? 33
  35. 35. Upsa Méthodo essais 2002 18/10/02 15:57 Page 34 Aucune des techniques de stimulation nociceptive aujourd’hui disponibles et applicables aux sujets sains ou aux patients ne répond à l’ensemble de ces critères. Nous pensons, comme beaucoup de cliniciens ou chercheurs qui travaillent dans ce domaine, que les tests utilisés sont trop nombreux. Cette variété a un intérêt incontestable dans les recherches fondamentales portant sur les mécanismes de la nociception.En revanche,pour ce qui concerne leur utilisation en pharmacologie clinique, un travail de standardisation serait nécessaire pour sélectionner les méthodes les plus pertinentes en termes de sensibilité et de spécificité.Il faut aussi noter que beaucoup de ces techniques,délicates à mettre en œuvre, exposent à des biais méthodologiques importants et il est regrettable que peu d’entre elles aient fait l’objet d’un véritable travail de validation. En définitive, on est obligé de constater que nous ne disposons aujourd’hui d’aucun type de stimulus qui puisse être pris comme référence pour évaluer les antalgiques. I MÉTHODES D’ÉVALUATION DE LA DOULEUR PROVOQUÉE ÉVALUATION DE LA DOULEUR ◗ Les tests subjectifs basés sur l’approche psycho-physique 34 La psycho-physique consiste à étudier les relations entre une sensation consciente et les caractéristiques d’un stimulus. A priori, cette approche semble particulièrement bien adaptée pour étudier, chez l’homme, la sensation douloureuse en réponse à des stimuli nociceptifs précalibrés. La plupart des travaux fondamentaux conduits dans le domaine de la psycho-physique ont été appliqués aux domaines de l’audition, de la vision, voire du goût mais, malheureusement, assez peu concernent la nociception. L’application des méthodes psycho-physiques dans le domaine de la nociception répond à trois objectifs : • l’identification des seuils de détection, de douleur et de tolérance à un stimulus spécifique représente l’approche liminaire ; • la discrimination entre deux stimuli d’intensité différente ; • la quantification des sensations pour des stimulations supra-liminaires (c’est-à-dire dans le domaine qui nous intéresse, des stimulations supérieures au seuil d’apparition d’une sensation douloureuse).
  36. 36. Upsa Méthodo essais 2002 18/10/02 15:57 Page 35 Pour chaque type de stimulus, les mesures liminaires visent à déterminer, pour un individu, son seuil de douleur (correspondant à un niveau d’intensité du stimulus qui devient désagréable) et son seuil de tolérance (qui correspond à un niveau où l’intensité du stimulus devient intolérable). Prenons l’exemple d’une stimulation réalisée à l’aide d’une thermode, dont la température s’élève progressivement,qui est appliquée sur l’éminence thénar de la main. Pour les mesures liminaires, on demande au sujet de bloquer la montée de température en appuyant sur un bouton dès que la chaleur de la thermode devient désagréable. Il fixe ainsi son seuil de douleur. On procède de la même façon pour déterminer son seuil de tolérance. L’intervalle de température se situant entre ces deux seuils constitue une plage thermique sur lequel nous pourrons appliquer des stimuli supra-liminaires (c’est-à-dire au dessus du seuil de douleur). Dans cette gamme de températures, on demande au sujet de coter l’intensité de la sensation douloureuse qu’il ressent à l’aide d’une échelle visuelle analogique, en réponse à un stimulus thermique d’amplitude variable se trouvant dans l’intervalle prédéfini. Une autre approche un peu différente consiste à fixer la température de la thermode à 1 degré ou à 1/2 degré en dessous du seuil de tolérance et d’enregistrer le temps pendant lequel le sujet peut maintenir la main sur la thermode à cette température. Au cours d’une expérimentation de ce type, on peut même demander au sujet d’évaluer en continu la sensation douloureuse qu’il ressent à l’aide d’une échelle visuelle analogique électronique. L’utilisation de ces stimuli thermiques supra-liminaires permet d’obtenir une très bonne corrélation entre l’intensité du stimulus appliqué et la sensation douloureuse ressentie par le sujet. Sous l’influence des médicaments antalgiques, on pourrait s’attendre à observer un aplatissement de la droite de régression ou son décalage vers la droite. En fait, cette approche s’avère décevante car très peu sensible à l’action des médicaments antalgiques. Les stimuli supra-liminaires sont également facilement utilisables avec un stimulus laser ou avec un stimulus électrique. Leurs mises en œuvre avec les stimuli mécaniques sont beaucoup plus délicates. ÉVALUATION DE LA DOULEUR Les mesures liminaires et supra-liminaires 35
  37. 37. Upsa Méthodo essais 2002 18/10/02 15:57 Page 36 Importance de l’entraînement aux tests Dans le domaine des tests psycho-physiques, on observe chez un sujet naïf une grande variabilité dans les réponses qui correspond à une phase d’adaptation aux tests, d’apprentissage. Ceci justifie plusieurs séances d’entraînement lorsque l’on veut les utiliser dans le domaine de la pharmacologie clinique. Avec les stimuli nociceptifs, il est naturel que, lors des premières expositions, les sujets aient tendance à réagir à des niveaux assez bas. Puis, lorsque l’on répète les tests, les réponses deviennent plus stables. Si on n’effectuait pas ces séances d’entraînement, ce phénomène d’adaptation interférerait avec l’effet propre des médicaments que l’on voudrait étudier et ceci apporterait un biais majeur dans l’interprétation des résultats. Dans le domaine des tests psycho-physiques nociceptifs, en dépit d’un entraînement bien suivi, les seuils de douleur présentent une grande variabilité inter-individuelle (d’un sujet à l’autre) et même intra-individuelle (d’un jour à l’autre chez un même sujet). Cette variabilité dans les seuils de douleur et de tolérance constitue indéniablement un handicap pour évaluer l’effet des médicaments antalgiques. Les statisticiens savent bien, en effet, que cette variabilité génère un “bruit de fond” qui a pour conséquence de nécessiter plus de sujets pour mettre en évidence l’effet pharmacologique du produit que l’on étudie. ÉVALUATION DE LA DOULEUR La nécessité d’un groupe placebo 36 Des études, peu nombreuses mais assez convaincantes, ont montré que les seuils de sensibilité à la douleur ne sont pas stables au cours du nycthémère. Ce constat a deux conséquences. D’une part, lorsque l’on veut faire des comparaisons chez un même sujet, il est important que les tests soient réalisés à la même heure de la journée s’ils doivent être réalisés à des jours différents. D’autre part, lorsque l’on suit l’évolution d’un seuil de douleur ou un seuil de tolérance sur une période relativement longue, il est indispensable d’avoir un groupe placebo qui reflète les variations circadiennes afin de les prendre en compte pour évaluer l’effet propre d’un médicament antalgique sur ces seuils. Un autre facteur à prendre en compte est le rôle de l’imprégnation hormonale œstro-progestative, et donc du cycle menstruel chez la
  38. 38. Upsa Méthodo essais 2002 18/10/02 15:57 Page 37 femme qui modifie les seuils de sensibilité à la douleur.Cette donnée fait que l’on évite d’inclure des personnes de sexe féminin dans des études au cours desquelles on va devoir répéter les tests psycho-physiques à quelques jours d’intervalle. La place des tests psycho-physiques dans l’étude des médicaments antalgiques chez le sujet sain La plupart des tests psycho-physiques sont relativement faciles à mettre en œuvre, d’où leur utilisation assez large en pharmacologie clinique. Derrière leur apparente facilité de réalisation, il faut savoir que de nombreux facteurs autres que le médicament (ce que l’on appelle les facteurs confondants) peuvent interférer sur les réponses observées. De plus, ces tests sont essentiellement pénalisés par leur grande variabilité. Cette variabilité peut être atténuée en étant très attentif à l’environnement dans lequel se déroulent ces tests, au conditionnement psychologique des sujets, à leur effort de concentration et à la sélection d’une population aussi homogène que possible pour ses seuils de réponse à un type de stimulus particulier. Cette dernière condition n’est toutefois pas réalisable lorsque l’on utilise une batterie de tests combinant plusieurs types de tests. Dans la pratique, on applique au volontaire sain une série de stimuli douloureux d’amplitude variable et on mesure l’intensité de la douleur ressentie, à l’aide d’une mesure de l’EVA qui est relevée après chaque stimulus.Une autre approche consiste à augmenter de manière continue le stimulus jusqu’à un palier, puis à enregistrer le temps pendant lequel le sujet tolère ce stimulus. On peut également demander au sujet de coter en continu sur une EVA la sensation douloureuse provoquée par un stimulus d’intensité croissante. L’utilisation d’échelles visuelles électroniques facilite grandement l’évaluation dans ce contexte expérimental. Lors de l’application de stimuli douloureux d’intensité variable au moyen d’une thermode (par exemple entre 43 °C et 51 °C), on observe une très bonne corrélation entre l’intensité de la température et celle ÉVALUATION DE LA DOULEUR La cotation de la sensation douloureuse en réponse à des stimuli dont l’intensité se situe entre le seuil de douleur et le seuil de tolérance 37
  39. 39. Upsa Méthodo essais 2002 18/10/02 15:57 Page 38 de la douleur. A priori, ce type d’évaluation constitue donc une méthode intéressante pour mesurer l’effet d’un antalgique. Mais les résultats sont très décevants puisque les réponses ne varient pas de manière significative après l’administration de morphine. Des résultats intéressants et pertinents ont pu être obtenus avec une autre approche qui consiste à pratiquer, à plusieurs reprises, trois niveaux de stimulation (haut/intermédiaire/bas) de manière individualisée en fonction des seuils de tolérance de chaque sujet. Cette méthode permet de moyenner la cotation. 10 8 Avant-bras 6 4 2 Masseter 0 43 45 47 49 51°C Log Intensité de la douleur (EVA) Intensité de la douleur (EVA) Relation entre l’intensité de la stimulation thermique et la sensation douloureuse 2,5 2,0 1,5 1,0 0 Stimulus thermique 43 45 47 49 51°C Stimulus thermique ÉVALUATION DE LA DOULEUR D’après Price et al, Clin. J. Pain, 1987 : 3,1-8 38 Certains auteurs ont montré que la répétition des stimulations thermiques pouvait induire une désensibilisation assez nette vis-à-vis de la première douleur (douleur aiguë). En revanche, on observe le phénomène inverse pour la deuxième (douleur lancinante qui apparaît 1,5 seconde après la première douleur). Lorsque l’on pratique des stimulations répétées dans un faible intervalle de temps, il n’est pas possible de demander au sujet de distinguer la première douleur de la deuxième douleur. Par conséquent, le sujet donne une cotation globale intégrant probablement les deux douleurs. En pratique, nous avons constaté que les stimulations répétées à des intervalles de moins de 10 secondes n’entraînaient pas de sensibilisation importante.
  40. 40. Upsa Méthodo essais 2002 18/10/02 15:57 Page 39 Conclusion sur les études subjectives Les études subjectives présentent l’avantage d’être faciles à mettre en œuvre.En revanche,elles ne permettent pas vraiment de dissocier,d’une part, la douleur primaire et la douleur secondaire, et, d’autre part, l’effet nociceptif et l’effet désagréable ou anxiogène (ce dernier étant particulièrement important pour les stimuli électriques). Enfin, les études subjectives sont fortement pénalisées par les phénomènes de variabilité interindividuelle et intra-individuelle. ◗ Les tests objectifs Les mesures électrophysiologiques Les réponses neurovégétatives Elles constituent un moyen indirect de mesurer la réponse d’un individu à une stimulation nociceptive supra-liminaire, en enregistrant les variations de la fréquence cardiaque, de la pression artérielle, du diamètre pupillaire et de la conductance cutanée. Le réflexe nociceptif de flexion Le principe consiste à appliquer une stimulation électrique de faible intensité (moins de 30 mA) sur le trajet d’un nerf périphérique. Pour le membre inférieur, on stimule habituellement le nerf sural, au niveau de son trajet rétro malléolaire externe. Cette stimulation déclenche ÉVALUATION DE LA DOULEUR Les techniques utilisées pour explorer les réponses à des stimuli douloureux sont pour la plupart fondées, soit sur le réflexe nociceptif de flexion (RIII), soit sur des potentiels évoqués somesthésiques. Dans les deux cas, elles permettent d’opérer une distinction entre un antalgique à effet central et un antalgique périphérique. Les techniques d’imagerie cérébrale,qui ont fait l’objet d’un grand nombre de publications ces dernières années, sont très intéressantes pour comprendre les mécanismes de la douleur. Pour l’instant, leur complexité de mise en œuvre et leur coût font qu’elles ont été réservées à des recherches fondamentales (en particulier sur les zones corticales impliquées dans la sensation douloureuse) plutôt qu’à l’étude de médicaments antalgiques. 39
  41. 41. Upsa Méthodo essais 2002 18/10/02 15:57 Page 40 un arc réflexe qui passe par la moelle épinière pour déclencher un mouvement de flexion ipsilatéral. Avec les courants de faible intensité que nous utilisons, ce réflexe ne déclenche pas de flexion visible cliniquement, mais il peut être enregistré à l’aide d’un électromyogramme. La technique du réflexe nociceptif de flexion a fait l’objet de plusieurs travaux de validations qui ont montré l’existence d’une relation étroite entre l’amplitude du réflexe RIII et la cotation de douleur (par EVA) ressentie à la suite de la stimulation électrique. Plusieurs études réalisées avec cette technique ont permis d’objectiver l’effet de différents antalgiques administrés par voie IV. Les méthodes “objectives” permettent généralement, mais pas systématiquement, d’établir une relation entre le paramètre mesuré et la sensation douloureuse. Lorsque cette relation n’est pas établie, la technique choisie peut être remise en cause. Les études objectives présentent l’inconvénient d’être lourdes à mettre en œuvre et d’être difficiles à répéter à court terme. ÉVALUATION DE LA DOULEUR ◗ Les techniques de stimulation nociceptives fondées sur l’hyperalgésie et l’allodynie induites 40 Après avoir induit une allodynie ou une hyperalgésie, on les quantifie, soit à l’aide de stimulations thermiques, soit avec le filament de Von Frey (classique ou électronique). En cas d’hyperalgésie induite, on peut mettre en évidence l’effet de substances antalgiques de palier I telles que le paracétamol ou l’ibuprofène dans la zone d’hyper-algésie alors qu’aucun effet n’est objectivable, lorsqu’on applique les mêmes stimuli sur une zone cutanée saine. I LES APPLICATIONS MÉDICAMENTEUSES L’évaluation de la douleur chez le sujet sain permet de standardiser les conditions expérimentales et d’évaluer l’effet des antalgiques dès la phase I. Le fait de recourir à des sujets sains plutôt qu’à des patients facilite grandement la répétition des mesures, ce qui est nécessaire pour obtenir des données pharmacocinétiques et pharmacodynamiques.
  42. 42. Upsa Méthodo essais 2002 18/10/02 15:57 Page 41 I LES LIMITES Tout d’abord,les douleurs provoquées,même lorsqu’il s’agit de douleurs toniques, se situent dans un cadre différent selon que l’on se place sur un plan psycho-affectif ou sur un plan nociceptif pur. Ensuite, la sensibilité des volontaires sains à l’action des antalgiques est souvent insuffisante. Enfin, la mise en œuvre des techniques d’évaluation de la douleur provoquée est souvent délicate. L’évaluation de la douleur provoquée chez le sujet sain représente un outil d’exploration parfaitement adapté à certaines recherches fondamentales sur la physiologie de la douleur. De ce point de vue, des travaux récents ont d’ailleurs montré que la douleur provoquée, le plus souvent fondée sur une stimulation aiguë, met en jeu des mécanismes qui sont pour partie différents de ceux impliqués dans les douleurs spontanées, surtout si elles ont un caractère chronique ou subchronique. Ces considérations purement physiologiques ou physiopathologiques, ainsi que les problèmes de variabilité et de sensibilité parfois insuffisante à l’action des médicaments antalgiques, font que l’on doit s’interroger sur la place de cette approche pour l’évaluation des médicaments antalgiques. Mieux connaître les limites de ces tests, leurs modalités optimales d’utilisation, leurs critères de validation, devrait permettre de mieux les utiliser dans le développement de nouvelles molécules. Les difficultés que nous avons énumérées ne doivent pas nous faire renoncer à ces approches mais nous inciter à travailler activement sur ces tests de douleur provoquée pour que le développement des antalgiques puisse, comme d’autres domaines thérapeutiques, bénéficier de tests pharmacodynamiques applicables dès les premières étapes du développement chez l’homme. Nous n’avons pas abordé dans cette présentation l’utilisation des tests de douleur provoquée chez le malade. Il s’agit là d’un domaine insuffisamment exploré mais certainement très porteur, dans la mesure où ils permettraient probablement de mieux caractériser les processus physiopathologiques sous-jacents aux phénomènes douloureux chroniques, en particulier ceux liés à une neuropathie. ÉVALUATION DE LA DOULEUR I CONCLUSION 41
  43. 43. ÉVALUATION DE LA DOULEUR Upsa Méthodo essais 2002 42 18/10/02 15:57 Page 42
  44. 44. Upsa Méthodo essais 2002 18/10/02 15:57 Page 43 Évaluation de la douleur clinique chez l’adulte François Boureau I INTRODUCTION Cet article porte sur l’évaluation de la douleur dans le cadre de la réalisation d’un essai clinique et ne concerne donc pas la pratique quotidienne de son évaluation et de son traitement. Les spécialistes de la douleur qui gèrent des cas difficiles, rebelles, sont en général très réceptifs à toute information concernant une nouvelle stratégie thérapeutique. Il est essentiel de souligner la nécessité d’appuyer toute acquisition nouvelle sur des essais cliniques répondant à des critères de qualité. Ceux-ci constituent une étape incontournable dans le développement de nouveaux antalgiques. La valeur d’un résultat dépend du choix des instruments de mesure mais aussi, et surtout, de la méthodologie de l’ensemble de l’essai. Les principes généraux d’un essai clinique tels que randomisation, double aveugle, définitions de critères d’inclusion et d’exclusion, calcul des effectifs, etc. sont considérés comme acquis et nous nous focaliserons sur les paramètres d’évaluation de la douleur.Concernant la méthodologie des essais cliniques dans ce domaine, il est souhaitable de se référer à des recommandations qui font l’objet d’un consensus par les spécialistes du domaine.Citons,par exemple,les recommandations de la FDA :“Guidelines for the clinical evaluation of analgesics drugs”. Lorsqu’un résultat est acquis avec une méthodologie quelque peu inhabituelle, on doit s’interroger sur les biais possibles introduits. Ceci incite à la standardisation des méthodes d’évaluation utilisées. Cette standardisation est d’autant plus nécessaire que les résultats des études portant sur une même problématique peuvent être repris dans des métaanalyses. Il devient délicat de faire des revues lorsque les variables étudiées ne sont pas homogènes. ÉVALUATION DE LA DOULEUR I QUALITÉ DE L’ESSAI CLINIQUE 43
  45. 45. Upsa Méthodo essais 2002 18/10/02 15:57 Page 44 Pour chaque modèle d’évaluation de la douleur, nous disposons d’une littérature spécifique qu’il est important de consulter. Par exemple, l’International Headache Society a proposé une liste de critères à respecter dans les études sur les migraines et sur les céphalées de tension. Des ouvrages généraux comme “Design of analgesics trials” (Max, 1991) ou “An evidence base resource for pain relief” (Mc Quay, 1998) peuvent également être utilement consultés. I LES PROBLÈMES POSÉS ÉVALUATION DE LA DOULEUR La douleur est, par définition, un vécu. Malgré la nature subjective de la douleur, sa mesure reste possible. Le problème posé consiste à standardiser au mieux les conditions de recueil de l’évaluation de ce phénomène subjectif. D’une certaine manière, les spécialistes sont confrontés aux mêmes difficultés que les psychiatres ou psychologues lorsque ceux-ci doivent mesurer la dépression ou l’anxiété.L’objectif est alors de disposer d’outils validés permettant de standardiser, c’est-à-dire d’objectiver, une information par nature subjective. On comprend dès lors que les échelles d’évaluation de la douleur rejoignent celles utilisées en psychométrie. 44 La méthode envisagée pour évaluer la douleur dépend en partie de la définition ou de la délimitation qu’on lui donne. À côté de l’aspect sensation proprement dit, on peut être amené à considérer la dimension affectivo-émotionnelle qui est intégrée à la perception, à s’intéresser au retentissement sur les capacités fonctionnelles… Dans le cas des lombalgies, par exemple, il paraît important de documenter les capacités fonctionnelles. Le retentissement sur le sommeil et plus généralement sur la qualité de vie est un autre niveau à considérer pour décrire la symptomatologie des pathologies douloureuses. L’appréciation des mécanismes générateurs d’une douleur est un autre objectif possible. Des outils permettant de préciser, par exemple, sa composante neuropathique seraient très utiles pour la réalisation d’une étude dans ce domaine. Lors d’un essai clinique, il faut définir un critère principal permettant d’évaluer l’efficacité de la substance antalgique testée. Pour évaluer un phénomène multidimensionnel, on peut être amené à chercher à
  46. 46. Upsa Méthodo essais 2002 18/10/02 15:57 Page 45 multiplier les critères.Toutefois, on doit alors connaître le risque d’introduire un biais dû à la chance de faire apparaître une différence significative. Modèle multidimensionnel de la douleur MÉCANISMES GÉNÉRATEURS P A T H O L O G I E ➨ DOULEUR PERCEPTION COMPORTEMENT ➨ ENVIRONNEMENT NOCICEPTIF SENSATION ➨ NEUROGÈNE PSYCHOGÈNE ➨ IDIOPATHIQUE DÉFICIENCE COGNITION FAMILIAL MOTEUR ➨ ➨ VERBAL ÉMOTION PROFESSIONNEL SOCIAL ➨ INCAPACITÉ ➨ DÉSAVANTAGE Aujourd’hui, la validation d’un outil d’évaluation de la douleur suppose une réflexion appréciant l’ensemble des caractéristiques métrologiques de cet outil.Le terme de validité rassemble en fait plusieurs types de validité : la validité de contenu (l’outil mesure-t-il véritablement ce qu’il est censé mesurer ?), d’apparence (comment l’outil est-il perçu par le patient ?), de construit (l’outil peut-il prendre en compte l’ensemble des dimensions ?) et la validité concourante (l’outil proposé est-il cohérent avec le “Gold Standard”éventuel ?).La validation d’un outil suppose aussi de s’assurer de sa fidélité (test/retest/cohérence interne) et de sa sensibilité au changement. Aujourd’hui, force est de reconnaître que peu d’outils d’évaluation de la douleur clinique ont fait l’objet de publications réexaminant l’ensemble de leurs caractéristiques métrologiques. ÉVALUATION DE LA DOULEUR I LA VALIDATION DES OUTILS D’ÉVALUATION DE LA DOULEUR 45
  47. 47. Upsa Méthodo essais 2002 18/10/02 15:57 Page 46 I LE DÉROULEMENT DE L’ESSAI CLINIQUE ◗ Quelques questions fréquentes •Faut-il éliminer les placebo-répondeurs ? La réponse à cette question souvent posée est simple : les placeborépondeurs ne doivent pas être éliminés. Il ne faut, en effet, pas confondre les notions de placebo-répondeur et de placebo-discriminateur. Un patient qui répond au placebo peut malgré tout faire la différence avec le verum. •Le placebo est-il éthique ? ÉVALUATION DE LA DOULEUR Il n’est pas facile de répondre à cette question. On peut décider de faire l’économie d’un placebo en basant l’étude sur une molécule de référence, ce qui suppose souvent de faire l’hypothèse que la molécule étudiée sera plus efficace que la molécule de référence.Cependant,pour des raisons méthodologiques, il est rarement satisfaisant de se passer d’un placebo. C’est pourquoi, il est souvent nécessaire de faire un compromis entre ce qui est acceptable sur un plan scientifique et ce qui est acceptable sur un plan éthique. Une autre question importante est celle de l’information du patient sur le placebo. Il ne semble pas que les bonnes pratiques, avec notamment l’information et le consentement, aient modifié la survenue de l’effet placebo. 46 ◗ La comparabilité des groupes Lorsque l’on procède à des études sur des groupes parallèles, il est essentiel de s’assurer que les groupes sont comparables. Dans cette perspective, on retient bien évidemment les critères diagnostiques habituels. Mais il faut aussi prendre en compte les variables de la douleur susceptibles de créer une hétérogénéité comme l’ancienneté de la douleur, son intensité ou le degré de handicap. Par exemple, il ne serait pas logique d’inclure dans la même étude des patients au stade aigu et chronique d’un zona.
  48. 48. Upsa Méthodo essais 2002 18/10/02 15:57 Page 47 ◗ La sélection des malades sur l’aptitude à s’évaluer Si une grande rigueur est souvent observée en termes de critères d’inclusion et d’exclusion, on peut regretter qu’il ne soit pas toujours vérifié que les sujets participant aux essais sachent utiliser correctement un outil d’évaluation. Il faut savoir que dans une population non-sélectionnée, environ 18 % à 25 % des sujets ne savent pas utiliser une échelle visuelle analogique (EVA). Une mauvaise appréhension de l’aptitude des patients à s’auto-évaluer se traduit donc par un manque de fiabilité des réponses qui se répercute directement sur la pertinence de l’étude. Pour remédier à ce type de problème, il faut donc sélectionner les patients sur leur aptitude à répondre, intégrer dans les critères d’inclusion des tests permettant de contrôler cette aptitude et standardiser les explications. Il est certain que ce type de raisonnement peut conduire à écarter, par exemple, les enfants et les personnes très âgées des essais cliniques, ce qui pose des problèmes pour documenter les possibilités thérapeutiques pour cette catégorie de malades. Si les essais cliniques sont souvent très rigoureux en termes d’échelle, on s’aperçoit que la définition claire de la douleur à évaluer n’est pas suffisamment explicite dans la question posée. Par exemple, la question de l’intensité de la douleur ne précise pas toujours s’il s’agit de la douleur ressentie au moment présent, depuis une heure ou depuis une journée. Les douleurs provoquées par l’activité peuvent être difficiles à évaluer. En effet, il faut que le patient accepte de réaliser une performance qui le fasse souffrir. Le plus souvent, le patient forme son jugement par anticipation du niveau possible de douleur. Pour des raisons méthodologiques, les essais cliniques se basent donc plus souvent sur les douleurs spontanées que sur les douleurs provoquées par une activité qu’il faudrait standardiser. Enfin, la douleur à l’inclusion doit avoir un niveau suffisant pour permettre la mise en évidence des variations des scores sous l’effet du traitement. ÉVALUATION DE LA DOULEUR ◗ Définir la douleur à étudier 47
  49. 49. Upsa Méthodo essais 2002 18/10/02 15:57 Page 48 I LES ÉCHELLES ◗ L’échelle verbale simple (EVS) L’échelle verbale simple est une échelle ordinale qui fonctionne par catégorie (douleur absente/faible/modérée/intense) et à laquelle un score est imputé (0, 1, 2 ou 3). Dans les essais internationaux, cette échelle pose des problèmes sémantiques car il n’est pas facile de traduire des termes comme “severe pain”. L’échelle verbale simple présente l’avantage d’être facile à comprendre, de permettre une réponse rapide et de pouvoir se prévaloir d’une certaine validité descriptive. En revanche, le nombre limité de catégories peut être responsable de choix forcés. En effet, supposons qu’un patient qui souffrait d’une douleur intense se sente un peu mieux, il n’aura d’autre choix que de qualifier sa douleur de modérée. Or, il aurait peutêtre traduit l’évolution de sa douleur d’une manière moins radicale s’il avait disposé d’une échelle de type visuelle analogique ou numérique. En définitive, le faible nombre de catégories de l’échelle verbale simple pénalise cet instrument qui a, par ailleurs, l’avantage d’être facilement compris. ÉVALUATION DE LA DOULEUR ◗ L’échelle numérique (EN) 48 Le patient indique sur une échelle de 0 (pas de douleur) à 10 (douleur maximale) le niveau de sa douleur au moment présent ou le niveau de la douleur ressentie de manière générale au cours des dernières 24 heures. L’échelle numérique, qui est un bon instrument pour la routine clinique, a été peu utilisée pour les essais contrôlés. ◗ L’échelle visuelle analogique (EVA) Cet instrument est aujourd’hui devenu un standard dans les essais cliniques portant sur la perception de la douleur.L’échelle visuelle analogique est une échelle ordinale bien que certains auteurs, comme Price, la désignent comme une échelle de rapport en raison de sa capacité descriptive.
  50. 50. Upsa Méthodo essais 2002 18/10/02 15:57 Page 49 Aujourd’hui, il n’existe pas de réel consensus sur la définition de l’extrémité supérieure de l’échelle visuelle analogique.Selon les réglettes,cette extrémité sera désignée comme une “douleur extrême”, une “douleur insupportable”.“Douleur maximale imaginable” est toutefois la terminologie la plus fréquente qu’il faut recommander. Évaluer une douleur, entre l’absence de douleur et la douleur insupportable,place les patients dans le registre de la tolérance,c’est-à-dire dans une dimension affective. Par conséquent, il faut garder à l’esprit que l’échelle visuelle analogique intègre un ensemble de composantes de la douleur : affective et sensorielle. Le traitement des données issues des échelles visuelles analogiques s’effectue en termes de moyennes et de médianes. Ces échelles sont simples à utiliser et présentent une bonne sensibilité. Néanmoins, il convient d’accepter que certains patients ne sont pas aptes à les utiliser, et ce malgré les explications fournies. Enfin, il faut se rappeler que l’utilisation de l’échelle visuelle analogique réclame une coordination motrice qui n’est pas toujours évidente à obtenir en période post-opératoire. La littérature ne permet pas de préciser à partir de quelle ampleur une variation sur l’échelle est pertinente sur le plan clinique. Souvent, on estime que la variation est pertinente à partir de 10 millimètres. Échelles globales : forces et faiblesses • Validité . . . . . . . . . . . . . . . . . . . . . . . . . .EVA=EVS=EN • Sensibilité . . . . . . . . . . . . . . . . . . . . . . . . .EVA>EVS, EN ? • Facilité de compréhension . . . . . . . . . . . . . .EVA<EN<EVS • Facilité de passation . . . . . . . . . . . . . . . . .EVA=EVS=EN • Adhésion du malade . . . . . . . . . . . . . . . . .EVA<EN<EVS • Risque d'erreur de score . . . . . . . . . . . . . . .EVA>EVS=EN D’après Jensen, 1992 ÉVALUATION DE LA DOULEUR ◗ Les forces et les faiblesses des échelles globales 49
  51. 51. Upsa Méthodo essais 2002 18/10/02 15:57 Page 50 L’EVA possède une sensibilité supérieure à l’EVS. Elle présente également un avantage certain en termes de risques d’erreurs de score. Pour limiter ces risques, il est préférable que l’EVA soit remplie directement dans le cahier d’observation. Lorsque ce cahier est photocopié, il est important de s’assurer que l’échelle est respectée sur la copie.En termes de validité et de facilité d’utilisation,les trois échelles sont réputées équivalentes. Enfin, l’EVS permet d’obtenir de meilleurs résultats en ce qui concerne la facilité de compréhension et l’adhésion du malade. ◗ Les relations entre l’EVA et l’EVS Nous savons qu’il existe une bonne corrélation entre les résultats obtenus avec l’EVA et l’EVS. Des travaux réalisés par Collins en 1997 ont montré que les patients souffrant d’une douleur modérée plaçaient en moyenne cette douleur à 49 mm sur une EVA et que 90 % d’entre eux la plaçaient à plus de 26 mm. Ces auteurs ont également montré que les patients souffrant d’une douleur intense plaçaient en moyenne cette douleur à 75 mm sur une EVA et que 90 % d’entre eux la plaçaient à plus de 49 mm. Il n’est pas certain que ces relations soient identiques dans des modèles de douleur chronique. Parfois un douloureux chronique se dit moins gêné par l’intensité de sa douleur que par son caractère continu, quotidien depuis de nombreuses années. ÉVALUATION DE LA DOULEUR ◗ Mesure d’intensité et de soulagement 50 L’EVA, l’EVS et l’EN peuvent être utilisées pour mesurer l’intensité de la douleur mais aussi pour mesurer l’ampleur du soulagement. Lorsqu’il évalue son soulagement, le patient doit faire référence à une douleur antérieure, ce qui peut introduire un biais dû à la mémoire de la douleur initiale. Mais nous ne savons pas en fait si ce biais conduit à surestimer ou à sous-estimer la douleur. Les échelles d’intensité permettent très rapidement de s’assurer que les groupes testés sont homogènes à l’inclusion, ce qui n’est pas le cas des échelles de soulagement. En effet, il faut savoir que la description en critère principal des différences d’intensité douloureuse peut masquer une hétérogénéité initiale, ce qui est un facteur de biais.

×