3-  Intervalle de confiance Kinésithérapie et Biostatistiques avec Excel ® Jean-Louis Estrade Enseignant IFMK Orléans La S...
<ul><li>Ces diaporamas ne sauraient remplacer un cours de biostatistiques. </li></ul><ul><li>Ils n’ont pour but que de per...
3.1- Intervalle de confiance d’une moyenne
Pourquoi le calculer ? <ul><li>Problème posé : </li></ul><ul><li>On a mesuré deux années de suite la taille des élèves de ...
Pourquoi le calculer ? <ul><li>A l’aide de l’outil « statistiques descriptives » du module utilitaire d’analyse d’Excel, i...
Pourquoi le calculer ? <ul><li>Nous avions 36 sujets en 2003, 53 en 2004 soit des échantillons considérés en statistiques ...
Pourquoi le calculer ? <ul><li>Il est possible de réaliser les histogramme de 2003 & 2004 et de les comparer.  </li></ul><...
Les fluctuations d’échantillonnage <ul><li>Soit l’exemple du lancé de dés cité par Bouyer *. Si le dé est non pipé, la pro...
Les fluctuations d’échantillonnage <ul><li>Est-ce que la taille vraie des élèves a diminué en un an ?   </li></ul><ul><li>...
Les fluctuations d’échantillonnage <ul><li>Est-ce que, d’une manière générale, la taille a diminué dans la population des ...
R ôle de l’intervalle de confiance <ul><li>Pratiquement, comment faire ? </li></ul><ul><li>Déterminer un intervalle dans l...
R ôle de l’intervalle de confiance <ul><li>A quoi correspond cet intervalle de confiance ? </li></ul><ul><li>Il sert à dét...
R ôle de l’intervalle de confiance <ul><li>Comment quantifier le hasard ? </li></ul><ul><li>Cette part de hasard sera quan...
Calcul de l’IC (grands échantillons) <ul><li>Comment calculer l’intervalle de confiance d’une moyenne dans de grands échan...
Calcul de l’IC (grands échantillons) <ul><li>Comment trouver la valeur permettant de pondérer le hasard ? </li></ul><ul><l...
Calcul de l’IC (grands échantillons) <ul><li>Avec Excel  </li></ul><ul><li>Nous souhaitons limiter notre erreur à 5% des é...
Calcul de l’IC (grands échantillons) <ul><li>Avec Excel  </li></ul><ul><li>Il faut trouver la valeur pour le risque   /2....
Calcul de l’IC (grands échantillons) Calcul manuel de l’IC Part de hasard, moyenne, variance, nombre de sujets sont désorm...
Calcul de l’IC (grands échantillons) Calcul de l’IC par Excel Il faut utiliser la fonction « INTERVALLE.CONFIANCE » pour o...
Calcul de l’IC (grands échantillons) <ul><li>Remarque : </li></ul><ul><li>Dans le tableau « statistiques descriptives » d’...
Conditions d’application  <ul><li>Pourquoi des conditions d’application ?  </li></ul><ul><li>La plupart du temps, notammen...
Conditions d’application  <ul><li>Peut-on utiliser la fonction INTERVALLE.CONFIANCE ? </li></ul><ul><li>La formule utilisé...
Conditions d’application  <ul><li>Alors, au fait ? Y a t’il une différence entre les tailles ? </li></ul><ul><li>Il n’y a ...
Calcul de l’IC (petits échantillons) <ul><li>Pourquoi une différence en fonction de la taille de l’échantillon ? </li></ul...
Calcul de l’IC (petits échantillons) <ul><li>La loi t de Student, une loi Z pour les petits échantillons </li></ul><ul><li...
Calcul de l’IC (petits échantillons) <ul><li>La loi t de Student, une loi Z pour les petits échantillons </li></ul><ul><li...
Calcul de l’IC (petits échantillons) <ul><li>Trouver la valeur de t n-1,  /2  avec Excel </li></ul><ul><li>Il faut utilis...
Calcul de l’IC (petits échantillons) <ul><li>Calcul proprement dit (manuel) </li></ul><ul><li>La valeur de t, pour 11 suje...
3.2- Intervalle de confiance d’un pourcentage
Calcul de l’IC d’un pourcentage <ul><li>Pourquoi le calculer ? </li></ul><ul><li>Donner un pourcentage brut c’est donner u...
Calcul de l’IC d’un pourcentage <ul><li>Comment le calculer ? </li></ul><ul><li>L’intervalle de confiance d’une distributi...
Calcul de l’IC d’un pourcentage <ul><li>Conditions d’application   </li></ul><ul><li>Cette formule ne peut être employée q...
Calcul de l’IC d’un pourcentage <ul><li>Cela sous-entend paradoxalement de déterminer l’intervalle de confiance avant de s...
Calcul de l’IC d’un pourcentage <ul><li>Résultat : </li></ul><ul><li>Sur 100 études similaires, au vu de la première étude...
Illustration  <ul><li>Un kinésithérapeute prétend que sa technique de normalisation de la cheville est fiable dans 75 % de...
Illustration  <ul><li>Nous n’avons pas tenu compte des conditions d’application lorsqu’il y a peu de sujets, mais intuitiv...
Conclusion  <ul><li>L’intervalle de confiance est un indicateur fort et incontournable pour caractériser une variable, not...
Bibliographie  <ul><li>Livres : </li></ul><ul><li>Bouyer J. Méthodes statistiques.  Médecine – Biologie. Estem. Editions I...
Upcoming SlideShare
Loading in...5
×

Stat3 Intervalle De Confiance

10,415

Published on

L'intervalle de confiance sous Excel, à l'aide d'exemples empruntés à la kinesitherapie.

Published in: Education, Technology
0 Comments
4 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
10,415
On Slideshare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
0
Comments
0
Likes
4
Embeds 0
No embeds

No notes for slide

Transcript of "Stat3 Intervalle De Confiance"

  1. 1. 3- Intervalle de confiance Kinésithérapie et Biostatistiques avec Excel ® Jean-Louis Estrade Enseignant IFMK Orléans La Source Enkre
  2. 2. <ul><li>Ces diaporamas ne sauraient remplacer un cours de biostatistiques. </li></ul><ul><li>Ils n’ont pour but que de permettre à des étudiants K1 de faire un premier abord objectif de l’évaluation de la posture et du mouvement, en application des connaissances biostatistiques théoriques acquises lors de l’année universitaire d’orientation. </li></ul><ul><li>Des notions abordées dans l’un des chapitres sont parfois utiles à la compréhension des chapitres suivants. En conséquence, ils sont à consulter dans l’ordre, avec le fichier Excel STAT.XLS joint qui reprend les illustrations du diaporama. </li></ul><ul><li>Il faut avoir à leur lecture la seule attitude compatible avec l’esprit du domaine étudié, à savoir le fait que nous ne pouvons pas rejeter l’hypothèse d’erreurs multiples, diverses et variées dans ces diaporamas. </li></ul><ul><li>Je suis à l’écoute de toutes vos remarques, annotations, critiques. N’hésitez pas à me les faire parvenir. </li></ul>Nécessaires préambules…
  3. 3. 3.1- Intervalle de confiance d’une moyenne
  4. 4. Pourquoi le calculer ? <ul><li>Problème posé : </li></ul><ul><li>On a mesuré deux années de suite la taille des élèves de l’Enkre. Une comparaison graphique des moyennes laisse penser qu’il y a une différence entre les tailles des élèves. Elle est tendancieuse : la perspective choisie vient appuyer la démonstration et l’axe vertical du graphe ne part pas de 0. Alors ? Différence ou non ? </li></ul>
  5. 5. Pourquoi le calculer ? <ul><li>A l’aide de l’outil « statistiques descriptives » du module utilitaire d’analyse d’Excel, il est possible de connaître rapidement les indices de position et de dispersion de ces deux échantillons. Les moyennes apparaissent effectivement différentes. </li></ul>
  6. 6. Pourquoi le calculer ? <ul><li>Nous avions 36 sujets en 2003, 53 en 2004 soit des échantillons considérés en statistiques comme grands ( égaux ou supérieurs à 30 sujets ). </li></ul><ul><li>Est-ce que ces échantillons proviennent d’une population identique ? Pouvons-nous en déduire que la taille des élèves diminue de façon significative en un an ? </li></ul><ul><li>Le hasard peut provoquer très facilement des différences notables, mais évidemment aléatoires, entre des moyennes, en particulier lorsque les échantillons sont de taille modeste. </li></ul><ul><li>Notre objectif consiste à déterminer si la différence observée est due seulement au hasard ou si elle est due au hasard ET à un effet réel. </li></ul>
  7. 7. Pourquoi le calculer ? <ul><li>Il est possible de réaliser les histogramme de 2003 & 2004 et de les comparer. </li></ul><ul><li>La différence des variables appara ît moins flagrante. </li></ul>
  8. 8. Les fluctuations d’échantillonnage <ul><li>Soit l’exemple du lancé de dés cité par Bouyer *. Si le dé est non pipé, la probabilité d’obtenir la face « 2 » est de 1/6. À partir de combien de lancés de dés cette proportion sera mise en évidence ? </li></ul><ul><li>Il faut un nombre très important de tirages pour voir apparaître cette proportion : autant de tirages de dés, autant de résultats. Pour les études sur le vivant idem : Trouver deux moyennes rigoureusement identiques en deux expériences similaires relève de la magie. </li></ul>* Bouyer J. Méthodes statistiques. Médecine – Biologie. Estem. Editions Inserm. 2004
  9. 9. Les fluctuations d’échantillonnage <ul><li>Est-ce que la taille vraie des élèves a diminué en un an ? </li></ul><ul><li>Les moyennes des échantillons sont les moyennes vraies , et l’on peut considérer que ces élèves, tirés au sort dans l’ensemble de leur promotion, sont représentatifs de la promotion dont ils sont issus. </li></ul><ul><li>La moyenne vraie des tailles des élèves de l’IFMK a donc réellement diminué en un an. </li></ul>
  10. 10. Les fluctuations d’échantillonnage <ul><li>Est-ce que, d’une manière générale, la taille a diminué dans la population des élèves de kinésithérapie ? </li></ul><ul><li>Nous ne pouvons pas, à moins de mesurer l’ensemble des élèves des différents écoles de kinésithérapie, connaître la moyenne vraie de la population des élèves. </li></ul><ul><li>Cela reviendrait à réaliser l’équivalent d’un nombre très important de tirages, comme précédemment à l’aide du dé. Matériellement, cela reste peu faisable. </li></ul>
  11. 11. R ôle de l’intervalle de confiance <ul><li>Pratiquement, comment faire ? </li></ul><ul><li>Déterminer un intervalle dans lequel se situera vraisemblablement la moyenne vraie des échantillons, un intervalle dans lequel nous pourrons, avec confiance , situer les moyennes des différents échantillons. </li></ul><ul><li>Ce ne sera pas un intervalle de valeurs dans lequel peut se situer la vraie valeur avec certitude , mais une zone dans laquelle se trouve très probablement, et avec une probabilité que l’on choisit, la véritable valeur (à jamais inconnue) du paramètre que l’on étudie. </li></ul>
  12. 12. R ôle de l’intervalle de confiance <ul><li>A quoi correspond cet intervalle de confiance ? </li></ul><ul><li>Il sert à déterminer la précision de l’estimation faite. </li></ul><ul><li>Il permet de borner, à l’aide de valeurs minimale et maximale, la dispersion des valeurs autour de la moyenne. </li></ul><ul><li>Il se calcule à l’aide de la moyenne de l’échantillon, pondérée par : </li></ul><ul><li>Le nombre de sujets, </li></ul><ul><li>La dispersion des valeurs (variance), </li></ul><ul><li>La part de hasard liée aux fluctuations d’échantillonnage. </li></ul>
  13. 13. R ôle de l’intervalle de confiance <ul><li>Comment quantifier le hasard ? </li></ul><ul><li>Cette part de hasard sera quantifiée à l’aide d’une table, qui prend en compte le risque d’erreur acceptable pour notre étude. </li></ul><ul><li>Ce risque d’erreur, appelé «  erreur de première espèce  », est classiquement fixé à 5%. Il est appelé risque  . </li></ul><ul><li>Cela sous-entend que les conclusions de l’étude seront valables dans 95% des cas, ce qui veut dire que lors du tirage de 100 échantillons, les moyennes de 95 d’entre eux se situeront dans l’intervalle de confiance . </li></ul>
  14. 14. Calcul de l’IC (grands échantillons) <ul><li>Comment calculer l’intervalle de confiance d’une moyenne dans de grands échantillons ? </li></ul><ul><li>Excel nous fourni les moyennes et les variances des échantillons. </li></ul><ul><li>Nous disposons du nombre de sujets. </li></ul><ul><li>Nous ne connaissons pas la variance dans la population, mais il est licite d’utiliser celle de l’échantillon pour de grands échantillons. </li></ul><ul><li>Nous avons défini le niveau d’erreur  acceptable à 5%. Nos conclusions seront considérées comme vraies dans 95% des cas. </li></ul>
  15. 15. Calcul de l’IC (grands échantillons) <ul><li>Comment trouver la valeur permettant de pondérer le hasard ? </li></ul><ul><li>Nous avons défini le niveau d’erreur  acceptable à 5%. Nos conclusions seront considérées comme vraies dans 95% des cas. Ce choix est arbitraire, mais totalement usuel. </li></ul><ul><li>La valeur peut se retrouver dans des tables statistiques, ou se retrouver avec Excel (en fait, vous saurez rapidement par cœur qu’elle est usuellement égale à 1,96 …) </li></ul><ul><li>Avec une table : </li></ul>
  16. 16. Calcul de l’IC (grands échantillons) <ul><li>Avec Excel </li></ul><ul><li>Nous souhaitons limiter notre erreur à 5% des échantillons possibles, qui peuvent être soit plus grands, soit plus petits que notre variable et sa dispersion. L’erreur de première espèce  est à 0,025 + 0,025 soit 5% divisée par 2, appelé  /2 (ce sont de grands échantillons, qui obéissent donc à une loi normale. Il y a répartition symétrique des valeurs). </li></ul>
  17. 17. Calcul de l’IC (grands échantillons) <ul><li>Avec Excel </li></ul><ul><li>Il faut trouver la valeur pour le risque  /2. Cette valeur est donnée à l’aide de la fonction « LOI.NORMALE.STANDARD.INVERSE ». </li></ul><ul><li>Pour la valeur du risque  /2, soit 0,025, qu’il appelle la probabilité, Excel donne la valeur -1,959963985, que nous arrondirons à -1,96. </li></ul><ul><li>Cela correspond au fait que dans une loi normale, 95% des valeurs sont situées dans un intervalle de ± 1,96 écarts-types autour de la moyenne. </li></ul>
  18. 18. Calcul de l’IC (grands échantillons) Calcul manuel de l’IC Part de hasard, moyenne, variance, nombre de sujets sont désormais connus. La valeur de l’intervalle de confiance sera liée à : Après calcul, nous pouvons déterminer que, en tenant compte des fluctuations d’échantillonnage , la taille des élèves en 2003 peut être comprise entre 166,96 et 171,98, et que celle de 2004 peut être comprise entre 165,76 et 169,74. Cela sous-entend que la vraie moyenne se situe très probablement dans un rayon de 1,96 fois l’erreur-standard autour de la moyenne mesurée. Notation Pour 2003, il est noté : IC 95% [166,96 - 171,98 cm]
  19. 19. Calcul de l’IC (grands échantillons) Calcul de l’IC par Excel Il faut utiliser la fonction « INTERVALLE.CONFIANCE » pour obtenir le même résultat, en notant bien qu’Excel nous demande alpha et non  /2. Le résultat est similaire à quelques décimales près à nos calculs, soit un intervalle de confiance à ± 2,51.
  20. 20. Calcul de l’IC (grands échantillons) <ul><li>Remarque : </li></ul><ul><li>Dans le tableau « statistiques descriptives » d’Excel apparaissent des valeurs intitulées «  niveau de confiance (95,0%)  ». Elles correspondent à quelques décimales près à la valeur de l’intervalle de confiance trouvée, mais leur utilisation n’est pas recommandée*. </li></ul><ul><li>Le calcul précédent est par ailleurs simple à utiliser et plus fiable. </li></ul><ul><ul><li>* Georgin JP. Gouet M. Statistiques avec Excel. Presses Universitaires de Rennes. 2005 </li></ul></ul>
  21. 21. Conditions d’application <ul><li>Pourquoi des conditions d’application ?  </li></ul><ul><li>La plupart du temps, notamment pour les tests dit « paramétriques », il existe des conditions d’application ou paramètres pour s’autoriser à utiliser une formule statistique, un test. Comme toujours, et c’est l’un des dangers de son utilisation, Excel est muet sur les conditions d’application. </li></ul><ul><li>Peut-on utiliser la fonction INTERVALLE.CONFIANCE ? </li></ul><ul><li>Pour appliquer cette formule, il est nécessaire que : </li></ul><ul><li>La variable mesurée suive une loi normale </li></ul><ul><li>Notre échantillon présente au moins 30 sujets. </li></ul>
  22. 22. Conditions d’application <ul><li>Peut-on utiliser la fonction INTERVALLE.CONFIANCE ? </li></ul><ul><li>La formule utilisée fait appel à l’emploi d’une loi mathématique, la loi Z dite loi normale centrée réduite, dont nous nous sommes servi pour calculer la part de hasard (le désormais fameux -1,96…), pour un risque  donné. Elle n’est applicable que si la distribution de la variable suit une loi normale, avec une courbe « en cloche ». </li></ul><ul><li>De fait, dans les sciences de la vie, une variable suit une loi normale dès lors que l’échantillon mesuré est grand, en pratique supérieur à 30 sujets…. Nous avons donc, en connaissance de cause utilisé cette fonction. </li></ul>
  23. 23. Conditions d’application <ul><li>Alors, au fait ? Y a t’il une différence entre les tailles ? </li></ul><ul><li>Il n’y a donc pas lieu d’estimer raisonnablement que la taille des élèves a varié entre 2003 et 2004, puisque la valeur de la moyenne vraie d’un échantillon se situe dans la fourchette des valeurs possibles de l’autre. </li></ul><ul><li>Il sera possible ultérieurement de comparer les deux moyennes à l’aide d’un test de Student pour déterminer quel poids on donne à cette estimation. </li></ul>
  24. 24. Calcul de l’IC (petits échantillons) <ul><li>Pourquoi une différence en fonction de la taille de l’échantillon ? </li></ul><ul><li>Les épidémiologistes français considèrent qu’une variable réputée normale dans la population l’est de fait dans un échantillon représentatif de cette population. </li></ul><ul><li>La variable « taille » est une variable connue, notre échantillon est tiré au sort dans la population des étudiants en kinésithérapie, s’il est homogène, il est possible de s’en sortir. </li></ul><ul><li>Par contre, si la variable mesurée est inconnue, on n’a pas le droit de considérer qu’elle obéisse à une loi normale, et il n’y a point de salut…sauf d’atteindre le nombre de 30 sujets mesurés ou de vérifier la normalité de sa distribution par des tests dédiés à cet usage. </li></ul><ul><li>… Utilité de la loi t de Student </li></ul>
  25. 25. Calcul de l’IC (petits échantillons) <ul><li>La loi t de Student, une loi Z pour les petits échantillons </li></ul><ul><li>Nous avons repris le même calcul avec 11 sujets. </li></ul><ul><li>La loi Z n’est pas utilisable, mais il existe une autre loi, la loi t de Student , qui est une variable de la loi Z applicable pour de petits échantillons. </li></ul><ul><li>Schématiquement, elle fait quoi ? </li></ul><ul><li>Précédemment, la variance de la population étudiée, inconnue, était remplacée par la variance de l’échantillon, mesurée sur de grands échantillons. </li></ul><ul><li>Pour pouvoir continuer de le faire sur de petits échantillons, il faut proposer une pondération de la variance mesurée. C’est ce que fait la loi de Student. </li></ul>
  26. 26. Calcul de l’IC (petits échantillons) <ul><li>La loi t de Student, une loi Z pour les petits échantillons </li></ul><ul><li>La formule est identique, mais nous allons remplacer le coefficient -1,96, soit la valeur Z  /2 par la valeur t n-1,  /2, soit le calcul de la part de hasard dans un petit échantillon suivant une loi normale en s’autorisant un risque d’erreur de première espèce de 5%. </li></ul><ul><li>Notion de degrés de liberté </li></ul><ul><li>t n-1,  /2 dépend du nombre de sujets mesurés. </li></ul><ul><li>Elle est pondérée par la valeur n-1 qui est appelée le nombre de degrés de liberté. </li></ul><ul><li>Quand une hanche a 3 degrés de liberté, cela sous-entend que sa position peut se situer dans toutes les configurations matérialisées par les trois axes orthonormés. Ici, une variable peut prendre, à 1 près, toutes les valeurs retrouvées dans l’échantillon. </li></ul>
  27. 27. Calcul de l’IC (petits échantillons) <ul><li>Trouver la valeur de t n-1,  /2 avec Excel </li></ul><ul><li>Il faut utiliser la fonction « LOI.STUDENT.INVERSE », à ceci près que, après vérification sur une table de la loi de Student, Excel considère la probabilité 0,05 comme le risque  /2 et non le risque  . Il faut donc, pour un risque  /2 entrer la probabilité 0,05 et non 0,025. Les degrés de liberté à indiquer sont donc n-1 soit 10 pour 11 tailles mesurées. </li></ul>
  28. 28. Calcul de l’IC (petits échantillons) <ul><li>Calcul proprement dit (manuel) </li></ul><ul><li>La valeur de t, pour 11 sujets mesurés est donc de 2,228. Il faut donc calculer la valeur </li></ul><ul><li>soit 5.06, ce qui correspond à la valeur donnée par Excel. </li></ul><ul><li>Il faut savoir que les valeurs obtenues en application de la la loi de Student sont, pour de grands échantillons, proches de celles obtenues en application de la loi Z. </li></ul>
  29. 29. 3.2- Intervalle de confiance d’un pourcentage
  30. 30. Calcul de l’IC d’un pourcentage <ul><li>Pourquoi le calculer ? </li></ul><ul><li>Donner un pourcentage brut c’est donner un renseignement parcellaire, faux dans l’absolu. </li></ul><ul><li>Exemple : </li></ul><ul><li>Nous avons recherché le nombre d’élèves de K1 de l’IFMK porteurs de lunettes ou de lentilles de contact. Nous avons trouvé 55 % de sujets « appareillés», soit 29 sujets sur les 53 questionnés. Ce 55 % n’a pas de valeur isolément. Il doit être accompagné d’une marge d’erreur pondérant les fluctuations d’échantillonnages. Ceci parce que, grâce à l’étude et comme nous allons le voir, nous aurions pu aussi bien donner 61% ou 41% de sujets porteurs de lunettes, ce qui serait plausible dans 95% des études réalisées avec le même nombre d’élèves. </li></ul><ul><li>Lors d’une nouvelle étude sur le même sujet, une autre année, nous avons trouvé 15 sujets sur 36 questionnés appareillés soit 42 %. Cela correspond à un nouveau « tirage », avec des valeurs vraisemblablement identiques. </li></ul>
  31. 31. Calcul de l’IC d’un pourcentage <ul><li>Comment le calculer ? </li></ul><ul><li>L’intervalle de confiance d’une distribution, se calcule selon une formule proche de l’intervalle de confiance d’une moyenne. Il s’agit toujours de calculer la valeur </li></ul><ul><li>pour déterminer l’intervalle dans lequel peut se situer la valeur vraie d’un pourcentage en tenant compte des fluctuation d’échantillonnage et en se basant sur un risque d’erreur de 5%. </li></ul><ul><li>Comment trouver la variance ? </li></ul><ul><li>La variance d’un pourcentage est égal au produit du pourcentage et de sa valeur complémentaire à 1 soit (p)(1-p). la valeur (1-p) est appelée q. La variance est donc le produit pq. </li></ul>
  32. 32. Calcul de l’IC d’un pourcentage <ul><li>Conditions d’application </li></ul><ul><li>Cette formule ne peut être employée que pour de grands échantillons, c’est-à-dire que le produit du nombre de sujets mesurés et du pourcentage et de son complémentaire à 1 doit être supérieur ou égal à 5 pour toutes les valeurs possibles . Cela sous-entend que np ≥ 5, que nq ≥ 5, y compris pour les valeurs minimales ou maximales pouvant être trouvées . </li></ul><ul><li>Il faut donc : </li></ul><ul><li>Calculer l’intervalle de confiance et ses bornes supérieure et inférieure </li></ul><ul><li>Déterminer le complémentaire à 1 du pourcentage minimal et du pourcentage maximal </li></ul><ul><li>Les multiplier par le nombre de sujets pour déterminer si le produit est supérieur ou égal à 5 </li></ul>
  33. 33. Calcul de l’IC d’un pourcentage <ul><li>Cela sous-entend paradoxalement de déterminer l’intervalle de confiance avant de savoir s’il est licite de le faire. </li></ul><ul><li>Remarque </li></ul><ul><li>Pour certains auteurs les conditions d’application se limitent aux valeurs np et nq supérieures à 5, sans tenir compte des valeurs n psup , n qsup , n pinf , n qinf </li></ul><ul><li>Dans notre cas </li></ul><ul><li>Nous avons ici des valeurs np sup , nq sup , np inf , nq inf supérieures à 5, l’estimation de l’intervalle de confiance peut être faite. </li></ul>
  34. 34. Calcul de l’IC d’un pourcentage <ul><li>Résultat : </li></ul><ul><li>Sur 100 études similaires, au vu de la première étude, il est raisonnable de penser que, dans 95 études sur 100, les pourcentages de sujets porteurs de lentilles de contact ou lunettes se répartissent entre 41 et 68 %, ce qui s’écrit IC 95%  : [41%-68%]. </li></ul><ul><li>Remarque : </li></ul><ul><li>Il est fréquent de voir des décimales aux pourcentages (ex. nous avions 41,7 % de porteurs de lunettes dans la 1° étude, 54,7 % dans la 2°) </li></ul><ul><li>Ceci est dérisoire par rapport à l’étendue de l’intervalle de confiance. </li></ul><ul><li>Il faut donc mettre un pourcentage sous forme d’un nombre entier avec son IC. </li></ul>
  35. 35. Illustration <ul><li>Un kinésithérapeute prétend que sa technique de normalisation de la cheville est fiable dans 75 % des cas d’entorse : en une séance, le patient se déclare guéri. Combien faut-il qu’il traite de patients pour que son affirmation soit fiable et ne repose pas que sur sa croyance ou le hasard ? </li></ul>
  36. 36. Illustration <ul><li>Nous n’avons pas tenu compte des conditions d’application lorsqu’il y a peu de sujets, mais intuitivement, la courbe nous montre qu’en deçà d’une trentaine de sujets, l’intervalle n’est pas assez resserré pour se prononcer. </li></ul><ul><li>A contrario, passer de 100 à 1000 sujets augmenterait de façon phénoménale le coût d’une telle étude pour une faible augmentation de la précision. </li></ul>
  37. 37. Conclusion <ul><li>L’intervalle de confiance est un indicateur fort et incontournable pour caractériser une variable, notamment dans de grands échantillons. </li></ul><ul><li>Nous avons vu précédemment la nécessité de faire figurer, à côté d’une valeur, une indication de sa dispersion à l’aide de son écart-type. </li></ul><ul><li>L’intervalle de confiance permet d’aller plus loin dans la précision de cette valeur, puisqu’il prend en compte, avec une marge d’erreur fixée au départ, non seulement la dispersion, mais aussi la part de hasard inhérente à tout résultat. </li></ul><ul><li>Cette part de hasard est liée au tirage au sort des sujets de l’échantillon dans la population qu’ils représentent. </li></ul>
  38. 38. Bibliographie <ul><li>Livres : </li></ul><ul><li>Bouyer J. Méthodes statistiques. Médecine – Biologie. Estem. Editions Inserm. 2004 </li></ul><ul><li>Georgin JP. Gouet M. Statistiques avec Excel. Presses Universitaires de Rennes. 2005 </li></ul><ul><li>Huguier M. Flahault A. Biostatistiques au quotidien. Elsevier. 2003 </li></ul><ul><li>Sites : </li></ul><ul><li>Cours de Denis Poinsot, maître de conférence à la Faculté de Rennes : http://perso.univ-rennes1.fr/denis.poinsot/Statistiques%20pour%20statophobes/ </li></ul><ul><li>Biostatistique clinique - épidemiologie et essais cliniques de la Faculté de Médecine Necker-Enfants Malades (Dr Landais & Jais) : http://www.educ.necker.fr/cours/poly/biostatistique/biostat.htm# </li></ul><ul><li>Cours : </li></ul><ul><li>Méthodologie de Base en Statistique et Epidémiologie. École d’été de santé publique et d’épidémiologie. Faculté de Médecine Paris-Sud, 63 rue Gabriel Péri, 94276 Le Kremlin Bicêtre. http://u569.kb.inserm.fr/ecolete/index.htm </li></ul><ul><li>Centre d’Enseignement de la Statistique Appliquée à la Médecine et à la Biologie Médicale (CESAM) http://cesam.vjf.inserm.fr/ </li></ul><ul><li>Articles : </li></ul><ul><li>Estrade JL. Statistiques appliquées à la kinésithérapie : Les différentes variables. Kinésithérapie, la Revue, Volume 8, Issue 78, June 2008, Pages 48-52 </li></ul><ul><li>Estrade JL. Statistiques appliquées à la kinésithérapie : Les indices de dispersions et la représentation graphique des variables. Kinésithérapie, la Revue, Volume 8, Issues 80-81, September 2008, Pages 63-67 </li></ul><ul><li>Estrade JL. Statistiques appliquées à la kinésithérapie : Intervalles de confiance avec Excel® Kinésithérapie, la Revue, Volume 9, Issue 89, Mai 2009, Pages 29-35 </li></ul>

×