• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Cours de statistiques s1 éco
 

Cours de statistiques s1 éco

on

  • 16,239 views

 

Statistics

Views

Total Views
16,239
Views on SlideShare
16,239
Embed Views
0

Actions

Likes
8
Downloads
463
Comments
3

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel

13 of 3 previous next Post a comment

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
  • Merci bcp !
    Are you sure you want to
    Your message goes here
    Processing…
  • vr mrc bcp
    Are you sure you want to
    Your message goes here
    Processing…
  • cela m'a beaucoup aider merci
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Cours de statistiques s1 éco Cours de statistiques s1 éco Document Transcript

    • STATISTIQUE DESCRIPTIVE §1 IntroductionLa statistique désigne l’ensemble des méthodes mathématiques relativesà la collecte, à la présentation, à l’ analyse et à l’utilisation de donnéesnumériques. Ces opérations permettent de tirer des conclusions et deprendre des décisions dans les situations d’ incertitude qu’ rencontre ondans le domaine économique, dans celui des a¤aires ou dans d’ autressciences sociales.....On distingue la statistique descriptive et la statistique inductive. Lapremière résume, récapitule, analyse un ensemble de données . La secondeconclut sur le tout aprés examen d’ une partie. Le tout est alors appelépopulation et une partie est appelée un échantillon .§2 Terminologie :- La population est l’ ensemble de tous les individus concernés par uneétude statistiqueExemple 1:Si l’ veut étudier la qualité des allumettes fabriquées par une usine, la onpopulation sera l’ ensemble de toutes les allumettes fabriquées par cetteusine.- On appelle échantillon toute partie de la population.- On appelle individu chaque élément de la population.- La taille représente le nombre d’ individus d’ échantillon ou d’ un unepopulation. Elle est notée n dans le cas d’ échantillon et N dans le uncas d’ population. une- Le caractère est l’ aspect particulier que l’ désire étudier. onExemple 2:Concernant un groupe de personnes, on peut s’ intéresser au caractèreâge, ou au caractère sexe ou encore à leur taille . 1
    • - On appelle modalités les di¤érentes possibilités que peut présenter uncaractère.Exemple 3:- Le sexe est un caractère à deux modalités : féminin ou masculin enfants par famille peut être égal à 0; 1; 2; :::- Le caractère nombre d’- On dira d’ caractère qu’ est qualitatif si ses modalités ne s’ un il exprimentpas par un nombre.Exemple 4 :La religion , la marque d’ une lessive et la couleur des yeux sont descaractères qualitatifs.- On dit d’ caractère qu’ est quantitatif si ses modalités sont numériques. un ilExemple 5 :L’ , le poids , le salaire , . . . sont des caractères quantitatifs. âge- On appelle série statistique l’ ensemble des di¤érentes données associéesaux individus d’ échantillon ou d’ population. un uneExemple 6:- La série suivante représente les notes (sur 20 ) obtenues par 10 étudiantsen statistique : 10 15 9 7 6 5 8 13 11 19- La série suivante représente le sexe de 10 étudiants de première annéede l0ISIAM : F F M M F F F M M F 2
    • §3 Traitement des données- D’ une façon générale , on distingue 3 étapes dans le traitement d’ unesérie statistique :A) La synthèse des résultats à l’ aide d’ tableau; unB) La représentation graphique du phénomène étudié;C) Le calcul des mesures caractéristiques.Expliquons maintenant comment il faut procéder dans chaque étape.A) Tableaux statistiques1) Cas d’ caractère qualitatif un- La taille de l’ échantillon est n- Les di¤érentes modalités sont x1; x2; :::; xk .- Chaque modalité constitue une classe .- Le nombre d’ individus qui appartiennent à la classe xi s’ appelle l’ e¤ectif(ou la fréquence absolue ) de cette classe . Il est noté fi. On a toujours f1 + f2 + ::: + fk = n fi- La fréquence relative de la classe xi est . n- Souvent on préfère exprimer la fréquence relative en pourcentage ; pour ficela, il su¢ t de multiplier par 100 . nExemple : La série statistique suivante représente l’ état-civil d’ un 3
    • groupe de 20 personnes .M C M V M M D V D M C V V V V C C C M Moù M; D; C et V représentent respectivement marié(e), divorcé(e), céli-bataire et veuf(ve). Repartition d0un groupe de 20 personnes selon leur etat civil fi fi Etat-civil e¤ectifs fréq.relatives pourcentages 100 n n M 7 0; 35 35 C 5 0; 25 25 V 6 0; 30 30 D 2 0; 10 10 Total 20 1 1002) Cas d’ caractère quantitatif discret : un- Un caractère quantitatif est discret si l’ ensemble des valeurs qu’ peut ilprendre est …ni.Exemple 1:- Le nombre d’enfants par famille et le nombre de téléviseurs fabriqués parune usine par jour sont des caractères quantitatifs discrets , par contre lecaractère poids n’ pas discret . estPour l’élaboration du tableau , il faut voir si le caractère présente beau-coup de valeurs di¤erentes ou non . Dans le deuxième cas on procèdecomme dans le cas d’ caractère qualitatif et dans le premier cas on unregroupe les données comme dans le cas d’ caractère continu qui sera untraité ultérieurement .Exemple 2: La série suivante donne le nombre d’ enfants à charge dans16 familles . 0 1 0 0 2 1 3 0 1 2 0 1 2 2 2 4 4
    • Repartition de 16 familles selon le nombre d0enfants a charge fi fi nb.d’ enf e¤ fi freq.rel. pourcent 100 e¤. cumul Fi n n 0 5 0; 3125 31; 25 5 1 4 0; 25 25 9 2 5 0; 3125 31; 25 14 3 1 0; 0625 6; 25 15 4 1 0; 0625 6; 25 16 Total 16 1 100 ///////////////////////////- La colonne des e¤ectifs cumulés Fi s’ obtient en additionnant à l’ e¤ectifd’ classe l’ une e¤ectif de chacune des classes qui la pécède , ainsi on a : F1 = f1 , F2 = f1 + f2 , . . . ,Fi = f1 + f2 + ::: + fiFi correspond au nombre de données de la série dont la valeur est in-férieure à la classe xi. 2) Cas d’ caractère quantitatif continu : unUn caractère quantitatif est continu s’ peut prendre théoriquement n’ il importequelle valeur dans un intervalle donné .Exemple 1 :La taille des individus et leur poids sont des caractèresquantitatifs continus .Dans ce cas (ou dans le cas d’ caractère discret avec beaucoup de unvaleurs di¤erentes) la construction du tableau passe par les étapes suiv-antes :Etape 1 : Déterminer l’ étendu de la sérieNotée e, l’étendu de la série est la di¤érence entre la plus grande valeuret la plus petite valeur observée.Etape 2 : Déterminer le nombre de classesNoté k, le nombre de classe doit se situer entre 5 et 15 , et s’ n’ pas il a 5
    • été imposé on peut le déterminer à partir de la formule de Sturges :k = la valeur entière la plus rapprochée de 1 + 3; 322 log10(n) où n estle nombre de données de la série.Exemple 2 :- Pour n = 12 on a 1 + 3; 322log10(12) = 4; 585::: donc k = 5classes- Pour n = 15 on a 1 + 3; 322log10(15) = 4; 906::: donc k = 5 classes- Pour n = 25 on a 1 + 3; 322log10(25) = 5; 643::: donc k = 6classes- Pour n = 1000 on a 1 + 3; 322log10(1000) = 10; 966::. donc k = 11classes.Etape 3 : Déterminer l’ amplitude des classesNotée c, l’ amplitude des classes ne doit pas contenir plus de chi¤res aprèsla virgule que les données de la série . Ainsi après avoir calculé le quotiente , il faut tronquer le résultat pour éliminer les décimales non utiles etkadditionner 1 au dernier chi¤re. eExemple 3: Si = 0; 9361 alors pour des données à 2 chi¤res après la kvirgule c = 0; 94 mais pour des données entières c = 1.Etape 4 : Construire les intervallesEn procédant avec la même unité de mesure que les données de la série ,on …xe tout d’ abord la limite inférieure du premier intervalle . La valeurchoisie peut être soit la plus petite mesure de la série , soit une valeurqui lui est assez voisine mais inférieure . En additionnant l’ amplitude àcette valeur , on obtient la limite supérieure de la classe .Pour les classes suivantes , la limite inférieure coincide avec la limitesupérieure de la classe précédente . L’ addition à la limite inférieure del’ amplitude permet encore d’ établir la limite supérieure .Par convention ,pour que toute donnée appartienne à une seule classe, 6
    • les intervalles seront fermés à gauche et ouverts à droite .Exemple (voir plus loin )Etape 5 : Etablir la fréquence des classesPour compléter le tableau, il reste à déterminer limite inférieure + limite supérieure- le centre des classes mi = (Les 2centres des classes serviront dans le calcul des mesures caractéristiques )- Les e¤ectifs fi .- Les e¤ectifs cumulés Fi . fi- Les fréquences relatives . n fi- Les fréquences relatives en pourcentages 100. nExemple 4 : La série suivante représente le poids réel , en grammes ,d’ échantillon de 23 boites de con…ture de marques di¤érentes : un 271 516 414 242 510 190 490 450 390 430 360 360 450 460 453 509 489 412 410 453 460 405 373Construire le tableau de fréquences de cette série.Solution :- L’ étendue e = 516 190 = 326- Le nombre de classes k : on a 1 + 3; 322log10(23) = 5; 523::: donc k = 6classes . e 326- L’ amplitude des classes : on a = = 54; 33::: donc c = 55 k 6 7
    • - Le premier intervalle : [190; 245[ fi fi Poids P (en g ) centres mi e¤ectifs fi e¤.cumulés Fi freq.rel. (%) 100 n n190 P < 245 217; 5 2 2 0; 0869 8; 69245 P < 300 272; 5 1 3 0; 0434 4; 34300 P < 355 327; 5 0 3 0 0355 P < 410 382; 5 5 8 0; 2173 21; 73410 P < 465 437; 5 10 18 0; 4347 43; 47465 P < 520 492; 5 5 23 0; 2173 21; 73Exemple 2 : Le salaire horaire (en DH ) de 20 employés d’ magasin unest donné par la série suivante : 6; 80 6; 30 8; 25 6; 45 6; 30 6; 80 8; 305; 55 6; 00 5; 60 6; 75 8; 35 5; 75 6; 80 7; 30 6; 85 5; 70 5; 557; 25 7; 25Construire la distribution de fréquences de cette série .Solution : étendue : e = 8; 35- L’ 5; 55 = 2; 8- Le nombre de classes k : on a 1 + 3; 322 log10(20) = 5; 322::: donc k = 5classes e 2; 8- L’ amplitude des classes c : on a = = 0; 56 donc c = 0; 57 k 5- Le premier intervalle : [5; 55 ; 6; 12 [ . 8
    • fi Salaire S (en DH) centres mi e¤ fi e¤.cum Fi freq.rel. % n 5; 55 S < 6; 12 5; 835 6 6 0; 30 30 6; 12 S < 6; 69 6; 405 3 9 0; 15 15 6; 69 S < 7; 26 6; 975 7 16 0; 35 35 7; 26 S < 7; 83 7; 545 1 17 0; 05 5 7; 83 S < 8; 4 8; 115 3 20 0; 15 15B) Représentation graphiqueIl existe plusieurs façons de représenter graphiquement les résultats d’ unesérie statistique. Nous verrons ici les formules les plus utilisées.1) Diagramme à bandes rectangulaires.Ce diagramme est adapté à la représentation d’ caractère qualitatif unou quantitatif discret. Il est constitué par la juxtaposition de bandesverticales ou la superposition de bandes horizontales; la hauteur ou lalongueur d’ bande, sera proportionnelle à la fréquence de la modalité. uneExemple 1.2) Histogramme.Il convient bien à la représentation d’ caractère quantitatif continu, unl’histogramme est constitué par la juxtaposition de bandes rectangulairesverticales, mais adjacentes. De plus chaque rectangle doit présenter unelargeur équivalente à l’ amplitude de la classe qu’ représente et la hauteur ilproportionnelle à la fréquence.Exemple 2.C) Le calcul des mesures caractéristiques. 9
    • Il est souvent nécessaire de résumer de façon très concise l’ ensemble desinformations qu’ possède sur une série statistique .Pour cela , on a onrecours à quelques mesures donnant une idée sur l’ ordre de grandeur desdonnées ou sur l’étalement de la série .On distingue deux types de mesures : les mesures de tendance centraleet les mesures de dispersion .1) les mesures de tendances centrales :Les mesures de tendance centrales les plus importantes sont : la moyennearithmétique , la médiane et le mode .a) La moyenne arithmétique :Pour calculer la moyenne arithmétique (on dira dans la suite moyennetout court ) d’ ensemble de données, il su¢ t de faire la somme de uncelles-ci et de diviser par le nombre de données .NotationDans le cas d’ population la moyenne sera notée une P N xi i=1 = Net dans le cas d’ échantillon elle sera notée x : un P n xi i=1 x= nExemple 1Les notes ( sur 20 ) obtenues par 10 étudiants en statistique sont : 2 2 8 9 10 12 8 13 12 13 10
    • 2 + 2 + 8 + 9 + 10 + 12 + 8 + 13 + 12 + 13 89On a donc x = = = 8: 9 10 10- Si les données sont traitées dans un tableau de fréquences : fi caractère xi e¤ectifs fi freq.rel. n f1 x1 f1 n f2 x2 f2 n . . . . . . . . . fk xk fk ndans ce cas la formule de la moyenne devient : P k xifi i=1 x= nExemple 2La distribution des notes des 10 étudiants de l’ exemple précédent est : 11
    • fi Notes xi e¤ectifs fi freq.rel. n 2 2 0; 2 8 2 0; 2 9 1 0; 1 10 1 0; 1 12 2 0; 2 13 2 0; 2 Total 10 1 2 2+2 8+1 9+1 10 + 2 12 + 2 13 89 x= = = 8; 9 10 10- Si maintenant les données sont groupées dans des intervalles de centresmi alors une aproximation de la moyenne est donnée par P k fimi i=1 x= noù k est le nombre de classes et n la taille de l’ échantillon .Exemple 3 a¤aires (en DH) réalisé par 36Le tableau suivant représente le chi¤re d’restaurants au cours d’ journée. une Chi¤re d’ C (en DH) a¤. centres mi e¤ectifs fi fimi 2000 C < 2500 2250 11 24750 2500 C < 3000 2750 9 24750 3000 C < 3500 3250 10 32500 3500 C < 4000 3750 6 22500 Total =============== 36 104500 12
    • 104500On a donc x = = 2902; 777::: = 2902; 78 36Le chi¤re d’ a¤aires moyen de ces restaurants est donc approximativement2902; 78 DHb) La médiane- La médiane est la valeur du caractère qui partage la série en deuxparties égales : 50% de données lui sont inférieures ou égales et 50% luisont supérieures ou égales .Notation : la médiane sera notée Me- Calcul de la médiane: On distingue deux cas :1er cas : les données ne sont pas groupées dans des intervalles.Alors dans ce cas on applique la règle suivante :- Si n est impair , la médiane est la valeur de la série dont le rang estn+1 dans le classement par ordre croissant . 2 n - Si n est pair , la médiane est la moyenne des valeurs de rang etn 2 + 1 dans le classement par ordre croissant .2Exemple 1: Soit la série 3 1 4 5 1 2 6 8 6:Le classement par ordre croissant est 1 1 2 3 4 5 6 6 8On a n = 9 donc Me = la cinquième valeur = 4Exemple 2 :Soit la série 3 1 4 7 5 1 2 6 8 6 13
    • Le classement par ordre croissant est 1 1 2 3 4 5 6 6 7 8On a n = 10 ; la 5eme valeur est 4 et la 6eme valeur est 5 donc la médiane 4+5est Me = = 4; 5 2Exercice 1 :Calculer la médiane de la série suivante : xi 0 2 5 7 9 Total fi 5 7 9 4 5 30SolutionOn a n = 30 donc la médiane est la moyenne entre la 15eme et la 16emevaleur dans le classement par ordre croissant .Ici la 15eme valeur est 5 et la 16eme valeur est 5 aussi, donc la médiane 5+5est Me = =5 22emecas : Si les données sont groupées dans des intervalles :Dans ce cas , on ne se préoccupe pas du fait qu’ y a un nombre pair ou ilimpair de données dans la série .On détermine d’ abord la classe qui contient la médiane : c’ la première est nclasse dont l’ e¤ectif cumulé est supérieur ou égal à . 2Si [Li , Li + c[ est la classe qui contient la médiane , et si Fi est sone¤ectif cumulé et Fi 1 l’e¤ectif cumulé de la classe qui la précède alorson a : n Me Li Fi 1 = 2 (Li + c) Li Fi Fi 1 14
    • donc 0n 1 Fi 1 M e = Li + @ 2 Ac Fi Fi 1Exemple 3:Reprenons l’ a¤aires des 36 restaurants . exemple du chi¤re d’ Chi¤re d’ C en DH e¤ectifs fi e¤ectifs cumulés Fi a¤. 2000 C < 2500 11 11 2500 C < 3000 9 20 3000 C < 3500 10 30 3500 C < 4000 6 36 nOn a n = 36 donc = 18; la classe qui contient la médiane est la 2deuxième donc Me 2500 18 11 Me 2500 7 = donc = et par suite Me =3000 2500 20 11 500 9 72500 + 500 = 2888; 88::: 9 Me = 2888; 89 DHc) Le mode .Le mode d’ série de données est la valeur du caractère la plus fréquente une. Le symbole utilisé pour le noter est Mo , qu’ s’ il agisse d’ échantillon unou d’ population . uneLorsque les données sont groupées dans des intervalles, on utilise le centrede la classe ayant la plus grande fréquence comme approximation dumode ou on parle tout simplement de la classe modale, c’ est-à-dire laclasse ayant la plus grande fréquence 15
    • Exemple 1. Le mode de la série 2 3 4 2 2 est la valeur 2 La série 2 2 3 4 3 2 3 a deux modes : 2 et 3 La série 1 2 3 4 5 n’ pas de mode a2) Les mesures de dispersion-La variancePour un échantillon de taille n , la variance, notée s2 , est dé…nie par P n (xi x)2 i=1 s2 = n _où xi représente la ième données et x la moyenne .Exemple 1Calculer la variance de la série suivante : 8 8 10 12 12 . _ 8 + 8 + 10 + 12 + 12 50 2 (8 10)2 + (8 10)2 + (10On a x = = 5 = 10 d’ s = où 54+4+0+4+4 = 3; 2 5Exemple 2Calculer la variance de la série 6 7 10 13 14. _ 6 + 7 + 10 + 13 + 14 50On a x= = = 10 5 5 2 (6 10)2 + (7 10)2 + (10 10)2 + (13 10)2 + (14 10)2d’ s = où = 550 = 1010 16
    • Remarque:les séries 8 8 10 12 12 et 6 7 10 13 14 ont la mêmemoyenne 10, mais les écarts des données par rapport à la moyenne sontplus grands dans la deuxième série que dans la première. Ceci se traduitpar une variance plus grande dans la deuxième série.- En général le calcul de la variance à l’ aide de sa formule est fastidieux,c’ pour cela qu’ est parfois intéressant d’ est il appliquer la formule équiv-alente suivante : frame s2 = x 2 (x)2Cette formule se retient facilement en disant que la variance est la moyennedes carrés moins le carré de la moyenne.Exemple 3 82 + 82 + 102 + 122 + 122Pour la série 8 8 10 12 12 on a x2 = = 5516 = 103: 2 5et (x)2 = 102 = 100 d’ où s2 = 103; 2 100 = 3; 2- Dans le cas où les données sont données dans un tableau de fréquences fi caractére xi e¤ectifs fi fréquences relatives n f1 x1 f1 n f2 x2 f2 n . . . . . . . . . fk xk fk n 17
    • alors f1x2 + f2x2 + ::: + fk x2 2 s = 1 2 k ( f1x1+f2x2:::+fk xk )2 n nOn peut écrire encore f1 2 f2 2 fk s2 = x1 + x2 + ::: + x2 (x)2 n n n kExercice 1Calculer la variance de la distribution suivante: fi caractére xi e¤ectifs fi fréquences n 2 2 0; 2 8 2 0; 2 9 1 0; 1 10 1 0; 1 12 2 0; 2 13 2 0; 2 Total 10 1SolutionPour le calcul de la variance , on organise le tableau comme suit : 18
    • xi fi fixi fix2i 2 2 4 8 8 2 16 128 9 1 9 81 10 1 10 100 12 2 24 288 13 2 26 338 Total 10 89 943 89 943On a x= 10 = 8; 9 et s2 = 10 (8; 9)2 = 94; 3 79; 21 =15; 09- Lorsque les données sont groupées dans des intervalles , on se contented’obtenir une approximation de la variance en remplaçant dans la formuleles xi par les centres mi 2 f1m2 + f2m2 + ::: + fk m2 1 2 k f1m1 + f2m2::: + fk mk 2 s = ( ) n nExercice 2Calculer la variance de la distribution suivante: 19
    • REGRESSION ET CORRELATION§ 1 IntroductionDans ce chapitre, on va étudier les relations, lorsqu’ elles existent, entredeux variables statistiques. Par exemple la relation entre publicité etvente, ou entre le revenu et les dépenses.§ 2 : Régression linéaire simpleNuage statistique : Considérons deux caractères numériques x et y. Sià partir d’une étude menée sur un échantillon de taille n on obtient lesvaleurs xi et yi , la représentation graphique dans le plan de l’ ensembledes points de coordonnées (xi; yi) pour i = 1; 2; ::::; n s’ appelle nuagestatistique.A partir de ce nuage, il faut chercher à exprimer la relation entre les deuxvariables à l’ aide d’ équation mathématique . On pourrait le faire de uneplus d’une façon, mais on va se limiter ici à la plus simple, c’ est-à-direl’ équation linéaire de la forme y = ax + b- On appelle régression linéaire, l’ ajustement d’ droite au nuage sta- unetistique (xi; yi)- Le problème consiste donc à trouver une droite d’ équation y = ax + bqui traduit , avec le plus de …délité, le lien entre x et y. Pour cela nousallons utiliser une technique appelée : la méthode des moindres carrés,qui consiste à minimiser la somme des carrés des distances Di verticalesentre la droite et chacun des points (xi; yi).Tout calcul fait (pour voir ces calculs consulter votre livre) on trouve : 20
    • P n xi yi nx:y i=1 a= Pn x2 i n (x)2 i=1 et b= y ax:où x et y sont respectivement les moyennes arithemétiques de x et de y:Exemple : Une entreprise veut mener une étude pour connaître la re-lation entre les dépenses hebdomadaires en publicité et le volume desventes qu’ réalise. On a recueilli au cours des dix dernières semaines elleles données suivantes : X=Coût pub en103 DH 4 2 2.5 2 3 5 1 5.5 3.5 4.5 Y=Ventes en 103 DH 49.5 41 43 39 46 53 38 54 48.5 51.51) Trouver l’ équation de la droite de régression des moindres carrés2) Estimer le volume des ventes si la semaine prochaine on comptedépenser 3500 DH en publicité .§3 : Séries chronologiques.Lorsque la variable indépendante x représente le temps et la variabley représente un facteur quelconque on dit qu’ a a¤aire à une série onchronologique . Dans ce cas la droite de régression s’ appelle la droite detendance ou le trendMéthode d’ ajustement : Lorsque les di¤érentes valeurs de x (le temps)se suivent par le même intervalle , on associe à chaque valeur de x uncode comme suit :- Si n est impair , les codes seront , 3; 2; 1; 0; 1; 2; 3, . Où le code 0est associé à la valeur de x de rang n + 1 2- Si n est pair , les codes seront , 5; 3; 1; 1; 3; 5; où le code 1 estassocié à la valeur de x de rang n + 1 2 21
    • Exemple 1Donner les codes pour représenter la variable indépendante temps si ona1) 1975; 1976; 1977; 1978; 1979; 19802) lundi mardi mercredi jeudi vendredi samedi dimanche3) janvier , février , ., décembre.Exercice 1Une nouvelle pâtisserie vient d’ ouvrir ses portes . La série statistiquesuivante donne le nombre de milliers de pains vendus au cours des dixpremières semaines : Semaine x 1ère 2ère 3ère 4ère 5ère 6ère 7ère 8ère 9ère 10ère Nb de pains(103) y 1,71 1.74 1.73 1.75 1.78 1.77 1.81 1.80 1.84 1.831) Trouver l’ équation de tendance.2) Déterminer le nombre de pains qui va etre vendus la semaine prochaine.§ 4 : Coe¢ cient de corrélation .Ce coe¢ cient va nous permettre d’aborder le problème du degré de dépen-dance entre les deux variables x et y.Considérons la série statistique à deux caractères : x x1 x2 . . . . . . . xn y y1 y2 . . . . . . . ynDé…nissons la covariance de x et y par : Cov(x; y) = xy x:yLe coe¢ cient de corrélation r est donné par la formule suivante Cov(x; y) r= s(x):s(y) 22
    • Où s(x) et s(y) sont les écart-types des variables x et y .Interprétation de r1) On a toujours : 16r612) Si r > 0 alors il y a corrélation positive entre x et y , c-à-d si xaugmente alors y augmente .3) Si r < 0 alors il y a corrélation négative entre x et y , c-à-d si xaugmente alors y diminue .4) Si r = 0 alors il n’ a aucune corrélation entre x et y , les variables x yet y sont indépendantes.5) Si r est voisin de 1 ou de 1, il y a une très forte dépendance entre xet y .6) Si r = +1 ou 1, la droite de régression s’ ajuste parfaitement auxdonnées recueillies .Exercice 1 : Intra 2000La série suivante représente le prix d’ boite de sardines, fabriquée par uneune usine marocaine, au cours des dix dernières années. Années 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 Prix y en DH 2.00 2.20 2.25 2.35 2.50 2.70 2.70 2.80 3.00 3.001) Trouver l’ équation de la droite de régression. une boite pour l’ 2001 et2) Si la tendance continue estimer le prix d’ anpour l’ 2002. an3) Calculer le coe¢ cient de corrélation linéaire r.4) Que peut-on dire des estimations de la question 25) En quelle année le prix d’ boite atteindra les 4 DH une 23
    • SolutionOn a n = 10 donc le code 1 sera attribué à la sixième année 1996 Année Code xi Prixyi en Dh x2 i yi2 xi:yi 1991 -9 2.00 81 4.00 -18.00 1992 -7 2.20 49 4.84 -15.40 1993 -5 2.25 25 5.06 -11.25 1994 -3 2.35 9 5.52 -7.05 1995 -1 2.50 1 6.25 -2.50 1996 1 2.70 1 7.29 2.70 1997 3 2.70 9 7.29 8.10 1998 5 2.80 25 7.84 14.00 1999 7 3.00 49 9.00 21.00 2000 9 3.00 81 9.00 27.00 Total 0 25,50 330 66.095 18.601) L’ équation de la droite de régression :On a : et équation de la droite est y = 2:55 + 0:056Donc l’ x2) - L’ 2001 a pour code x = 11, donc l’ an estimation du prix est y =2:55 + 0:056 11 = 3:166 DH.- L’ 2002 a pour code x = 13, donc l’ an estimation du prix est y =2:55 + 0:056 13 = 3:278 DH.3) Coe¢ cient de corrélation :On a Cov(x; y) = xy x:y = xy car donc x = 0 18:6 Cov(x; y) = = 1:86 , s2(x) = x2 (x)2 = 33 et s2(y) = 10 2y2 (y) = 0:107 24
    • Cov(x; y) 1:86Le coe¢ cient de corrélation r = = 0; 98 s(x):s(y) 5:74 0:334) Puisque le coe¢ cient de corrélation r est proche de 1 alors il y a uneforte dépendance linéaire entre x et y , donc si la tendance continue , lesestimations de la question 2 seront bonnes .5) Si le prix est de 4 DH , alors le code de l’ année est donné par c-à-dOr l’ 2008 a pour code 25 et l’ 2009 a pour code 27, donc le prix an anatteindra les 4 DH vers la …n de 2008.Exercice 2 :( intra 2000)Dans une entreprise on veut étudier la relation entre le revenu mensuelet les dépenses mensuelles pour le transport. Pour cela , on a choisi unéchantillon de dix employés.Les résultats de l’ enquête sont dans le tableau suivant : X = Rev mes en Dh 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 Y= Dép en trans en Dh 500 500 475 450 570 525 725 300 625 8001) Calculer l’ équation de la droite de régression .2) Estimer les dépenses en transport pour quelqu’ qui a un revenu unmensuel de 2500 DH.3) Calculer le coe¢ cient de corrélation .4) Que peut-on dire de l’ estimation de la question 2 .Solution : Total 25
    • xi yi x2 i yi2 xi yi 3 500 9 25000 1500 3.5 500 12.5 25000 1750 4 475 16 225625 1900 4.5 450 20.25 202500 2025 5 570 25 324900 2850 5.5 525 30.25 275625 2887.5 6 725 36 275625 4350 6.5 300 42.25 90000 1950 7 625 49 390625 4375 7.5 800 56.25 640000 6000 52.5 5470 266.25 3174900 29587.5 équation de la droite est donc y = 325:56 + 42:18L’ x2) Si x = 2; 5 alors y = 325; 56 + 42; 18 2; 5 = 431; 01 DH cov (x; y)3) Le coe¢ cient de corrélation : r = : Où cov(x; y) = xy s (x) s (y) x:y , s2 (x) = x2 (x)2 et s2 (y) = y 2 (y)2 :donc il y a une faible corrélation linéaire entre x et y . 26
    • LES PROBABILITES Introduction. Après avoir appris à traiter les résultats d’ une enquête sur un échan-tillon ( la première partie) nous allons maintenant passer à la questionimportante, à savoir, comment généraliser les résultats obtenus sur unéchantillon à toute la population (statistique inductive). Pour cela nousavons besoin de quelques notions en calcul des probabilités. Le présentchapitre sera donc juste un outil pour pouvoir aborder la statistique in-ductive.§1 : Notions fondamentales. Une expérience aléatoire est un processus caracterisé par:- i) on ne peut prédire son résultat,- ii) on peut décrire à priori l’ ensemble de tous ses résultat possibles.Exemple 1- Un investissement est une expérience aléatoire dont les résultats possi-bles sont, soit R=rentable, soit N=non rentable.- Lancer un dé est une expérience aléatoire dont les résultats sont 1,2,3,4,5ou 6. L’espace échantionnal S associé à une expérience aléatoire est l’ ensemblede tous les résultats possibles de cette expérience. Exemple 2 n o- Dans le cas d’ investissement un S= N,R- Dans le cas du dé, on a S = f1; 2; 3; 4; 5; 6g Un événement est un sous-ensemble de l’ espace S 27
    • On dira qu’ événement A s’ réalisé lorsque le résultat de expérience un estaléatoire est un élément de A: Exemple 3- Dans le cas du dé, considèrons l’événement A = ” obtenir une face paire” .On a A = f2; 4; 6g, et l’ événement A sera réalisé si le résultat est 2 ou 4 ou 6. L’ événement S est appelé l’ événement sûr ( ou certain ) L’ événement ; est appelé l’ événement impossible. Lorsqu’ événement est composé d’ seul élément, il est dit simple un unou élémentaire. Si A et B sont deux événements alors,- A[B est l’ événement qui se réalise si au moins un de ces deux événementsse réalise- A B est l’ événement qui se réalise les deux événements se realisent.- A (lire non A) est l’ événement qui se réalise si l’ événement A ne se réalisepas.§2 : Probabilité d’ evenement. un On dit qu’ a dé…ni une probabilité p sur un espace échantionnal on Slorsqu’ chaque événement A on peut associé un nombre p(A) tel que : ài) 0 p(A) 1ii) p(S) = 1iii) p(A [ B) = p(A) + p(B) pour tous les événements A et B tels que A B = ;:§ 2.1 Conséquences immédiates. _a) Pour tout événement A on a p(A) = 1 p(A)b) On a toujours p(;) = 0c) On a toujours p(A[B) = p(A)+p(B) p(AB) quels que soient les événements 28
    • A et B: § 2.2 Cas particulier d’ équiprobabilité.Lors d’ expérience aléatoire, il arrive souvent (pour des raisons physiques) uneque les événements élémentaires aient la même chance de se réaliser. Dansce cas on dit qu’ y a équiprobabilité des événements élémentaires. ilSi l’ espace échantionnal est S = fr1; r2; :::; rng et si A est un événement quel-conque, p(A) est dé…ni, dans le cas d’ équiprobabilité, par p(A) = card(A) = nombre de cas favorables à la réalisation de A card(S) nombre de cas possiblesOn véri…e facilement que i) 0 p(A) 1 ii) p(S) = 1 iii) p(A [ B) = p(A) + p(B) si A B = ; 1 1Donc on a bien une probabilité sur S et p(fri g) = card S = : nExemple 1.On lance un dé équilibré. 1) Calculer la probabilité d’ avoir un résultat pair.2) Calculer la probabilité d’ avoir un résultat impair.Solution :On a S = f1; 2; 3; 4; 5; 6g : Puisque le dé est équilibré, alors on peut supposerqu’ ya équiprobabilité des événements élémentaires. ilAppelons A l’ événement ”avoir un résultat pair”et B l’ événement ”avoirun résultat impair” On a A = f2; 4; 6g et B = f1; 3; 5g . 29
    • card A 3 1 card B 3 1 p(A) = card S = = 6 2 et p(B) = card S = = : 6 2Exercice 1On lance une pièce de monnaie équilibrée 3 fois d’ lée, et on observe a¢chaque fois le côté qu’ présente lorsqu’ tombe. elle elle1) Calculer la probabilité d’ obtenir au moins une fois le côté face.2) Calculer la probabilité d’ obtenir exactement deux fois le côté face.Solution :L’ espace échantonnal est S = fF F F; F F P; F P F; F P P; P F F; P F P; P P F; P P P gComme la pièce est équilibrée, on peut supposer qu’ y a équiprobabilité ildes événements élémentaires.1) Appelons A l’ événement ”obtenir au moins une fois le côté face” card A 7On a A = fF F F; F F P; F P F; F P P; P F F; P F P; P P F g et p(A) = card S = : 8Remarque 1Pour_ calculer p(A) il est parfois plus simple d’ _ utiliser la proprieté p(A) = 1 71 p(A). En e¤et; dans le cas présent on a A = fP P P g donc p(A) = 1 = 8 82) Appelons B l’ événement ”avoir exactement 2 fois le côté face”On a B = fF F P; F P F; P F F g donc p(B) = 3 : 8§3:Analyse combinatoire:Le cardinal de certains événements complexes est souvent di¢ cile à cal-culer. Les téchniques d’ analyse combinatoire, que nous allons voir main-tenant, vont nous faciliter cette tâche dans beaucoup de cas.§3.1 Principe de multiplicationSi une première opération peut être executée de n1 façons, et si pourchacun des cas précédent, une deuxième opération peut être executée de 30
    • n2façons,...., et si pour chacun des cas précédent une k-ième opérationpeut être executée de nk façons, alors il y aura n1:n2::::nk façons d’ executertoutes ces opérations.Exemple 1.Vous interroger trois personnes au hasard. Calculer la probabilité quetoutes les trois soient nées un dimanche.SolutionNotons le résultat de l’ experience par (x; y; z) où x est le jour de naissancede la première personne, y celui de la deuxième personne et z celui de latroisième personne.Il y a 7 réponses possibles pour la première personne, et pour chaqueréponse de la première personne il y a 7 réponses possibles pour la deux-ième personne, et quelle que soit la réponse des deux premières personnes,il y a 7 réponses possibles pour la troisième personne. Au total , d’ aprèsle principe de multiplication, il y a 7 7 7 = 343 réponses possibles . card S = 343Si on appelle A l’ événement ” 3 personnes sont nées un dimanche”alors les 1A = f(d; d; d)g, donc p(A) = 343§3.2 Les arragementsConsidérons un ensemble …ni E à n éléments, et un entier p n: On ap-pelle arrangement de p éléments pris parmi n, toute suite ordonnée de péléments di¤erents formée à partir des n éléments de E:Exemple 2.Soit E = fa; b; c; dg : Les di¤erents arrangements de 2 éléments pris parmi les4 éléments sont : ab ac ad ba bc bd ca cb cd da db dc. Il y en a 12.Théorème 1 :Le nombre d’ arrangements de p éléments pris parmi n , noté Ap , est donné npar : 31
    • n! Ap = n (n p)!où n! = 1 2 ::: n et par convention on pose 0! = 1Exemple 3.A2 4 est le nombre d’ arrangements de 2 éléments pris parmi 4. 4! 4!A2 = 4 (4 2)! = 2! =3 4 = 12 c’ ce qu’ atrouvé dans l’ est on exemple précédent.Exercice 2.Au tiercé, supposons qu’ ya il 12 partants et qu’ ne peut y avoir d’ il exaequo.1) Calculer la probabilité de gagner dans l’ ordre si l’ a parié une seule onfois sur 3 numéros2) Calculer la probabilité de gagner dans l’ ordre ou dans le désordre sil’ a parié une seule fois sur 3 numéros. onSolutionLe résultat de la course est un arrangement de 3 numéros pris parmi 12.Donc card(S) = A3 = 12! = 12 11 10 = 1320 12 9!Supposons qu’ y a équiprobabilité des événements élémentaires. il1) Posons A l’ événement ”gagner dans l’ ordre”, on a card(A) = 1 ( il y a un 1seul arrangement gagnant) , donc p(A) = 1320 = 0; 000752) Si abc est le résultat dans l’ ordre alors acb; bac; bca; cab et cba sont gagnantdans le désordre . Au total il y a 6 arrangements gagnant dans l’ ordre ou 6dans le désordre. La probabilité cherchée est donc égale à 1320 = 0; 0045:§3.3 Les pérmutations- On appelle pérmutation de n éléments de E , tout arrangement de n 32
    • éléments pris parmi les n éléments de E .- Le nombre de pérmutations de n éléments est donc An = (n n! n)! = n! = n! n 0!§3.4 Les combinaisons.- Considérons un ensemble …ni E à n éléments, et un entier p n: Onappelle combinaison de p éléments pris parmin, tout ss-ensemble de péléments di¤erents formé à partir des n éléments de E:Exemple 4.Soit E = fa; b; c; dgLes di¤erentes combinaisons de 2 éléments pris parmi les 4 éléments de Esont :fa; bg , fa; cg , fa; dg , fb; cg , fb; dg , fc; dgRappelons que dans un ensemble l’ ordre dans lequel on écrit les élémentsn’ aucune importance. aThéorème 2 : Le nombre de combinaisons de p éléments pris parmi n , noté p Cn ; estdonné par p n! Cn = p!(n p)!Exemple 5.Au jeu Loto, le parieur doit faire une sélection de 6 numéros parmi lesnombres de 1 à 49.De combien de façons peut-il faire une mise?Solution :Une sélection est une combinaison de 6 éléments pris parmi les 49 ( car 49!l’ ordre n’ aucune importance) . Il y a donc C49 = 6!(49 6)! = 13983816 façons a 6 33
    • de faire une mise. 1La probabilité de gagner avec une mise est 13983816 = 0; 000000071§4: Probabilité conditionnelleSoit A un événement dans le cadre d’ une expérience aléatoire, et B unévénement non impossible ( i.e p(B) 6= 0 ) ; alors la probabilité de l’ événementA sachant que l’ événement B est déjà réaliser , notée p(A=B) , est donnéepar p(A B) p(A=B) = p(B)p(A=B) s’ appelle la probabilité de A par rapport à B:Exemple 11) Quelle est la probabilité qu’ famille de 2 enfants n’ que des …lles une aitsachant que l’ aînée est une …lle.2) Quelle est la probabilité qu’ famille de 2 enfants n’ que des …lles une aitsachant qu’ a au moins une …lle. elleSolution:L’ espace echantionnal de cette expérience est S = fF F; F G; GF; GGgAppelons A l’ événement ” famille n’ que des …lles” la a B l’ événement ”l’ ainée est une …lle” C l’ événement ” famille a au moins une …lle” laOn a A = fF F g , B = fF F; F Gg ; C = fF F; F G; GF g 11) On doit calculer p(A=B): Pour cela on a A B = fF F g donc p(A B) = 4 et 1 2 p(A=B) 1p(B) = , d’ où p(A=B) = = 4 = 4 p(B) 2 2 42) On doit calculer ici p(A=C). pour cela on a A C = fF F g donc p(A C) = 1 4 34
    • 1 3 p(A C) 1et p(C) = 4 d’ où p(A=C) = p(C) = 4 3 = : 3 4Exercice 1Le tableau suivant présente le comportement d’ échantillon de con- unsommateurs par rapport à une compagne publicitaire en faveur d’unelessive. les consommateurs qui ont acheté n’ pas acheté total ont ont vu la pub 15 30 45 n’ pas vu la pub ont 15 60 75 total 30 90 120Si l’ considére au hasard une personne de cette échantillon : on1) Quelle est la probabilité qu’ ait acheté la lessive ? elle2) Quelle est la probabilité qu’ ait acheté la lessive si elle a vu la ellepublicité?3) Est-ce que la publicité a eu des e¤ets positifs sur les consommateurs?Solution- L’ échantillon contient 120 personnes au total; parmi elles 30 ( au total )ont acheté la lessive.1) Si on choisit une personne au hasard ( sans aucune information sup-plémentaire) la probabilité qu’ ait acheté la lessive est 120 = 1 elle 30 42) Si on choisit une personne au hasard et si on sait qu’ elle a vu lapublicité (il y en a 45 au total qui ont vu la pub parmi lesquelles 15 ontacheté ) alors la probabilité qu’ ait acheté est 15 = 1 elle 45 33) Puisque 3 > 1 donc la probabilité qu’ 1 4 une personne achéte la lessiveaprès avoir vu la pub est supérieur à la probabilité qu’ personne prise uneau hasard achète la lessive; donc la publicité a eu des e¤ets positifs surles consommateurs.§5 Les variables aléatoires (v.a) 35
    • Soit S l’ espace échantionnal associé à une expérience aléatoire. Une vari-able aléatoire est une fonction de S dans R .Généralement une v.a sera désigné par X; Y; Z ou T:Exemple 1On lance une pièce de monnaie trois fois, alors on a vu que S = fF F F; F F P; F P F; F P P; P F F; P F P; P P F; P P P gOn peut considérer la v.a X qui compte le nombre de faces, on alors X(F F F ) = 3 ; X(F F P ) = 2 ; X(F P F ) = 2; ::::X(P F P ) = 1 ; X(P P P ) = 0Les valeurs possibles de X sont 0; 1; 2 et 3§5.1 Nouvelle notation pour les événementsSoit X une v.a . l’ écriture (X = a) désignera l’ événement fs 2 S : X(s) = agExemple 2Dans le cadre de l’ exemple précédent on a :(X = 3) = fF F F g ; (X = 2) = fF F P; F P F; P F F g ; (X = 1) = fP F P; P P F; F P P g et(X = 0) = fP P P g : 1 3- On peut donc parler de p(X = a); par exemple on a p(X = 3) = 8 ; p(X = 2) = 8; p(X = 1) = 3 et p(X = 0) = 1 8 8- De même on note par (X a); (a X b) ou (a X) les événementssuivants: (X a) = fs 2 S : X(s) ag (a X b) = fs 2 S : a X(s) bg (X a) = fs 2 S : X(s) ag :Exemple 3Toujours dans le cadre de l’ exemple précédent on a 36
    • 4 1 (X 1) = fP P P; P F P; P P F; F P P g et p(X 1) = 8 = : 2§5.2 Remarque :a)Comme pour les variables statistiques quantitatives, il y a deux typesde v.a : discrètes et continues.b)Une v.a est discrète si l’ ensemble des valeurs qu’ peut prendre est …ni elleou dénombrable, par contre si l’ensemble des ses valeurs est un intervalle,elle sera dite continue. 37
    • LES LOIS D0USAGE COURANTDans ce chapitre, nous allons étudier trois exemples importants de vari-ables aléatoires obéissant aux lois suivantes: binomiale, de Poisson et laloi normale. §1 Variable aléatoire discrèteSoit X une v.a discrète pouvant prendre les valeurs x1 ; x2 ; :::; xn . Posonsp(X = xi ) = pi pour i = 1; 2; :::; n .On appelle loi de la variable X (ou distribution de probabilité de X ) letableau suivant: X x1 x2 .... xn p(X = xi ) p1 p2 .... pnRemarquons que cela est identique à une distribution de fréquences pourune variable statistique où les probabilités pi remplacent les fréquencesrelatives fi : nDe même que pour une variable statistique, on peut calculer la moyenne,la variance et l’ écart-type d’ v.a. une- La moyenne, appelée aussi l’ espérance mathématique et notée E(X);d’ unev.a X est dé…nie par P n E(X) = pi xi i=1où les xi sont les valeurs de X et pi = p(X = xi) pour i = 1; 2; :::; n .- La variance de X , notée V ar(X), est dé…nie par : V ar(X) = E(X 2 ) (E(X))2- L’écart-type de X , noté (X); est dé…ni comme la racine carrée de lavariance: p (X) = V ar(X) 38
    • §2 La loi binomiale.Considérons une expérience qui n’ que deux résultats possibles dont al’ est appelé R (réussite) et l’ un autre est appelé E (échec), avec p(R) = p etp(E) = 1 p = q:Ce genre d’ expérience s’ appelle expérience de Bernoulli.Répétons cette expérience n fois et considérons la variable aléatoire X quicompte le nombre de réussites au cours des n essais. Alors les valeurspossibles pour X sont 0; 1; 2; :::; n; et on démontre que la loi de probabilitéde X est donnée par : p(X = k) = Cn pk q n k k pour k = 0; 1; 2; :::; n:p(X = k)représente la probabilité d’ avoir k réussites après n essais . Cettev.a est dite suivre la loi binomiale de paramétres n et p, et pour dire celaen abrégé on note X B(n; p)On montre que si X B(n; p) alors p E(X) = np , V ar(X) = npq et (X) = npqExemple 1.Calculer la probabilité d’ obtenir 6 bonnes réponses dans un test de 10questions où il y a 4 choix de réponses pour chacune d’ elles, si l’ choisit onles réponses tout à fait au hasard. SolutionLexperience ” répondre à une question au hasard” n’ que deux résul- a 1tats:ou bien la réponse est juste R (réussite) avec la probabilité 4 ; ou bienla réponse est fausse E (échec) avec la probabilité 3 : 4Cette experience se répète 10 fois dans le test.Considérons maintenant la v.a X qui compte le nombre de bonnes réponses.Il est clair que 1X B(n = 10; p = ): 4 39
    • La probabilité d’ avoir 6 bonnes réponses est donc donnée par p(X = 6): 6 1 3On a alors p(X = 6) = C10 ( )6 ( )10 4 4 6 = 0; 0162Exercice 1Dans le cadre de l’ exemple précédent , calculer :1) la probabilité de n’ avoir aucune bonne réponse,2) la probabilité d’ avoir au moins cinq bonnes réponses.Solution1) la probabilité de n’ avoir aucune bonne réponse est donnée par p(X = 0): 0 1 3On a p(X = 0) = C10 ( )0 ( )10 = 0; 0563: 4 42) la probabilité d’ avoir au moins 5 bonnes réponses est donnée par p(X5):Or p(X 5) = p(X = 5) + p(X = 6) + p(X = 7) + p(X = 8) + p(X = 9) + p(X = 10)Pour accélérer ces calculs, on dispose d’ table (à la …n du livre) don- unenant les valeurs numériques de p(X = k) pour certaines valeurs de n etp.Après lecture de la table , on trouve p(X 5) = 0; 0584 + 0; 0162 + 0; 0031 + 0; 0004 + 0; 000 + 0; 000 = 0; 0781 §3 La loi de PoissonConsidérons un événement R dont on sait (par expérience) qu’ se réalise ilen moyenne fois dans un intervalle de temps t (ou dans une région D)donné. Alors la v.a X qui compte le nombre de réalisation de l’ événementR dans l’ intervalle de temps t (ou dans la région D) a pour loi de prob-abilité : k p(X = k) = e : k! pour k = 0; 1; 2; :::p(X = k) est la probabilité que l’ événement R se réalise k-fois dans l’ intervalle 40
    • de temps t (ou dans la région D)Une telle v.a est dite suivre la loi de Poisson de paramètre ; et pourexprimer cela on écrit X Po( ): pOn montre que si X Po ( ) alors E(X) = V ar(X) = et (X) =Exemple 2Dans une grande usine, on sait, par expérience, qu’ se produit en moyenne il1; 8 accident de travail par semaine.1) Calculer la probabilité qu’ se produise, dans cette usine, trois acci- ildents en une semaine.2) Calculer la probabilité qu’ se produise, dans cette usine, au plus deux ilaccidents en une semaine.SolutionL’ événement R ici est ” accident de travail” On sait qu’ se réalise en un . ilmoyenne 1; 8 fois par semaine. Donc t = une semaine, et = 1; 8La v.a X qui compte le nombre d’ accidents par semaine suit alors une loide Poisson de paramètre 1; 8: X Po (1; 8)1) La probabilité d’ avoir trois accidents par semaine est donnée donc par 3 1;8 (1; 8) p(X = 3) = e = 0; 1607 3!2) La probabilité de voir se produire au plus 2 accidents par semaine estdonnée par p(X 2) = p(X = 0) + p(X = 1) + p(X = 2) 0 1 2 1;8 (1; 8) 1;8 (1; 8) 1;8 (1; 8) =e +e +e 0! 1! 2!Pour calculer rapidement des expressions de ce genre, une table estfournie en annexe à la …n du livre.On lit sur la table p(X = 0) = 0; 1653; p(X = 1) = 0; 2975 et p(X = 2) = 0; 2678d’ où p(X 2) = 0; 1653 + 0; 2975 + 0; 2678 = 0; 7306Exemple 3 41
    • Le nombre moyen de défauts mineurs par mètre carré de tissu produitpar une usine de textile est 0; 3. Si les défauts sont distribués au hasarddans la production, quelle est la probabilité qu’ mètre carré de tissu uncontienne plus d’ défaut. unSolutionL’ événement R ici est ” défaut mineur” On sait qu’ se réalise en un . ilmoyenne 0; 3 fois par mètre carré. Donc la région D=un mètre carré, et = 0; 3La v.a X qui compte le nombre de défauts mineurs par mètre carré, suitdonc une loi de Poisson de paramètre 0; 3: X Po(0; 3)la probabilité qu’ mètre carré de tissu contienne plus d’ défaut est un undonnée par p(X > 1) = p(X = 2) + p(X = 3) + ::::::Pour faciliter ce calcul , il vaut mieux passer par l’ événement contrairecomme suit: p(X > 1) = 1 p(X 1) =1 [p(X = 0) + p(X = 1)] =1 (0; 7408 + 0; 2222) = 0; 037 §3.1 Remarque importanteSoit X Po( ) . Il arrive souvent qu’ cherche la probabilité de voir se onréaliser l’ événement R en question pendant n t (ou dans la région nD).Alors dans ce cas la v.a Y qui compte le nombre de réalisation de Rpendant n t ( ou nD) suit la loi Po(n ):Exemple 4.Dans le cadre de l’ exemple précédent, quelle est la probabilité qu’ unepièce de tissu de 10 mètres carrés ne contienne aucun défaut.SolutionOn sait qu’ moyenne, il y a 0; 3 défauts par mètre carré, donc il y a en enmoyenne 10 0; 3 = 3 défauts par 10 m2: 42
    • La v.a Y qui compte le nombre de défauts par 10 m2 suit donc la loi dePoisson de paramètre 3: Y Po(3)la probabilité qu’ pièce de tissu de 10 mètres carrés ne contienne aucun une 0défaut est donnée par p(Y = 0) = e 3 (3) = 0; 0498 0! ExercicesExercice 1 (…nal 2000)Par expérience, on sait qu’ personne sur huit parmi celles qui entrent unedans un supermarché n’ achète aucun article.Parmi les 12 prochaines personnes qui vont entrer au supermarché, cal-culer:1) la probabilité qu’ s’ trouve au moins une personne qui n’ il en achèterien ;2) la probabilité que les 12 achètent chacun au moins un article.Exercice 2L’expérience montre que 6 des cosommateurs contactés par un vendeur 1d’aspirateurs achètent un des produits o¤erts.Calculer la probabilité queparmi les 15 prochaines personnes contactées, il s’ trouve 5 qui accéptent end’acheter le produit.Exercice 3Des relevés récents montrent qu’ entre en moyenne 1; 6 clients par minute ildans une agence banquaire.1) Quelle est la probabilité qu’ n’ il entre, dans cette agence, aucun clientpendant un intervalle d’ minute une2) Quelle est la probabilité qu’ entre, dans cette agence, au moins un ilclient pendant un intervalle de deux minutes3) Quelle est la probabilité qu’ entre, dans cette agence, au plus 5 clients ilpendant un intervalle de 5 minutes. 43
    • SolutionsExercice 1Une personne qui entre au supermarché est une expérience qui n’ queadeux résultats : ou bien la personne n’ achète aucun article R (réussite) 1avec p(R) = 8 ; ou bien la personne achète au moins un article E (échec) 7avec p(E) = 8 :Pour les 12 prochaines personnes qui entrent au supermarché, cette ex-périence se répéte 12 fois .Considérons la v.a X qui compte le nombre de personnes qui n’ achètent 1aucun article. Alors X B(n = 12; p = 8 )1) la probabilité que parmi les 12 au moins une personne n’ achète rien est 1 0 7 12donnée par p(X 1) = 1 p(X < 1) = 1 p(X = 0) = 1 C12( 8 ) ( 8 ) = 0; 798 58 02) Considérons la v.a Y qui compte le nombre de personnes qui achètentau moins un article. Il est clair que cette v.a suit une loi binomiale deparamétres n = 12, et p = 7 : 8La probabilité que les 12 achètent chacun au moins un article est donnéepar p(Y = 12): p(Y = 12) = C12 ( 7 )12 ( 1 )0 = ( 7 )12 = 0; 201 4 12 8 8 8Exercice 2Contacter un client est une expérience à deux résultats : ou bien le clientachète (Réussite) , avec p(R) = 1 , ou bien il n’ 6 achète pas (Echec) , avec 5p(E) = : 6Lorsque le vendeur cotacte 15 clients, il répète l’ expérience 15 fois. Donc lav.a X qui compte le nombre de clients qui achètent , suit la loi binomiale 1B(n = 15; p = ): 6La probabilité que parmi les 15 clietns contactés, il s’ trouve 5 qui en 1 5 5 10achètent, est donnée par p(X = 5) = C15( 6 ) ( 6 ) = 0; 0623 (n’ 5 existe pas dans 44
    • la table)Exercice 31) L’ événement R ”un client entre dans l’ agence”se produit en moyenne1; 6 fois par minute. Donc la v.a X qui compte le nombre de clients quientrent, par minute, dans l’agence suit une loi de Poisson de paramètre1; 6:La probabilité qu’ n’ il entre aucun client dans l’ agence pendant un inter- (1; 6)0valle d’ minute est donnée par p(X = 0) = e 1;6 0! = 0; 2019 une2) De même si on considére la v.a Y qui compte le nombre de clientsqui entrent dans l’ agence pendant un intervalle de deux minutes, alorsY Po (3; 2) car 2 1; 6 = 3; 2la probabilité qu’ entre, dans cette agence, au moins un client pendant ilun intervalle de deux minutes est donnée par : p(Y 1) = 1 p(Y < 1) =1 p(Y = 0) = 1 0; 0408 = 0; 95923) Soit Z la v.a qui compte le nombre de clients qui entrent dans l’ agencependant un intervalle de 5 minutes. On a Z Po(8) car 5 1; 6 = 8.la probabilité qu’ entre, dans cette agence, au plus 5 clients pendant un ilintervalle de 5 minutes est donnée par : p(Z 5) = p(Z = 0) + p(Z = 1) + :::: + p(Z = 5) (la lecture de la table donne) = 0; 0003 + 0; 0027 + 0; 0107 + 0; 0286 + 0; 0573 + 0; 0916 = 0; 1912: §4 Variable aléatoire continue Pour une v.a aléatoire X continue, sa loi de probabilité est donnée parune fonction f appelée densité de probabilité de X: Elle est représentéepar une courbe continue et la probabilité p(a X b) est donnée par la 45
    • surface comprise entre la courbe de f , l’ axe Ox et les droites verticalesx=a et x = b La surface totale entre la courbe de f et l’ des x est évidemment axeégale à 1 On dé…nit l’ espérance mathématique, la variance et l’ écart type d’ unevariable continue comme suit: R E(X) = xf (x)dx R V ar(x) = x2 f (x)dx (E(x))2 = E(X 2 ) (E(X))2 p (X) = V ar(X) Dans la suite on va avoir besoin de la dé…nition suivante:Une variable aléatoire est dite centée si E(X) = 0 et elle est dite réduite siV ar(X) = 1:Si on a à la fois E(X) = 0 et V ar(X) = 1 , elle sera dite centrée réduite. On montre que si X est une v.a telle que E(X) = et (X) = alors lavariable Z = X est une variable centrée réduite c’ est-àdire que E(Z) = 0et (Z) = 1 §4.1 La loi normale centée réduite Une variable Z est dite normale centée réduite si sa densité de probabilitéest donnée par : x2 1 f (x) = p e 2 2 Pour dire qu’ une variable aléatoire Z suit une loi est normale centréeréduite, on écrit Z N (0; 1) §4.2 Proprietés La courbe de f est symétrique par rapport à l’ des y axe La surface comprise entre la courbe et l’ des x est comme on l’ déjà axe adit est égale à 1, donc l’ axe des y divise cette surface en deux parties 46
    • égales chacune à 0; 5 Pour calculer une probabilité, lorsque Z N (0; 1) , on se sert d’ table uneconstruite pour cela. Cette table donne seulement p(Z z0) pour z0 > 0 .c’est-à-dire elle donne la surface hachurée.Pour comprendre comment lire la table voici un exemple Exemple 1.Soit Z N (0; 1): Calculer p(Z 1; 65):On utilise la table comme suit: on écrit 1; 65 = 1; 6+0; 05. Puis au croisementde la ligne 1; 6 et la colonne 0; 05 on lit la probabilité p(Z 1; 65) = 0; 9505: Pour calculer toutes les probabilités, même celles qui ne sont pas donnéespar la table, par exemple p(Z 1; 65) ou p(Z 1; 36) , on utilise les proprietésde f . Voici comment : §4.2 Calcul de p(Z z0 ) avec z0 négatif.Bien sûr cette probabilité n’ pas donnée par la table, mais en utilisant estles proprietés de la densité, on peut la calculer en se ramenant à ce quedonne la table c’est-à-dire p(Z x) où x est positif.La surface S1 est égale à la surface S2 à cause de la symétrie de la courbepar rapport à l’ des y. axeOn a donc p(Z z0 ) =surface totale p(Z z0 ) (avec z0 0) =1 p(Z z0 ):La table nous donne p(Z z0 ) car z0 0. 47
    • ECHANTILLONNAGE ET ESTIMATION Dans ce chapitre on va aborder le problème fondamental de la statis-tique, à savoir développer des procédés permettant de généraliser à touteune population des résultats observés sur un échantillon, tout en étantcapable de mesurer les chances que ces généralisations s’ avèrent exactes.§1: Echantillon aléatoire Dans la pratique, il est souvent impensable de faire porter notre étudestatistique sur l’ ensemble de tou les individus de la population. Onprocède alors par échantillonnage, c’ est-à-dire que l’ restreint notre onétude à une partie de la population.Pour que les conclusions de notre étude soient valables, les échantil-lons doivent être représentatifs. Une des façons d’ obtenir un échantillonreprésentatif est de procéder à un échantillonnage aléatoire, ce qui re-vient à considérer que les individus de la population ont la même chanced’appartenir à un même échantillon. En…n, pour obtenir un échantillonaléatoire , on attribue un numéro à chaque individu de la population; oninscrit ces numéros sur des petits morceaux de papier que l’ place dans onune urne, puis on procéde à un tirage dans l’ urne.Quand on a extrait un individu d’ urne, avant de procéder à un nou- uneveau tirage, on peut soit l’ remettre (tirage avec remise), soit ne pas l’ y yremettre(tirage sans remise). Dans le deuxième cas, un individu ne peutsortir qu’ seule fois. uneQuand chaque individu d’ une population peut être tiré plus d’une fois,l’ échantillonnage est dit non exhaustif, dans le cas contraire il est ditexhaustif.§2 Distribution d’ échantillonnage des moyennes Supposons qu’ certain caractère numérique dans une population a unpour moyenne et d’ écart-type :Considérons tous les échantillons de taille n, qui peuvent être extrait auhasard (avec ou sans remise).Désignons par x1; x2; ::: les moyennes du caractère dans l’ échantillon 1,2,...etc. 48
    • Considérons la variable aléatoire X dont les valeurs possibles sont x1; x2; :::La variable aléatoire X s’ appelle distribution d’ échantillonnage des moyennes.On montre les deux théorèmes suivants :Théorème 1: Les caractéristiques de Xa) Si le tirage est exhaustif dans une population de taille N, on a : r N n E( X) = et ( X) = p n N 1b) Sinon on a : E( X) = et ( X) = p nThéorème 2: La loi de XDans une population distribuée normalement (c-à-d le caractère suit laloi normale dans la population) ou dans une population quelconque maisavec n 30 on a : X N ( ; 2(X))Remarque. r N nLe facteur N 1 qui s’ appelle facteur d’ exhaustivité peut être pris égal r N nà 1 si n 0; 05N: Autrement dit N 1 =1 si la taille de l’ échantillon estinférieur à 5% de la population.Exemple 1Supposons que le poids d’ population de 60 étudiants d’ université une uneest normalement distibué avec une moyenne = 64 kg et une variance 2 = 20 kg2 :Un échantillon de 20 étudiants a été tiré.1) Trouver les caractéristiques et la loi de probabilité de la distributiond’échantillonnage des moyennes X si le tirage a été e¤ectué avec remise.2) Même question pour un tirage sans remise. 49
    • 3) Trouver la probabilité qu’ échantillon de taille un 20 tiré avec remiseait une moyenne supérieure ou égale à 66 kg.4) Trouver deux valeurs L1 et L2 situées à distance égale de part et d’ autresde = 64 telles que la probabilité que la moyenne d’ échantillon non unexhaustif de 20 étudiants tombe entr ces deux valeurs soit 0; 95.Solution.1) On est dans le cas non exhaustif, donc les caractéristiques de X sont (voir théorème 1) p 20 E( X) = = 64 kg et ( X) = p = p = 1 n 20Puisque la population est distribuée normalement alors X N( ; 2 (X))(voir théorème 2)Donc ici X N (64 ; 1)2) Si le tirage est exhaustif alors le théorème 1 nous dit que E( X) = 64kg et p r 20 60 20 ( X) = p 20 60 1ce qui donne ( X) = 0; 8234Le théorème 2 nous dit que 2 X N (64 ; (X) = 0; 6779)3) Puisque le tirage est avec remise alors on est dans le cadre de laquestion 1) donc X N (64; 1): La probabilité demandée est P (X 66): Pourla calculer faisons le changement de variable habituel X X 64 Z= = 1 donc X = Z + 64 (X)On sait que dans ce cas Z N (0; 1) P (X 66) = P (Z + 64 66) 50
    • = P (Z 2) =1 P (Z 2) =1 0; 9772 = 0; 0228:4) La question signi…e qu’ faut chercher L1 et L2 telles que il P (L1 XL2 ) = 0; 95 avec X N (64; 1) puisque le tirage est avec remise. X X 64Pour cela posons encore Z = = 1 donc X = Z + 64 On a 0; 95 = (X)P (L1 X L2 ) = P (L1 Z + 64 L2 ) = P (L1 64 Z L2 64)Puisque L1 et L2 doivent être symétriques par rapport à la moyenne = 64de X alors pour la variable aléatoire Z ceci revient à chercher t > 0 tel queP( t Z t) = 0; 95:Dans ce cas on a : P( t Z t) = P (Z t) P (Z t) = P (Z t) [1 P (Z t)] = 0; 95donc, P (Z t) = 1+0;95 2 = 0; 975La table de la loi normale nous donne t = 1; 96 et par suiteOn peut écrire donc P (62; 04 X 65; 96) = 0; 95Autrement dit l’ intervalle [62; 04 ; 65; 95] possède 95% de chance de contenirla moyenne d’ échantillon non exhaustif de taille 20. unExercice 1La durée de vie moyenne des ampoules électriques produites par une usineest de 800 heures avec un écart-type =40 heures: De cette population ontire un échantillon de taille 25 pris sans remise(exhaustif). Trouver, ensupposant que la durée de vie des ampoules est distribuée normalement:1) P (X 785)2) P (790 X 810)3) L1et L2 symétriques par rapport à = 800 telles que P (L1 X L2 ) = 0; 90: 51
    • Exercice 2Les résultats de 200 étudiants à un test de mathématiques présentent unemoyenne de 75 sur 100 et un écart-type de 10 . De cette population , onpréléve , sans remise, un échantillon de taille 50. Trouver:1) La probabilité que le résultat moyen de cet échantillon se situe entre74 et 76.2) Les limites L1 et L2 d’ intervalle symétrique par rapport à la moyenne unqui posséde 99% des chances de contenir la moyenne de cet échantillon.SolutionsExercice 1On a = 800 h et = 40 hLe tirage est exhaustif, donc on doit tenir compte du facteur d’ exhaustivitépuisque n = 25 < 30 . Mais on peut considérer que la population est trèsgrande, donc n < 0; 05N (ce qui est logique puisque 25 ampoules représentecertainement moins de 5% de la production de l’ usine) et par suite lefacteur d’exhaustivité peut être pris égal à 1. D’ où 40 E(X ) = 800 h et (X) = p = p = 8 n 25La population est supposée normale donc X N (800 ; 64) X X 800Posons Z= = 8 donc X = 8Z + 800 avec Z N (0 ; 1) (X)1) P (X 785) = P (8Z + 800 785) = P (Z 1; 88) = 1 P (Z 1; 88) = 1 0; 9699 = 0; 0301:2) P (790 X 810) = P (790 8Z + 800 810) = P ( 1; 25 Z 1; 25) = P (Z 1; 25) P (Z 1; 25) = P (Z 1; 25) [1 P (Z 1; 25)] = 2P (Z 1; 25) 1 = 2(0; 8944) 1 52
    • = 0; 7888Cette probabilité signi…e qu’ y a 78; 88% de chances que la moyenne d’ il unéchantillon exhaustif de taille 25 soit dans l’ intervalle [790 ; 785]3) De la même façon que dans l’ exemple du cours, on a : L1 800 L2 800P (L1 X L2 ) = P (L1 8Z + 800 L2 ) = P ( Z ) = 0; 90 8 8Cherchons t > 0 tel que P( t Z t) = 0; 90 1 + 0; 90Ceci est équivalent à P (Z t) = 2 = 0; 95: la valeur de t la plus prochedans la table est t = 1; 65 L1 800 L2 800 8 = 1; 65 et 8 = 1; 65 Donc L1 = 786; 8 et L2 = 813; 2Ceci signi…e qu’ y a 90% de chances que la moyenne d’ échantillon de il untaille 25 soit dans l’ intervalle [786; 8 ; 813; 2] :Exercice 2On a = 75 ; = 10 ; n = 50 et N = 200 r r N n 10 200 50Le tirage est exhaustif donc E(X) = 75 et (X) = p n N 1 =p 200 1 501; 23Puisque n = 50 > 30 alors X N (75 ; (1; 23)2 ) X 75Posons comme toujours Z= 1; 23 donc X = 1; 23Z + 75 et Z N (0 ; 1)1) P (74 X 76) = P (74 1; 23Z + 75 76) 74 75 76 75 = P( Z ) 1; 23 1; 23 = P ( 0; 81 Z 0; 81) = P (Z 0; 81) P (Z 0; 81) = P (Z 0; 81) [1 P (Z 0; 81)] = 2P (Z 0; 81) 1 53
    • = 2(0; 7910) 1 = 0; 58202) P (L1 X L2 ) = 0; 99 L1 75 L2 75P (L1 1; 23Z + 75 L2 = 0; 99 =) P ( Z ) = 0; 99 1; 23 1; 23On cherche t > 0 tel que P( t Z t) = 0; 99 et comme avant ceci revient àrésoudre l’ équation 1 + 0; 99P (Z t) = 2 = 0; 995 . La table de la loi normale nous donne t = 2; 58 (lavaleur la plus proche)DoncL1 75 L2 75 = 2; 58 et = 2; 58 =) L1 = 1; 23( 2; 58) + 75 = 71; 83L2 = 1; 23(2; 58) + 75 = 78; 17 1; 23 1; 23L’ intervalle [L1 ; L2] a 99% de chances de contenir la moyenne d’ échan- untillon exhaustif de taille 50.§3 Estimation par intervalle de con…ance de la moyenneLors d’ étude statistique, en général la moyenne de la population est uneinconnue. Le problème qui nous interésse ici est de trouver un intervalle[L1 ; L2 ] tel que la probabilité que appartienne à cet intervalle soit …xéed’ avance.Dé…nition 1On appelle intervalle de con…ance, un intervalle de la forme [L1 ; L2]symétrique par rapport à ayant une certaine probabilité de contenir lamoyenne :Dé…nition 2On appelle niveau de con…ance, noté 1 , la probabilité qu’ l’ à intervallede con…ance de contenir la moyenne : Le nombre s’ appelle le risqued’erreur.Méthode de calcul de L1 et L2Si n 30 , ou si la population est distribuée normalement avec connu,on sait que dans ce cas que X N ( ; 2(X)): 54
    • XPosons Z= , on sait qu’ alors Z N (0; 1) (X)1ereétape: on cherche d’ abord t > 0 tel que P( t Z t) = 1 . Voicicomment:On a P (Z t) P (Z t) = 1 P (Z t) [1 P (Z t)] = 1 donc P (Z t) = 1 2 et t sera donné parla table de la loi normale. X2emeétape: Une fois que t est connu, on peut écrire que P ( t t) = (X)1 donc P (X t (X) X + t (X)) = 1Pour un échantillon, la variable aléatoire X prend la valeur x, donc L1 = x t (X) L2 = x + t (X)Si est inconnu, alors on peut prendre une valeur estiméé ponctuellepour ; c’ est-à-dire l’ écart-type trouvé dans l’ échantillon.RemarquePour le calcul de l’ intervalle de con…ance [L1; L2] on prendra les valeurs det suivantes: t = 2; 58 si = 1% t = 1; 96 si = 5% t = 1; 65 si = 10%Exemple Une machine est réglée pour verser un certain mélange dans une boiteavec un écart-type de 3; 2 grammes. Parmi l’ensemble de la production, onprélève au hasard, avec remise, 30 boites pour chacune d’elles on a noté lepoids. Sachant que le poids moyen obtenu à partir de l’ échantillon est 165grammes, construire un intervalle de con…ance à 95% pour le poids moyendes boites remplies par cette machine.Solution : 55
    • On a et L1 = x t (X) et L2 = x + t (X) avec x = 165g et puisque le 3; 2tirage est non exhaustif alors (X) = p = p = 0; 584:: n 30Comme 1 = 0; 95 alors = 0; 05 = 5% donc t = 1; 96Donc L1 = 165 (1; 96)(0; 584) = 163; 86 L2 = 165 + (1; 96)(0; 584) = 166; 14On a donc P ( 2 [163; 86 ; 166; 14]) = 0; 95Autrement dit, on a 95% de chances que la moyenne appartienne à l’ intervalle[163; 86 ; 166; 14] :Exercice 1 Etan donné que la moyenne et l’ écart-type de la durée de vie d’ untube écran de télévision fabriqué par une compagnie sont inconnus, ona prelevé au hasard dans la production un échantillon de taille 36 pourlequel on a obtenu une moyenne de 6 ans et un écart-type de 0; 8 an .Construire un intervalle de con…ance à 95% pour puis un intervalle decon…ance à 99%:Exercice 2Dans le but de se faire une idée sur l’ cacité d’ nouveau médicament e¢ undevant prolonger la durée du sommeil des gens, on a administré unedose de ce médicament à 40 individus choisis au hasar. On a obtenu untemps supplémentaire moyen de sommeil de 1; 6 heures avec un écart-typede 0; 4 heure pour ces individus. Construire un intervalle de con…ance à99% pour’ , le temps moyen de prolongation de sommeil causé par lemédicament. Solution :Exercice 1On a n = 36 ; x=6 et l’ écart-type de l’ échantillon s = 0; 8: On a aussi s 0; 8L1 = x t (X) et L2 = x + t (X) où (X) = p = p = 0; 133:: n 36Ici on a pas tenu compte du facteur d’exhaustivité car on peut considérerque la population est très grande, et par suite la taille de l’ échantillonreprésente moins de 5% de la taille de la population. 56
    • - Si = 5% alors t = 1; 96 donc L1 = 6 (1; 96)(0; 133) = 5; 74et L2 = 6 + (1; 96)(0; 133) = 6; 26D’ où P ( 2 [5; 74 ; 6; 26]) = 0; 95- Si = 1% alors t = 2; 58 donc L1 = 6 (2; 58)(0; 133) = 5; 66 L2 = 6 + (2; 58)(0; 133) = 6; 34D’ où P ( 2 [5; 66 ; 6; 34]) = 0; 99Exercice 2 s 0; 4On a n = 40 ; x = 1; 6 et s = 0; 4 donc (X) = p p = 0; 06 n 40Pour = 1% on a t = 2; 58 donc L1 = x t (X) = 1; 6 (2; 58)(0; 06) = 1; 45 L2 = x + t (X) = 1; 6 + (2; 58)(0; 06) = 1; 75Donc P ( 2 [1; 45 ; 1; 75]) = 0; 99§4 Distribution d’ échantillonnage des proportions Considérons une population dans laquelle chaque individu posséde oune posséde pas un caractère. Supposons que la proportion de ceux quipossédent le caractère est p ( donc la proportion de ceux qui ne possédentpas le caractère est 1 p)Considérons tous les échantillons de taille n qui peuvent être extrait dela population . Pour chaque échantillon i déterminons la proportion fi deceux qui posséedent le caractère.La variable aléatoire F dont les valeurs sont f1 ; f2 ; ::: est appelée distrib-ution d’échantillonnage des proportions. 57
    • On a les théorèmes suivants:Théorème 1Si le tirage est sans remise (exhaustif) dans une population de taille Nalors r r p(1 p) N n E(F ) = p et (F ) = n N 1Sinon on a r p(1 p) E(F ) = p et (F ) = nThéorème 2 Si n 30 alors F N (p ; 2 (F ))Remarque r N nSi n < 0; 05N le facteur d’ exhaustivité N 1 peut être pris égal à 1:Exercice 1Une certaine machine usine des pièces. D’ façon générale, elle produit une3% de pièces mauvaises. Un client reçoit une caisse de 500 pièces, enprovenance directe de la machine.1) Quelle est la probabiulité qu’ trouve moins de 1% de pièce mauvaises ilà l’ interieur de la caisse.2) Quelle est la probabiulité qu’ trouve plus de 5% de pièce mauvaises à ill’ interieur de la caisseExercice 2Calculer la probabilité pour que sur les 200 prochains accidentés de voituresur les routes, il existe:1) moins de30% d’ hommes,2) plus de 80% d’ hommes 58
    • 3) entre 40% et 60% d’ hommes sachant que, généralement, sur cinq person-nes accidentées il y a une femme.Solution :Exercice 1 D’ une façon générale, la proportion de pièces mauvaises est p = 3% =0; 03: On peut considérer que l’échantillon provient d’ population très unegrande (donc n 0; 05N ) . La distibution d’échantillonnage des proportionsF a donc les caractéristiques suivantes: r r p(1 p) 0; 03(1 0; 03) E(F ) = p = 0; 03 ; (F ) = = 0; 0076 n 500 F N (0; 03 ; (0; 0076)2 ) F 0; 031) On doit calculer P (F < 0; 01); Pour cela posons Z= 0; 0076On a P (F < 0; 01) = P (0; 0076Z + 0; 03 < 0; 01) = P (Z < 2; 63) = 1 P (Z < 2; 63) = 0; 0043:2) La probabilité que le client trouve plus de 5% de pièces mauvaises estdonnée par P (F > 0; 05):On a P (F > 0; 05) = P (0; 0076Z + 0; 03 > 0; 05) = P (Z > 2; 63) = 1 P (Z < 2; 63) = 0; 0043:Exercice 2Désignons par p la proportion d’ hommes accidentés. On a p= 4 5 = 0; 8:On peut considérer que l’ échantillon de taille n = 200 provient d’ pop- uneulation très grande (donc n < 0; 05N ), ce qui permet de prendre le facteurd’exhaustivité égal à 1. La distribution d’ échantillonnage des proportionsa donc les caractéristiques suivantes: r r p(1 p) 0; 8(1 0; 8) E(F ) = 0; 8 ; (F ) = = 0; 028 n 200Et comme n = 200 > 30 alors F N (0; 8 ; (0; 028)2 )1) La probabilité demandée est donnée par P (F < 0; 3): F 0; 8Posons Z= 0; 028 donc F = 0; 028Z + 0; 8 et Z N (0; 1) 59
    • 0; 3 0; 8 P (F < 0; 3) = P (0; 028Z + 0; 8 < 0; 3) = P (Z < ) = P (Z < 17; 85) 0 0; 0282) De même calculons P (F > 0; 8): P (F > 0; 8) = P (0; 028Z + 0; 8 > 0; 8) = P (Z > 0) = 0; 53) Il faut calculer P (0; 4 < F < 0; 6): P (0; 4 < F < 0; 6) = P (0; 4 < 0; 028Z + 0; 8 < 0; 6) = P ( 14 < Z < 7) 0§ 5 Estimation par intervalle de con…ance de la proportion Comme pour la moyenne, nous allons chercher deux valeurs L1 et L2telles que la probabilité que p apparetienne à [L1; L2] soit égale à 1 oùest le risque d’erreur …xé d’avance.Si n 30 nous savons que la distribution d’ échantillonnage F suit la loinormale N (p ; (F ) ):Posons Z = F (F ) , on sait que p Z N (0; 1)Cherchons t > 0 tel que P( t Z t) = 1On a vu (voir §3 ) que ceci est equivalent à P (Z t) = 1 2 et t est donnépar la table de la loi normale. F pOn a donc P( t (F ) t) = 1 donc P (F t (F ) p F + t (F )) = 1Pour un échantillon la variable aléatoire prend la valeur f , donc L1 = f t (F ) L2 = f + t (F )Il reste pour calculer L1 et L2 à estimer (F ) : r r f (1 f) N nOn prend (F ) = n N 1 r si l’ on doit tenir compte du facteur f (1 f )d’ exhaustivité, ou on prend (F ) = n sinon . 60
    • Rappelons que f est la valeur de la proportion trouvée dans l’ échantillon.Exercice 190% des 150 personnes interrogées sont des consommateurs d’ une marquede lessive.Construire un intervalle de con…ance à 95% pour la proportion de l’ ensembledes consommateurs de cette lessiveExercice 2Dans un certain lac, un échantillon de 350 poissons pris à l’aide d’ un…let comprend 70 truites. Construire un intervalle de con…ance pour laproportion des truites dans ce lac.1) avec un niveau de con…ance de 90%2) avec un risque de 1%Solution :Exercice 1Dans l’ échantillon de taille 150 on a trouvé que la proportion est f = 0; 9:On peut supposer que la population est très grande (donc n < 0; 05N ), doncle facteur r exhaustivité peut être pris égal à 1, et par suiter d’ (F ) = f (1 f) 0; 9(1 0; 9) = = 0; 024 n 150Ici 1 = 0; 95 donc = 0; 05 = 5% et par suite t = 1; 96Donc L1 = 0; 9 (1; 96)(0; 024) = 0; 85 L2 = 0; 9 + (1; 96)(0; 024) = 0; 95D’ où P (p 2 [0; 85 ; 0; 95]) = 0; 95Avec un niveau de con…ance de 95%, la proportion des consommateurs sesitue entre 85% et 95%:Exercice 2 61
    • 70Dans l’ échantillon de taille n = 350 , la proportion des truites est f = 350 =0; 2:On peut supposer que la taille de r population (les poissons du lac) est r latrès grande donc (F ) = f (1 n f ) = 0; 2(1 0; 2) = 0; 0213::: 0; 021 3501) Si = 10% ( c-à-d 1 = 0; 90) alors t = 1; 65 donc L1 = 0; 2 (1; 65)(0; 021) = 0; 165 0; 17 L2 = 0; 2 + (1; 65)(0; 021) = 0; 234 0; 23Avec un risque d’ erreur de 10% , la proportion des truites dans le lac sesitue entre 17% et 23%.2) Si = 1% alors t = 2; 58 donc L1 = 0; 2 (2; 58)(0; 021) = 0; 1458 0; 15 et L2 = 0; 2 + (2; 58)(0; 021) = 0; 254 0; 25Avec un niveau de con…ance de 99%, la proportion des truites dans le lacse situe entre 15% et 25%: 62