1. Vocabulaire
Représentations graphiques
Résumé Numérique
Statistique Descriptive - 1ère partie
Statistique pour une variable
L1 MASS
Université Rennes 2
Année 2010-2011
Semestre 2
MASS 1 Stat. Univariée
2. Vocabulaire
Représentations graphiques
Résumé Numérique
Références
Statistique descriptive, cours et exercices corrigés
Agnès Hamon et Nicolas Jégou
Résumé du cours de statistique descriptive
Yves Tillé
MASS 1 Stat. Univariée
3. Vocabulaire
Représentations graphiques
Résumé Numérique
Informations sur le cours
12H Cours
12H TD-TP sur logiciel R
Contrôle Continu : Un écrit de 2H et un mini-projet sous R
Examen Terminal : Un écrit de 2H
MASS 1 Stat. Univariée
4. Vocabulaire
Représentations graphiques
Résumé Numérique
Plan
1 Vocabulaire
2 Représentations graphiques
3 Résumé Numérique
Paramètres de position
Paramètres de dispersion
Moments
Paramètres de forme
Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
MASS 1 Stat. Univariée
5. Vocabulaire
Représentations graphiques
Résumé Numérique
Population, individu, variable
Recueil des données sur les éléments constitutifs d’un
ensemble ;
Ex : Notes aux examens, marque des voitures formant le parc
automobile de Rennes en 2005, etc.
L’ensemble étudié = population ;
Attention : la population ne sera pas toujours un ensemble
d’êtres humains.
Éléments qui le constituent = individus ;
Caractère étudié = variable ;
Sa valeur relevée sur un individu sera appelée observation.
MASS 1 Stat. Univariée
6. Vocabulaire
Représentations graphiques
Résumé Numérique
Exemple - Questionnaire
Age Nombre de personnes Lecture
X dans le foyer : Y journal : Z
1 17 4 de temps en temps
2 12 2 très rarement
3 15 3 très rarement
.
. .
. .
. .
.
. . . .
18 38 2 tous les jours
19 40 4 très rarement
20 42 5 de temps en temps
MASS 1 Stat. Univariée
7. Vocabulaire
Représentations graphiques
Résumé Numérique
Exemple suite
Population = 20 personnes interrogées ;
Individus renseignés sur 3 variables :
L’âge, noté X ;
Nombre de personnes dans le foyer, noté Y ;
Fréquence de lecture, notée Z .
Chaque individu est identifié par un numéro pour indexer les
observations ;
Exemple : x18 correspond à l’observation de la variable X faite
sur l’individu 18, et dans le tableau on lit x18 =38.
MASS 1 Stat. Univariée
8. Vocabulaire
Représentations graphiques
Résumé Numérique
Types de variables
2 familles de variables :
Si les observations sont des nombres, on parle de variable
quantitative ;
Si les observations se traduisent par un attribut, appartenance
à une catégorie ou à un genre, la variable est dite qualitative ;
On parle donc des valeurs possibles prises par une variable
quantitative ;
Et de modalités pour une variable qualitative.
Sur l’exemple précédent, Y va. quantitative et Z va. qualitative.
MASS 1 Stat. Univariée
9. Vocabulaire
Représentations graphiques
Résumé Numérique
Variables Quantitatives
2 types de variables :
Variables discrètes dont l’ensemble possible des valeurs est fini ;
Ex : Variable Y .
Variables continues lorsque les réalisations possibles
s’organisent sur une échelle continue des valeurs ;
Ex : Variable X .
Même si les observations prennent des valeurs entières, on
comprend bien qu’un individu qui a 15 ans signifie que son âge
appartient à l’intervalle [15; 16[.
MASS 1 Stat. Univariée
10. Vocabulaire
Représentations graphiques
Résumé Numérique
Variables Qualitatives
2 catégories :
Les modalités possèdent un ordre naturel, la variable est
qualifiée d’ordinale ;
Ex : Variable Z .
Pas d’ordonnancement on parle de variable nominale ;
Ex : Variable ”sexe” a deux modalités, "homme" et "femme",
et est dite nominale.
MASS 1 Stat. Univariée
11. Vocabulaire
Représentations graphiques
Résumé Numérique
Données Agrégées -1
Avec l’exemple précédent pour chacun des 20 individus, nous
disposons des observations pour chaque variable : on parle de
données brutes ou individuelles.
Il n’est pas toujours possible de toutes les représenter (trop
d’observations) et on présente les données dans un tableau
synthétique et on parle alors de données agrégées.
MASS 1 Stat. Univariée
12. Vocabulaire
Représentations graphiques
Résumé Numérique
Données Agrégées -2
Variable discrète :
On regroupe les observations suivant les valeurs de la variable
Valeurs 1 2 3 4 5 6
variable Y
Effectifs n1 = 3 n2 = 9 n3 = 2 n4 = 4 n5 = 1 n6 = 1
observés
MASS 1 Stat. Univariée
13. Vocabulaire
Représentations graphiques
Résumé Numérique
Données Agrégées -3
Variable Qualitative :
On regroupe les observations suivant les modalités de la
variable
Modalités très de temps tous
variable Z rarement en temps les jours
Effectifs n1 = 6 n2 = 6 n3 = 8
observés
MASS 1 Stat. Univariée
14. Vocabulaire
Représentations graphiques
Résumé Numérique
Données Agrégées -4
Variable continue :
Regroupement suivant des classes
Classes pour X [0 ;20[ [20 ;40[ [40 ;60[ [60 ;90[
Effectifs n1 = 6 n2 = 5 n3 = 5 n4 = 4
Choix des classes subjectif, autre exemple :
Classes pour X [10 ;30[ [30 ;40[ [40 ;50[ [50 ;70[ [70 ;90[
Effectifs n1 = 7 n2 = 4 n3 = 4 n4 = 3 n5 = 2
MASS 1 Stat. Univariée
15. Vocabulaire
Représentations graphiques
Résumé Numérique
A propos des fréquences . . .
Regrouper les données (slides précédents) : utile pour connaître les
modalités (valeurs) les plus souvent observées, mais :
Le nombre d’observations d’une valeur n’a de sens que si on le
compare au nombre total d’observations :
Dans une entreprise, 10 salariés gagnent plus de 60 ke/an
Si l’entreprise a 50 salariés cela représente 20%
Si l’entreprise a 5000 salariés cela représente 0,2%
C’est la notion de fréquences qui formalise cela ;
Avec n le nombre total d’observations et ni le nombre
d’observations de la i-ème modalité, la fréquence de cette
modalité est
ni
fi =
n
MASS 1 Stat. Univariée
16. Vocabulaire
Représentations graphiques
Résumé Numérique
Variables qualitatives : Un exemple
On s’intéresse à la variable "état-civil", notée X , pour 20 personnes.
M M D C C M C C C M
C M V M V D C C C M
Le domaine de la variable X est {M, D, C , V } ;
M : marié(e) ;
D : divorcé(e) :
C : célibataire ;
V : veuf(ve) ;
La valeur de X pour le 3ème individu est : x3 = D.
MASS 1 Stat. Univariée
17. Vocabulaire
Représentations graphiques
Résumé Numérique
Variables qualitatives : Présentation des données
La variable est qualitative nominale et nous regroupons les
observations suivant ses quatre modalités pour une présentation
agrégée :
xi ni fi
C 9 0.45
Avec
M 7 0.35 4
i=1 ni = 20
V 2 0.10 4
i=1 fi = 1
D 2 0.10
20 1
MASS 1 Stat. Univariée
18. Vocabulaire
Représentations graphiques
Résumé Numérique
Variables qualitatives : Les diagrammes
Figure: Diagramme en barres ; Diagramme en secteurs
MASS 1 Stat. Univariée
19. Vocabulaire
Représentations graphiques
Résumé Numérique
Variables quantitatives discrètes : Un exemple
On s’intéresse à la variable "nombre de personnes par ménage",
notée Z , pour un quartier composé de 50 ménages.
1 1 1 1 1 2 2 2 2 2
2 2 2 2 3 3 3 3 3 3
3 3 3 3 3 3 3 3 3 4
4 4 4 4 4 4 4 4 4 5
5 5 5 5 5 6 6 6 7 7
MASS 1 Stat. Univariée
20. Vocabulaire
Représentations graphiques
Résumé Numérique
Variables quantitatives discrètes : Présentation des données
xi ni fi
1 5 0.1
2 9 0.18
3 15 0.30
4 10 0.20
5 6 0.12
6 3 0.06
7 2 0.04
Figure: Diagramme en bâtons
50 1
MASS 1 Stat. Univariée
21. Vocabulaire
Représentations graphiques
Résumé Numérique
Variables quantitatives continues : Un exemple
On s’intéresse à la variable "taille" de 50 élèves d’une classe.
152 152 152 153 153 154 154 154 155 155
156 156 156 156 156 157 157 157 158 158
159 159 160 160 160 160 160 161 161 162
162 162 163 164 164 164 164 165 166 167
168 168 168 169 169 170 171 171 171 171
MASS 1 Stat. Univariée
22. Vocabulaire
Représentations graphiques
Résumé Numérique
Variables quantitatives continues : les classes
On peut définir les classes suivantes et obtenir le tableau des
données agrégées :
Classes ni fi
[151,5 ;155,5] [151,5 ;155,5] 10 0.20
[155,5 ;159,5] [155,5 ;159,5] 12 0.24
[159,5 ;163,5] [159,5 ;163,5] 11 0.22
[163,5 ;167,5] [163,5 ;167,5] 7 0.14
[167,5 ;171,5] [167,5 ;171,5] 10 0.2
50 1
MASS 1 Stat. Univariée
23. Vocabulaire
Représentations graphiques
Résumé Numérique
Variables quantitatives : L’histogramme - 1
Construction de l’histogramme à partir du tableau précédent.
Les observations sur les n individus sont réparties dans k
intervalles de la forme
([ei ; ei+1 ])i=1,...,k
Nous graduons l’axe horizontal à l’échelle des valeurs
(ei )i=1,...,k ;
Pour la hauteur on traduit le fait que l’air de chaque rectangle
correspond à la fréquence de la classe :
fi = (ei+1 − ei ) × di
MASS 1 Stat. Univariée
24. Vocabulaire
Représentations graphiques
Résumé Numérique
Variables quantitatives : L’histogramme - 2
En ordonnée on a donc la "densité" di :
Figure: Histogramme des effectifs
MASS 1 Stat. Univariée
25. Vocabulaire
Représentations graphiques
Résumé Numérique
Variables quantitatives : L’histogramme - 3
Et en agrégeant les deux dernières classes on obtient :
Figure: Histogramme des effectifs avec les 2 dernières classes agrégées
MASS 1 Stat. Univariée
26. Vocabulaire
Représentations graphiques
Résumé Numérique
Fréquences cumulées
La fréquence cumulée de la ième valeur, notée Fi , donnée par
i
Fi = f1 + . . . + fi = fj
j=1
C’est la proportion des observations inférieures ou égales à la
ième valeur de la variable :
xi ni fi Fi
1 5 0.1 0.1
2 9 0.18 0.28
3 15 0.30 0.58
··· ··· ··· ···
MASS 1 Stat. Univariée
27. Vocabulaire
Représentations graphiques
Résumé Numérique
Fonction de répartition
Figure: Fonction de répartition pour variable discrète et continue.
MASS 1 Stat. Univariée
28. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Le mode
Mode = valeur distincte correspondant à l’effectif le plus élevé.
Exemple avec variable "Etat-civil"
xi ni fi
C 9 0.45
M 7 0.35
Ici mode est C : célibataire.
V 2 0.10
D 2 0.10
20 1
MASS 1 Stat. Univariée
29. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Le mode - Qqs Remarques
Le mode peut être calculé pour tous les types de variable ;
Le mode n’est pas forcément unique ;
Pour une variable continue découpée en classes, on peut
définir une classe modale - cf après.
MASS 1 Stat. Univariée
30. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
La moyenne
La moyenne est définie que sur une variable quantitative ;
Elle est notée x et est définie par :
¯
n
1 x1 + x2 + . . . + xn
x=
¯ xi =
n n
i=1
Elle peut aussi être calculée à partir des effectifs :
J
1
x=
¯ nj xj
n
j=1
MASS 1 Stat. Univariée
31. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
La moyenne - Exemple
Variable : "Nombre d’enfants par famille"
0+0+1+1+1+2+3+4
0 0 1 1 1 2 3 4 x=
¯ 8 = 1.5
Tableau synthétique
xj nj
0 2
2×0+3×1+1×2+1×3+1×4
1 3 x
¯ = 8
2 1 = 1.5
3 1
4 1
MASS 1 Stat. Univariée
32. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
La médiane - 1
Médiane = valeur centrale de la série statistique, notée x1/2 .
Obtenue de la manière suivante :
On trie la série statistique par ordre croissant des valeurs
observés.
Ex : {3, 2, 1, 0, 0, 1, 2} devient {0, 0, 1, 1, 2, 2, 3}.
La médiane est la valeur qui se trouve au milieu de la série
ordonée ;
Ici x1/2 = 1.
MASS 1 Stat. Univariée
33. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
La médiane - 2 - Cas où n est impair
La médiane peut être
définie comme l’inverse de
la fonction de répartition
pour la valeur 1/2.
x1/2 = F −1 (0.5).
Figure: Médiane quand n impair
MASS 1 Stat. Univariée
34. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
La médiane - 3 - Cas où n est pair :
2 valeurs se trouvent au
milieu de la série ;
Médiane = moyenne de ces
2 valeurs ;
x1/2 = F −1 (0.5) ;
La fonction de répartition
correspond à un "palier".
Figure: Médiane quand n pair
MASS 1 Stat. Univariée
35. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Éléments de comparaison des paramètres de position
Exercice :
On regarde la variable "nombre d’aces réussis" dans les 10
derniers matchs d’un joueur de l’équipe de France ;
Aces 0 1 2 3 ... 11 12 13
Effectifs 4 2 3 0 ... 0 0 1
Mode ? Médiane ? Moyenne ?
Interprétation ? Est-ce un mauvais serveur ?
MASS 1 Stat. Univariée
36. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Éléments de comparaison des paramètres de position
Mode donne la valeur la plus fréquente mais ne tient pas
compte des autres observations ;
Médiane dépend de l’ordre des données mais peu sensible aux
valeurs extrêmes ;
Moyenne manque de robustesse ;
Ex : une fois 13 aces permet d’augmenter facilement la
moyenne alors qu’en réalité il ne sert jamais plus de 2 aces par
match.
MASS 1 Stat. Univariée
37. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Éléments de comparaison des paramètres de position
Suivant la distribution étudiée, les 3 mesures présentent leur propre
intérêt.
Il faut surtout éviter de faire des interprétations abusives et il est
souvent utile de les comparer.
MASS 1 Stat. Univariée
38. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Le mode - Variable continue
La classe modale n’est pas la classe de plus grande fréquence
mais la classe de plus grande densité ;
Classe modale = pic sur l’histogramme.
MASS 1 Stat. Univariée
39. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
La moyenne - Variable continue
Les observations sont réparties dans J intervalles et
J
1
x=
¯ nj cj ,
n
j=1
ej +ej+1
où cj = 2 est le centre de classe.
MASS 1 Stat. Univariée
40. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
La médiane - Variable continue
Regrouper en "classes" donc on se prive des valeurs mesurées
pour ne garder que des intervalles ;
Hyp : les données sont uniformément réparties dans les
intervalles ;
MASS 1 Stat. Univariée
41. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Exemple
Temps en min. [0 ;2 [ [2 ;6 [ ...
Fréquences (%) 40 40 ...
Temps médian ∈ [2; 6[ ;
L’hyp. nous donne :
10 % entre 2 et 3 min ;
10 % entre 3 et 4 min ;
...
Donc le temps médian est de 3 min ;
Sinon interpolation linéaire pour utiliser x1/2 = F −1 (0.5).
MASS 1 Stat. Univariée
42. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Interpolation linéaire
Cela consiste à déterminer une équation de droite pour en
déduire la valeur de x1/2 ;
On sait que F (x1/2 ) = 0.5 et que x1/2 ∈ [ek ; ek+1 ] ;
F (ek+1 ) − F (ek )
F (x1/2 ) ≈ F (ek ) + (x1/2 − ek )
ek+1 − ek
MASS 1 Stat. Univariée
43. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Quantiles - 1
La notion de quantile d’ordre p (où 0 < p < 1) généralise la
médiane ;
xp = F −1 (p).
La fonction de répartition est discontinue ;
On va présenter une manière de définir les quantiles.
MASS 1 Stat. Univariée
44. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Quantiles - 2
Si np est un nombre entier, alors
1
xp = {xnp + xnp+1 }.
2
Si np n’est pas un nombre entier, alors
1
xp = x[np] ,
2
où [np] représente le plus petit entier supérieur ou égal à np.
Notations : x1/4 = 1er quartile ; x1/2 = médiane ; x3/4 = 3ème
quartile ; . . .
MASS 1 Stat. Univariée
45. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Quantiles - 3 - Exemple
Avec la série suivante :
{12, 13, 15, 16, 18, 19, 22, 24, 25, 27, 28, 34} ;
Le 1er quartile nous donne np = 0.25 × 12 = 3 donc entier ;
Et donc
x3 + x4 15 + 16
x1/4 = = = 15.5;
2 2
Avec la série suivante : {12, 13, 15, 16, 18, 19, 22, 24, 25, 27} ;
Le 1er quartile nous donne np = 0.25 × 10 = 2.5 donc pas
entier ;
Et donc
x1/4 = x[2.5] = x3 = 15.
MASS 1 Stat. Univariée
46. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
L’étendue
L’étendue est simplement la différence entre la plus grande et
la plus petite valeur ;
E = xn − x1 .
MASS 1 Stat. Univariée
47. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
La distance interquartile
La distance interquartile est la différence entre le 3ème et le
1er quartile ;
IQ = x3/4 − x1/4 .
MASS 1 Stat. Univariée
48. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Application
X : "Journées d’absence au travail"
X 0 1 2 3 4 5 6 7 8 9 10 11
ni 1 4 4 8 14 7 4 4 2 1 0 1
Donner un résumé numérique de la variable X .
MASS 1 Stat. Univariée
49. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
La variance
La variance est la somme des carrés des écarts à la moyenne
divisée par le nombre d’observations :
n
1
σ2 = (xi − x )2
¯
n
i=1
Réécriture de la variance
n
1
σ2 = xi2 − x 2 .
¯
n
i=1
Démonstration : exercice.
Mesure pas très parlante.
MASS 1 Stat. Univariée
50. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
L’écart type
Dispersion autour de la moyenne ;
√
σ= Variance
Cf. Exercices de TD pour interprétation simple d’un point de
vue descriptif.
MASS 1 Stat. Univariée
51. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Moments - 1
On appelle moment d’ordre r, r ∈ N, le paramètre
n
1
mr = xir .
n
i=1
On appelle moment centré d’ordre r le paramètre
n
1
mr = (xi − x )r .
¯
n
i=1
MASS 1 Stat. Univariée
52. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Moments - 2
Les moments généralisent la plupart des paramètres.
m1 = x,
¯
m1 = 0,
m2 = σ2 + x 2 ,
¯
m2 = σ2 .
Les moments d’ordre 3,4 sont utilisés pour mesurer la symétrie
et l’aplatissement.
MASS 1 Stat. Univariée
53. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Skewness
Le skewness peut prendre des valeurs positives, négatives, ou
nulles.
L’asymétrie se mesure avec le coefficient d’asymétrie de Fisher
m3
sk = .
σ3
MASS 1 Stat. Univariée
54. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Exemple
Figure: Asymétrie d’une distribution.
Le skewness est positif quand la distribution est allongée à droite,
comme par exemple lorsqu’on regarde les variables "revenus",
"tailles des entreprises", etc.
MASS 1 Stat. Univariée
55. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Kurtosis
L’aplatissement est mesuré par le coef. d’aplatissement de
Pearson :
m4
β2 = 4 ,
σ
ou le coef. d’aplatissement de Fisher :
g2 = β2 − 3.
MASS 1 Stat. Univariée
56. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Exemple
Figure: Distribution mésokurtique et leptokurtique.
Une courbe leptokurtique (g2 > 0) est plus pointue et possède des
queues de distributions plus longues.
MASS 1 Stat. Univariée
57. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Diagramme en tiges et feuilles
Le Stem and leaf diagram est un moyen rapide de présenter
une variable quantitative ;
Par exemple avec la série suivante :
15, 15, 16, 17, 18, 20, 21, 22, 23, 23, 23, 24, 25, 25, 26,
26, 27, 28, 28, 29, 30, 30, 32, 34, 35, 36, 39, 40, 43, 44.
La tige du diagramme sera les dizaines et les feuilles seront les
unités.
MASS 1 Stat. Univariée
58. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Stem and leaf diagram
Figure: Diagramme en tiges et feuilles.
MASS 1 Stat. Univariée
59. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Box-Plot - Composition
Un rectangle qui s’étend du 1er au 3ème quartile.
Divisé par une ligne correspondant à la médiane.
Rectangle complété par 2 segments de droites.
Calcul des bornes : b − = x0.25 − 1.5IQ et b + = x0.75 + 1.5IQ ;
On identifie ensuite la plus petite et la plus grande observation
comprise entre ces bornes, qu’on appelle "valeurs adjacentes" ;
Les valeurs qui ne sont pas comprises entre les valeurs
adjacentes, sont représentées par des points et sont appelées
"valeurs extrêmes".
MASS 1 Stat. Univariée
60. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Box-Plot - Exemple
Figure: Diagramme en boîte, ou box-plot.
MASS 1 Stat. Univariée
61. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Box-Plot - Exemple 2
Figure: Diagramme en boîte, ou box-plot.
MASS 1 Stat. Univariée
62. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Exercices de fin de partie
On pèse 50 élèves d’une classe et nous obtenons :
43 43 43 47 48 48 48 48 49 49
49 50 50 51 51 52 53 53 53 54
54 56 56 56 57 59 59 59 62 62
63 63 65 65 67 67 68 70 70 70
72 72 73 77 77 81 83 86 92 93
Construisez l’histogramme, la fonction de répartition en adoptant
les classes suivantes :
[40; 45], ]45; 50], ]50; 55], ]55; 60], ]60; 65], ]65; 70], ]70; 80], ]80; 100]
MASS 1 Stat. Univariée
63. Paramètres de position
Paramètres de dispersion
Vocabulaire Moments
Représentations graphiques Paramètres de forme
Résumé Numérique Paramètres d’aplatissement
Diagramme en tiges et feuilles
Boîte à moustaches
Exercices de fin de partie
152 152 152 153 153 154 154 154 155 155
156 156 156 156 156 157 157 157 158 158
159 159 160 160 160 160 160 161 161 162
162 162 163 164 164 164 164 165 166 167
168 168 168 169 169 170 171 171 171 171
Calculez tous les paramètres (position, dispersion, etc.) sans
prendre en compte les classes.
MASS 1 Stat. Univariée