Your SlideShare is downloading. ×
0
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
   statistique dsc s1
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

statistique dsc s1

1,154

Published on

0 Comments
3 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
1,154
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
62
Comments
0
Likes
3
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide
  • Les graphiques de ce module ont été effectués avec Excel. Et ça n’a pas toujours été très facile…
    L’étudiant est invité à consulter la page http://www.astro.ulg.ac.be/cours/magain/stat/stat25.html où il verra les « pièges » des graphiques statistiques.
  • Le diagramme à bandes fait partie de la famille des diagrammes différentiels, c’est-à-dire qu’il met en évidence les différences d’effectifs entre les modalités.
  • Si l’on veut comparer plusieurs diagrammes circulaires entre eux, les rayons de chaque diagramme doivent être proportionnels à la racine carrée de l’effectif total de la série qu’ils représentent. Ainsi l’aire de chacun des disques sera proportionnelle à l’effectif total de la série considérée.
    C’est le cas d’études sur plusieurs années par exemple.
  • C’est un diagramme différentiel.
  • On dit qu’un tel graphique est de type intégral ou cumulatif.
  • Ce type de graphique n’est pas standard pour Excel…
  • Comparer des densités de fréquence est plus « juste » que de comparer des fréquences dans le cas de classes d’amplitude différentes. En effet si une classe a une très forte amplitude, on peut s’attendre à ce qu’elle ait également une forte fréquence.
  • C’est un graphique de type différentiel.
  • On émet implicitement l’hypothèse que la répartition des valeurs dans chaque classe est uniforme.
  • Transcript

    • 1. DESCRIPTIVE CHAPITRE 1 : LES TABLEAUX ET REPRÉSENTATIONS GRAPHIQUES Faire par : fallatte abdelhakim facebook: abdlhakim fallatte
    • 2. Statistiques descriptives à une variable : représentations OBJECTIFS DE CE MODULE  Savoir décrire et représenter une série statistique par un tableau et un ou plusieurs graphiques adaptés.  On fera des choix des représentations différents selon la nature du caractère.
    • 3. INTRODUCTION     La représentation tabulaire est préalable à toute analyse statistique. Elle fait suite au travail préliminaire de collecte des données. La représentation graphique d’un seul caractère repose sur une règle de proportionnalité des hauteurs ou aires des graphiques aux effectifs (ou fréquences). Le choix d’un type de graphique dépendra de la nature du caractère étudié.
    • 4. PLAN DU CHAPITRE 1 Voici les parties que nous allons aborder : I. II. III. Caractères qualitatifs. Caractères quantitatifs discrets. Caractères quantitatifs continus.
    • 5. Ⅰ. Caractères qualitatifs PLAN DE LA PARTIE Voici les chapitres que nous allons aborder : 1. 2. 3. Représentation tabulaire. Diagramme à bande. Diagramme circulaire.
    • 6. Ⅰ. Caractères qualitatifs 1. REPRÉSENTATION TABULAIRE    Tableau à simple entrée, sans hiérarchie (sauf si le caractère est ordinal). La première colonne renseigne les modalités et les deux suivantes les effectifs et fréquences. Si le caractère est ordinal, on pourra rajouter une dernière colonne avec les fréquences cumulées.
    • 7. Ⅰ. Caractères qualitatifs 1. Représentation tabulaire  Exemple: On a noté la situation familiale des 150 employés d'une entreprise. Noms Situation de famille M.Azim Marié MFarid Veuf Mme Latifi Mariée Melle Fatiha Célibataire M. Ahmed Divorcé M. Salih Marié M. Berrada Divorcé Mme Réda Divorcée Melle Fatiha Célibataire M. Halim Marié M. Chadi Veuf Mme Faouzi Mariée ... ...
    • 8.  On ne s'intéresse pas à la situation personnelle de M. Azim ou de M. Farid, mais à la répartition du caractère "situation familiale" dans la population des 150 employés.  Pour cela il faut, pour chacune des modalités de la variable, déterminer l'effectif correspondant, c'est-à-dire le nombre de personnes ayant cette modalité : il faut dénombrer le nombre de célibataires, le nombre de mariés, etc..
    • 9. Cela peut se résumer par : Modalités Effectifs Marié 80 Célibataire 30 Veuf 20 Divorcé 20
    • 10. On notera x1, x2, ..., xk les différentes modalités, et n1, n2, ... , nk les effectifs associés. Dans le tableau ci-dessus, x1 = "marié", n1 = k= La somme des effectifs vaut : La variable que nous venons de voir est…
    • 11. On aurait pu tout aussi bien présenter les résultats sous la forme ci-dessus, par exemple. Modalité Effectif Célibataire 30 Marié 80 Divorcé 20 Veuf 20
    • 12. Par contre, s'il s'agit d'une variable ordinale, les modalités sont toujours présentées dans l'ordre : x1 < x2 < .... < xk , comme dans l'exemple ci-dessous. Modalités = tailles Effectifs = Nombre de personnes de cette taille XS 10 S 25 M 40 L 32 XL 23 XXL 20
    • 13. L'ensemble des couples { (xi , ni ), i = 1, ... , k } est une série statistique (ordonnée), ou distribution observée de la variable. La somme de tous les ni est-elle toujours égale à n, nombre des observations ? On notera ceci : effectif total
    • 14. On appellera fréquence relative la valeur que l'on peut aussi exprimer en pourcentage par fi x 100, c'est le pourcentage d'individus pour lesquels la variable a pris la valeur xi.
    • 15. COMPLÉTEZ LE TABLEAU : Modalités xi Effectif ni Fréquence relative fi % Célibataire 30 0.2 20 Marié 80 Divorcé 20 Veuf 20 Effectif total : 150 A quoi est égal ici le total de la colonne fréquence ? Et celui de la colonne "pourcentage" ? Il y a, parmi les 150 employés, …….% qui sont mariés.
    • 16. Ⅰ. Caractères qualitatifs 2. DIAGRAMME À BANDES Aussi appelé représentation par « tuyaux d’orgue ».  Les modalités sont placées sur un axe horizontal.  Les effectifs (ou fréquences) sont placés sur un axe vertical.  La hauteur de chaque tuyau est proportionnelle à l’effectif correspondant.  Permet de comparer d’un « coup d’œil » les différentes modalités.
    • 17. CSP Cadres Agents de maîtrise Employés Ouvriers ni 10 40 60 90 fi 0,05 0,2 0,3 0,45 90 80 70 60 50 Série1 40 30 20 10 0 cadres ouvriers employés ouvriers
    • 18. Ⅰ. Caractères qualitatifs 3. DIAGRAMME CIRCULAIRE  L’aire, et donc l’angle au centre d’un secteur, est proportionnelle à la fréquence (ou l’effectif) de la modalité considérée (d’où un angle de fi x 360° pour la modalité i).  Permet de bien visualiser la part relative de chaque modalité.
    • 19. Statistiques descriptives à une variable : représentations Ⅱ. CARACTÈRES QUANTITATIFS DISCRETS
    • 20. Ⅱ. Caractères quantitatifs discrets PLAN DE LA PARTIE Voici les chapitres que nous allons aborder : 1. 2. 3. Représentation tabulaire. Diagramme bâton. Courbe des fréquences cumulées.
    • 21. Ⅱ. Caractères quantitatifs discrets 1. REPRÉSENTATION TABULAIRE  Tableau à simple entrée, où les données sont classées par ordre croissant.  La première colonne renseigne les différentes valeurs du caractère, et les trois suivantes les effectifs, fréquences et fréquences cumulées.
    • 22. De même, pour une variable discrète, on notera x1 , x2 , ... , xk les valeurs rangées par ordre croissant, et n1 , n2 , ... , nk les effectifs correspondants.
    • 23. Noms Nombre d'enfants M.Azim 2 MFarid 3 Mme Latifi 0 Melle Fatiha 0 M. Ahmed 1 M. Salih 0 M. Berrada 1 Mme Réda 0 Melle Fatiha 2 M. Halim 4 M. Chadi 1 Mme Faouzi 3 M. Ali 2 Melle Loubna 0 M Fatih 0 M. Said 1 M. Radi 2 Mme Faraj 2
    • 24.  Ainsi, à partir de la série brute ci-dessus, construisez le tableau : Nombre d'enfants xi Effectifs ni 0 6
    • 25. Nombre d'enfants xi Effectif ni Fréquence relative fi 0 6 0.33 1 4 0.22 2 5 0.28 3 2 0.11 4 1 0.06 Total : 18 1
    • 26. Voyons un autre exemple : Pour étudier les appels téléphoniques arrivant à un central, on a noté, sur 96 jours comparables, le nombre d'appels reçus entre 9 h et 9 h 10. Les résultats sont consignés dans ce tableau :
    • 27. QUELLE EST LA PROPORTION DE JOURS OÙ LE NOMBRE D'APPELS A ÉTÉ DE 2 ? Nombre d'appels xi Nombre de jours ni Fréquence relative fi % fi × 100 0 2 0.0208 2.08 1 14 0.1458 14.58 2 23 0.2396 23.96 3 24 0.2500 25.00 4 18 0.1875 18.75 5 9 0.0938 9.38 6 6 0.0625 6.25 Total : 96 1 100
    • 28. QUELLE EST LA PROPORTION DE JOURS OÙ LE NOMBRE D'APPELS A ÉTÉ SUPÉRIEUR OU ÉGALE À 3? Nombre d'appels xi Nombre de jours ni Fréquence relative fi % fi × 100 0 2 0.0208 2.08 1 14 0.1458 14.58 2 23 0.2396 23.96 3 24 0.2500 25.00 4 18 0.1875 18.75 5 9 0.0938 9.38 6 6 0.0625 6.25 Total : 96 1 100
    • 29. COMBIEN Y-A-T-IL EU DE JOURS OÙ LE NOMBRE D'APPELS A ÉTÉ INFÉRIEUR OU ÉGAL À 2 ? Nombre d'appels xi Nombre de jours ni Fréquence relative fi % fi × 100 0 2 0.0208 2.08 1 14 0.1458 14.58 2 23 0.2396 23.96 3 24 0.2500 25.00 4 18 0.1875 18.75 5 9 0.0938 9.38 6 6 0.0625 6.25 Total : 96 1 100
    • 30. Plus généralement, si { (xi , ni ), i = 1, ..., K } est la distribution observée d'une variable discrète, n 1 + n2 + ... + ni = Ni est le nombre d'individus pour lesquels la variable a été inférieure ou égale à xi.. On peut calculer Ni de proche en proche : N1 = n1, N2 = N1 + n2, N3 = N2 + n3, etc ... Les Ni sont les effectifs cumulés croissants.
    • 31.  De même ni + ni+1 + ... + nk = N'i est le nombre d'individus pour lesquels la variable a été supérieure ou égale à xi.  Il peut se calculer de proche en proche : N'k = nk , N'k-1 = nk + nk-1 ,  Les N'i sont les effectifs cumulés décroissants.
    • 32. On peut définir de même : Fi = f1 + f2 + ... + fi , fréquences relative cumulées croissantes obtenues de proche en proche par Fi+1 = fi+1 + Fi F'i = fi + fi+1 + ... + fk , fréquences relative cumulées décroissantes obtenues de proche en proche par F'i = F'i+1 + fi F et F'i peuvent s'exprimer aussi en pourcentage (en multipliant tout par 100). i
    • 33. COMPLÉTEZ LE TABLEAU : Nombre d'appels Fréquence relative en % Fréquences relative cumulées croissantes 0 2.08 2.08 1 14.58 16.66 2 23.96 3 25.00 65.62 4 18.75 84.37 5 9.38 93.75 6 6.25 Fréquences relative cumulées décroissantes 97.92 83.34 59.38 15.63 6.25
    • 34. Ⅱ. Caractères quantitatifs discrets 2. DIAGRAMME BÂTON Diagramme bâton des effectifs  A chaque valeur du caractère portée en abscisse, on associe un « bâton » vertical dont la hauteur est proportionnelle à l’effectif.  Cette représentation permet de comparer les effectifs de chaque valeur du caractère.
    • 35. Ⅱ. Caractères quantitatifs discrets 3. COURBE DES FRÉQUENCES CUMULÉES  Représente l’évolution des fréquences cumulées.  Le caractère étant discret, la courbe est en « escalier ».  En effet, les valeurs étant séparées, entre chacune d’elle la fréquence cumulée est inchangée, d’où ces paliers.
    • 36. Ⅱ. Caractères quantitatifs discrets 3. COURBE DES FRÉQUENCES CUMULÉES Diagramme en Escalier 120 Fréquence relative cumulée 100 80 60 40 20 0 0 1 2 3 4 5 6 7
    • 37. Statistiques descriptives à une variable : représentations Ⅲ. CARACTÈRES QUANTITATIFS CONTINUS
    • 38. Ⅲ. Caractères quantitatifs continus PLAN DE LA PARTIE Voici les chapitres que nous allons aborder : 1. 2. 3. 4. Représentation tabulaire. Histogramme des densités de fréquence. Polygone de fréquences Courbe des fréquences cumulées.
    • 39. Ⅲ. Caractères quantitatifs continus 1. REPRÉSENTATION TABULAIRE    Tableau à simple entrée, où les classes de données sont triées par ordre croissant. La première colonne renseigne les différentes classes de valeurs du caractère, et les trois suivantes les effectifs, fréquences relatifs et fréquences cumulées. Si les classes ne sont pas toutes de même amplitude, on rajoute une colonne contenant les densités de fréquence, i.e. la fréquence de la classe divisée par son amplitude.
    • 40. 1. REPRÉSENTATION TABULAIRE  Lorsque la variable est continue, ou que la variable peut prendre un grand nombre de valeurs différentes, même si celle-ci est une variable discrète, il convient de regrouper ces valeurs en classes.  À chaque classe on fait correspondre une fréquence ou une fréquence relative, et l’on obtient alors une distribution de fréquence ou de fréquence relative pour valeurs groupées.  Pour construire une distribution de fréquence, de fréquence relative ou de fréquence relative cumulée pour valeurs groupées on doit procéder de la manière suivante : 1. 2. 3. Déterminer le nombre de classes Déterminer l’amplitude des classes Déterminer les différentes classes
    • 41. 1. REPRÉSENTATION TABULAIRE EXEMPLE 1 Voyons l'exemple d'une série brute de 60 valeurs du CA mensuelle d’une entreprise (en 1000dh), et le tableau des effectifs obtenus. L'inconvénient est que, comme on aura toujours un grand nombre de valeurs différentes, on obtiendra un grand nombre de petits effectifs, ne résumant finalement pas grande chose !
    • 42. CA (1000dh) Effectifs CA (1000dh) Effectifs 159 1 169 7 160 0 170 7 161 0 171 9 162 0 172 6 163 2 173 5 164 3 174 2 165 3 175 1 166 0 176 2 167 5 177 1 168 6 Total : 60
    • 43.  Une variable continue ne prend pas des valeurs isolées, mais des valeurs appartenant à des intervalles. C'est pourquoi, au lieu de définir des effectifs par valeurs, on définira des effectifs par intervalles, appelés classes.
    • 44.  Afin de simplifier la présentation on peut, quitte à perdre un peu d'information, regrouper les effectifs proches, par exemple 175 d’ effectif 1 176 d’ effectif 2 177 d’ effectif 1 peut être remplacé par [ 175 ; 178 [ d’ effectif 4.
    • 45. On découpera ainsi l'intervalle des valeurs en classes contiguës, de la forme : [ e1 ; e2 [    [ e2 ; e3 [    [ e3 ; e4 [ .... [ ek ; ek+1 [ et on notera n1, n2, ... , nk les effectifs associés. ni est le nombre d'individus appartenant à la classe [ ei ; ei+1 [.
    • 46. EXEMPLE 1 Classes de CA ( en 1000dh) Effectifs [159 - 165 [ 6 [165 - 168 [ 8 [168 - 171 [ 20 [171 - 174 [ 20 [174 - 177 [ 5 [177 - 179 [ 1
    • 47. EXEMPLE 1 Classes de CA ( en 1000dh) Effectifs moins de 160 1 [160 - 165 [ 5 [165 - 170 [ 21 [170 - 175 [ 29 175 et plus 4
    • 48.  Quel que soit le type de variable on a finalement, pour toute modalité, valeur xi , ou classe [ ei , ei+1 [, un effectif ni , tel que  Il est parfois utile, surtout pour faire des comparaisons entre plusieurs séries, de raisonner plutôt avec des fréquences relatifs.
    • 49. Les définitions d'effectifs et de fréquences cumulés restent les mêmes dans le cas d'une variable continue.
    • 50. 1. REPRÉSENTATION TABULAIRE 1. Déterminer le nombre de classes : 1) 2) (règle de Sturges) N C = 1 + 3.3Log (n) NC = n Nombre d’observations dans la série statistique
    • 51. 1. REPRÉSENTATION TABULAIRE 2. Calculer l’amplitude des classes : 1) D’une façon plus ou moins arbitraire 2) En utilisant l’étendue   valeur de la série statistique E = xmax − xmin = (Plus grande valeur de la série statistique) – Plus petite E AC = NC Des classes d’amplitudes égales
    • 52. 1. REPRÉSENTATION TABULAIRE 3. Déterminer les différentes classes : xmin ≤ Classe1 < xmin + Ac xmin + Ac ≤ Classe2 < xmin + 2 Ac xmin + (k − 1) Ac ≤ Classek < xmin + kAc xmin + ( N c − 1) Ac ≤ Classe N c < xmin + N c Ac
    • 53. EXEMPLE 2 : LE TABLEAU STATISTIQUE (VALEURS GROUPÉES) Pour les trois dernières années, le débit mensuel moyen d'une rivière, exprimé en milliers de mètres cubes par seconde, a été le suivant : Variable continue Posons X = la variable statistique représentant le débit mensuel moyen d’une rivière.
    • 54. EXEMPLE 2 : LE TABLEAU STATISTIQUE (VALEURS GROUPÉES) (1) Nombre de classes : N C = 1 + 3.3Log (36) = 6.1358 classes N C = 36 = 6 classes (2) L’amplitude des classes : E = 1.05 − 0.08 = 0.97 0.97 AC = = 0.1617 ≈ 0.17 6 (3) Détermination des classes : Débit D (en milliers de m 3 ) 0.08 ≤ Classe1 < 0.25 0.25 ≤ Classe2 < 0.42 0.42 ≤ Classe3 < 0.59 0.59 ≤ Classe4 < 0.76 0.76 ≤ Classe5 < 0.93 0.93 ≤ Classe6 < 1.10
    • 55. EXEMPLE 2 : LE TABLEAU STATISTIQUE (VALEURS GROUPÉES) Distribution de fréquence, de fréquence relative et de fréquence relative cumulée :
    • 56. Ⅲ. Caractères quantitatifs continus 2. HISTOGRAMME DES DENSITÉS DE FRÉQUENCE.   Ensemble de rectangles contigus. Pour chaque classe on trace un rectangle : de base B proportionnelle à l’amplitude de la classe  de hauteur h proportionnelle à la densité de fréquence de la classe   L’aire du rectangle sera alors proportionnelle à la fréquence de la classe.
    • 57. Ⅲ. Caractères quantitatifs continus 2. HISTOGRAMME DES DENSITÉS DE FRÉQUENCE. Double interprétation :  On comparera les densités de fréquence des classes en comparant les hauteurs des rectangles.  On comparera les fréquences des classes en comparant les aires des rectangles.
    • 58. Age (ans) Nombre de personnes dans cette tranche d'âge 20 à 30 100 30 à 40 150 40 à 50 90 50 à 65 20
    • 59. Histogramme de fréquence pour valeurs groupées (exemple 2) Histogramme de fréquence 25 Fréquence 20 15 10 5 0 0,08 - 0,249 0,25 - 0,419 0,42 - 0,589 0,59 - 0,759 Débit D (en milliers m3/sec) 0,76 - 0,929 0,93 et plus
    • 60. Histogramme de fréquence relative groupées (exemple 2) pour valeurs Histogramme de fréquence relative 0,7 0,6 Fréquence relative 0,5 0,4 0,3 0,2 0,1 0 0,08 - 0,249 0,25 - 0,419 0,42 - 0,589 0,59 - 0,759 Débit D (en milliers de m3/sec) 0,76 - 0,929 0,93 et plus
    • 61. 3. Polygone de fréquences pour valeurs groupées (exemple 2) Polygone de fréquence 25 Fréquence 20 15 10 5 0 moins de 0,08 0,08 - 0,249 0,25 - 0,419 0,42 - 0,589 0,59 - 0,759 0,76 - 0,929 0,93 et plus Débit D (en milliers de m3/sec)
    • 62. 3. Polygone de fréquence relative pour valeurs groupées Polygone de fréquence relative 0,7 Fréquence relative 0,6 0,5 0,4 0,3 0,2 0,1 0 moins de 0,08 0,08 - 0,249 0,25 - 0,419 0,42 - 0,589 0,59 - 0,759 0,76 - 0,929 0,93 et plus Débit D ( en milliers m3/sec)
    • 63. Ⅲ. Caractères quantitatifs continus 4. COURBE DES FRÉQUENCES CUMULÉES  Représente l’évolution des fréquences cumulées.  Le caractère étant continu, la courbe l’est également.  Pour la construire, on joint les points de coordonnées (bi,Fi) où bi désigne l’extrémité supérieure de la ième classe.
    • 64. Ogive de fréquence relative cumulée pour valeurs groupées Ogive de fréquence relative cumulée Fréquence relative cumulée 120,00% 100,00% 80,00% 60,00% 40,00% 20,00% ,00% moins de 0,08 0,08 0,249 0,25 0,419 0,42 0,589 0,59 0,759 Débit D (en milliers m3/sec) 0,76 0,929 0,93 et plus
    • 65. SYNTHÈSE En plus des tableaux et graphiques, on résume l'observation d'une variable quantitative par un petit nombre de paramètres.

    ×