Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Les déterminants des choix d'études supérieures
1. ENSAE ParisTech
Groupe de Statistique Appliquée
2013-2014
Les déterminants des
choix d’études
supérieures
Thibault PLUQUET
Duc Hien VU
Hengrui WAN
Yasin ZORLU
Sujet encadré par Meryam ZAIEM
2. 1
Remerciements
Nous adressons nos sincères remerciements à notre encadrante : Meryam ZAIEM, qui a
contribué à l’élaboration de notre mémoire. Sa disponibilité, son soutien, son encouragement
et sa patience nous ont été précieux afin de bien mener notre travail.
3. 2
Sommaire
Introduction .............................................................................................................................. 3
Première partie: Statistiques descriptives.............................................................................. 5
1. Présentation des données .................................................................................................. 5
2. La distance à l’établissement d’enseignement.................................................................. 7
3. La moyenne au baccalauréat........................................................................................... 11
4. La durée des études......................................................................................................... 13
5. La variable domaine ....................................................................................................... 16
Deuxième partie: Les modèles à choix discret..................................................................... 17
1. Premier modèle : expliquer le choix du domaine ........................................................... 17
1.1.L’hypothèse I.I.A...................................................................................................... 17
1.2.Le logit multinomial ................................................................................................. 18
1.3.Le logit conditionnel................................................................................................. 25
2. Deuxième modèle : expliquer la durée des études.......................................................... 28
3. Troisième modèle : expliquer la formation (académique/professionnelle) .................... 29
Conclusion............................................................................................................................... 32
Bibliographie........................................................................................................................... 34
Annexe..................................................................................................................................... 36
4. 3
Introduction
Le choix de la filière d’enseignement supérieur est décisif pour le développement
académique et professionnel d’un élève. Ce dernier, compte tenu des différentes informations
dont il dispose, choisit l’option qui est apte à répondre au mieux à ses souhaits, c’est-à-dire
celle qui maximise leur utilité. L’enjeu est également de taille pour les gouvernements qui,
pour défendre la justice sociale et le droit à l’éducation des citoyens, essaient de proposer des
formations adaptées au besoin de la population afin de soutenir une croissance économique
durable. Comprendre les préférences des demandeurs de formations permet d’améliorer la
qualité des offres de formations, ce qui est en faveur du bien être social.
Les facteurs qui déterminent l'établissement et la filière d’étude souhaités des
bacheliers sont sujets à de nombreuses études des économistes de différents pays : une
abondante littérature porte sur les États-Unis (Mixon 1992a, 1992b, Mixon and Hsing 1994a
,1994b, Baryla and Dotterweich 2001), mais nous trouvons aussi des analyses sur des élèves
allemands (Bruckmeier, Fisher, Wigger 2013), hollandais (Sa et al. 2004), canadiens
(Boudarbat, Montmarquette 2007) ou encore italiens (Agasisti and Dal Bianco 2007). Les
conclusions pourraient différer d’un pays à l’autre en raison des différences de culture ou du
système éducatif et politique des pays.
Parmi la littérature à laquelle nous nous sommes intéressés, deux genres de facteurs de
choix d'études sont souvent évoqués : d’une part, les caractéristiques individuelles ou
familiales des élèves, par exemple l’aide à l’orientation académique des élèves par leurs
parents (Hoover-Dempsey et Sandler 1995, Ono 2001, Hastings, Kane et Staiger 2006),
notamment dans certains pays comme le Japon où le financement des études dépend
largement des parents. D’autre part, il y a un ensemble de facteurs divers qui sont
indépendants de ceux évoqués plus haut (Kjellsttrom and Regner 1998, Ono 2001, Agasisti
and Dal Bianco 2007, Beffy, Fougère et Maurel 2009) : ces facteurs dépendent soit des
établissements de l’enseignement supérieur, par exemple la qualité du programme d’études
proposé, le nombre de places offertes, la sélectivité, la taille de classe, les possibilités
d’obtenir des bourses... soit de la localisation des établissements choisis : la distance entre
l’établissement et le lieu de domicile de l’élève... soit des perspectives en terme d’emploi
qu’offre la formation : taux de chômage après l’obtention du diplôme par exemple. Bien que
les études des économistes sur cet aspect se heurtent parfois à la simplification que
représentent des modèles, face à la complexité des comportements humains et des réalités
sociales et politiques, certains consensus sont établis. La distance entre le lieu du domicile et
celui de l’école semble être en corrélation négative avec la probabilité de choisir cet
établissement. De plus, les élèves sont souvent attirés par les établissements d’une région où
le loyer et les frais de scolarité des établissements sont moins élevés (Sa et al. 2004). Ils sont
aussi soucieux de la qualité et du débouché des programmes d’études proposées par des
établissements (Baryla and Dotterweich 2001).
Le présent papier portera sur le cas de la Tunisie. En 2007, 138245 personnes ont
passé la session principale du baccalauréat et 75256 d’entre elles ont réussi à le décrocher.1
La
1
Source : http://www.babnet.net/cadredetail-11017.asp. Il convient de souligner que seuls les lycéens ayant eu
leur baccalauréat sont retenus pour notre analyse, car ils sont les seuls concernés par une affectation post-
baccalauréat.
5. 4
Tunisie compte 198 établissements de l’enseignement supérieur dont 13 universités2
, 25
Instituts Supérieurs d’Études Technologiques (ISET) et 46 établissements privés. Toutes les
universités proposent des formations similaires allant des sciences pures (mathématiques,
physique) à des sciences humaines (littérature, langues étrangères) en passant par les sciences
sociales (droit, économie, commerce) et la médecine. Nous remarquons que l’enseignement
supérieur en ce pays est gratuit, il n’y a donc pas d’effet de frais de scolarité sur le choix de
l’école. Ces spécificités rendent superflus l’étude de certains facteurs qui pourraient bien
influencer les décisions d’orientation académique dans d’autres pays. Cependant, comme des
étudiants d’autres pays, les élèves tunisiens pourraient prendre en compte des éléments moins
dépendants des particularités culturelles des pays, comme la distance entre le lieu de domicile
et le lieu de l’établissement, la perspective d’emploi à l’issue de la formation ou encore le
conseil des parents. De plus, comme le gouvernement tunisien détermine le nombre de places
disponibles en fonction de chaque formation dans chaque établissement, l’accessibilité à une
formation dans la contrainte du nombre de places offertes pourrait être un facteur capital du
choix des formations supérieures des bacheliers.
L’objectif de notre étude est de tenter de trouver les déterminants de choix des
formations supérieures. Notre étude est organisée comme suit : dans la première partie, des
statistiques descriptives sont présentées pour donner un aperçu de la situation d’orientation
académique post-baccalauréat en Tunisie. Dans la seconde partie, nous effectuons une analyse
empirique à l’aide de modèles de choix discret.
2
Voir : http://www.universites.tn/francais/donnees_de_base/p_ensei_sup.htm
6. 5
Première partie : Statistiques descriptives
1. Présentation des données
Une fois le baccalauréat obtenu, les élèves doivent effectuer leur choix d’études
supérieures. A l’issue des résultats (1ère
et 2ème
session) du baccalauréat, les bacheliers sont
classés par ordre de mérite au sein de leur spécialité. Pour établir cette classification, une
formule générale (un score FG) leur est attribuée. Cette formule diffère d’un baccalauréat à un
autre, elle va dépendre de la moyenne obtenue au baccalauréat (formule de base FB) et des
matières principales de la spécialité (formule spécifique FS).
Notre base contient les 74398 bacheliers orientés en 2007. Chaque bachelier peut faire
au maximum 10 vœux pour son affectation. Certains n’en formulent pas 10. Pour établir sa
liste de vœux, l’élève bénéficie d’informations sur la capacité d’accueil, ses résultats
(moyenne au baccalauréat, classement selon la formule générale), classement à l’intérieur du
type de baccalauréat et le score du dernier pris dans la filière les trois années précédentes,
grâce à un guide d’orientation fourni systématiquement par le Ministère tunisien de
l’enseignement supérieur. Il est important pour le bachelier d’étudier ses chances d’obtenir
une filière.
Nous disposons pour chaque bachelier de son premier choix et de son affectation
finale. Nous supposons que le bachelier est rationnel. Son premier choix reflètera vraiment ses
préférences sous contraintes. Nous considérerons ce premier choix pour la statistique
descriptive et pour les différents modèles (sauf indication contraire).
En moyenne les élèves obtiennent leurs 2,5ème
choix.
Graphe 1. La distribution du rang du vœu obtenu
Dans notre base de données, il y a 45207 filles, soit 60,76% des bacheliers et les
garçons sont au nombre de 29191.
7. 6
La répartition des bacheliers entre le littoral et les régions intérieures est à peu près
identique. Pour mieux prendre en compte leur proximité avec le littoral, les 23 gouvernorats3
en Tunisie seront divisés en deux groupes : régions littorales et régions intérieures. Cette
distinction pourrait être importante dans les choix des étudiants car ce sont des endroits
différents, pour les régions du littoral : elles sont généralement développées économiquement
et offrent de plus nombreuses opportunités d’emploi que les régions intérieures.
Ainsi, le littoral est composé de 9 gouvernorats et les régions intérieures de 14 (voir
Annexe A1). Bien qu’il y ait moins de gouvernorats sur le littoral, la répartition des bacheliers
entre le littoral et les régions intérieures est quasi-équilibrée : environ 52% des bacheliers sont
sur le littoral. Nous remarquons notamment qu’un dixième des bacheliers ont passé leur
baccalauréat à Tunis (voir Annexe A2).
Filles Garçons
Part 60,76% 39,24%
Moyenne au baccalauréat
(écart-type)
0,03
(1,01)
-0,05
(0,98)
Part de parents ouvriers 41,52% 36,67%
Part de parents cadres 21,11% 24,34%
Part littoral 51,42% 52,57%
Table 1. Quelques chiffres en fonction du sexe
La moyenne considérée est celle qui est centrée et réduite d’où la possibilité d’avoir
des valeurs négatives. Cette opération se fait au sein d’une même spécialité de baccalauréat.
L’intérêt est de pouvoir comparer des élèves de spécialités différentes. Sans cette opération,
par exemple, la comparaison de la moyenne d’un élève qui a fait un baccalauréat lettres et
celle d’un élève ayant fait un baccalauréat mathématiques ne serait pas judicieuse. En effet,
les notes entre ces deux spécialités ne se valent pas. Il est plus difficile d’avoir 20 en
philosophie que d’avoir 20 en mathématiques.
La catégorie socioprofessionnelle du père est un élément qui pourrait avoir son
importance dans l’orientation des bacheliers.
Environ 40% des bacheliers ont un père ouvrier. 22% des élèves ont des pères qui sont
cadres. Il y a très peu d’instituteurs et de professeurs. Sur le littoral, il y a 36% d’ouvriers, ce
nombre s’élève à 46% pour les régions intérieures. Les cadres représentent 26% de la
population sur le littoral alors que dans les régions intérieures, ils sont de 18% (Voir Annexe
A3).
3
Il y a 23 gouvernorats en Tunisie qui sont : Ariana, Beja, Ben Arous, Bizerte, Gabes, Gafsa, Jendouba,
Kasserine, Kebili, Le Kef, Mahdia, Manouba, Mednine, Monastir, Nabeul, Sfax, Sidi Bouzid, Siliana, Sousse,
Tataouine, Tozeur, Tunis et Zaghouane.
8. 7
Graphe 2. La répartition socioprofessionnelle en Tunisie
2. La distance à l’établissement d’enseignement
Il serait intéressant d’étudier les distances entre la zone géographique d’origine de
l’élève et les villes correspondantes aux filières choisies : la distance au premier vœu ou celle
au vœu d’affectation. Pour la suite, nous ne considérons que la distance au premier vœu car
les résultats sont assez proches pour les deux types. Cette distance pourrait influencer de
manière significative la formulation des choix. Cette distance a été calculée
approximativement4
en considérant la distance entre la capitale du gouvernorat de résidence
du bachelier et la ville où se situe l’établissement d’enseignement.
La distance par rapport au sexe
Garçons Filles
Moyenne 111,84 92,21
Ecart-type 128,35 115,34
Table 2. La variable distance en fonction du sexe
En moyenne, les filles vont moins loin que les garçons. Nous pourrions supposer que
les parents sont plus réticents à envoyer leurs filles loin d’eux.
Nous faisons un test de Kolmogorov-Smirnov pour voir si les deux densités sont
confondues, autrement dit, si la distribution associée à la variable distance au premier vœu est
4
Si celle-ci est petite, nous la mettons à zéro
PROFESSEUR
3%
INSTITUTEUR
2%
OUVRIER
QUALIFIE
11%
OUVRIER NON
QUALIFIE
29%
PROFESSION LIBRE
5%
P.M.CULTIVANT
COMMERCANT
9%
CADRE MOYEN NON
INSTI
15%
CADRE (NON PROF)
7%
PÈRE DECEDE
5%
RETRAITE
10%
SANS EMPLOI
4%
Répartition socioprofessionnelle en Tunisie
9. 8
la même pour les garçons et les filles. Sous l’hypothèse nulle, ces deux distributions
coïncident l’une avec l’autre.
Test de Kolmogorov-Smirnov
Graphe 3. La densité de la variable distance pour les deux sexes
Le résultat montre que la p-valeur est nulle. Donc pour un niveau standard5
, nous
rejetons l’hypothèse nulle d’égalité des densités.
Pour mesurer la « corrélation » entre la distance au premier vœu et le sexe, en
contrôlant la moyenne, nous allons utiliser la régression suivante :
où sexei vaut 1 si l’individu i est un garçon et 0 sinon.
Les résultats de la régression sont les suivants :
(écart-type) (0,57) (0,90) (0,44)
Tous les coefficients sont significativement différents de 0 au seuil de 5%.
La régression montre que pour une note de moyenne fixée, la distance moyenne au
premier vœu est de 92,55 km environ pour les filles. Celle-ci augmente de 18,77 km pour les
garçons.
5
1%, 5% ou 10%
10. 9
La distance en tenant compte du gouvernorat (littoral ou intérieur)
Effectifs moyenne écart-type
Littoral 38591 60,46 94,32
Régions intérieures 35807 142,43 131,70
Table 3. La variable distance en fonction du littoral/intérieur
Test de Kolmogorov-Smirnov
Graphe 4. Les densités de la variable distance pour le littoral/hors-littoral
Dans ce cas, la p-valeur est nulle. Nous rejetons donc l’hypothèse nulle au seuil
standard : la distribution de la distance pour le littoral et celle pour l’intérieur ne se
ressemblent pas. Les bacheliers qui ont passé leurs baccalauréats sur le littoral vont, en
moyenne générale, moins loin que les autres. En effet, les offres de formation sont plus
nombreuses sur le littoral.
La distance en tenant compte de la catégorie socioprofessionnelle (CSP) du père
Les élèves sont scindés en deux groupes selon la profession du père :
- Groupe 1 (plus aisé) : la catégorie socioprofessionnelle du père est parmi les cadres, les
instituteurs et les professeurs.
- Groupe 2 (plus défavorisé) : la catégorie socioprofessionnelle du père est parmi les ouvriers,
les commerçants, les pères décédés, les retraités et les sans-emplois6
.
Effectifs moyenne écart-type
Groupe aisé 20459 86,57 116,85
Groupe défavorisé 50489 106,64 122,53
Table 4. La variable distance en fonction de la profession du père
6
Nous omettons le troisième groupe qui contient les professions libres.
11. 10
Test de Kolmogorov-Smirnov
Graphe 5. La densité de la variable distance pour les deux groupes
La p-valeur est nulle. La distribution de la distance n’est pas la même pour le groupe
plus aisé et pour le groupe plus défavorisé.
Pour le groupe plus aisé, le déplacement moyen est plus court que pour le groupe plus
défavorisé. Les conditions de réussite pour les élèves du groupe plus défavorisé sont plus
difficiles, le contexte familial ne favorise pas l’éducation. Ainsi, ces élèves ont des choix
limités de par le niveau, ce qui conduit à des éloignements du domicile familial. Les écoles
ont des places limitées, les bacheliers vont être affectés selon leur niveau. Les élèves du
groupe défavorisé sont plus nombreux dans les régions intérieures (26811) que sur le littoral
(23678). Cela contribue aussi à l’écart de distribution.
Nous mesurons la « corrélation » entre la distance et le groupe de catégorie
socioprofessionnelle, en contrôlant la moyenne au baccalauréat.
Distancei = β0 + β1.Aiséi + β 2.Moyennei + , i=1,…, 70948
Aisé = 1 si l’individu i est dans le groupe plus aisé, 0 si l’individu est dans le groupe plus
défavorisé.
Nous obtenons le modèle estimé :
Distancei = 105,76 - 17,40.Aiséi - 8,33.Moyennei + , i=1,…, 70948
(Ecart-type) (0,54) (1,01) (0,46)
Tous les coefficients sont significativement différents de 0 au seuil de 5%.
̂ = -17,40 < 0. En contrôlant la moyenne obtenue au baccalauréat, la distance (par rapport au
premier vœu) diminue de 17,40 km quand nous passons du groupe plus défavorisé au groupe
plus aisé.
12. 11
3. La moyenne au baccalauréat
La moyenne au baccalauréat par sexe
Effectifs Moyenne Ecart-type
Garçons 29191 -0,05 0,98
Filles 45207 0,03 1,01
Table 5. La moyenne au baccalauréat en fonction du sexe
Test de Kolmogorov-Smirnov
Graphe 6. La densité de la variable moyenne pour les deux sexes
La p-valeur est nulle, les distributions des moyennes centrées réduites ne sont pas les
mêmes pour les garçons et les filles. Les filles ont une moyenne plus grande que les garçons.
La moyenne au baccalauréat par région
Effectifs Moyenne Ecart-type
Littoral 38591 0,11 1,04
Régions intérieures 35807 -0,12 0,93
Table 6. La moyenne au baccalauréat en fonction de la position géographique
Les élèves du littoral ont une meilleure moyenne que les élèves vivant à l’intérieur du
pays.
Test de Kolmogorov-Smirnov
Comme la p-valeur est nulle, nous rejetons l’hypothèse nulle, ce qui veut dire que la
distribution de la moyenne au baccalauréat n’est pas la même sur le littoral que dans les
régions intérieures.
13. 12
Graphe 7. La densité de la variable moyenne en fonction du littoral/régions intérieures
La moyenne au baccalauréat par statut social du père
Effectifs Moyenne Ecart-type
Les plus aisés 20459 0,21 1,10
Les plus défavorisés 50489 -0,11 0,93
Table 7. La moyenne au baccalauréat en fonction du milieu social
Nous constatons que les élèves qui sont dans un milieu aisé ont une meilleure
moyenne que ceux qui sont dans un milieu défavorisé. Néanmoins ces élèves présentent des
résultats plus volatils. L’écart-type est plus important pour les élèves issus du groupe 1 que
celui pour les élèves du groupe 2. En effet, les enfants dont les parents sont enseignants auront
la faculté de s’ouvrir plus facilement à la culture et d’être plus studieux. De plus, les parents
aisés peuvent payer des cours particuliers à leurs enfants.
D’ailleurs, nous pouvons supposer que des parents ouvriers donnent une place moins
importante à l’éducation que des parents cadres. Ainsi, des élèves dont les parents sont
ouvriers bénéficieraient d’un moins grand suivi qu’un enfant dont les parents sont
enseignants.
Test de Kolmogorov-Smirnov
La p-valeur vaut zéro. La distribution de la moyenne au baccalauréat n’est pas la
même entre les deux groupes.
14. 13
Graphe 8. La densité de la variable moyenne pour les deux origines sociales
4. La durée des études
Cette variable durée peut susciter de nombreuses questions : quelle est la durée
moyenne d’études sur le littoral ? Pour les élèves issus de milieux défavorisés ? Pour les
filles ? En fonction du libellé du baccalauréat ?
La durée des études en fonction du découpage littoral/régions intérieures
Nombre
d’observations
Durée moyenne Ecart-type
Littoral 38591 3,31 1,25
Régions intérieures 35807 3,16 1,05
Table 8. La durée moyenne des études en fonction de la répartition géographique
La durée moyenne des études est plus longue sur le littoral avec un écart-type plus
grand comparé aux villes intérieures.
Test de Kolmogorov-Smirnov
Nous avons une p-valeur qui est nulle. Nous rejetons donc l’hypothèse nulle au seuil
standard : la distribution de la variable durée pour le littoral et la distribution de la variable
durée hors du littoral ne se ressemblent pas.
15. 14
Graphe 9. La densité de la variable durée pour le littoral/hors littoral
La durée des études en fonction du milieu social
Nombre
d’observations
Durée moyenne Ecart-type
Défavorisé 42871 3,10 1,01
Aisé 20459 3,50 1,36
Table 9. La durée moyenne des études selon le milieu social
La durée moyenne des études est plus longue pour les élèves issus de familles aisées.
En effet, les élèves auront probablement des loyers à payer et d’autres frais liés à leurs études.
Les familles peu aisées ne peuvent pas offrir ces dépenses à leurs enfants. Les élèves issus de
milieu défavorisé vont privilégier les études de courtes durées.
Test de Kolmogorov-Smirnov
La p-valeur est nulle. Nous rejetons l’hypothèse nulle au seuil standard : la distribution
de la variable durée pour les bacheliers les plus aisés et la distribution de la variable durée
pour les bacheliers les plus défavorisés ne sont pas identiques.
16. 15
Graphe 10. La densité de la variable durée selon le milieu social
La durée des études en fonction du sexe
Nombre d’observations Durée moyenne Ecart-type
Garçons 29191 3,22 1,25
Filles 45207 3,25 1,10
Table 10. La durée moyenne des études en fonction du sexe
Les filles font de plus longues études que les garçons cependant la différence de la
durée moyenne n’est pas très remarquable.
Test de Kolmogorov-Smirnov
Graphe 11. La densité de la variable durée en fonction du sexe
17. 16
La p-valeur est nulle. Nous rejetons l’hypothèse nulle au seuil standard : la distribution
de la variable durée pour les garçons et la distribution de la variable durée pour les filles ne se
ressemblent pas.
La durée des études en fonction du libellé du baccalauréat
Nombre d’observations Durée moyenne Ecart-type
Economie-Gestion 14232 2,83 0,72
Lettres 21964 3,16 0,65
Mathématiques 13937 3,60 1,35
Sciences exp. 15113 3,64 1,45
Techniques 9152 2,85 1,43
Table 11. La durée moyenne des études en fonction du libellé du baccalauréat
Les bacheliers scientifiques (mathématiques et sciences expérimentales) font en
moyenne des études plus longues que les autres élèves. Par contre, les écart-types sont élevés.
Néanmoins, nous remarquons que les bacheliers en économie-gestion et en techniques
enregistrent des durées moyennes d’études plus faibles. Pour la filière technique, nous
pourrions penser qu’elle accorde une place plus importante au profil professionnel. Les élèves
de cette filière veulent intégrer le milieu professionnel le plus rapidement possible.
5. La variable domaine
Le but de ce projet est de donner des explications sur le choix des études supérieures.
Ainsi, il faut nous intéresser aux formations. Cependant, il existe un très grand nombre de
formations. Nous avons donc décidé de construire la variable domaine par soucis de
simplicité.
Cette variable « domaine » a été construite par recherche lexicographique. Nous nous
sommes posé les questions suivantes : quels sont les domaines préférés par les garçons ?
Quelle est la répartition des domaines sur le littoral ? Quelles sont les formations les plus
fréquentées par les bacheliers les plus aisés ?
Le domaine en fonction du littoral/hors-littoral : les bacheliers vivant en dehors du
littoral font moins d’études de médecine que les bacheliers vivant sur le littoral. Cependant,
nous pouvons voir que les bacheliers vivant à l’intérieur du pays font plus de formations
linguistiques que les bacheliers vivant sur le littoral (voir Annexe A6).
Le domaine en fonction de la CSP du père : les élèves vivant dans un milieu aisé font
plus de médecine que ceux issus d’un milieu moins aisé. Pour ceux qui sont dans un milieu
défavorisé, la part qui s’oriente vers les langues est plus importante que le milieu aisé (voir
Annexe A7).
Le domaine en fonction du sexe : les garçons s’orientent plus vers l’ingénierie et la
physique que les filles. Les filles s’orientent plus vers les langues que les garçons (voir
Annexe A8).
Le domaine en fonction du baccalauréat mathématiques et lettres : la proportion des
littéraires qui s’orientent vers les langues est très importante comparée aux matheux. Les
matheux font plus d’ingénierie, de la physique, de l’informatique et des sciences
fondamentales. Contrairement aux littéraires qui vont vers les domaines des sciences
humaines (voir Annexe A9).
18. 17
Deuxième partie : Les modèles à choix discret
Ce que nous cherchons à expliquer est le choix d’études supérieures des bacheliers. Ce
choix peut être caractérisé par : les domaines, la durée des études (longue/courte durée) et le
profil de la filière (cursus professionnalisant/académique). Ce sont des variables catégorielles,
la régression linéaire n’est pas adaptée pour les traiter.
1. Premier modèle : expliquer le choix du domaine (en considérant le premier vœu)
Nous allons utiliser plusieurs modèles polytomiques. Ces modèles seront non-
ordonnés parce qu’il n’y a pas d’ordre pour les différentes filières d’études supérieures.
Vu le nombre assez conséquent de formations proposées, interpréter les coefficients
serait laborieux. C’est pour cette raison que nous avons décidé d’établir des groupes de
domaines. Nous en dévoilons la composition ci-dessous :
Domaine groupé Détails
Ingénierie Agronomie, Ingénierie, Ingénierie et Technique apparenté, Arts et
métiers, Architecture, Informatique et Physique/Informatique
Sciences sociales Droit, Gestion, Commerce et Administration et Gestion,
Economie et Finance
Sciences humaines Langues et Sciences humaines
Santé Médecine/Pharmacie et Santé et Services sociaux
Sciences
fondamentales
Sciences fondamentales
Autre Autres
Table 12. La constitution des groupes de domaines
1.1. L’hypothèse I.I.A.
Le modèle polytomique non-ordonné doit satisfaire l’hypothèse d’indépendance des
alternatives non pertinentes (ou I.I.A. Independance of irrelevant alternative). Selon cette
hypothèse, le rapport de deux probabilités associés à deux événements particuliers est
indépendant des autres événements.
Nos alternatives sont les domaines. Considérons deux modèles : le premier qui exclut
le domaine des sciences fondamentales et le deuxième qui contient tous les domaines.
Selon l’hypothèse I.I.A., le ratio « P(Ingénierie)/P(Sciences humaines) » du premier modèle
doit être égal à « P(Ingénierie)/P(Sciences humaines) » du deuxième modèle. L’ajout d’une
alternative n’influence pas ce ratio.
Intuitivement, nous pourrions penser que dans le premier modèle, la probabilité de
choisir le domaine de l’ingénierie est plus grande par rapport au deuxième modèle. En effet,
entre ces deux modèles, il peut y avoir un changement d’orientation pour les élèves intéressés
par les sciences fondamentales. En excluant les sciences fondamentales, les élèves intéressés
par ce domaine ne vont probablement pas choisir les sciences sociales, ni les sciences
humaines. Il reste le domaine de la santé et de l’ingénierie. Une part importante des élèves
s’orienterait vers l’ingénierie. L’ajout du domaine des sciences fondamentales diminuera la
probabilité de choisir l’ingénierie dans une proportion plus importante qu’il ne diminue la
probabilité de choisir les sciences humaines. Or, pour que l’hypothèse I.I.A. soit respectée, il
19. 18
faudrait que les deux probabilités diminuent dans une même proportion (afin que le ratio des
probabilités reste inchangé).
Malgré la non-vérification de l’hypothèse I.I.A. dans notre cas, nous allons tout de
même utiliser les modèles polytomiques non-ordonnés. Nous détaillons dans l’annexe A14 le
test d’Hausman-McFadden que nous avons utilisé après les régressions pour montrer la non-
validité de l’hypothèse I.I.A dans notre cas.
1.2. Le logit multinomial
Tout d’abord, nous voulons expliquer le choix des domaines par rapport aux
caractéristiques propres des individus. Ces variables sont les suivantes :
-le score/ la formule générale (fg) : fg est une variable continue. Nous avons décidé de le
centrer et réduire par type de baccalauréat. Comme pour la moyenne obtenue au baccalauréat,
cela est plus pertinent en matière de comparaison.
-le type de baccalauréat : économie-gestion, lettres, mathématiques, sciences expérimentales
et techniques.
-la position géographique : nous faisons la distinction entre les régions du littoral et les
régions intérieures
-le milieu social : groupe plus aisé, groupe plus défavorisé et groupe libre
-le sexe
Il serait judicieux d’utiliser le logit multinomial.
Nous n’allons pas inclure la variable sexe dans le modèle comme les autres variables
explicatives. Nous allons plutôt effectuer des régressions multinomiales séparément pour les
filles et pour les garçons.
Le modèle utilisé dans ces deux régressions est le suivant :
Uij = +
où
i est l’indice qui représente l’individu (i = 1,…, 74398) ; j correspond au groupe de
domaine (j = 1,…,6)
Uij représente l’utilité du bachelier i s’il choisit le groupe de domaine j. L’individu i
choisira l’alternative qui maximise son utilité. Uij s’interprète comme une variable
latente dans notre modèle.
littorali est une variable binaire, baccalauréati et CSPi sont des vecteurs de variables
binaires.
baccalauréati = ( ) et = ( )
(Le baccalauréat économie-gestion est le baccalauréat de référence)
CSPi = ( ) et = ( )
(Le groupe défavorisé est le groupe de référence)
Nous supposons finalement que les ( ) i=1,…,74398 sont indépendantes et suivent une loi de
Gompertz.
20. 19
Ces tableaux ci-dessous représentent les coefficients et les écart-types entre
parenthèses, que nous avons obtenus pour les deux régressions (chez les garçons et chez les
filles). Le domaine de référence est celui des sciences sociales.
Ingénierie
Sciences
humaines
Santé
Sciences
fondamentales
Autres
Littoral
-0,277***
(0,041)
-0,188***
(0,055)
-0,289***
(0,066)
-0,631***
(0,058)
-0,241***
(0,053)
Lettres
-0,591***
(0,085)
3,456***
(0,088)
1,722***
(0,385)
1,718***
(0,117)
3,015***
(0,075)
Mathématiques
2,823***
(0,053)
-0,407***
(0,133)
5,683***
(0,250)
3,404***
(0,106)
0,892***
(0,095)
Sciences
Expérimentales
2,692 ***
(0,065)
0,384***
(0,194)
7,180***
(0.254)
3,642***
(0,114)
1,707***
(0,096)
Techniques
4,267***
(0,074)
0,962***
(0,251)
4,711***
(0,268)
3,280***
(0,129)
2,564***
(0,101)
fg
0,341***
(0,022)
-0,824***
(0,034)
1,041***
(0,189)
0,239***
(0,032)
-0,758***
(0,034)
Groupe Aisé
-0,288***
(0,044)
0,064
(0,064)
-0,727***
(0,069)
-0,881***
(0,068)
-0,185***
(0,061)
Groupe Libre
-0,700***
(0,085)
-0,434***
(0,154)
-1,011***
(0,129)
-1,289***
(0,149)
-0,528***
(0,134)
Table 13. Le modèle logit multinomial sans interaction (garçons) : les coefficients
Ingénierie
Sciences
humaines
Santé
Sciences
fondamentales
Autres
Littoral7
-0,200***
(0,032)
-0,106***
(0,033)
-0,181***
(0,042)
-0,419***
(0,048)
-0,268***
(0,036)
Lettres
-0,467***
(0,054)
3,009***
(0,044)
2,237***
(0,124)
1,800***
(0,128)
2,778***
(0,051)
Mathématiques
2,305***
(0,045)
-0,289***
(0,096)
5,155***
(0,123)
4,036***
(0,121)
1,089***
(0,076)
Sciences
Expérimentales
2,297***
(0,045)
0,656***
(0,069)
6 ,250***
(0,122)
4,424***
(0,119)
1,806***
(0,064)
Techniques
3,704***
(0,094)
0,691***
(0,176)
4,293***
(0,183)
3,979***
(0,171)
2,807***
(0,117)
fg
0,068***
(0,017)
-0,410***
(0,018)
1,160***
(0,022)
0,001
(0,028)
-0,516***
(0,021)
Groupe Aisé
-0,076***
(0,037)
0,310***
(0,041)
-0,508***
(0,048)
-0,322***
(0,055)
0,002
(0,044)
Groupe Libre
-0,293***
(0,072)
0,011
(0,087)
-0,802***
(0,093)
-0,740***
(0,122)
-0,029***
(0,096)
Table 14. Le modèle logit multinomial sans interaction (filles) : les coefficients
*significatif au seuil de 10%
**significatif au seuil de 5%
***significatif au seuil de 1%
21. 20
Nous remarquons que les signes des coefficients significatifs sont presque similaires
dans les deux régressions. Ainsi, l’impact que pourraient exercer le score, le choix du type de
baccalauréat et la catégorie socioprofessionnelle est similaire en termes d’effet (augmente ou
diminue la probabilité de choisir tel domaine par rapport au domaine de référence) chez les
garçons et chez les filles.
Etre sur le littoral plutôt que les régions intérieures fait diminuer la probabilité de
choisir chacun des autres domaines plutôt que les sciences sociales.
Le fait d’avoir un baccalauréat en mathématiques plutôt qu’économie-gestion
augmente la probabilité de choisir le domaine de l’ingénierie plutôt que le domaine des
sciences sociales, toutes choses égales par ailleurs. Le fait d’avoir un baccalauréat lettres
plutôt qu’économie-gestion diminue la probabilité de choisir l’ingénierie plutôt que les
sciences sociales. Pour un bachelier en sciences expérimentales, la probabilité de choisir la
santé plutôt que les sciences sociales augmente par rapport au bachelier en économie-gestion,
toutes choses égales par ailleurs. Enfin, avoir un baccalauréat en techniques plutôt
qu’économie-gestion augmente la probabilité de choisir tous les autres domaines plutôt que
les sciences sociales.
En général, une augmentation du score augmente la probabilité de choisir l’ingénierie
et la santé et diminue la probabilité de choisir les sciences humaines (par rapport aux sciences
sociales) pour les deux sexes, toutes choses égales par ailleurs. Pour les filles, l’impact du
score sur le choix du domaine des sciences fondamentales par rapport au domaine des
sciences sociales n’est pas significatif tandis que pour les garçons cet impact est positif.
Etre dans le groupe plus aisé plutôt que le groupe plus défavorisé fait augmenter la
probabilité de choisir les sciences humaines plutôt que les sciences sociales et fait diminuer la
probabilité de choisir les autres domaines.
Effets marginaux sur la prédiction après l’estimation
Pour voir plus en détail ce que donne le résultat de régression, nous proposons
d’étudier les effets marginaux. Ils nous permettent d’évaluer l’intensité des impacts des
différentes variables explicatives sur le choix du domaine.
Il est plus intéressant d’analyser les effets marginaux sur la probabilité prédite plutôt
que les coefficients ou les odds-ratios. En effet, selon le choix de domaine de référence, nous
obtiendrions des coefficients de régression (ainsi que les odds-ratios) différents, mais les
effets marginaux ne changent pas. Nous pouvons donc étudier directement les effets
marginaux sur les 6 groupes de domaine d’études. Il n’y a plus de domaine de référence.
Les deux tableaux ci-dessous, qui représentent les effets marginaux et les écart-types
entre parenthèses, se lisent de deux façons, soit verticalement, soit horizontalement. La lecture
colonne par colonne nous donne l’impact des différentes variables explicatives sur le choix
d’un domaine fixé. Si nous regardons les deux tableaux, lignes par lignes, nous pouvons
étudier l’impact d’une variable explicative sur plusieurs choix de domaines.
Nous fixons le seuil de 5% pour commenter les résultats.
23. 22
bacheliers choisissant ce domaine ne vont probablement pas prendre en compte leur position
géographique.
En moyenne, une augmentation du score, diminue la probabilité de choisir les sciences
humaines pour les filles (les sciences humaines et sociales pour les garçons). Elle augmente,
notamment, la probabilité de choisir la santé pour les filles et l’ingénierie pour les garçons.
Par rapport aux autres variables explicatives, le type de baccalauréat obtenu influence
beaucoup le choix de domaine d’études.
Faire un baccalauréat lettres plutôt qu’économie-gestion augmente de 30,2% la
probabilité de faire des sciences humaines pour les filles (24% pour les garçons) et diminue de
30,8% la probabilité de faire l’ingénierie pour les filles (49,8% pour les garçons).
Le fait d’avoir un baccalauréat mathématiques plutôt qu’économie-gestion fait
augmenter de 16,6% la probabilité de choisir l’ingénierie pour les garçons alors que pour les
filles, ce n’est pas significatif. Les filles qui ont un baccalauréat mathématiques plutôt
qu’économie-gestion s’orientent vers le domaine de la santé, la probabilité augmente de
44,5%, ce pourcentage est de 19,8% pour les garçons.
Les bacheliers en sciences expérimentales plutôt qu’en économie-gestion voient leur
probabilité de choisir santé augmenter de 55,9% pour les filles (52,8% pour les garçons).
Faire un baccalauréat techniques plutôt qu’économie-gestion fait augmenter de 47,3% la
probabilité de choisir l’ingénierie pour les garçons, ce pourcentage est de 27,2% pour les
filles.
Nous présentons ici quelques résultats principaux concernant les types de baccalauréat.
Les littéraires, surtout les filles, préfèrent les sciences humaines. Pour les bacheliers en
mathématiques, ils préfèrent l’ingénierie, les sciences fondamentales et la santé ; l’ingénierie
attire un peu plus de garçons, la santé et les sciences fondamentales attirent plus de filles. Les
bacheliers en sciences expérimentales préfèrent la santé et les sciences fondamentales, mais la
préférence pour la santé est plus grande. Les bacheliers en techniques sont attirés par
l’ingénierie et un peu la santé.
Les résultats avec les interactions
Nous soupçonnons qu’il puisse exister une interaction significative entre le score et le
libellé du baccalauréat. Selon le type de baccalauréat, le score joue un rôle différent pour le
choix des domaines d’études. Par exemple, prenons deux bacheliers avec un score faible, l’un
étant littéraire voulant faire des études de langues, l’autre est un bachelier en sciences
expérimentales souhaitant faire de la médecine. Intuitivement, le littéraire ne sera pas pénalisé
de la même ampleur que celui qui souhaiterait faire de la médecine. La médecine est un
domaine très sélectif.
Nous proposons d’estimer un modèle qui prend en compte les interactions entre le
score et le libellé du baccalauréat pour voir si nos interprétations changent :
Uij = +
Nous gardons toujours les sciences sociales comme domaine de référence.
25. 24
Techniques
*fg
1,050***
(0,151)
0,345
(0,325)
0,743***
(0,192)
-0,112
(0,204)
0,316
(0,200)
Groupe Aisé
-0,141***
(0,037)
0,274***
(0,041)
-0,627***
(0,507)
-0,314***
(0,507)
-0,028
(0,044)
Groupe Libre
-0,382***
(0,074)
-0,032
(0,088)
-0,973***
(0,101)
-0,740***
(0,122)
-0,328***
(0,096)
Table 18. Le modèle logit multinomial avec interaction (filles) : les coefficients
Par rapport au modèle sans interactions, les signes et les significativités des
coefficients représentants le littoral et le milieu social ne diffèrent pas, ainsi, il en est de même
pour les interprétations. Les signes des coefficients des types de baccalauréat sans interaction
restent inchangés. La prise en compte de l’interaction avec le score apporte plus
d’informations sur le choix d’études, sans contredire les résultats énoncés dans le modèle sans
interactions.
Le fait d’avoir fait un baccalauréat lettres plutôt qu’économie-gestion fait diminuer la
probabilité de choisir l’ingénierie aux sciences humaines. La variation du score pour un
bachelier littéraire n’affecte pas significativement cette diminution de probabilité. Faire un
baccalauréat lettres plutôt qu’économie-gestion fait augmenter la probabilité de choisir les
sciences humaines, cette augmentation est d’autant plus forte que le score augmente.
Le fait d’avoir un baccalauréat mathématiques plutôt qu’économie-gestion augmente
la probabilité de choisir le domaine de l’ingénierie et de la santé plutôt que le domaine des
sciences sociales, toutes choses égales par ailleurs. Cet effet est d’autant plus grand que le
score augmente. Avoir un baccalauréat mathématiques plutôt qu’économie-gestion augmente
la probabilité de choisir les sciences fondamentales aux sciences sociales, cette augmentation
s’atténue quand le score augmente.
Faire un baccalauréat en sciences expérimentales plutôt qu’en économie-gestion
augmente la probabilité de faire la santé au lieu des sciences sociales. Cette augmentation est
d’autant plus forte que le score augmente.
Avoir un baccalauréat techniques plutôt qu’économie-gestion fait augmenter la
probabilité de choisir l’ingénierie, cette augmentation est d’autant plus forte que le score
augmente.
Les vœux affectés
Nous travaillons maintenant avec les vœux affectés. Nous refaisons les mêmes
régressions pour voir s’il y a une différence remarquable entre l’explication du premier choix
de domaine (correspondant au premier vœu) et l’explication du domaine affecté
(correspondant au choix de filière affectée)8
.
Dans les deux cas : domaine du premier vœu et domaine affecté, presque tous les
coefficients gardent leur significativité et leur signe. En effet, le premier vœu et le vœu affecté
sont plus ou moins liés, ils sont dans la majorité des cas dans le même groupe de domaine. Le
tableau des effets marginaux9
pour le vœu affecté (sans prendre en compte les interactions)
8
Voir Annexe A10 et A11 pour le tableau des coefficients
9
Voir Annexe A12 et A13 pour le tableau des effets marginaux
26. 25
nous montre qu’il y a une différence entre l’intensité des effets dans les deux cas, mais les
conclusions générales sur le sens des effets (l’augmentation ou la diminution de la probabilité)
de choisir un tel groupe de domaine restent quasiment inchangées.
1.3. Le logit conditionnel
Nous expliquons maintenant le choix de domaine d’études (en utilisant le premier
vœu) par la durée d’études, le taux de chômage et la capacité d’accueil. Le taux de chômage
est issu d’une enquête sur les diplômés du supérieur (ce taux diffère avec le type du diplôme)
trois ans après l’obtention du diplôme.
Nos variables explicatives sont propres à chaque domaine. Le modèle logit
multinomial ne répond plus à notre besoin. Nous utiliserons le modèle logit conditionnel qui
nous permet de prendre en compte les variables explicatives alternatives spécifiques.
Vu que nous avons regroupé les filières en domaines, ensuite les domaines en 6
groupes de domaines au total, nous proposons de considérer la durée moyenne d’études, le
niveau de chômage moyen et la capacité moyenne. Plus précisément, pour chaque groupe de
domaine, la variable durée d’études (resp. chômage) prend la valeur moyenne des durées
d’études (resp. la moyenne du niveau de chômage) de toutes les filières comprises dans ce
groupe de domaine ; la variable capacité prend la valeur moyenne des capacités d’accueil de
tous les établissements pour les filières comprises dans ce groupe de domaine.
Nous présentons ci-dessous les valeurs que prennent nos variables explicatives selon
le groupe de domaine, ainsi que leurs moyennes et leurs écart-types :
Groupe de domaine Durée d’études Chômage Capacité
Ingénierie 2,80 28,60 51,31
Sciences sociales 2,85 38,00 59,45
Sciences humaines 3,32 41,00 83,70
Santé 3,40 35,48 64,88
Sciences fondamentales 3,00 34,00 45,00
Autre 2,98 38,62 55,65
Moyenne 3,058 35,950 53,958
(Ecart-type) (0,225) (3,977) (13,714)
Table 19. La moyenne de la durée d’études, du taux de chômage et de la capacité
Le modèle logit conditionnel que nous utilisons est le suivant :
Uij = β.Xj + i , i=1,… , 74398 ; j = 1,...,3
Où β = (β1 β2 β3) et Xij = Xj = ( )
Uij s’interprète comme l’utilité de l’individu i s’il prend l’alternative j. L’individu choisit
l’alternative j qui maximise son utilité.
Toutes les p-valeurs sont nulles, les coefficients sont tous significatifs. En général,
pour un domaine donné, plus la durée d’études et le niveau de chômage correspondants sont
élevés plus l’utilité de l’individu qui choisit ce domaine diminue. Par contre, plus la capacité
d’accueil augmente, plus l’utilité que donne ce domaine à l’individu augmente, plus sa
probabilité de choisir ce domaine est forte.
27. 26
Variable explicative Coefficient
Durée d’études
-1,974***
(0,025)
Chômage
-0,033***
(0,001)
Capacité
0,027***
(0,004)
Table 20. Le modèle logit conditionnel : les coefficients
Nous allons étudier les effets marginaux pour voir l’impact d’une variation de la durée
d’études, du niveau de chômage et de la capacité de chacun des domaines groupés sur le
comportement d’un bachelier face au choix de domaine d’études.
Variable
explicative
Domaine
Ingénierie
Science
sociales
Sciences
humaines
Santé
Sciences
fondam.
Autre
Duréed’études
Ingénierie
-0,3881
(0,0053)
0,1172
(0,0022)
0,0804
(0,0012)
0,0498
(0,0004)
0,0899
(0,0013)
0,0508
(0,0007)
Sciences
sociales
0,1171
(0,0022)
-0,3396
(0,0055)
0,0660
(0,0013)
0,0409
(0,0004)
0,0738
(0,0012)
0,0417
(0,0008)
Sciences
humaines
0,0804
(0,0012)
0,0660
(0,0013)
-0,2538
(0,0035)
0,0281
(0,0003)
0,0507
(0,0007)
0,0286
(0,0004)
Santé 0,0498
(0,0004)
0,0409
(0,0004)
0,0281
(0,0000)
-0,1678
(0,0009)
0,0314
(0,0001)
0,0177
(0,0001)
Sciences
Fondamentales
0,0899
(0,0013)
0,0738
(0,0012)
0,0507
(0,0007)
0,0314
(0,0001)
-0,2778
(0,0033)
0,0320
(0,0004)
Autre 0,0508
(0,0007)
0,0417
(0,0008)
0,0286
(0,0004)
0,0177
(0,0001)
0,0320
(0,0004)
-0,1708
(0,0022)
Chômage
Ingénierie -0,0065
(0,0002)
0,0020
(0,0001)
0,0014
(0,0000)
0,0008
(0,0000)
0,0015
(0,0001)
0,0009
(0,0000)
Sciences
sociales
0,0020
(0,0001)
-0,0057
(0,0002)
0,0011
(0,0000)
0,0007
(0,0000)
0,0012
(0,0000)
0,0007
(0,0000)
Sciences
humaines
0,0014
(0,0000)
0,0011
(0,0000)
-0,0043
(0,0001)
0,0005
(0,0000)
0,0009
(0,0000)
0,0005
(0,0000)
Santé 0,0008
(0,000)
0,0007
(0,0000)
0,0005
(0,0000)
-0,0028
(0,0001)
0,0005
(0,0000)
0,0003
(0,0000)
Sciences
Fondamentales
0,0015
(0,0001)
0,0012
(0,0000)
0,0009
(0,0000)
0,0005
(0,0000)
-0,0047
(0,0001)
0,0005
(0,0000)
Autre 0,0009
(0,0000)
0,0007
(0,0000)
0,0005
(0,0000)
0,0003
(0,0000)
0,0005
(0,0000)
-0,0029
(0,0001)
Capacité
Ingénierie 0,0053
(0,0009)
-0,0016
(0,0000)
-0,0011
(0,0000)
-0,0007
(0,0000)
-0,0012
(0,0000)
-0,0007
(0,0000)
Sciences
sociales
-0,0016
(0,0001)
0,0046
(0,0001)
-0,0009
(0,0000)
-0,0006
(0,0000)
-0,0010
(0,0000)
-0,0006
(0,0000)
Sciences
humaines
-0,0011
(0,0000)
-0,0090
(0,0000)
0,0035
(0,0001)
0,0004
(0,0000)
-0,0007
(0,0000)
-0,0004
(0,0000)
Santé -0,0007
(0,0000)
-0,0056
(0,0000)
-0,0004
(0,0000)
0,0023
(0,0000)
-0,0004
(0,0000)
-0,0002
(0,0000)
Sciences
Fondamentales
-0,0012
(0,0000)
-0,0010
(0,0000)
-0,0007
(0,0000)
-0,0004
(0,0000)
0,0038
(0,0001)
-0,0004
(0,0000)
Autre -0,0007
(0,0000)
-0,0006
(0,0000)
-0,0004
(0,0000)
-0,0002
(0,0000)
-0,0004
(0,0000)
0,0023
(0,0000)
Table 21. Le modèle logit conditionnel : les effets marginaux
Tous les résultats des effets marginaux sont significativement différents de 0 au seuil de 1%.
28. 27
Nous remarquons qu’un prolongement de la durée d’études d’un groupe de domaine
fait diminuer la probabilité de choisir ce groupe de domaine et fait augmenter la probabilité de
choisir chacun des autres groupes de domaines. Nous constatons le même type d’effet avec
une hausse du taux de chômage. Par contre, quand la capacité moyenne d’accueil d’un groupe
de domaine augmente, la probabilité pour un bachelier de choisir ce groupe de domaine
augmente, la probabilité de choisir des autres groupes de domaines diminue.
Nous constatons une baisse très forte de la probabilité de choisir l’ingénierie (38,81%)
quand la durée d’études moyenne pour ce domaine groupé se prolonge d’un an, toutes choses
égales par ailleurs. La probabilité de choisir chacun des autres groupes de domaines (à part
Autre et la santé) augmente environ de 10%.
Le prolongement d’un an de la durée d’études dans chacun des groupes de domaines
parmi les sciences sociales, les sciences humaines, la santé, les sciences fondamentales n’a
pas un effet très important sur la probabilité de choisir les groupes de domaines qui restent.
Toutes choses égales par ailleurs, une hausse de 1% du taux de chômage pour
n’importe quel groupe de domaine ne fait pas varier remarquablement la probabilité de choisir
un autre groupe de domaines (une diminution de 0,3% à 0,6% pour ce même groupe de
domaine et une augmentation de moins de 0,2% de la probabilité de choisir l’un des autres
groupes).
Toutes choses égales par ailleurs, une augmentation d’une place de la capacité
moyenne d’accueil pour un groupe de domaine donné, fait augmenter la probabilité de choisir
ce groupe de 0,23% à 0,53% et fait diminuer la probabilité de choisir chacun des autres
groupes de domaine d’environ 0,1% ou moins.
L’effet minime d’une augmentation d’une unité du taux de chômage ou de la capacité
d’accueil par rapport à l’effet d’une augmentation d’une unité de la durée d’études est
raisonnable. En effet, la durée d’études moyenne pour tous les domaines est d’environ 3 ans,
une augmentation d’un an correspond à un prolongement de 33% de la durée d’études totale.
Elle implique donc une variation très forte du choix du domaine d’études. Par contre, le
niveau moyen de chômage est de 35,95 % et la capacité moyenne d’accueil est à peu près de
54 places, une variation de 1% du taux de chômage ou une variation d’une place de la
capacité d’accueil ne modifie pas d’une manière importante la probabilité de choisir un tel
groupe de domaine. L’effet sera plus net si nous considérons une variation de 5 à 10 unités du
niveau de chômage ou de la capacité d’accueil.
Si nous regardons l’effet d’une variation de la durée d’études ou du taux de chômage
ou de la capacité d’un groupe de domaine sur la probabilité de choisir ce même groupe, nous
pouvons voir que l’ingénierie est le groupe le plus sensible et la santé est le groupe qui l’est le
moins.
Le résultat observé pour l’ingénierie est plus naturel car parmi les groupes de domaine,
l’ingénierie est caractérisé par la durée d’études la plus courte, le niveau de chômage le plus
faible et une capacité d’accueil assez limitée.
Ce qui est remarquable vient du groupe de domaine de la santé. Il paraît être le groupe
le moins sensible. Un changement d’un an de la durée d’études sur la probabilité de choisir ce
groupe de domaine a un effet plus faible par rapport aux autres groupes de domaine. C’est
tout à fait normal parce que la durée présente pour les études de santé est la plus grande parmi
29. 28
l’ensemble des groupes de domaine (3,4 ans). Par contre, le groupe de la santé a un niveau de
chômage moyen ainsi qu’une capacité d’accueil pas très élevée (elle est relativement faible
par rapport à celle des sciences humaines et plus proches des autres domaines). Or l’effet
direct d’un changement du niveau de chômage et de la capacité d’accueil sur la probabilité de
choisir la santé est plus faible que celui sur la probabilité de choisir les autres groupes. Nous
pouvons l’expliquer par la raison suivante : les élèves qui souhaitent faire médecine et plus
généralement une formation axée sur le milieu de la santé ont des résultats élevés. Ainsi, ils
sont donc moins sensibles au changement de capacité d’accueil et de taux de chômage que les
autres élèves.
2. Deuxième modèle : expliquer la durée des études (en considérant le premier vœu)
Il peut être pertinent d’expliquer le choix des études supérieures à travers la durée des
études. En effet, l’éducation est un investissement. La durée de cet investissement va
dépendre de sa « rentabilité » pour un individu rationnel. Nous verrons pourquoi certains
élèves investissent moins que d’autres et nous essayerons de décrire ceux qui investissent le
plus. Ainsi, nous proposons de régresser la durée des études sur le sexe, le littoral, le libellé du
baccalauréat, le score et la CSP. La variable à expliquer est binaire, elle vaut 0 si la durée des
études est inférieure ou égale à 3 ans et vaut 1 sinon.
Voici le modèle :
+
où
, si , l’individu i va choisir des études de longues durées.
Ui représente l’utilité du bachelier i s’il choisit de faire de longues études. Ui
s’interprète comme une variable latente dans notre modèle.
Nous supposons finalement que les ( ) i=1,…,74398 sont indépendantes et suivent une loi
logistique.
Odds-ratios Coefficients
Littoral 0,970
(0,021)
-0,030
(0,022)
Lettres 7,764***
(0,359)
2,049***
(0,046)
Mathématiques 10,366***
(0,491)
2,339***
(0,047)
Sciences expérimentales 8,965***
(0,424)
2,193***
(0,047)
Techniques 5,674***
(0,296)
1,736***
(0,052)
Sexe 1,415***
(0,032)
0,347***
(0,023)
Aisé 1,347***
(0,032)
0,298***
(0,024)
Libre 1,438***
(0,068)
0,363***
(0,047)
fg 2,941***
(0,001)
1,079***
(0,011)
Table 22. Les odds-ratios et les coefficients lorsque la variable dépendante est la durée
des études
30. 29
Les interprétations des coefficients
Pour un élève habitant sur le littoral, la probabilité de faire des études longues
diminue. Pour tous les autres types de baccalauréat, la probabilité de faire des études longues
augmente par rapport au baccalauréat de référence (économie-gestion), toutes choses égales
par ailleurs. Le fait que l’élève soit un garçon va augmenter la probabilité de faire des études
longues. Si le score augmente, la probabilité que l’élève fasse des études longues va
augmenter. Si l’élève est issu d’un milieu aisé, il a plus de chance de faire des études longues
qu’un élève issu d’un milieu défavorisé.
Les odds-ratios
Nous définissons la chance par la formule suivante : P (longues études|X)/P(courtes
études|X). L’odd-ratio est définit comme le rapport des chances. Pour l’obtenir, il suffit de
mettre le coefficient à l’exponentiel.
Pour la variable littorale, l’odd-ratio est de 0,97. Cela signifie, toutes choses égales par
ailleurs, que nous multiplions la chance de faire des études longues par 0,97 en étant sur le
littoral. Peu importe le type de baccalauréat, nous multiplions par un nombre supérieur à 5 la
chance de faire de longues études par rapport à un élève qui fait un baccalauréat économie-
gestion, toutes choses égales par ailleurs. Par exemple, un élève disposant d’un baccalauréat
mathématiques plutôt qu’un baccalauréat économie-gestion multipliera sa chance de faire des
études longues par 10,37. Nous pouvons voir également qu’un bachelier vivant dans un milieu
assez aisé aura plus de chance de faire de longues études qu’un bachelier issu d’un milieu plus
défavorisé. L’odd-ratio est de 1,347. Augmenter le score d’un point va « multiplier » la
chance de faire de longues études de 2,94 environ, toutes choses égales par ailleurs. Le fait
d’être un garçon plutôt qu’une fille va multiplier la chance de faire des études longues par
1,42 environ.
En résumé, le fait d’être sur le littoral ne donne pas plus de chances au bachelier de
faire des études longues. Le fait d'être titulaire d’un baccalauréat (lettres, mathématiques,
sciences fondamentales et techniques) donne une plus grande chance de faire des études
longues par rapport au baccalauréat de référence. Un garçon aura plus de chances de faire des
études longues qu’une fille. Vivre dans un milieu aisé par rapport à un milieu considéré plus
défavorisé augmente la chance de faire des études longues.
3. Troisième modèle : expliquer la formation (académique/professionnelle)
Nous distinguons les formations selon qu’elles soient professionnelles ou
académiques. Nous cherchons à expliquer les motivations d’orientations des bacheliers par
cette distinction. De même que pour la variable domaine, la construction a été faite par
recherche lexicographique.
Le modèle que nous estimons est le suivant :
+
où
, si , l’individu i va choisir des études à orientation professionnelle.
Ui représente l’utilité du bachelier i s’il choisit de faire des études professionnelles. Ui
s’interprète comme une variable latente dans notre modèle.
31. 30
Nous supposons finalement que les ( ) i=1,…,74398 sont indépendantes et suivent une loi
logistique.
Nous obtenons les coefficients suivants :
Odds-ratios Coefficients
Littoral 1,011
(0,017)
0,011
(0,016)
Lettres 0,339***
(0,008)
-1,083***
(0,024)
Mathématiques 0,596***
(0,015)
-0,518***
(0,025)
Sciences expérimentales 0,612***
(0,015)
-0,492***
(0,025)
Techniques 1,446***
(0,041)
0,369***
(0,028)
Sexe 1,049***
(0,018)
0,047***
(0,017)
Aisé 0,820***
(0,015)
-0,199***
(0,019)
Libre 0,799***
(0,032)
-0,225***
(0,040)
fg 0,666***
(0,006)
-0,407***
(0,009)
Table 23. Les odds-ratios et les coefficients quand la variable dépendante est le type de
la formation (pro./aca.)
Les interprétations des coefficients
Nous remarquons qu’au niveau standard de 1%, seul le coefficient devant la variable
littoral n’est pas significatif. Donc, la variable littoral n’a pas d’impact sur le fait de choisir
une formation plus professionnelle qu’académique. Le fait d’avoir un baccalauréat
mathématiques ou sciences expérimentales ou lettres par rapport à l’économie-gestion
diminue la probabilité de faire des études professionnelles. Le fait d’être titulaire d’un
baccalauréat techniques plutôt qu’économie-gestion augmente la probabilité de faire des
études professionnelles. Ce résultat nous paraît cohérent. Le fait d’être un garçon augmente la
probabilité de faire des études professionnelles.
Si le bachelier est issu d’un milieu aisé, sa probabilité de faire des études
professionnelles diminuera. Enfin, en augmentant le score, nous diminuons la probabilité de
faire des études professionnnelles.
Les odds-ratios
Pour commenter les résultats, nous fixons le seuil de 1%. Avoir obtenu un
baccalauréat lettres plutôt qu’économie-gestion, multiplie par 0,34 la chance de poursuivre
des études dans une filière professionnelle, toutes choses égales par ailleurs. Cette chance
augmente petit à petit pour les mathématiques et les sciences expérimentales (l’odd-ratio est
d’environ de 0,6 pour les deux baccalauréats), mais elle reste toujours faible par rapport à
l’économie-gestion. Pour les bacheliers en techniques, la chance de faire des études
professionnelles est multipliée par 1,45 par rapport à l’économie-gestion. Le fait d’être un
32. 31
garçon va multiplier par 1,05 la chance de faire des études professionnelles par rapport aux
filles. Si l’élève est dans un milieu aisé, sa chance de faire des études professionnelles va être
multipliée par 0,8 par rapport au milieu défavorisé. En augmentant le score, la chance de faire
des études professionnelles est multipliée par 0,7.
Pour résumé, la chance de faire des études professionnelles est plus faible pour les
littéraires par rapport au baccalauréat économie-gestion. Elle augmente pour les bacheliers en
techniques. Le bachelier diminue sa chance de poursuivre des études professionnelles, s’il est
issu d’un milieu aisé. Une augmentation de son score va réduire sa chance de faire des études
professionnelles.
33. 32
Conclusion
En expliquant le choix du domaine d’études par des caractéristiques individuelles
dans le premier modèle (logit multinomial), nous sommes arrivés aux résultats suivants.
Le type de baccalauréat obtenu va avoir une influence sur le choix du domaine
d’études, les bacheliers vont s’orienter vers des domaines qui sont compatibles avec le type de
baccalauréat.
La formule générale va également affecter le choix du domaine d’études. En
augmentant son score, l’élève pourra se permettre de s’orienter vers des domaines qui exigent
de résultats très élevés.
La position géographique du bachelier est aussi un facteur influent le choix du
domaine, en étant sur le littoral, l’élève s’intéressera plus aux sciences sociales.
Ces deux premiers faits sont valables pour les filles et les garçons.
La catégorie socioprofessionnelle du père joue un rôle dans le choix du domaine
d’études de l’élève, selon que l’élève soit issu d’un milieu aisé ou pas, il va avoir des choix
différents. Etre dans un milieu aisé conduira à un intérêt plus marquant pour les sciences
sociales (pour les garçons) et les sciences humaines (pour les filles) comparé aux autres
domaines.
Nous pouvons aussi expliquer le choix du domaine d’études par des caractéristiques
propres aux domaines (premier modèle : logit conditionnel).
D’une manière générale, si le taux de chômage et la durée d’études pour un domaine
augmente, les bacheliers seront moins attirés par celui-ci. Néanmoins, ce résultat n’est pas très
valable pour un domaine assez particulier : la santé.
En augmentant la capacité d’accueil d’un domaine, un engouement accentué naîtra de
la part des bacheliers pour ce domaine. Cela apparaît comme une réduction de contraintes
pour les bacheliers voyant dans le livret délivré par le ministère, la capacité d’accueil de la
filière augmenter.
Le choix des études supérieures peut aussi s’expliquer en considérant la durée des
études (deuxième modèle).
Une disparité apparaît entre les garçons et les filles, ces dernières ont moins de chance
de faire des études longues.
Un bachelier dont la catégorie socioprofessionnelle du père est parmi les métiers les
mieux payés, pourra s’offrir des études de longues durées.
Les bacheliers en économie-gestion sont destinés à faire des études de courtes durées.
Enfin, un résultat assez naturel, les élèves ayant un bon score s’aventureront vers des
études de longues durées.
L’orientation des bacheliers peut se voir en confrontant les cursus académiques aux
cursus professionnalisant.
L’adéquation entre le type de baccalauréat et le profil du cursus choisi est conservée,
les bacheliers en techniques vont s’orienter vers les cursus professionnels, ceux en
mathématiques vont préférer des parcours moins professionnels.
La catégorie socioprofessionnelle influence toujours le choix des étudiants, être dans
un milieu aisé diminue les chances de faire des études professionnelles.
Selon Beffy, Fougère et Maurel (2009), le revenu espéré après le diplôme n’est pas un
facteur important pour les étudiants français dans leur choix de majeures. Les salaires
attendus ne sont pas disponibles dans nos données, il aurait pu être intéressant de voir si ces
derniers auraient eu un effet marquant sur le choix d’études supérieures dans le cas tunisien.
34. 33
Les gouvernements cherchent à améliorer le système éducatif, ce sujet est toujours
d’actualité. En France, cette année, le site internet établi pour les inscriptions post-
baccalauréat précisera pour chaque formation le taux de poursuite des études et le taux
d’insertion professionnelle. Un numéro vert a été mis en place, par la secrétaire d’Etat à
l’Enseignement supérieur Geneviève Fioraso, pour guider les bacheliers et les familles sur
leur orientation.
35. 34
Bibliographie
Agasisti, Tommaso and Dal Bianco, Antonio (2007) “Determinants of College Student
Migration in Italy: Empirical Evidence from a Gravity Approach”. Available at
SSRN:http://ssrn.com/abstract=1063481 or http://dx.doi.org/10.2139/ssrn.1063481
Ani Katchova (2013) “Multinomial Probit and Logit Models, Conditional Logit Model,
Mixed Logit Model”
https://sites.google.com/site/econometricsacademy/econometrics-models/multinomial-probit-
and-logit-models
Baryla, E. A., and D. Dotterweich. (2001) “Student migration: Do significant factors vary
by region?” Education Economics 9(3):269-80
Beffy, Fougère et Maurel (2009) « L’impact du travail salarié des étudiants sur la réussite et
la poursuite des études universitaires », Document de travail, INSEE
Boudarbat, Montmarquette (2007) “Choice of Fields of Study of Canadian University
Graduates: The Role of Gender and their Parents’ Education”, IZA Discussion Paper No.
2552
Bruckmeier, Kerstin, Georg-Benedikt Fischer and Berthold U. Wigger (2013) "Does
Distance Matter? Tuition Fees and Enrollment of First-Year Students at German Public
Universities", CESifo Working Paper No. 4258, May 2013.
Christophe Hurlin (2003) Polycopié de Cours «Econométrie des Variables Qualitatives -
Chapitre 2 : Modèles Multinomiaux – Modèle Logit Multinomiaux Ordonnées et non
Ordonnés »
http://www.univ-orleans.fr/deg/masters/ESA/CH/Qualitatif_Chapitre2.pdf
Hastings, Justine S., Thomas J. Kane, and Douglas O. Staiger. (2006). “Gender and
Performance: Evidence from School Assignment by Randomized Lottery,” American
Economic Review Papers and Proceedings, 96(2):232-236.
Hoover-Dempsey, K.V., & Sandler, H.M. (1995). “Parental involvement in children's
education: Why does it make a difference?” Teachers College Record, 97, 310-331.
Kjellstrom and Regner (1998) “Does distance to a university affect enrollment decisions?
Evidence from data on three cohorts of Swedes”, Working paper 8/98, Institute for Social
Research, Stockholm University, Stockholm
Mixon (1992a) “Factors affecting college student migration across States”,International
Journal of Manpower
Mixon (1992b) “A public choice note on college student migration”,International Journal
of Manpower
Mixon and Hsing (1994a) “College student migration and human capital theory: a research
note”,Education Economics
36. 35
Mixon and Hsing (1994b) “The determinants of out out-of-state enrollments in higher
education”, Economics of Education Review
Ono (2001) “Migration patterns among Japanese university students”, Discussion paper,
Center for Economic Policy Research Conference of the European Network on the Japanese
Economy, University of Oxford, UK
Sa et al. (2004) “Determinants of the regional demand for higher education in the
Netherlands: a gravity model approach”, Regional Studies
Xavier D’Haultfœuille (2014) Polycopié Econométrie 2
47. 46
A14 – Test de l’hypothèse d’indépendance des états non pertinents (I.I.A.) : test
d’Hausman-McFadden
Dans le premier modèle de choix discret où nous expliquons le choix des différents
groupes de domaine d’études, nous avons soupçonné la non-vérification de l’hypothèse I.I.A
dans notre cas. Cependant, nous avons utilisé tout de même le logit multinomial et le logit
conditionnel. Nous proposons maintenant d’effectuer le test d’Hausman après les régressions
pour tester la validité de l’hypothèse I.I.A
L’idée du test d’Hausman est d’estimer le modèle en retirant une modalité et de
comparer les nouveaux paramètres avec ceux du modèle complet. Si I.I.A. est valide, les
paramètres ne changent pas significativement. Si I.I.A. n’est pas valide, les paramètres
changent significativement.
H0 : l’hypothèse I.I.A. est valide
H1 : l’hypothèse I.I.A. n’est pas valide
H = (̂ - ̂)’ [Var(̂) – Var(̂)]-1
(̂ - ̂)
où ̂ est le vecteur des coefficients estimés dans le modèle dont une modalité a été retirée et
̂ le vecteur de ces coefficients estimés dans le modèle complet. Var(̂) et Var(̂) sont des
matrices de variances-covariances estimées. Pour s’assurer l’inversibilité de [Var( ̂ ) –
Var(̂)], il faut peut-être restreindre le nombre de composantes des vecteurs ̂ et ̂.
Sous H0, la statistique H suit une distribution du χ2 à M degré de liberté (M étant le
rang de de [Var(̂) – Var(̂)]).
Test d’Hausman pour le modèle logit multinomial (premier vœu) sans interaction pour
pour les garçons :
Groupe de domaine omis χ2 Df P-valeur Evidence
Ingénierie 359,748 36 0 Contre H0
Sciences sociales -4,4.103
36 1 Pour H0
Sciences humaines 1280,260 27 0 Contre H0
Santé -3,9.103
27 1 Pour H0
Sciences fondamentales -3,5.103
27 1 Pour H0
Autre -5,4.103
27 1 Pour H0
Note : Df est le degré de liberté
pour les filles :
Groupe de domaine omis χ2 Df P-valeur Evidence
Ingénierie -188,837 36 1 Pour H0
Sciences sociales 410,515 36 0 Contre H0
Sciences humaines 407,039 36 0 Contre H0
Santé 973,412 36 0 Contre H0
Sciences fondamentales -283,353 36 1 Pour H0
Autre -162,832 36 1 Pour H0
Les résultats nous montrent que l’hypothèse I.I.A. n’est pas valide dans notre modèle.