Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Optimisation d'une allocation mixte

601 views

Published on

Présentation sur l'optimisation d'une allocation mixte, donnée au 9ème colloque francophone sondages, 14 octobre 2016.

Published in: Science
  • Be the first to comment

  • Be the first to like this

Optimisation d'une allocation mixte

  1. 1. Introduction Programme d’optimisation Un exemple Conclusion et extensions Optimisation d’une allocation mixte Thomas Merly-Alpa, Antoine Rebecq (INSEE) 9`eme Colloque Francophone sur les Sondages - Gatineau 14 octobre 2016 T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  2. 2. Introduction Programme d’optimisation Un exemple Conclusion et extensions Sommaire 1 Introduction 2 Programme d’optimisation 3 Un exemple 4 Conclusion et extensions T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  3. 3. Introduction Programme d’optimisation Un exemple Conclusion et extensions Allocation(s) En sondages, une allocation est une ventilation d’une taille totale d’´echantillon n entre plusieurs strates h ∈ H. Les allocations obtenues nh sont choisies pour atteindre certains objectifs : ´Equipond´eration Pr´ecision maximale Pr´ecision sur des domaines de diffusion. . . T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  4. 4. Introduction Programme d’optimisation Un exemple Conclusion et extensions Allocation mixte On peut souhaiter combiner plusieurs de ces objectifs. L’allocation mixte est souvent utilis´ee dans ce cadre. On a : nmixte = 1 2 n1 + 1 2 n2 (1) Ici, on utilisera l’allocation mixte entre Neyman et proportionnelle. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  5. 5. Introduction Programme d’optimisation Un exemple Conclusion et extensions Allocations mixtes On ´etudie dans cette pr´esentation les allocations d´efinies ici : nα = α · nProp + (1 − α) · nNeyman (2) On souhaite choisir α de telle sorte que l’allocation soit optimale. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  6. 6. Introduction Programme d’optimisation Un exemple Conclusion et extensions Logique du programme R´esolution pour l’allocation mixte Le programme d’optimisation T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  7. 7. Introduction Programme d’optimisation Un exemple Conclusion et extensions Logique du programme R´esolution pour l’allocation mixte Programme d’optimisation On ´etudie les allocations d´efinies ici : nα = α · nProp + (1 − α) · nNeyman (3) Le programme de minimisation est le suivant : min α∈[0,1] Disp(Poids) ´Equivalence +λ Dist((nα), (nNeyman)) Sp´ecificit´e (4) o`u λ ∈ [0, +∞[ est `a sp´ecifier. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  8. 8. Introduction Programme d’optimisation Un exemple Conclusion et extensions Logique du programme R´esolution pour l’allocation mixte Respecter le plan de sondage initial L’objectif de Sp´ecificit´e consiste `a respecter le plan de sondage sp´ecifiquement cr´e´e pour l’enquˆete. Ici, il s’agit de l’allocation de Neyman utilis´ee pour optimiser la pr´ecision. En pratique, on veut minimiser l’´ecart de l’´echantillon au plan de sondage initial. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  9. 9. Introduction Programme d’optimisation Un exemple Conclusion et extensions Logique du programme R´esolution pour l’allocation mixte Minimiser la dispersion des poids L’objectif d’´Equivalence consiste `a minimiser la dispersion des poids (corrig´es de la non-r´eponse) : Estimations multiples Robustesse Estimations ´econom´etriques Correction de la non-r´eponse et calage On utilise ici les poids initiaux. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  10. 10. Introduction Programme d’optimisation Un exemple Conclusion et extensions Logique du programme R´esolution pour l’allocation mixte Programme d’optimisation Dans le cadre d’un sondage al´eatoire simple stratifi´e `a H strates, on r´e´ecrit : min α∈[0,1] H h=1 nh α Nh nh α − ¯p 2 + λ Dist((nα), (nNeyman)) (5) avec : ¯p = H h=1 nh α Nh nh α n = N n T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  11. 11. Introduction Programme d’optimisation Un exemple Conclusion et extensions Logique du programme R´esolution pour l’allocation mixte Programme d’optimisation On utilise la distance d´efinie de la fa¸con suivante : Distm(x, y) = max h≤H |xh − yh| Le second terme se r´e´ecrit comme un polynˆome en α, ici : min α∈[0,1] H h=1 nh α Nh nh α − N n 2 + λ · α (6) T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  12. 12. Introduction Programme d’optimisation Un exemple Conclusion et extensions Logique du programme R´esolution pour l’allocation mixte Comment choisir λ ? Le terme λ de l’´equation (8) est choisi pour limiter la variance de l’estimation d’Horvitz-Thompson de X : Th´eor`eme Il existe un segment S ⊂ [0, +∞[ tel que : α(S) = [0, 1], o`u α(λ) associe `a λ la solution du programme 4. V (λ), la fonction de variance pour l’allocation associ´ee `a α(λ), est d´ecroissante sur S. Sa d´eriv´ee seconde admet un maximum dans S qu’on appelle point de torsion. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  13. 13. Introduction Programme d’optimisation Un exemple Conclusion et extensions Logique du programme R´esolution pour l’allocation mixte Forme du coude La forme de la courbe est la suivante : 0 10000 20000 30000 40000 50000 1e+122e+123e+124e+125e+12 lambda variancedel'estimateurdutotal Varianceoftheestimatorofthetotalwealth opt lambda Variancedel'estimateur d'Horvitz-Thompson T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  14. 14. Introduction Programme d’optimisation Un exemple Conclusion et extensions Contexte R´esultats Exemple On s’int´eresse au tirage d’un ´echantillon de 1000 entreprises de l’industrie selon diff´erents plans de sondages stratifi´es afin de connaˆıtre le CA total du secteur. Le champ exact est d´efini comme suit : Entreprises actives situ´ees en France. Entreprises dont l’effectif est compris entre 1 et 100. Entreprises dont le code APE commence par un code division entre 10 et 33 (sauf 12 et 19). La population initiale est de 102 172 entreprises. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  15. 15. Introduction Programme d’optimisation Un exemple Conclusion et extensions Contexte R´esultats Exemple Cette population est stratifi´ee selon deux crit`eres : 1 L’APE, au niveau division (deux premiers chiffres). 2 La tranche d’effectif, de la fa¸con suivante : 1 `a 9 salari´es ; 10 `a 19 salari´es ; 20 `a 49 salari´es ; 50 salari´es ou plus. ce qui constitue 88 strates. On calcule alors les allocations proportionnelle et de Neyman relative `a la dispersion du chiffre d’affaires dans chacune de ces strates, pour n = 1000. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  16. 16. Introduction Programme d’optimisation Un exemple Conclusion et extensions Contexte R´esultats Allocations initiales Allocation Min M´ediane Max Proportionnelle 1 3 278 Neyman 1 5 162 Allocation Prop. Neyman Strate (10,1) 278 80 Strate (10,3) 18 162 T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  17. 17. Introduction Programme d’optimisation Un exemple Conclusion et extensions Contexte R´esultats M´ethode On souhaite choisir l’allocation mixte optimale pour le probl`eme pr´esent´e au paragraphe pr´ec´edent. Pour cela on proc`ede comme suit : Calculer pour diff´erentes valeurs de λ la valeur de α solution du programme de minimisation. Pour chaque α, calculer l’allocation correspondante. Pour chacune des allocations, calculer analytiquement la variance de l’estimateur d’Horvitz-Thompson du total du chiffre d’affaire. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  18. 18. Introduction Programme d’optimisation Un exemple Conclusion et extensions Contexte R´esultats R´esultats On obtient finalement la courbe suivante : 0.0e+00 5.0e+06 1.0e+07 1.5e+07 2.0e+07 2.5e+07 3.0e+07 1e+142e+143e+144e+145e+146e+14 Variancedel'estimateur d'Horvitz-ThompsonduCA lambda On obtient λcoude = 1 · 107, ce qui donne α = 0.644. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  19. 19. Introduction Programme d’optimisation Un exemple Conclusion et extensions Contexte R´esultats Allocation obtenue Allocation Min M´ediane Max Proportionnelle 1 3 278 Coude 1 4 208 Mixte 1 4 179 Neyman 1 3 162 Allocation Prop. Coude Mixte Neyman Strate (10,1) 278 208 179 80 Strate (10,3) 18 69 90 162 T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  20. 20. Introduction Programme d’optimisation Un exemple Conclusion et extensions Contexte R´esultats Allocation obtenue Allocation Prop. Coude Mixte Neyman σ( ˆT(CA)HT ) 24.7 12.5 11.4 9.8 Dispersion des poids 47.5 1929 3473 18585 Lorsque l’on compare l’allocation obtenue `a la strat´egie mixte utilisant le facteur α = 1 2, on remarque que la perte d’un facteur 1.1 en pr´ecision est compens´ee par le gain d’un facteur 1.8 en dispersion des poids. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  21. 21. Introduction Programme d’optimisation Un exemple Conclusion et extensions Conclusions et extensions T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  22. 22. Introduction Programme d’optimisation Un exemple Conclusion et extensions Conclusion La m´ethode pr´esent´ee ici d´ecrit une allocation permettant de proposer une pond´eration peu dispers´ee (li´e `a la qualit´e des estimations multiples en sondages) tout en contrˆolant la pr´ecision sur les principales statistiques d’int´erˆet. Une extension logique de ce travail revient `a ´etudier les allocations de Neyman avec prise en compte de contrainte de pr´ecision locale, c’est `a dire lorsqu’on souhaite une pr´ecision minimale pour la variable d’int´erˆet sur ces domaines. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  23. 23. Introduction Programme d’optimisation Un exemple Conclusion et extensions Conclusion Merci pour votre attention ! T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  24. 24. Introduction Programme d’optimisation Un exemple Conclusion et extensions Annexes T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  25. 25. Introduction Programme d’optimisation Un exemple Conclusion et extensions Principe de l’algorithme L’algorithme CURIOS choisit l’´echantillon selon des contraintes oppos´ees : ´Echantillon Qualit´e Sp´ecificit´e ´Equivalence 2 3 1 Dans la pratique, on choisit des termes de Qualit´e, Sp´ecificit´e et ´Equivalence qu’on int`egre `a un programme de minimisation. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  26. 26. Introduction Programme d’optimisation Un exemple Conclusion et extensions Programme d’optimisation On d´etermine l’´echantillon en minimisant un programme de la forme : arg min S E [Disp(wCNR) + λ1 · Dist(S) + λ2 · Γ(S)] (7) avec : S = ´echantillon wCNR = poids corrig´e de la non-r´eponse des unit´es de S Γ(S) = mesure de l’´equilibre de l’´echantillon de r´epondants λ1, λ2 ∈ [0, +∞[ T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  27. 27. Introduction Programme d’optimisation Un exemple Conclusion et extensions Programme d’optimisation On simplifie ici le programme : arg min S E [Disp(wCNR) + λ · Dist(S)] (8) avec : S = ´echantillon wCNR = poids corrig´e de la non-r´eponse des unit´es de S λ ∈ [0, +∞[ T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  28. 28. Introduction Programme d’optimisation Un exemple Conclusion et extensions Comment choisir λ ? Le terme λ de l’´equation (8) doit ˆetre choisi pour limiter la variance de l’estimation d’Horvitz-Thompson de X. Th´eor`eme Soit V (λ) la fonction de variance d’un estimateur du total de X pour les tailles d’´echantillons ni f (λ). Sous de bonnes hypoth`eses, V (λ) est d´ecroissante et sa d´eriv´ee seconde admet un maximum dans ]0, +∞[ qu’on appelle point de torsion de V (λ). Ce point de torsion est difficile `a calculer. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte

×