SlideShare a Scribd company logo
1 of 28
Download to read offline
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Optimisation d’une allocation mixte
Thomas Merly-Alpa, Antoine Rebecq (INSEE)
9`eme Colloque Francophone sur les Sondages - Gatineau
14 octobre 2016
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Sommaire
1 Introduction
2 Programme d’optimisation
3 Un exemple
4 Conclusion et extensions
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Allocation(s)
En sondages, une allocation est une ventilation d’une taille totale
d’´echantillon n entre plusieurs strates h ∈ H. Les allocations
obtenues nh sont choisies pour atteindre certains objectifs :
´Equipond´eration
Pr´ecision maximale
Pr´ecision sur des domaines de diffusion. . .
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Allocation mixte
On peut souhaiter combiner plusieurs de ces objectifs. L’allocation
mixte est souvent utilis´ee dans ce cadre. On a :
nmixte =
1
2
n1 +
1
2
n2 (1)
Ici, on utilisera l’allocation mixte entre Neyman et proportionnelle.
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Allocations mixtes
On ´etudie dans cette pr´esentation les allocations d´efinies ici :
nα = α · nProp + (1 − α) · nNeyman (2)
On souhaite choisir α de telle sorte que l’allocation soit optimale.
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Logique du programme
R´esolution pour l’allocation mixte
Le programme d’optimisation
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Logique du programme
R´esolution pour l’allocation mixte
Programme d’optimisation
On ´etudie les allocations d´efinies ici :
nα = α · nProp + (1 − α) · nNeyman (3)
Le programme de minimisation est le suivant :
min
α∈[0,1]
Disp(Poids)
´Equivalence
+λ Dist((nα), (nNeyman))
Sp´ecificit´e
(4)
o`u λ ∈ [0, +∞[ est `a sp´ecifier.
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Logique du programme
R´esolution pour l’allocation mixte
Respecter le plan de sondage initial
L’objectif de Sp´ecificit´e consiste `a respecter le plan de sondage
sp´ecifiquement cr´e´e pour l’enquˆete.
Ici, il s’agit de l’allocation de Neyman utilis´ee pour optimiser la
pr´ecision.
En pratique, on veut minimiser l’´ecart de l’´echantillon au plan de
sondage initial.
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Logique du programme
R´esolution pour l’allocation mixte
Minimiser la dispersion des poids
L’objectif d’´Equivalence consiste `a minimiser la dispersion des
poids (corrig´es de la non-r´eponse) :
Estimations multiples
Robustesse
Estimations ´econom´etriques
Correction de la non-r´eponse et calage
On utilise ici les poids initiaux.
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Logique du programme
R´esolution pour l’allocation mixte
Programme d’optimisation
Dans le cadre d’un sondage al´eatoire simple stratifi´e `a H strates,
on r´e´ecrit :
min
α∈[0,1]
H
h=1
nh
α
Nh
nh
α
− ¯p
2
+ λ Dist((nα), (nNeyman)) (5)
avec :
¯p =
H
h=1 nh
α
Nh
nh
α
n
=
N
n
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Logique du programme
R´esolution pour l’allocation mixte
Programme d’optimisation
On utilise la distance d´efinie de la fa¸con suivante :
Distm(x, y) = max
h≤H
|xh − yh|
Le second terme se r´e´ecrit comme un polynˆome en α, ici :
min
α∈[0,1]
H
h=1
nh
α
Nh
nh
α
−
N
n
2
+ λ · α (6)
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Logique du programme
R´esolution pour l’allocation mixte
Comment choisir λ ?
Le terme λ de l’´equation (8) est choisi pour limiter la variance de
l’estimation d’Horvitz-Thompson de X :
Th´eor`eme
Il existe un segment S ⊂ [0, +∞[ tel que :
α(S) = [0, 1], o`u α(λ) associe `a λ la solution du
programme 4.
V (λ), la fonction de variance pour l’allocation associ´ee `a
α(λ), est d´ecroissante sur S.
Sa d´eriv´ee seconde admet un maximum dans S qu’on appelle
point de torsion.
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Logique du programme
R´esolution pour l’allocation mixte
Forme du coude
La forme de la courbe est la suivante :
0 10000 20000 30000 40000 50000
1e+122e+123e+124e+125e+12
lambda
variancedel'estimateurdutotal
Varianceoftheestimatorofthetotalwealth
opt
lambda
Variancedel'estimateur
d'Horvitz-Thompson
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Contexte
R´esultats
Exemple
On s’int´eresse au tirage d’un ´echantillon de 1000 entreprises de
l’industrie selon diff´erents plans de sondages stratifi´es afin de
connaˆıtre le CA total du secteur. Le champ exact est d´efini comme
suit :
Entreprises actives situ´ees en France.
Entreprises dont l’effectif est compris entre 1 et 100.
Entreprises dont le code APE commence par un code division
entre 10 et 33 (sauf 12 et 19).
La population initiale est de 102 172 entreprises.
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Contexte
R´esultats
Exemple
Cette population est stratifi´ee selon deux crit`eres :
1 L’APE, au niveau division (deux premiers chiffres).
2 La tranche d’effectif, de la fa¸con suivante : 1 `a 9 salari´es ; 10
`a 19 salari´es ; 20 `a 49 salari´es ; 50 salari´es ou plus.
ce qui constitue 88 strates.
On calcule alors les allocations proportionnelle et de Neyman
relative `a la dispersion du chiffre d’affaires dans chacune de ces
strates, pour n = 1000.
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Contexte
R´esultats
Allocations initiales
Allocation Min M´ediane Max
Proportionnelle 1 3 278
Neyman 1 5 162
Allocation Prop. Neyman
Strate (10,1) 278 80
Strate (10,3) 18 162
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Contexte
R´esultats
M´ethode
On souhaite choisir l’allocation mixte optimale pour le probl`eme
pr´esent´e au paragraphe pr´ec´edent. Pour cela on proc`ede comme
suit :
Calculer pour diff´erentes valeurs de λ la valeur de α solution
du programme de minimisation.
Pour chaque α, calculer l’allocation correspondante.
Pour chacune des allocations, calculer analytiquement la
variance de l’estimateur d’Horvitz-Thompson du total du
chiffre d’affaire.
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Contexte
R´esultats
R´esultats
On obtient finalement la courbe suivante :
0.0e+00 5.0e+06 1.0e+07 1.5e+07 2.0e+07 2.5e+07 3.0e+07
1e+142e+143e+144e+145e+146e+14
Variancedel'estimateur
d'Horvitz-ThompsonduCA
lambda
On obtient λcoude = 1 · 107, ce qui donne α = 0.644.
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Contexte
R´esultats
Allocation obtenue
Allocation Min M´ediane Max
Proportionnelle 1 3 278
Coude 1 4 208
Mixte 1 4 179
Neyman 1 3 162
Allocation Prop. Coude Mixte Neyman
Strate (10,1) 278 208 179 80
Strate (10,3) 18 69 90 162
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Contexte
R´esultats
Allocation obtenue
Allocation Prop. Coude Mixte Neyman
σ( ˆT(CA)HT ) 24.7 12.5 11.4 9.8
Dispersion des poids 47.5 1929 3473 18585
Lorsque l’on compare l’allocation obtenue `a la strat´egie
mixte utilisant le facteur α = 1
2, on remarque que la perte
d’un facteur 1.1 en pr´ecision est compens´ee par le gain d’un
facteur 1.8 en dispersion des poids.
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Conclusions et extensions
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Conclusion
La m´ethode pr´esent´ee ici d´ecrit une allocation permettant de
proposer une pond´eration peu dispers´ee (li´e `a la qualit´e des
estimations multiples en sondages) tout en contrˆolant la pr´ecision
sur les principales statistiques d’int´erˆet.
Une extension logique de ce travail revient `a ´etudier les allocations
de Neyman avec prise en compte de contrainte de pr´ecision locale,
c’est `a dire lorsqu’on souhaite une pr´ecision minimale pour la
variable d’int´erˆet sur ces domaines.
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Conclusion
Merci pour votre attention !
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Annexes
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Principe de l’algorithme
L’algorithme CURIOS choisit l’´echantillon selon des contraintes
oppos´ees :
´Echantillon
Qualit´e
Sp´ecificit´e
´Equivalence
2
3
1
Dans la pratique, on choisit des termes de Qualit´e, Sp´ecificit´e et
´Equivalence qu’on int`egre `a un programme de minimisation.
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Programme d’optimisation
On d´etermine l’´echantillon en minimisant un programme de la
forme :
arg min
S
E [Disp(wCNR) + λ1 · Dist(S) + λ2 · Γ(S)] (7)
avec :
S = ´echantillon
wCNR = poids corrig´e de la non-r´eponse des unit´es de S
Γ(S) = mesure de l’´equilibre de l’´echantillon de r´epondants
λ1, λ2 ∈ [0, +∞[
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Programme d’optimisation
On simplifie ici le programme :
arg min
S
E [Disp(wCNR) + λ · Dist(S)] (8)
avec :
S = ´echantillon
wCNR = poids corrig´e de la non-r´eponse des unit´es de S
λ ∈ [0, +∞[
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
Introduction
Programme d’optimisation
Un exemple
Conclusion et extensions
Comment choisir λ ?
Le terme λ de l’´equation (8) doit ˆetre choisi pour limiter la
variance de l’estimation d’Horvitz-Thompson de X.
Th´eor`eme
Soit V (λ) la fonction de variance d’un estimateur du total de X
pour les tailles d’´echantillons ni
f (λ). Sous de bonnes hypoth`eses,
V (λ) est d´ecroissante et sa d´eriv´ee seconde admet un maximum
dans ]0, +∞[ qu’on appelle point de torsion de V (λ).
Ce point de torsion est difficile `a calculer.
T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte

More Related Content

Featured

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by HubspotMarius Sescu
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTExpeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 

Featured (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

Optimisation d'une allocation mixte

  • 1. Introduction Programme d’optimisation Un exemple Conclusion et extensions Optimisation d’une allocation mixte Thomas Merly-Alpa, Antoine Rebecq (INSEE) 9`eme Colloque Francophone sur les Sondages - Gatineau 14 octobre 2016 T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 2. Introduction Programme d’optimisation Un exemple Conclusion et extensions Sommaire 1 Introduction 2 Programme d’optimisation 3 Un exemple 4 Conclusion et extensions T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 3. Introduction Programme d’optimisation Un exemple Conclusion et extensions Allocation(s) En sondages, une allocation est une ventilation d’une taille totale d’´echantillon n entre plusieurs strates h ∈ H. Les allocations obtenues nh sont choisies pour atteindre certains objectifs : ´Equipond´eration Pr´ecision maximale Pr´ecision sur des domaines de diffusion. . . T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 4. Introduction Programme d’optimisation Un exemple Conclusion et extensions Allocation mixte On peut souhaiter combiner plusieurs de ces objectifs. L’allocation mixte est souvent utilis´ee dans ce cadre. On a : nmixte = 1 2 n1 + 1 2 n2 (1) Ici, on utilisera l’allocation mixte entre Neyman et proportionnelle. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 5. Introduction Programme d’optimisation Un exemple Conclusion et extensions Allocations mixtes On ´etudie dans cette pr´esentation les allocations d´efinies ici : nα = α · nProp + (1 − α) · nNeyman (2) On souhaite choisir α de telle sorte que l’allocation soit optimale. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 6. Introduction Programme d’optimisation Un exemple Conclusion et extensions Logique du programme R´esolution pour l’allocation mixte Le programme d’optimisation T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 7. Introduction Programme d’optimisation Un exemple Conclusion et extensions Logique du programme R´esolution pour l’allocation mixte Programme d’optimisation On ´etudie les allocations d´efinies ici : nα = α · nProp + (1 − α) · nNeyman (3) Le programme de minimisation est le suivant : min α∈[0,1] Disp(Poids) ´Equivalence +λ Dist((nα), (nNeyman)) Sp´ecificit´e (4) o`u λ ∈ [0, +∞[ est `a sp´ecifier. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 8. Introduction Programme d’optimisation Un exemple Conclusion et extensions Logique du programme R´esolution pour l’allocation mixte Respecter le plan de sondage initial L’objectif de Sp´ecificit´e consiste `a respecter le plan de sondage sp´ecifiquement cr´e´e pour l’enquˆete. Ici, il s’agit de l’allocation de Neyman utilis´ee pour optimiser la pr´ecision. En pratique, on veut minimiser l’´ecart de l’´echantillon au plan de sondage initial. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 9. Introduction Programme d’optimisation Un exemple Conclusion et extensions Logique du programme R´esolution pour l’allocation mixte Minimiser la dispersion des poids L’objectif d’´Equivalence consiste `a minimiser la dispersion des poids (corrig´es de la non-r´eponse) : Estimations multiples Robustesse Estimations ´econom´etriques Correction de la non-r´eponse et calage On utilise ici les poids initiaux. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 10. Introduction Programme d’optimisation Un exemple Conclusion et extensions Logique du programme R´esolution pour l’allocation mixte Programme d’optimisation Dans le cadre d’un sondage al´eatoire simple stratifi´e `a H strates, on r´e´ecrit : min α∈[0,1] H h=1 nh α Nh nh α − ¯p 2 + λ Dist((nα), (nNeyman)) (5) avec : ¯p = H h=1 nh α Nh nh α n = N n T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 11. Introduction Programme d’optimisation Un exemple Conclusion et extensions Logique du programme R´esolution pour l’allocation mixte Programme d’optimisation On utilise la distance d´efinie de la fa¸con suivante : Distm(x, y) = max h≤H |xh − yh| Le second terme se r´e´ecrit comme un polynˆome en α, ici : min α∈[0,1] H h=1 nh α Nh nh α − N n 2 + λ · α (6) T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 12. Introduction Programme d’optimisation Un exemple Conclusion et extensions Logique du programme R´esolution pour l’allocation mixte Comment choisir λ ? Le terme λ de l’´equation (8) est choisi pour limiter la variance de l’estimation d’Horvitz-Thompson de X : Th´eor`eme Il existe un segment S ⊂ [0, +∞[ tel que : α(S) = [0, 1], o`u α(λ) associe `a λ la solution du programme 4. V (λ), la fonction de variance pour l’allocation associ´ee `a α(λ), est d´ecroissante sur S. Sa d´eriv´ee seconde admet un maximum dans S qu’on appelle point de torsion. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 13. Introduction Programme d’optimisation Un exemple Conclusion et extensions Logique du programme R´esolution pour l’allocation mixte Forme du coude La forme de la courbe est la suivante : 0 10000 20000 30000 40000 50000 1e+122e+123e+124e+125e+12 lambda variancedel'estimateurdutotal Varianceoftheestimatorofthetotalwealth opt lambda Variancedel'estimateur d'Horvitz-Thompson T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 14. Introduction Programme d’optimisation Un exemple Conclusion et extensions Contexte R´esultats Exemple On s’int´eresse au tirage d’un ´echantillon de 1000 entreprises de l’industrie selon diff´erents plans de sondages stratifi´es afin de connaˆıtre le CA total du secteur. Le champ exact est d´efini comme suit : Entreprises actives situ´ees en France. Entreprises dont l’effectif est compris entre 1 et 100. Entreprises dont le code APE commence par un code division entre 10 et 33 (sauf 12 et 19). La population initiale est de 102 172 entreprises. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 15. Introduction Programme d’optimisation Un exemple Conclusion et extensions Contexte R´esultats Exemple Cette population est stratifi´ee selon deux crit`eres : 1 L’APE, au niveau division (deux premiers chiffres). 2 La tranche d’effectif, de la fa¸con suivante : 1 `a 9 salari´es ; 10 `a 19 salari´es ; 20 `a 49 salari´es ; 50 salari´es ou plus. ce qui constitue 88 strates. On calcule alors les allocations proportionnelle et de Neyman relative `a la dispersion du chiffre d’affaires dans chacune de ces strates, pour n = 1000. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 16. Introduction Programme d’optimisation Un exemple Conclusion et extensions Contexte R´esultats Allocations initiales Allocation Min M´ediane Max Proportionnelle 1 3 278 Neyman 1 5 162 Allocation Prop. Neyman Strate (10,1) 278 80 Strate (10,3) 18 162 T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 17. Introduction Programme d’optimisation Un exemple Conclusion et extensions Contexte R´esultats M´ethode On souhaite choisir l’allocation mixte optimale pour le probl`eme pr´esent´e au paragraphe pr´ec´edent. Pour cela on proc`ede comme suit : Calculer pour diff´erentes valeurs de λ la valeur de α solution du programme de minimisation. Pour chaque α, calculer l’allocation correspondante. Pour chacune des allocations, calculer analytiquement la variance de l’estimateur d’Horvitz-Thompson du total du chiffre d’affaire. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 18. Introduction Programme d’optimisation Un exemple Conclusion et extensions Contexte R´esultats R´esultats On obtient finalement la courbe suivante : 0.0e+00 5.0e+06 1.0e+07 1.5e+07 2.0e+07 2.5e+07 3.0e+07 1e+142e+143e+144e+145e+146e+14 Variancedel'estimateur d'Horvitz-ThompsonduCA lambda On obtient λcoude = 1 · 107, ce qui donne α = 0.644. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 19. Introduction Programme d’optimisation Un exemple Conclusion et extensions Contexte R´esultats Allocation obtenue Allocation Min M´ediane Max Proportionnelle 1 3 278 Coude 1 4 208 Mixte 1 4 179 Neyman 1 3 162 Allocation Prop. Coude Mixte Neyman Strate (10,1) 278 208 179 80 Strate (10,3) 18 69 90 162 T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 20. Introduction Programme d’optimisation Un exemple Conclusion et extensions Contexte R´esultats Allocation obtenue Allocation Prop. Coude Mixte Neyman σ( ˆT(CA)HT ) 24.7 12.5 11.4 9.8 Dispersion des poids 47.5 1929 3473 18585 Lorsque l’on compare l’allocation obtenue `a la strat´egie mixte utilisant le facteur α = 1 2, on remarque que la perte d’un facteur 1.1 en pr´ecision est compens´ee par le gain d’un facteur 1.8 en dispersion des poids. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 21. Introduction Programme d’optimisation Un exemple Conclusion et extensions Conclusions et extensions T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 22. Introduction Programme d’optimisation Un exemple Conclusion et extensions Conclusion La m´ethode pr´esent´ee ici d´ecrit une allocation permettant de proposer une pond´eration peu dispers´ee (li´e `a la qualit´e des estimations multiples en sondages) tout en contrˆolant la pr´ecision sur les principales statistiques d’int´erˆet. Une extension logique de ce travail revient `a ´etudier les allocations de Neyman avec prise en compte de contrainte de pr´ecision locale, c’est `a dire lorsqu’on souhaite une pr´ecision minimale pour la variable d’int´erˆet sur ces domaines. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 23. Introduction Programme d’optimisation Un exemple Conclusion et extensions Conclusion Merci pour votre attention ! T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 24. Introduction Programme d’optimisation Un exemple Conclusion et extensions Annexes T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 25. Introduction Programme d’optimisation Un exemple Conclusion et extensions Principe de l’algorithme L’algorithme CURIOS choisit l’´echantillon selon des contraintes oppos´ees : ´Echantillon Qualit´e Sp´ecificit´e ´Equivalence 2 3 1 Dans la pratique, on choisit des termes de Qualit´e, Sp´ecificit´e et ´Equivalence qu’on int`egre `a un programme de minimisation. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 26. Introduction Programme d’optimisation Un exemple Conclusion et extensions Programme d’optimisation On d´etermine l’´echantillon en minimisant un programme de la forme : arg min S E [Disp(wCNR) + λ1 · Dist(S) + λ2 · Γ(S)] (7) avec : S = ´echantillon wCNR = poids corrig´e de la non-r´eponse des unit´es de S Γ(S) = mesure de l’´equilibre de l’´echantillon de r´epondants λ1, λ2 ∈ [0, +∞[ T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 27. Introduction Programme d’optimisation Un exemple Conclusion et extensions Programme d’optimisation On simplifie ici le programme : arg min S E [Disp(wCNR) + λ · Dist(S)] (8) avec : S = ´echantillon wCNR = poids corrig´e de la non-r´eponse des unit´es de S λ ∈ [0, +∞[ T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte
  • 28. Introduction Programme d’optimisation Un exemple Conclusion et extensions Comment choisir λ ? Le terme λ de l’´equation (8) doit ˆetre choisi pour limiter la variance de l’estimation d’Horvitz-Thompson de X. Th´eor`eme Soit V (λ) la fonction de variance d’un estimateur du total de X pour les tailles d’´echantillons ni f (λ). Sous de bonnes hypoth`eses, V (λ) est d´ecroissante et sa d´eriv´ee seconde admet un maximum dans ]0, +∞[ qu’on appelle point de torsion de V (λ). Ce point de torsion est difficile `a calculer. T. Merly-Alpa, A. Rebecq (INSEE) Optimisation d’une allocation mixte