3. La prédiction des valeurs génétiques
(1)
18 octobre 2022
Rapport annuel
3
• Le sujet fil rouge du WCGALP, de nombreuses sessions
• Intégration de l’information étrangère en évaluation Single-Step
Problème des animaux génotypés sans information pedigree
• Utilisation des méta-fondateurs en évaluation multi-race et Single-Step
Ancêtre virtuel qui permet de relier des groupes d’individus non liés par leur pedigree.
Une méthode élégante pour assurer la cohérence entre marqueurs et pedigree
• Evaluation génétique des animaux croisés
Comment gérer l’origine raciale des allèles? Comment estimer l’hétérosis?
• Les modèles de transmissibilité (I David) :
Généralisation des prédictions à partir d’information d’apparentés
Adapté pour une utilisation sur données microbiote, épigénétique…
• Et côté UMT ?
• Présentation de P. Croiseau sur l’évaluation génomique en croisement (cf R. Saintilan)
• (Présentation d’Ana Guillenea sur les données irlandaises)
• Présentation de F. Mollandin sur la prise en compte d’annotations fonctionnelles
• Doctorante INRAe GABI ayant soutenu le 28 Septembre 2022
4. La prédiction des valeurs génétiques
(2)
• Le single-step : Une préoccupation centrale pour de nombreuses équipes
• Application à de nouveaux caractères et/ou de nouvelles populations
• Comparaison des précisions single-step vs 2 étapes
• Estimation de la précision des index dans le contexte du single-step
• Discussion d’algorithmes de calcul
• Présentation de divers logiciels
• Et côté UMT ?
• Présentation de Roberta Rostellato sur les corrélations génétiques entre caractères
• Présentation de Laure-Hélène Maugan sur l’évaluation longévité combinée en single-
step
• Présentation de Didier Boichard sur le facteur d’érosion (cf webinaire de Mars)
• Présentation de Beatriz Cuyabano sur la prédiction de la précision des évaluations
5. La prédiction des valeurs génétiques
(3)
• Prédiction génomique par des outils d’Intelligence Artificielle (IA)
• Capable de traiter rapidement de grands jeux de données
• Capable de prendre en compte les effets non-additifs
• Débat sur leur apport :
Peu de gain de précision
Un système en boite noire complet
• Et côté UMT ?
• Un sujet traité dans le cadre du stage de M2 de Fatima Shokor
• Test d’un outil d’IA (Deep Learning) pour la réalisation d’évaluation génomique en race Holstein.
• Démarrage d’un doctorat au 1er Octobre 2022
6. Diversité génétique et
objectif de sélection
• Deux sujets globalement peu présents au congrès mondial
• Quasi absence du thème « objectif de sélection » (interne aux programmes ?)
• Des enquêtes terrains pour la définition des index de synthèse
• Discussion a posteriori sur le manque d’apport théorique sur ce sujet
• Le déterminisme de l’hétérosis
• Utilisation des échantillons de cryobanques dans les schémas de sélection
• La détection de la consanguinité locale (ROH) et le fardeau génétique
• Et en France ?
• Présentation de M. Bérodier sur les objectifs de sélection au niveau de l’élevage
• Une session présidée par Gwendal Restoux (INRAe, GABI) avec de nombreuses
présentations GABI
7. La génétique dans les tropiques
18 octobre 2022
Rapport annuel
7
• Des sessions dédiées
• Mais pas de sessions spécifiques sur la tolérance à la chaleur
• Intérêt de collaborer avec les acteurs locaux
• Phénotypage et sélection dans les conditions de production
• Démonstrations faites en monogastrique
• Et côté UMT ?
• Collaboration de Vincent Ducrocq avec l’Inde et l’Afrique du Sud
• Constitution et utilisation d’une population de référence femelle
• A. Guintard : Prise en compte de l’hétérogénéité des données en
évaluation
• M.G. Kinghorn : Interaction G*E en Afrique du Sud
8. La réponse à la sélection pour les
caractères de santé (1)
18 octobre 2022
Rapport annuel
8
• Contexte
• Un phénotype mesuré comme 0/1 : sain ou malade
• Prévalence : pourcentage d’animaux atteints
• D’un point de vue purement génétique quantitative :
• L’héritabilité est fonction de la prévalence de la maladie
• La variance génétique tend vers zéro quand la prévalence diminue
• Donc impossible d’éradiquer une maladie uniquement avec la
génétique
• Mais en expérience de sélection divergente
• -15% de prévalence vs +8% en valeur génétique
• +20% de prévalence vs +2% en valeur génétique
9. La réponse à la sélection pour les
caractères de santé (1)
• Intégration de notion d’épidémiologie dans la théorie de
la sélection pour les caractères de santé
• Deux papiers de Wageningen : P. Bijma, A D Hulst, M C M de
Jong
• Publiés dans Genetics en Avril 2021 et Janvier 2022
• Prise en compte de la réduction de la transmission
dans la réponse à la sélection
Animal infecté Animal susceptible
Susceptibilité
: probabilité
d’être infecté
après un
contact
Prévalence :
pourcentage
d’animaux
infectés
Transmission
Fonction de la
prévalence et de
la susceptibilité
10. La réponse à la sélection pour les
caractères de santé (3)
18 octobre 2022
Rapport annuel
10
• Simulation avec prise en compte de la transmission et de
variations génétiques de la susceptibilité
• Une baisse de la susceptibilité se traduit
par une diminution du risque de devenir
infectieux à son tour
• Moins d’individus infectés
• Moins de transmission
Diminution de la prévalence
• La sélection pour la résistance est plus efficace que ce que
prédit le gain de résistance, car il faut inclure l’impact sur R0
Nombre
d’
infectés
Prévalence
11. Gestion des
population
Evaluation génétique des
Bovins croisés
R. Saintilan, P. Croiseau, A. Baur,
I. Croué, V. Ducrocq, J.R. Thomasen,
E. Karaman, D. Boichard, H. Leclerc
et B.C.D. Cuyabano
12. Introduction
• Le croisement se développe dans les fermes laitières
• Opportunité de combiner les forces de nombreuses races
pures, de compenser leurs faiblesses tout en bénéficiant des
effets d’hétérosis
• En France actuellement, peu d’évaluations existent pour les
animaux croisés et seulement à des fins de croisements
terminaux
• Les programmes GenTORE (UE) et Evagenoc (Français) ont
pour objectif de développer une méthode d’évaluation
génomique en croisement
• Premiers résultats d’une évaluation génomique en croisement
13. Méthodologie
A C Effet A = +10
Effet C = -5
Population de
référence race A
Génotypage
Estimation effets
marqueurs race A
14. Méthodologie
A C
A C
A C
Effet A = +10
Effet C = -5
Effet A = +8
Effet C = -7
Effet A = +2
Effet C = -1
15. Méthodologie
A C
A C
Effet A = ?
Effet C = ?
Origine A? Effet A =
?
Origine C? Effet C =
?
A: origine race rouge, bleu, vert ?
C: origine race rouge, bleu, vert ?
Deux possibilités:
1- si on dispose d’animaux croisés avec performances, on estime
les effets de marqueurs sur une population de référence
multiraciale+croisés
2- sinon on applique les effets des races pures
16. Méthodologie: estimation de
l’Origine Raciale des Allèles
• BOA: Breed of Origin (Eirikson et al., 2021) principe équivalent dans le logiciel INRAE
OrigRace
• Recodification des allèles portés par un animal croisé en fonction de la race pure qui a « donné »
cet allèle
• Estimation qui se base sur la comparaison des fréquences d’haplotypes de SNP consécutifs
entre population croisée et de races pures
Race d’Origine Allèle Original Allèle Recodifié
A A 1
A C 2
B A 3
B C 4
C A 5
C C 6
17. Méthodologie: Evaluation
Génomique
• Adaptation du modèle d’évaluation génomique SNP BLUP pour estimer pour un SNP
donné autant d’effet qu’il n’y a de races pures
• Avec
yi la performance de l’animal i
μ un vecteur de moyennes par race
pi,b la proportion de la race b dans le genome de l’individu i, estimée précédemment par l’approche BOA
βi,j,b vecteurs des effets de marqueurs
Xi,j,b contenu allélique du SNP j qui vient de la race b pour l’animal i, centré sur
les fréquences alléliques du SNP dans la race b
18. Méthodologie: Evaluation
Génomique
• ki,j,b et ni,j,b le nombre d’allèles “2” et le total de SNP j qui vient de la race b pour l’animal
i, respectivement
• fj,b est la fréquence de l’allèle “2” du SNP j dans la race b
allele 1 allele 2 k k k n n n X X X
1 1 0 0 0 1 1 0 -f -f 0
2 2 2 0 0 2 0 0 2-2f 0 0
2 1 0 0 1 1 0 1 -f 0 1-f
19. Données de l’étude
• Population de 5 238 animaux croisés génotypés
• Imputation et phasage des croisés à partir des informations de race pure
• Analyse de 5 caractères de production laitière avec ou sans correction pour les effets d’Hétérosis
LAIT, MP, MG, TB, TP
• Test avec 22 571 femelles avec performances et génotypées, dont 4 380 croisées
• Etude de validation: les 2 000 femelles croisées les plus jeunes avec performances constituent la
population de validation (mises en situation de candidat), les autres la population d’apprentissage
20. Résultats: origines raciales
• Sur la population de femelles croisées génotypées, 96% de leurs allèles ont eu une origine raciale
attribuée sans ambiguïté
48% des allèles proviennent de la Holstein, 34% de la Rouge Danoise et 14% de la
Montbéliarde
En comparaison, les origines raciales sur la base du pedigree sont 56%, 30% et 12%
Entre les deux types de compositions raciales, les corrélations sont très hautes entre 0.95 et
0.99
Mean Sd Mean Sd Correlation
Montbéliarde (Mo) 13.60% 20.00% 11.80% 19.20% 0.99
Holstein (Ho) 48.00% 19.40% 56.30% 20.20% 0.97
Red Danish (RD) 34.00% 17.80% 29.80% 17.80% 0.95
Breed composition with BOA Breed composition based on Pedigree
Breed of Origin
21. Résultats: évaluation génomique
• Sur la population d’apprentissage, les corrélations varient de 0.76 (TP) et 0.93 (QMP, QMG).
• Sur la population de validation, les corrélations varient de 0.35 à 0.65 et les pentes sont proches de 1.
• Les corrections pour les effets d’hétérosis ont peu d’impact, en apprentissage comme en validation
Corr Slope Corr Slope Corr Slope Corr Slope
milk yield 0.83 1.17 0.40 1.03 0.82 1.19 0.41 1.07
fat yield 0.80 1.20 0.36 1.09 0.78 1.22 0.38 1.15
protein yield 0.77 1.23 0.35 1.11 0.76 1.26 0.36 1.16
fat content 0.92 1.15 0.65 1.05 0.92 1.15 0.65 1.05
protein content 0.93 1.12 0.62 1.00 0.93 1.12 0.62 1.00
performances without Heterosis effect performances adjusted for Heterosis effect
Traits
Training Population Validation Population Training Population Validation Population
22. Conclusions & Perspectives
• Une des premières applications sur jeu de données réelles d’une évaluation génomique avec un
BLUP SNP en tenant compte des BOA
Imputation et phasage des animaux croisés sont nécessaires pour estimer les BOA
Bonne adéquation entre BOA et composition raciale sur la base des informations de pedigree
• Les évaluations montrent des précisions honorables pour des caractères de production
0.30 pour des caractères moyennement héritables (h²=0.30)
0.60 pour des caractères fortement héritables (h²=0.50)
• Des tests en cours pour améliorer le modèle :
Inclure les performances des taureaux de race pure
Inclure les effets SNP estimés en race pure
• Transfert et applications possibles à relativement court terme !
23.
24. Merci de votre attention
R. Saintilan, P. Croiseau, A. Baur, I. Croue, V. Ducrocq,
J.R. Thomasen, E. Karaman, D. Boichard, H. Leclerc et
B.C.D. Cuyabano
13 octobre 2022
UMT e-Bis
contact@umt-e-bis.com
Notes de l'éditeur
Fanny Mollandin:
Fanny s’est intéressée à l’exploitation de données d’annotations fonctionnelles (issues d’études indépendantes : GWAS, TWAS, mutation causales, …) dans des approches d’évaluations génomiques Bayésiennes.
Pour cela: Création d’un logiciel (BayesRCO) qui regroupe un grand nombre d’approches (BayesCpi, BayesR, BayesRC et 2 nouvelles approches qui autorisent des SNP à intégrer plusieurs annotations fonctionnelles : BayesRC+ et BayesRCpi).
Fanny a montré que ces approches permettent de mettre en avant les QTL et de réaliser la sélection sur ces QTL plutôt que sur des SNP en DL avec les mutations causales.
Romain: on renvoie à la présentation.
Laure-Hélène:
La thèse de Laure-Hélène vise à mettre en place une stratégie permettant de réaliser une évaluation génomique Single Step de ce caractère.
Une première étape à cette évaluation est de s’assurer que les caractères impliqués pour créer cet index combinés sont corrélés génétiquement. Ces travaux ont été réalisés par Roberta Rostellato.
Béa:
Beatriz s’est intéressée aux limites théoriques auxquelles nos prédictions génomiques sont soumises.
Une limite reconnue est la racine de l’héritabilité mais en fait cette limite n’est jamais atteinte car l’information génomique utilisée n’est pas optimale.
Dans cette étude, Beatriz propose une mesure juste de cette limite en incluant ou non l’information du facteur d’érosion.
Didier:
Déjà présenté, je ne ferai que l’évoquer.
Les approches d’intelligence artificielle et en particulier le Deep Learning consistent à mimer le fonctionnement de nos neurones :
De nombreuses cellules interconnectées via des synapses et qui, en fonction du signal reçu, s’activent ou non.
A l’échelle de nos données (des SNP), nous pouvons exploiter ces approches pour construire notre réseaux de neurones et estimer les poids qui interconnectent les « neurones ».
Ces approches sont aujourd’hui envisagées dans un relativement large panel d’études en lien avec la prédiction de caractère (analyse d’images; prédiction génomique; …).
Dans le cadre de la prédiction génomique, ces approches nous ouvrent la possibilité d’intégrer les effets non additifs dans nos modèles d’évaluations (dominance, interaction, heterosis, …).
Bien que ces effets soient non transmis à la génération suivante, ils pourraient participer à l’amélioration des prédictions génomiques.
Nous nous sommes emparés de cette thématique à travers un stage de M2, réalisé par Fatima Shokor, qui se poursuit par une thèse Cifre qui vient de démarrer.