Les nouvelles technologies de séquençage permettent d’explorer de nouveaux écosystèmes naturels, mais l’analyse de ces grands jeux de données complexes nécessite l’optimisation des pipelines bioinformatiques.
Dans les grottes d’Afrique centrale, les chauves-souris coexistent avec de nombreux insectes impliqués dans le cycle naturel des arbovirus et des hématozoaires. L’objectif de notre étude est d’identifier la nature et les fonctions actives des communautés microbiennes portées par ces insectes, en milieu cavernicole éloigné de l’activité humaine. Nous avons développé un pipeline pour l’étude du catalogue des ARNs oumétatranscriptomes des moustiques. Conçu pour être utilisé en local, il inclut une méthode de réduction exacte et une étape de soustraction in silico pour réduire la taille des échantillons. Il inclut des outils d’identification des ARNr 16S, 18S, 23S et 28S et des outils d’annotation fonctionnelle des ARNm. Sa performance a été évaluée sur 3 réplicats techniques et 18 jeux de paramètres tests. Comparé à une application web existante, ce pipeline montre une très bonne efficacité en temps d’analyse, une facilité d’accès aux paramètres, une bonne reproductibilité et précision d’analyse, et une meilleure lisibilité des résultats.
L’analyse d’un premier jeu de donnés révèle l’expression des gènes de microorganismes environnementaux et aussi de bactéries, virus et parasites, responsables de maladies infectieuses endémiques dans la région.