Le visiteur utile : De la data à la connaissance - Thomas Leonetti - SEO CAM...
tests, investigations et études SEO - Alexis Rylko - SEO CAMP'us Paris 2021
1. Recherches dans le SEO:
tests, investigations et études SEO
Alexis Rylko, iProspect
2. Paris 2021 #seocamp
Cycle Tech SEO 2
ALEXIS RYLKO
Consultant SEO & Directeur technique SEO
iProspect France. Auteur de www.alekseo.com.
@alekseo
3. Paris 2021 #seocamp
Cycle Tech SEO
AU PROGRAMME
3
Typologie de recherches SEO
Données à utiliser
Protocole de test
Tests field et lab
Biais méthodologiques et cognitifs
Fichier .htaccess & volume redirections.
Rel canonical cross domaine est-il efficace ?
Google Cache et ses limites.
Google Actualités : quand Google refuse de lire ?
Google Discover : réduire la zone d’inconnu.
THEORIE PRATIQUE
4. Paris 2021 #seocamp
Cycle Tech SEO
Il était une fois en avril 2016
4
https://www.campaignlive.co.uk/article/just-say-it-future-search-voice-personal-digital-assistants/1392459
6. Paris 2021 #seocamp
Cycle Tech SEO 6
Et tout cela pour une étude qui n’a jamais existé
https://brodieclark.com/stop-using-comscores-2020-voice-search-stat/
7. Paris 2021 #seocamp
Cycle Tech SEO
Pourquoi y a-t-on cru aveuglément ?
7
Sujet
très tendance
Pénurie extrême
de statistiques
sur le sujet
Vague de
partages sur des
sources d’autorité
Mais aussi:
9. Paris 2021 #seocamp
Cycle Tech SEO
Pourquoi a-t-on besoin de faire des recherches dans le SEO?
9
La boîte noire de l’algorithme de Google.
L’algorithme qui se complexifie chaque année.
La documentation concise et qui suit les intérêts de Google.
La communication de Google pas toujours parfaite.
L’instabilité et volatilité.
10. Paris 2021 #seocamp
Cycle Tech SEO
Principaux types d’études en SEO
10
Types d’études SEO
Sondages Observations
Tests &
Expériences
Analyse
statistique
Prédictions
Régression
Corrélations
Arbres
décisionnels
Monitoring
11. Paris 2021 #seocamp
Cycle Tech SEO
Environnements de tests
11
Environnements de tests
Lab Terrain
Pages spécialement créées.
Environnement fermé.
Sans ou avec très peu de trafic.
Mots-clés réels ou inventés.
100% maîtrisable.
Pages existantes ou créées.
Avec un trafic réel et des positions SEO.
12. Paris 2021 #seocamp
Cycle Tech SEO
Quelles données utiliser pour les études ?
12
Données pour les études
Provenant de Google
Brutes Traitées
Provenant d’outils tiers
Brutes Traitées
Logs de serveur
SERPs de Google
Chrome DevTools
Mobile-friendly test
Dates de mises à jour
Google Search Console
Google Analytics
Score Lighthouse
Google NLP
Crawlers : Screaming Frog,
Botify, Oncrawl etc.
Nombre de backlinks et
domaines référents.
TrustFlow & CitationFlow
Domain Rating (Ahrefs)
Score YourTextGuru
Semrush Keyword Difficulty
Précision
13. Paris 2021 #seocamp
Cycle Tech SEO
La méthodologie est aussi importante que les résultats
13
Par exemple, il existe au moins 3 méthodes de calcul du taux de clics
et chacune a son droit d’exister:
14. Paris 2021 #seocamp
Cycle Tech SEO
Biais méthodologiques
14
Un biais méthodologique est une erreur dans la méthode scientifique, le non-respect
des règles de protocole, qui engendre des résultats erronés.
Biais de survivant
Biais de sélection
Biais de mesure
Biais de confusion
…
16. Paris 2021 #seocamp
Cycle Tech SEO
Combien de redirections peut-on mettre dans .htaccess ?
16
Protocole de test:
Hypothèse: Il existerait une limite du volume de lignes de redirections qu’on peut
ajouter dans le fichier .htaccess, à partir duquel celui-ci dégrade le temps de
chargement.
Environnement : Lab
Serveur mutualisé.
Nouveau sous-domaine.
Fichier html minimaliste.
.htaccess allourdi en continu de lignes de redirections.
Mesure :
Critère : TTFB.
Outil : Chrome DevTools (Connexion fibre vs 3G Fast).
Réserves : les résultats peuvent être différents sur des serveurs plus performants.
17. Paris 2021 #seocamp
Cycle Tech SEO
Combien de redirections peut-on mettre dans .htaccess ?
17
0
500
1000
1500
2000
2500
3000
3500
4000
4500
Nombre de redirections vs TTFB du fichier html cible
TTFB - Chrome - Fibre TTFB - Chrome - Fast 3G
18. Paris 2021 #seocamp
Cycle Tech SEO
Rel=Canonical cross domaine est-ce une solution fiable ?
18
Protocole de test:
Hypothèse: Dans le cas de la diffusion de nos contenus
sur des sites tiers, l’attribut rel canonical est-il une
solution fiable pour ne pas dégrader ses performances
SEO?
Environnement : Terrain (réel)
Méthodologie :
• 150k articles de Medium.com exportés au total.
• 2 876 articles ayant un canonical vers une source
externe.
• En-têtes H1 extraits et utilisés comme mots-clés.
• Positions comparées de l’article sur Medium et sur le
site d’origine.
Mesure :
• Critère : Position organique.
• Outil : Seranking.
19. Paris 2021 #seocamp
Cycle Tech SEO
Rel=Canonical cross domaine est une solution fiable ?
url canonical_domain medium_domain source_domain position_medium position_other keyword who_wins
https://medium.com/@alexismaron/preparing-for-change-656b72a6a6ef https://alexismaron.com/blog/2020/3/14/preparing-for-change medium.com alexismaron.com 29 - Preparing for Change medium
https://medium.com/@alexismaron/semper-gumby-9ea080dbafdc https://alexismaron.com/blog/2020/4/20/semper-gumby medium.com alexismaron.com - - Semper Gumby nobody ranks
https://medium.com/anatwine/our-name-in-lights-eb03c680c1a0 https://anatwine.com/brands/our-name-in-lights/ medium.com anatwine.com - - Our name in lights! nobody ranks
https://annejanzer.medium.com/anyone-can-write-but-e35ed2988743 https://annejanzer.com/universal-writer-myth/ annejanzer.medium.com annejanzer.com 40 2 Anyone Can Write But other
https://medium.com/the-winter-writer/defining-authorpreneur-78de202c4b9f https://authorboundpress.com/2020/10/13/episode-1-defining-authorpreneur/ medium.com authorboundpress.com 2 - Defining Authorpreneur medium
https://medium.com/the-winter-writer/self-care-for-authors-d6aa418d8214 https://authorboundpress.com/2020/12/08/episode-9-self-care-for-authors/ medium.com authorboundpress.com 7 - Self Care for Authors medium
https://medium.com/launchdarkly/all-the-pretty-ponies-f06dd9947998 https://blog.launchdarkly.com/all-the-pretty-ponies/ medium.com blog.launchdarkly.com - - All the Pretty Ponies nobody ranks
https://medium.com/@onshoreusa/innovation-in-america-6a9354f2f8d6 https://blog.onshoreoutsourcing.com/blog/innovation-in-america-onshore-brings-outsourcing-home
medium.com blog.onshoreoutsourcing.com 52 - Innovation in America medium
https://medium.com/@onshoreusa/the-onshore-experience-40644031e319 https://blog.onshoreoutsourcing.com/the-onshore-experience medium.com blog.onshoreoutsourcing.com 5 - The Onshore Experience medium
https://medium.com/@brian.stumbaugh519/making-a-scene-18269e3b3660 https://brianstumbaugh.net/?p=2157 medium.com brianstumbaugh.net - - Making a Scene nobody ranks
https://medium.com/@ChristopherSherrod/i-hate-voice-mail-6b705e29203d https://christophersherrod.com/i-hate-voice-mail/ medium.com christophersherrod.com 36 - I hate voice mail medium
https://geekasms.medium.com/my-2020-in-20-photos-fatherhood-reloaded-1981f9ac06cc https://fatherhoodreloaded.com/my-2020-in-20-photos/ geekasms.medium.com fatherhoodreloaded.com 1 - My 2020 in 20 Photos medium
https://medium.com/@wlc3/houston-we-have-landed-ea1281c988b3 https://gmi2.blogs.rice.edu/2017/11/10/houston-we-have-landed/ medium.com gmi2.blogs.rice.edu 53 - Houston we have landed medium
https://medium.com/@puneetjaink/apply-your-smarts-93b93e80b6f3 https://puneethsuraana.com/apply-your-smarts/ medium.com puneethsuraana.com - - Apply your smarts nobody ranks
https://medium.com/@puneetjaink/frame-your-time-b714dae6a57e https://puneethsuraana.com/frame-your-time/ medium.com puneethsuraana.com 10 - Frame your time medium
https://medium.com/@puneetjaink/routine-sets-you-free-b3135bb7c890 https://puneethsuraana.com/routine-sets-you-free/ medium.com puneethsuraana.com 64 - Routine sets you free! medium
https://medium.com/@puneetjaink/the-reward-3d52c138427f https://puneethsuraana.com/the-reward/ medium.com puneethsuraana.com - - The reward nobody ranks
https://medium.com/@puneetjaink/the-spotlight-shock-52dc19ee4f6a https://puneethsuraana.com/the-spotlight-shock/ medium.com puneethsuraana.com - - The spotlight shock! nobody ranks
https://medium.com/@puneetjaink/turning-pro-f3ebc67a8d45 https://puneethsuraana.com/turning-pro/ medium.com puneethsuraana.com 22 - Turning pro? medium
https://medium.com/@raspi.kidd/using-the-radio-deb99560a736 https://raspikidd.com/using-the-radio/ medium.com raspikidd.com - - Using The Radio nobody ranks
https://stuckonsw.medium.com/run-to-the-cloud-d00f1aae8322 https://stuckonsocialwork.com/2018/03/06/run-to-the-cloud/ stuckonsw.medium.com stuckonsocialwork.com 3 - Run To The Cloud? medium
https://stuckonsw.medium.com/stuck-on-algorithms-91aa6ae2d778 https://stuckonsocialwork.com/2019/06/20/algorithms/ stuckonsw.medium.com stuckonsocialwork.com 10 3 Stuck On Algorithms other
https://medium.com/pragmatic-programmers/doing-interviews-48a2bf55f930 https://theengineeringmanager.com/management-101/doing-interviews/ medium.com theengineeringmanager.com - - Doing Interviews nobody ranks
https://medium.com/pragmatic-programmers/feeling-productive-23b2568996de https://theengineeringmanager.com/management-101/feeling-productive/ medium.com theengineeringmanager.com 9 - Feeling Productive medium
https://becalewis.medium.com/be-a-life-gambler-f23cda381db1 https://theshift.com/the-shift-ezine/2017/11/20/be-a-life-gambler/ becalewis.medium.com theshift.com 3 - Be A Life Gambler medium
https://medium.com/know-thyself-heal-thyself/what-to-write-for-1b1ebf34ada1 https://www.authorkaseymarie.com/2021/08/what-to-write-for.html medium.com www.authorkaseymarie.com 32 - What To Write For medium
https://medium.com/@perpetua/a-new-state-of-mind-60619a1fd31a https://www.fluxblog.org/2021/06/a-new-state-of-mind/ medium.com www.fluxblog.org 92 - A New State Of Mind medium
https://babystepping.medium.com/the-nature-of-the-tell-1d78a45a867c https://www.frequencyoffullness.com/2016/06/the-nature-of-tell.html babystepping.medium.com www.frequencyoffullness.com 10 - The Nature of the Tell medium
https://humanparts.medium.com/shadowplaces-part-one-a3af1ecc5e39 https://www.mariagorre.com/work/shadowplaces/ humanparts.medium.com www.mariagorre.com - - Shadowplaces nobody ranks
https://medium.com/@nicholasmrnickmorris/free-food-with-react-9fe739aec9c8 https://www.nickmorris.life/blog/free-food-with-react/ medium.com www.nickmorris.life 2 - Free Food With React medium
https://medium.com/@quali/speaking-of-sandboxes-da48d74a8d3c https://www.quali.com/blog/speaking-of-sandboxes/ medium.com www.quali.com 1 - Speaking of Sandboxes medium
https://medium.com/@analualp/nanowrimo-2018-172e338b9b20 https://analusrandomthingsandthoughts.wordpress.com/2018/12/02/nanowrimo-2018/
medium.com analusrandomthingsandthoughts.wordpress.com
19 - NaNoWriMo 2018 medium
A quoi ressemble le tableau d’analyse :
20. Paris 2021 #seocamp
Cycle Tech SEO
Qui se positionne mieux : Medium ou la source ?
Medium
36%
Source
42%
Nobody ranks
22%
21. Paris 2021 #seocamp
Cycle Tech SEO
Mais peut-être le problème n’est pas dans rel canonical ?
Vérifions aussi l’état technique des pages vers lesquelles pointe rel canonical.
22. Paris 2021 #seocamp
Cycle Tech SEO
Indexabilité des pages canoniques
Medium se positionne Source se positionne
Rel canonical ignoré Rel canonical respecté
Rel canonical n’est pas respecté en cas de problèmes techniques sur la page de destination.
27% 59%
indexable indexable
23. Paris 2021 #seocamp
Cycle Tech SEO 23
Est-ce que le fait d’ajouter un lien vers la source va aider ?
0
50
100
150
200
250
300
350
Medium Source
Un lien direct vers la source augmente fortement ses chances d’être considéré comme l’original.
24. Paris 2021 #seocamp
Cycle Tech SEO 24
Qui se positionne : Medium, source ou les 2?
27%
25%
22%
14%
12%
0%
5%
10%
15%
20%
25%
30%
Source seule Medium seul Les deux en 1ère
page
Aucun Les deux
Dans 52% des cas Google ne positionne qu’une des pages, envoyant l’autre dans les oubliettes.
25. Paris 2021 #seocamp
Cycle Tech SEO
Google Actualités : quand Google refuse de lire nos articles ?
25
Problème :
Certains articles de 20minutes.fr ne passaient pas ou étaient peu visibles
dans Google Actualités.
Investigation :
Vérifier s’il y a des problèmes de lecture d’articles par Google et si oui c’est
quoi la cause.
26. Paris 2021 #seocamp
Cycle Tech SEO
Google Actualités : quand Google refuse de lire nos articles ?
26
1. Nous avons pris un échantillon de 70 articles toutes thématiques confondues et les
avons soumis dans l’outil de dépannage d’articles dans
https://partnerdash.google.com/ (n’existe plus depuis 2019 ). L’objectif était de
vérifier si Google arrivait extraire correctement le contenu des articles.
2. A l’issue de chaque soumission nous avons noté tous les cas de troncature d’articles et
l’élément qui l’a provoquée.
27. Paris 2021 #seocamp
Cycle Tech SEO 27
Quand Google refuse de lire nos articles ?
Sur 70 articles 18 ont été extraits entièrement, les 52
autres articles ont été tronqués.
Sur notre échantillon d’articles nous avons noté tous les
éléments en atteignant lesquels le robot de Google News
cessait de l’explorer plus loin:
Avant quel élément de la page l'article est tronqué? Nombre de cas
A lire aussi 32
Article complet 18
Texte du tweet 9
Avant <iframe id="twitter-widget-0" 7
Youtube 3
Avant <iframe id="twitter-widget-1" 1
29. Paris 2021 #seocamp
Cycle Tech SEO 29
Quand Google refuse de lire nos articles ?
Nous avons vérifié aussi quelques articles ne contenant pas d’encarts « Lire aussi ». Ceux-ci sont extraits
entièrement:
30. Paris 2021 #seocamp
Cycle Tech SEO
Google Discover : réduire la zone d’inconnu
30
Résultats 100% IA.
Pas de mots-clés.
Documentation ultraconcise.
Pas de possibilités de scraper
des échantillons larges.
Pas d’API, donc exports
manuels.
31. Paris 2021 #seocamp
Cycle Tech SEO
Et alors, avec toutes ces contraintes,
peut-on finalement apprendre quelque chose
sur le fonctionnement de Google Discover ?
32. Paris 2021 #seocamp
Cycle Tech SEO 32
Google Discover : tirons le maximum des données à notre disposition
33. Paris 2021 #seocamp
Cycle Tech SEO 33
Google Actualités
Google Discover
Donc, pour apparaître dans
Google Discover, il faut être
référencé dans Google
Actualités?
34. Paris 2021 #seocamp
Cycle Tech SEO 34
Google Actualités
Google Discover
Recherche Web
Non, il est juste question de
couverture des tendances qui
sont visibles à travers tous les
leviers SEO.
35. Paris 2021 #seocamp
Cycle Tech SEO 35
Combien de pages apparaissent dans Google Discover par jour?
0
50
100
150
200
250
300
350
400
450
500
Nombre de pages qui apparaissent dans Discover
Utilité: En cas de baisse de trafic depuis Google Discover,
analyser si réellement moins d’articles y apparaissent.
36. Paris 2021 #seocamp
Cycle Tech SEO 36
Quelle est la durée de vie des articles dans Google Discover ?
0%
5%
10%
15%
20%
25%
1 2 3 4 5 6 7 8 9 10 11 12 14 15 16
% d’articles par nombre de jours d’apparition dans Discover
Jours d'apparition dans Discover
59%
37. Paris 2021 #seocamp
Cycle Tech SEO 37
Quel est l’impact de la date de publication sur l’apparition dans Discover?
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
0 -1 -2 -3 -4 -5 -6 -7 -8 -23 -25 -26 -28 -29 -30
Nombre de pages apparues dans Google Discover
& nombre de jours passés depuis la publication
36%
88%
36% d’articles apparus dans Discover ont été publié le jour même.
38. Paris 2021 #seocamp
Cycle Tech SEO 38
Quel est l’impact de la modification d’articles sur l’apparition dans Discover?
2,82
2,77
3,22
2,5
2,6
2,7
2,8
2,9
3
3,1
3,2
3,3
Durée de vie moyenne Durée de vie d'un article sans modification Durée de vie d'un article avec modification
Nombre d’affichages dans Google Discover
Durée de vie moyenne Durée de vie d'un article sans modification Durée de vie d'un article avec modification
Les articles mis à jour un des jours après la publication ont une durée de vie plus longue de 16% jusqu’à 3,2 jours.
39. Paris 2021 #seocamp
Cycle Tech SEO 39
La longueur des titres, influence-t-elle le taux de clics des articles ?
0,00%
1,00%
2,00%
3,00%
4,00%
5,00%
6,00%
7,00%
8,00%
30-40 40-50 50-60 60-70 70-80 80-90 90-100 100-110110-120120-130130-140140-150150-160
Répartition de la longueur des titres
par volume d’impressions d’articles dans Google Discover
En règle générale, plus le titre est long meilleur est son taux de clics dans les résultats de Discover.
La raison est probablement simple – un titre long occupe une superficie plus grande ce qui se ressent beaucoup sur les
écrans mobiles.
40. Paris 2021 #seocamp
Cycle Tech SEO 40
Google Discover : Sentiment et impartialité dans les titres
0
10000
20000
30000
40000
50000
60000
70000
Impartialité
Nb moyen d’impressions d’articles avec
des titres objectifs et subjectifs
Objectif Subjectif
0
10000
20000
30000
40000
50000
60000
70000
Sentiment
Nb moyen d’impressions d’articles avec des
titres à connotation positive et négative
Positif Négatif Neutre
41. Paris 2021 #seocamp
Cycle Tech SEO 41
Quels sont les thèmes d’articles qui apparaissent le plus souvent dans
Discover?
On ne peut pas s’adapter à tous les centres d’intérêt, mais on peut identifier les sujets communs qui marchent le mieux:
Potentiel = moyenne d’impressions des articles dans le thème.
42. Paris 2021 #seocamp
Cycle Tech SEO
Biais cognitifs
42
Biais cognitifs - déviations systématiques de la pensée logique et rationnelle par
rapport à la réalité.
privilégier les informations confirmant ses
idées préconçues ou ses hypothèses.
avoir ses perceptions influencées par ses
propres centres d’intérêt.
influence laissée par la première impression.
Nécessité de constater quelque chose car on a
passé trop de temps sur l’étude.
Biais de confirmation
Biais d'attention
Biais d’ancrage
Coût irrécupérable
Wikipédia
45. Paris 2021 #seocamp
Cycle Tech SEO 45
A partir de quand Google arrête de garder et afficher
la version cache de la page?
Chargement > 5 sec.
Poids HTML > 1 Mo Poids HTML+CSS+JS > 1Mo
Chargement > 10 sec.
47. Paris 2021 #seocamp
Cycle Tech SEO 47
Chargement > 5 sec.
Poids HTML+CSS+JS > 1Mo
Chargement > 10 sec.
Poids HTML > 1 Mo
A partir de quand Google arrête de garder et afficher
la version cache de la page?
48. Paris 2021 #seocamp
Cycle Tech SEO 48
MERCI ! QUESTIONS ?
Consultant SEO & Directeur technique SEO
iProspect France.
aliaksei.rylko@iprospect.com
@alekseo
www.alekseo.com
PSS, ON RECRUTE ! ☺
Junior / middle /senior / stagiaire