Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

En route vers le Data+SEO [SEO Camp'US 2019]

3,015 views

Published on

Conférence au SEO Camp'US Paris 2019 : des exemples concrets pour débuter en Data+SEO.
Au programme : prédiction de trafic avec les régressions linéaires, catégorisation automatique avec le clustering, et calcul des critères de rankings avec les corrélations.

Published in: Internet
  • Be the first to comment

En route vers le Data+SEO [SEO Camp'US 2019]

  1. 1. #seocamp En route vers le Data+SEO 1
  2. 2. #seocamp Qui suis-je ? Julien Deneuville • SEO // Data // Python • Databulle // Crowl.tech • twitter.com/diije // databulle.com/blog • Web In Reims – 27/09/2019 – webinreims.fr 2
  3. 3. #seocamp 3
  4. 4. #seocamp 4
  5. 5. #seocamp 5
  6. 6. #seocamp 6
  7. 7. #seocamp 7
  8. 8. #seocamp Objectifs 8
  9. 9. #seocamp Des exemples concrets 9
  10. 10. #seocamp Un minimum de code 1 0
  11. 11. #seocamp Des résultats rapides 1 1
  12. 12. #seocamp 1 2
  13. 13. #seocamp 1 3
  14. 14. #seocamp Statistiques & Machine Learning 1 4
  15. 15. #seocamp Trois exemples 1. Prédiction de trafic 2. Keyword Clustering 3. Critères de ranking 15
  16. 16. Prédiction
  17. 17. #seocamp Outils nécessaires Google Spreadsheets … 17
  18. 18. #seocamp Apprendre du passé pour prévoir le futur. 1 8
  19. 19. #seocamp Régression linéaire 1 9 =FORECAST.LINEAR( CLÉ_CHERCHÉE; PLAGE_VALEURS; PLAGE_CLÉS)
  20. 20. #seocamp Prévision 2 0
  21. 21. #seocamp Résultats 2 1
  22. 22. #seocamp Résultats 2 2
  23. 23. #seocamp Usages Anticiper la saisonnalité Prévoir un budget Approvisionner les stocks … 23
  24. 24. Clustering
  25. 25. #seocamp Outils nécessaires Un tableur Gephi Un outil pour scrapper Google 25
  26. 26. #seocamp Gephi Un logiciel open-source et gratuit de visualisation et de traitement des graphes. > Les bases de Gephi : seomix.fr/pourquoi-comment-utiliser-gephi-seo/ 26
  27. 27. #seocamp #1: Liste de mots-clés 2 7
  28. 28. #seocamp Exemple : Google Search Console 2 8
  29. 29. #seocamp Autre option : les concurrents Sur quels mots-clés mes concurrents sont-ils positionnés ? 29
  30. 30. #seocamp 30
  31. 31. #seocamp Après nettoyage 1847 mots-clés Univers des chaussures Langue anglaise 31
  32. 32. #seocamp #2: Positions 3 2
  33. 33. #seocamp Aka scrapper Google 3 3
  34. 34. #seocamp #3: Format 3 4
  35. 35. #seocamp CSV #1 : mots-clés 3 5 1. Insérer : • Une colonne « Label » avec les mots-clés • Une colonne « Search Volume » 2. Ajouter les URLs à la suite des mots-clés, avec un volume de 1 3. Donner un ID à chaque item 4. Exporter en CSV
  36. 36. #seocamp 36
  37. 37. #seocamp CSV #2 : liens 1. Reprendre l’export des positions 2. Ajouter deux colonnes : • Source : l’ID attribué à l’URL • Target : l’ID attribué au mot-clé 3. Exporter les deux colonnes en CSV 37
  38. 38. #seocamp 38
  39. 39. #seocamp #4: Gephi 3 9
  40. 40. #seocamp Projet 1. Nouveau projet 2. Laboratoire de données 3. Importer feuille de calcul 40
  41. 41. #seocamp Import des nœuds 4 1
  42. 42. #seocamp Import des liens 4 2
  43. 43. #seocamp Clustering Une fois le graphe créé : 43
  44. 44. #seocamp Si des URLs apparaissent sur les mêmes requêtes, alors ces requêtes sont similaires. 4 4
  45. 45. #seocamp #5: Profit 4 5
  46. 46. #seocamp Exemples Label Search Volume clogs 49500 mules shoes 27100 clogs for women 27100 clog shoes 9900 womens mules 6600 women's mule shoes 2400 mule sneakers 2400 black clogs 1900 mule clogs 880 womens leather clogs 720 sneaker clogs 590 Label Search Volume vans 1830000 vans mens shoes 22200 vans womens shoes 22200 mens vans 22200 black high top vans 18100 vans shoes sale 18100 burgundy vans 14800 van shoes 12100 cheap vans 12100 red high top vans 12100 womens vans on sale 3600 4 6 Label Search Volume toddler converse 14800 kids converse shoes 9900 boys converse 5400 converse toddler shoes 3600 toddler girl converse 2900 toddler converse high tops 2400 kids chuck taylors 2400 toddler converse velcro 1900 girls white converse 1900 youth converse 1600 girls black converse 1600
  47. 47. #seocamp Attention Clusters trop gros / trop petits Sujets qui paraissent mélangés Mots-clés hors univers sémantique 47
  48. 48. Corrélation
  49. 49. #seocamp Outils nécessaires Un tableur … 49
  50. 50. #seocamp Si A varie, est-ce que B varie aussi ? 5 0
  51. 51. #seocamp Comparaison visuelle 5 1 0 20000 40000 60000 80000 100000 120000 140000 160000 0 50000 100000 150000 200000 250000 300000 350000 Hits / Sessions
  52. 52. #seocamp =RANG(A2;A:A) =RANG(B2;B:B) =COEFFICIENT.CORRELATION(C:C;D:D) 5 2 Coefficient de Spearman
  53. 53. #seocamp En pratique 5 3
  54. 54. #seocamp 54
  55. 55. #seocamp #1: Dataset 5 5
  56. 56. #seocamp Positions • Mot-clé • URL • Position 56
  57. 57. #seocamp Crawl • Title • Nombre de mots • Images & vidéos • Balisage sémantique • Liens sortants Script gratuit : gitlab.com/databulle/scrap 57
  58. 58. #seocamp Sémantique • Présence du mot-clé dans le title, dans l’URL, … • Score d’optimisation 58 yourtext.guru =CHERCHE( mot-clé;texte)
  59. 59. #seocamp Liens externes • Nombre de liens • Domaines référents • Citation Flow • Trust Flow 59
  60. 60. #seocamp #2: Nettoyage 60
  61. 61. #seocamp #2: Nettoyage • Valeurs incohérentes • Valeurs manquantes • Valeurs non-numériques • … 61
  62. 62. #seocamp Avant / Après 1 847 mots-clés 9 304 URLs 17 620 items 1 176 mots-clés 2 297 URLs 4 319 items 62
  63. 63. #seocamp Dataset 6 3 19 critères à comparer
  64. 64. #seocamp #3: Rangs 64
  65. 65. #seocamp #3 : Rangs 6 5
  66. 66. #seocamp #4: Corrélations 66
  67. 67. #seocamp #4 : Corrélations 6 7
  68. 68. #seocamp #5: Conclusion 68
  69. 69. #seocamp #5 : Conclusion Travaillez votre netlinking et la qualité de votre contenu 69
  70. 70. #seocamp 7 0
  71. 71. Et ensuite ?
  72. 72. #seocamp Formez-vous ! 7 2
  73. 73. #seocamp Apprenez à coder ! 7 3
  74. 74. #seocamp Travaillez la DataViz 74
  75. 75. #seocamp Merci ! 7 5

×