Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Cours SEO Master IDEMM 2018 - Sébastien Billard

4,880 views

Published on

Cours de 20 heures donné aux étudiant du Master IDEMM de l'université de Lille 3 sur le SEO (référencement naturel). Ce cours couvre l'histoire des moteurs de recherche, les fonctionnement des moteurs et les différentes méthodes d'optimisation.

Published in: Internet

Cours SEO Master IDEMM 2018 - Sébastien Billard

  1. 1. Cours de 20h, donné auprès des étudiants du Master IDEMM, université de Lille 3 Auteur : Sébastien Billard (s.billard@free.fr) SEO (référencement naturel)
  2. 2. THEME ABORDES DURANT CES 20 HEURES Auteur : Sébastien Billard (s.billard@free.fr) - Notions de base : le web, son histoire, notions-clés - Les outils de recherche : typologie, fonctionnement, fonctionnalités - Le search marketing en général : marché, métier, bonnes et mauvaises pratiques - Optimisation structurelle et accessibilité technique - Optimisation éditoriale : écrire pour le web - Optimisation de la popularité : créer du lien - Mesure d'audience, analyse de trafic et contrôle de positionnement - Contenus spécifiques : réferencement local, images,vidéos, flux RSS, actualités... - Les liens sponsorisés : fonctionnement, marché, techniques d'optimisation
  3. 3. ORGANISATION DES COURS ET DE L'EXAMEN Auteur : Sébastien Billard (s.billard@free.fr) - Les questions et partages d'expériences sont bienvenus, aussi bien sur le contenu du cours que sur l'actualité du référencement. - L'examen se fait sous forme de QCM et de questions ouvertes (40 questions). - La durée de l’examen est de 2 heures. - Notes de cours, smartphones et ordinateurs sont interdits durant l’examen. - Des points négatifs seront attribués en cas de mauvaises réponse à une question fermée. - Les questions ouvertes et les questions avec plusieurs réponses bonnes possibles seront notées au prorata. - Des questions sur ce qui aura été vu et évoqué en cours seront posées.
  4. 4. AVERTISSEMENT PREALABLE Auteur : Sébastien Billard (s.billard@free.fr) - Le référencement n'est ni de la magie, ni de la science. - Le référencement est un art (au sens d'artisan). - Ne prenez pas ce que disent les experts pour argent comptant (le prof y compris). - Expérimentez, faites-vous votre propre opinion !
  5. 5. LE WEB : NOTIONS FONDAMENTALES Auteur : Sébastien Billard (s.billard@free.fr)
  6. 6. UNE BREVE HISTOIRE DU WEB ET DES OUTILS DE RECHERCHE Auteur : Sébastien Billard (s.billard@free.fr) 1945 : Le Memex, décrit dans « As we may think » de Vannevar Bush. 1963 : Le terme « hypertexte » créé par Ted Nelson. 1971 : « A theory of indexing », par Gerard Salton, inventeur de cosinus du même nom. 1974 : Naissance du protocole TCP/IP. 1990: 1er serveur web, au CERN, par Tim Berners Lee et Robert Cailliau. 1991 : Le web devient public. Archie,1er moteur FTP . Virtual Librairy, 1er annuaire. 1993 : Wanderer, 1er robot (crawler). Jumpstation, 1er vrai moteur de recherche. HTML 1.0. 1994 : Annuaire Yahoo. Webcrawler 1er moteur full text. 1ère bannière publicitaire. 1995 : Naissance d'Altavista, et du terme SEO. HTML 2.0. Javascript apparaît. 1996 : Inktomi crée l'inclusion payante, naissance de Echo, futur Voila. Flash apparaît.
  7. 7. UNE BREVE HISTOIRE DU WEB ET DES OUTILS DE RECHERCHE Auteur : Sébastien Billard (s.billard@free.fr) 1997 : Naissance d'Askjeeves. John Kleinberg invente HITS. HTML 3.2 et 4.0. 1998 : Naissances de Google, DMOZ, Goto qui crée les liens sponsorisés. 2000 : Lancement d'Adwords, effondrement de la bulle Internet. 2004 : Naissance de MSN Search. Lancement du moteur Yahoo. 2009 : Le moteur Yahoo disparaît au profit de Microsoft Bing. 2014 : Lancement d’HTML 5.
  8. 8. LE MEMEX DE VANNEVAR BUSH (AS WE MAY THINK) Auteur : Sébastien Billard (s.billard@free.fr) « Imaginons un appareil de l’avenir à usage individuel, une sorte de classeur et de bibliothèque personnels et mécaniques (...) Un memex, c’est un appareil dans lequel une personne stocke tous ses livres, ses archives et sa correspondance, et qui est mécanisé de façon à permettre la consultation à une vitesse énorme et avec une grande souplesse. Il s’agit d’un supplément agrandi et intime de sa mémoire (...) Une étape s’avère indispensable au classement par association, dont le principe reposerait sur un système permettant à tout article d’en sélectionner immédiatement et automatiquement un autre. C’est ce processus reliant deux articles l’un à l’autre qui caractérise le memex (...) Ainsi, à tout moment, quand l’un de ces documents est visible, l’autre peut être rappelé instantanément (...) Des formes entièrement nouvelles d’encyclopédies vont apparaître, prêtes à l’emploi avec un réseau de pistes fonctionnant par association les traversant, prêtes à être insérées et amplifiées dans le memex... » « Le memex sous la forme d'un bureau serait capable de mettre à portée de main de l'operateur les fichiers et documents relatifs à n'importe quel sujet »
  9. 9. LE COSINUS DE SALTON Auteur : Sébastien Billard (s.billard@free.fr) Documents dans l'index : Texte 1 : « la loutre est dans la rivière » Texte 2 : « la loutre est avec les loutres dans la rivière » Lemmatisation + suppression des verbes et stopwords : Texte 1 : loutre, rivière Texte 2 : loutre, loutre, rivière Calcul des fréquence et vectorisation dans l’espace des fréquences des mots rivière, loutre (dans cet ordre) : Texte 1 : (1/2, 1/2 ) Texte 2 : (1/3, 2/3) Requête : « je suis dans la rivière avec les loutres de la rivière » Vecteur : 2/3, 1/3 Source : http://www.spoonylife.org/algorithms-and-computation/modele-vectoriel-et-cosinus-de-salton
  10. 10. LE WEB DECRIT PAR TIM BERNERS LEE ET ROBERT CAILLIAU Auteur : Sébastien Billard (s.billard@free.fr)
  11. 11. STRUCTURE DU WEB : HOTES, DOMAINES ET DOCUMENTS Auteur : Sébastien Billard (s.billard@free.fr) World Wide Web Hôtes identifiés par leurs adresses IP (ex : 209.85.229.147) Domaines (sites) Identifiés par leurs noms de domaines (ex : google.fr) Documents (pages) Identifiés par leurs URLs (ex : http://www.site.fr/page.html ) Note : une IP est spécifique à un hôte, mais un hôte peut avoir plusieurs IPs
  12. 12. QUE SE PASSE-T-IL LORS DE L'ACCES A UNE PAGE ? DNS du FAI Serveur web « J'aimerais accéder à www.exemple.fr/index.html » « Bonjour hôte 209.85.229.99, j'aimerais accéder à l'URL www.exemple.fr/index.html » « Je regarde dans ma base... Ok ! L'IP du domaine exemple.fr est 209.85.229.99 » « Voyons voir... Le domaine existe bien chez moi... ...Le document demandé également... Je vous envoie le fichier ! » HTTP L’accès à une page se fait en réalité en deux temps : Auteur : Sébastien Billard (s.billard@free.fr)
  13. 13. QUE SE PASSE-T-IL LORS DE L'ACCES A UNE PAGE ? GET /referencement/ HTTP/1.1 Host: s.billard.free.fr Connection: close Accept: */* User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; GTB6; .NET CLR 2.0.50727; InfoPath.2; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729) HTTP/1.1 200 OK Date: Fri, 02 Oct 2009 10:36:31 GMT Server: Apache/ProXad [Aug 9 2008 02:45:09] Cache-Control: must-revalidate, max-age=0 Pragma: X-Powered-By: PHP/4.4.3-dev Last-Modified: Wed, 30 Sep 2009 14:39:48 GMT Connection: close Content-Type: text/html; charset=ISO-8859-1 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" (...) Exemple de requête HTTP : Exemple de réponse HTTP : Auteur : Sébastien Billard (s.billard@free.fr)
  14. 14. Auteur : Sébastien Billard (s.billard@free.fr) PLUSIEURS TYPES DE REPONSES HTTP 2XX : Succès 3XX : Redirections 4XX : Erreurs coté client 5XX : Erreurs coté serveur Pour voir les entêtes HTTP : outils de développement web de Firefox, rubrique réseau.
  15. 15. Auteur : Sébastien Billard (s.billard@free.fr) LES CODES DE REPONSE HTTP (AUTRES QUE 200) « Voyons voir... Le domaine existe bien chez moi... ...par contre je ne connais pas votre fichier » « Voyons voir... Le domaine existe bien chez moi... ...par contre le fichier a définitivement changé d'adresse. La voici » « Voyons voir... Le domaine existe bien chez moi... ...par contre le fichier e temporairement changé d'adresse. La voici » « Voyons voir... Le domaine existe bien chez moi... ...par contre l'accès au fichier est interdit » « Voyons voir... Le domaine existe bien chez moi... ...par contre le site web est en panne » 404 301 404 302 500 403 « Voyons voir... Le domaine existe bien chez moi... ...par contre revenez plus tard le site est en maintenance » 503
  16. 16. Auteur : Sébastien Billard (s.billard@free.fr) PAGES STATIQUES ET DYNAMIQUES Sites statiques Chaque page pré-existe sur le serveur (1 page = 1 fichier HTML). Sites dynamiques Les pages sont générées à la demande, par un langage de script (PHP, ASP...). Les paramètres pour construire la page sont souvent passés dans l'URL. Ex : www.site.fr/index.php?paramètre1=a&parametre2=b Attention : L'URL ne permet pas à 100% de déterminer si un site est statique. « www.site.fr/catalogue/chemises-rouges.html » peut très bien être une page dynamique
  17. 17. Auteur : Sébastien Billard (s.billard@free.fr) LIRE UNE ADRESSE INTERNET (URL) http://www.exemple.fr/repertoire/fichier.html http://catalogue.exemple.fr/index.php?gamme=3&couleur=vert protocole sous-domaine domaine répertoire fichiertop level domain (TLD) script PHP paramètres
  18. 18. Auteur : Sébastien Billard (s.billard@free.fr) STRUCTURE D'UNE PAGE WEB : LE CODE HTML Les balises définissent la fonction de chaque élément. Elles s'ouvrent et se ferment. On peut les imbriquer. Syntaxe : <balise>élément</balise> (en général) Les attributs précisent les propriétés de chaque élément. On peut les cumuler. Syntaxe : <balise attribut= "valeur">élément</balise>
  19. 19. Auteur : Sébastien Billard (s.billard@free.fr) STRUCTURE D'UNE PAGE WEB : PRINCIPALES BALISES ET ATTRIBUTS Les balises fondamentales les balises <meta> <html> <meta> description <head> <meta> robots <body> <title> Les balises structurantes du contenu (dans le <body>) <a> <p> <h1> à <h6> <strong> <b> <ul>,<ol> et <li> <table>, <tr> et <td> Les balises riches et multimedia (dans le <body>) <img> <script> <embed> ou <object>
  20. 20. Auteur : Sébastien Billard (s.billard@free.fr) SUGGESTIONS DE LECTURE L'essentiel sur le référencement Un condensé sur l'écriture web Un pavé sur l'écriture web, davantage orienté SEO Une référence sur le « bien chercher »
  21. 21. Auteur : Sébastien Billard (s.billard@free.fr) QUELQUES SITES POUR LA VEILLE En français : www.abondance.com www.webrankinfo.com webmaster-fr.googleblog.com lemusclereferencement.com www.seomix.fr En anglais : searchengineland.com www.seobythesea.com www.seomoz.org webmasters.googleblog.com
  22. 22. LES OUTILS DE RECHERCHE Auteur : Sébastien Billard (s.billard@free.fr)
  23. 23. Auteur : Sébastien Billard (s.billard@free.fr) TYPOLOGIE DES OUTILS DE RECHERCHE : MOTEURS ET ANNUAIRES Moteurs - Gestion automatisée - Entrée par indexation - Tout le web a vocation à être indexé - Tout le contenu des pages est indexé - Navigation par requêtes Annuaires - Gestion humaine - Entrée par soumission - Des choix éditoriaux sont faits - Seules les références aux sites sont indexées - Navigation arborescente (recherche possible)
  24. 24. Auteur : Sébastien Billard (s.billard@free.fr) FONCTIONNEMENT D'UN MOTEUR DE RECHERCHE (VERSION SIMPLE) Index Moteur de recherche IndexeurWeb
  25. 25. FONCTIONNEMENT D'UN MOTEUR (VERSION MOINS SIMPLE)
  26. 26. COMMENT PENSE UN MOTEUR ? Juger de la pertinence d'une page web, c'est un peu comme juger du contenu d'un livre dans une bibliothèque : Contenu Titre 4ème de couverture Table des matière Contenu général Balise <title> Balise <meta> description Titraille (balises <h1> à <h6>) Ensemble des textes Structure Lisibilité Accessibilité technique et structuration Popularité Recommandations Quantité, qualité et teneur des liens entrants Auteur : Sébastien Billard (s.billard@free.fr)
  27. 27. ANATOMIE GENERALE D’UNE PAGE DE RESULTATS Auteur : Sébastien Billard (s.billard@free.fr) Résultats sponsorisés Résultats naturels Résultats Google Shopping (sponsorisés)
  28. 28. ELEMENTS D’INTERFACE GOOGLE Auteur : Sébastien Billard (s.billard@free.fr) Sitelinks - Déterminés algorithmiquement - Jusque 10 éléments Classic sitelinks - Déterminés algorithmiquement - Jusque 4 éléments Sitelinks searchbox - Pour des requêtes « marque » - Uniquement pour certains sites - Mieux vaut mettre en place le script Google Hiérarchie de site - Basés sur le fil d’ariane Jumplinks - Contextuels - Basés sur les ancres
  29. 29. ELEMENTS D’INTERFACE GOOGLE Auteur : Sébastien Billard (s.billard@free.fr) Position zéro - Site source déterminé algorithmiquement Résultats Onebox - Réponses fournies directement par Google - Réponses à de multiples questions Carousel Knowledge graphBloc Knowledge graph - Issus de la base de connaissance Google
  30. 30. RECHERCHE UNIVERSELLE Auteur : Sébastien Billard (s.billard@free.fr) Actualités Knowledge graph ages web Images La recherche universelle consiste à présenter dans la page de résultats (SERP) par défaut des résultats issus des divers moteurs de recherche verticaux. Objectif : « faire tomber les silos de l'information qui existent sur le web » (Marissa Mayer, 16/05/07) Peuvent apparaître dans les SERP en plus des pages web : actualités, images, vidéo, blocs Knowledge Graph… La recherche universelle ne doit pas être confondue avec les enrichissement visuels via les microformats (ex : cas des recettes de cuisine).
  31. 31. RECHERCHE UNIVERSELLE Auteur : Sébastien Billard (s.billard@free.fr) Plusieurs critères concourent à la personnalisation et à la contextualisation des résultats : Localisation de l'utilisateur (IP, langue du navigateur) Comportement de l'utilisateur (recherches précédentes, sites préférés) Saisonnalité, actualité de la requête Interface utilisée (.com, .fr...) Depuis 2019, les résultats de recherche sont personnalisés pour tout le monde, que les utilisateurs soient loggés ou non.
  32. 32. LES OPERATEURS UTILES A LA RECHERCHE ET AU SEO Auteur : Sébastien Billard (s.billard@free.fr) Les guillemets, pour rechercher une chaine de caractères, ou un terme exact sans synonymie : Le signe « - », pour exclure un mot, une expression ou un autre critère de recherche : La commande « site: » pour chercher sur un TLD, un domaine, un sous-domaine, un répertoire : La commande « filetype: » pour chercher un type de fichier donné : « inurl: » et « allinurl: » pour chercher les pages dont l'URL contient une expression :
  33. 33. LES OPERATEURS UTILES A LA RECHERCHE ET AU SEO Auteur : Sébastien Billard (s.billard@free.fr) « intitle: » et « allintitle: » pour chercher les pages dont le <title> contient une expression : « cache: » pour obtenir la version en cache d’une page : « src: » pour chercher les images hébergées sur un domaine ou sous-domaine : « OR » pour chercher l’un ou l’autre des termes : Les parenthèses pour grouper des termes :
  34. 34. COMBINAISONS ET EXEMPLES CONCRETS Auteur : Sébastien Billard (s.billard@free.fr) Trouver des sites qui hotlinkent vos images : Trouver les sous-domaine d’un domaine : Trouver les sous-rayons d’un site e-commerce : Trouver produits épuisés d’un site e-commerce :
  35. 35. LE SEARCH MARKETING EN GENERAL Auteur : Sébastien Billard (s.billard@free.fr)
  36. 36. Auteur : Sébastien Billard (s.billard@free.fr) QU'EST CE QUE LE SEARCH MARKETING ? Il s'agit de l'ensemble des moyens permettant de rendre un site visible dans un contexte de recherche sur le web : Référencement naturel (SEO) Liens sponsorisés (SEA) Shopping feeds (comparateurs)
  37. 37. Auteur : Sébastien Billard (s.billard@free.fr) LES MOTS ONT LEUR IMPORTANCE Le « Search Marketing » ou SEM ne désigne pas les seuls liens sponsorisés comme cela est parfois présenté ! SEM=SEO+SEA+SF
  38. 38. Auteur : Sébastien Billard (s.billard@free.fr) LA JUNGLE DES TERMINOLOGIES Le jargon du Search comprend de nombreux synonymes : REFERENCEMENT NATUREL LIENS SPONSORISES« référencement » « SEO » « référencement organique » « searche engine optimization » « positionnement publicitaire » «SEA » « PPC » « pay per click » « search engine advertising » « référencement payant » SHOPPING FEEDS « shop bots » « comparateurs de prix » « products feeds »
  39. 39. Auteur : Sébastien Billard (s.billard@free.fr) Référencement naturel (SEO) Liens sponsorisés (SEA)Shopping feeds
  40. 40. REFERENCEMENT NATUREL Auteur : Sébastien Billard (s.billard@free.fr) - Visibilité dans les moteurs de recherche généralistes et portails - L'indexation est automatique, sans action obligatoire de l'éditeur - C'est le contenu des pages qui est indexé - L'indexation est gratuite - Pas de garantie de position (classement algorithmique en fonction de la pertinence)
  41. 41. LIENS SPONSORISES Auteur : Sébastien Billard (s.billard@free.fr) - Visibilité dans les moteurs de recherche généralistes, portails et site de contenu - Il faut enchérir sur des expressions-clés pour être visible - Modèle de paiement au clic, avec prix variable déterminé par enchères - La position est dépendante de ce que l'annonceur est prêt à payer (principalement)
  42. 42. SHOPPING FEEDS Auteur : Sébastien Billard (s.billard@free.fr) - Visibilité dans les comparateurs de prix et sites de contenu affiliés - C'est un flux XML qui est indexé (base produits) - Visibilité uniquement si l'on paye - Modèle de paiement au clic, avec prix fixé par forfait ou enchères - La position est dépendante en partie de ce que l'annonceur est prêt à payer
  43. 43. LE MARCHE DU SEARCH MARKETING Auteur : Sébastien Billard (s.billard@free.fr)
  44. 44. LE PAYSAGE DES MOTEURS DE RECHERCHE : EUROPE Auteur : Sébastien Billard (s.billard@free.fr)
  45. 45. LE PAYSAGE DES MOTEURS DE RECHERCHE : USA Auteur : Sébastien Billard (s.billard@free.fr)
  46. 46. LE PAYSAGE DES MOTEURS DE RECHERCHE : RUSSIE Auteur : Sébastien Billard (s.billard@free.fr)
  47. 47. LE PAYSAGE DES MOTEURS DE RECHERCHE : CHINE Auteur : Sébastien Billard (s.billard@free.fr)
  48. 48. LE PAYSAGE DES MOTEURS DE RECHERCHE : JAPON Auteur : Sébastien Billard (s.billard@free.fr)
  49. 49. QUELQUES DONNEES CLES Auteur : Sébastien Billard (s.billard@free.fr) - 46,6 millions d'internautes soit 89% des français (Mediametrie, septembre 2017) - 82,7% des internautes effectuent des achats en ligne (Fevad, juin 2017) - 1 consommateur sur 2 effectue au moins un achat par mois sur internet (Ipsos media, janvier 2015) - La recherche d'information est l'activité la plus pratiquée sur le web, devant le web (Insee, mai 2006) - Les moteurs représentent de 30 à 40% du trafic d'un site en moyenne - Plus de 90% des clics ont lieu sur les 3 premières pages de résultats (iProspect, avril 2006)
  50. 50. DISTRIBUTION DES CLICS SUR UNE PAGE DE RESULTATS Auteur : Sébastien Billard (s.billard@free.fr) Position = visibilité = trafic . Mais le taux de clic décroît rapidement avec la position…
  51. 51. DISTRIBUTION DES CLICS SUR UNE PAGE DE RESULTATS Auteur : Sébastien Billard (s.billard@free.fr) y = 29,498x-0,855 0 10 20 30 40 50 60 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 CTR … y compris sur les requêtes hors-marque (génériques)
  52. 52. REPARTITION DES CLICS : SEO vs SEA Auteur : Sébastien Billard (s.billard@free.fr) D’après une étude Seomoz de décembre 2017, les liens naturels draineraient 20X plus de trafic que les liens sponsorisés
  53. 53. LE TRAVAIL DU REFERENCEUR Auteur : Sébastien Billard (s.billard@free.fr)
  54. 54. Auteur : Sébastien Billard (s.billard@free.fr) LA PYRAMIDE DU REFERENCEMENT L'ensemble de ces composantes doit être optimisé pour obtenir une bonne visibilité : CONTENU STRUCTURE POPULARITE Le code qui contient le site et le met en forme Essentiellement le contenu textuel du site Ce que le web dit de votre site via les liens Crédibilise Favorise Valorise Redistribue Le travail de référencement va consister à activer chacun de ces leviers.
  55. 55. Auteur : Sébastien Billard (s.billard@free.fr) LA PYRAMIDE DU REFERENCEMENT Le référenceur va ainsi agir sur les différents étages de la pyramide, par de multiples actions. Quelques exemples (liste non exhaustive) : CONTENU STRUCTURE POPULARITE Accessibilité technique Soumission aux annuaires Réseaux spécifiques Communiqués de presseRéseaux sociaux Optimisation des textes Micro contenus Recherche de mots-clés Architecture de l'information Intitulés des liens Distribution interne de la popularité Formation des rédacteurs Balisage sémantique Duplication de contenu Qualité du code Noms de domaine Link baiting
  56. 56. Auteur : Sébastien Billard (s.billard@free.fr) LA PYRAMIDE DU REFERENCEMENT Pour mener à bien sa mission, le référenceur va devoir développer un certain nombre de compétences :
  57. 57. CE QUI EST PERMIS, CE QUI NE L’EST PAS Auteur : Sébastien Billard (s.billard@free.fr)
  58. 58. BONNES PRATIQUES PRONEES PAR LES MOTEURS Auteur : Sébastien Billard (s.billard@free.fr) Source : https://support.google.com/webmasters/answer/35769?hl=fr
  59. 59. PRATIQUES INTERDITES PAR LES MOTEURS Auteur : Sébastien Billard (s.billard@free.fr) - Systèmes de liens pour améliorer artificiellement la popularité - Textes et liens cachés - Cloaking et redirections trompeuses - Mots-clés sans rapport avec le site - Répétition abusives de mots-clés - Contenus dupliqués dans le seul but de mieux se positionner - Pages satellites - Requêtes automatisées
  60. 60. SYSTEMES DES LIENS ARTIFICIELS Auteur : Sébastien Billard (s.billard@free.fr) Les private blog networks (PBN) sont à la mode mais ne sont pas appréciés des moteurs…. L’achat de liens (si découvert) est également sanctionné De même que les échanges automatisés de liens
  61. 61. TEXTES ET LIENS CACHES Auteur : Sébastien Billard (s.billard@free.fr) Un snippet a priori pertinent, quoique suspect... Tiens ! Aucun contenu visible... L'examen du code source montre du texte caché grâce à la balise <noembed>, texte qui plus est visiblement écrit à destination des moteurs.
  62. 62. TEXTES ET LIENS CACHES Auteur : Sébastien Billard (s.billard@free.fr) Un site très ordinaire... Mais la désactivation des CSS montre des textes cachés visiblement optimisés pour les moteurs
  63. 63. TEXTES ET LIENS CACHES : PRINCIPALES TECHNIQUES Auteur : Sébastien Billard (s.billard@free.fr) - Insertion dans balises <noframe>, <noscript>, <noembed> - Utilisation d'une couleur de police similaire à celle du fond (via HTML ou CSS) - Utilisation des propriétés CSS visibility:hidden et display:none - Positionnement CSS hors de l'écran (coordonnées négatives)
  64. 64. CLOAKING Auteur : Sébastien Billard (s.billard@free.fr) Cloaking pour la bonne cause : le site fournit un contenu différent en mobile et en desktop Mais la même technique pourrait être utilisée pour tricher, par ex par insertion de contenu invisible pour les visiteurs humains
  65. 65. 2 FORMES DE CLOAKING (+1) Auteur : Sébastien Billard (s.billard@free.fr) - IP delivery : le contenu affiché est déterminé en fonction de l'adresse IP du visiteur (IP d'un moteur ? IP d'un FAI ?) - User-agent delivery : le contenu est affiché en fonction de l'user-agent du visiteur (navigateur desktop ? Navigateur mobile ? Googlebot ?) - Cloaking sur referer : le contenu est affiché en fonction de la provenance du visiteur. Pas d'utilité pour spammer, les moteurs ne transmettant pas de referers. Mais d'autres utilités...
  66. 66. PAGES SATELLITES Auteur : Sébastien Billard (s.billard@free.fr) Pas de redirection, pas de texte caché, mais un contenu visiblement pensé pour les seuls moteurs
  67. 67. REDIRECTIONS TROMPEUSES Auteur : Sébastien Billard (s.billard@free.fr) Un listing d'apparence ordinaire... Mais la page renvoie automatiquement vers l'accueil du site La désactivation de javascript montre une page satellite, avec texte caché par CSS, comprenant une redirection javascript
  68. 68. REQUETES AUTOMATISEES Auteur : Sébastien Billard (s.billard@free.fr) Les moteurs n’apprécient pas les requêtes automatisées Mais il faut bien avouer qu'elle peuvent être utiles au référenceur :).
  69. 69. QUELQUES PISTES POUR DETECTER LE SPAM Auteur : Sébastien Billard (s.billard@free.fr) - Contenu camouflé : Ctrl+A, et scrolling - Contenu caché : examen du code source - Redirections : désactivation de javascript (barre d'outils Web Developer pour Chrome) - Répétitions abusives et mots-clés hors propos : lire ! - Cloaking sur user-agent : simulation de l'user agent d'un moteur (extension User agent switcher pour Firefox) - Cloaking sur IP : cache Google (rare), affichage dans Google Translate ou Google Analytics (synthèse données/site) - Réseaux de liens artificiels : analyse des liens
  70. 70. OPTIMISATION STRUCTURELLE POUR LE REFERENCEMENT Auteur : Sébastien Billard (s.billard@free.fr)
  71. 71. RAPPEL : LA PYRAMIDE DU REFERENCEMENT Auteur : Sébastien Billard (s.billard@free.fr) L'ensemble de ces composantes doit être optimisé pour obtenir une bonne visibilité : CONTENU STRUCTURE POPULARITE Le code qui contient le site et le met en forme Essentiellement le contenu textuel du site Ce que le web dit de votre site via les liens Crédibilise Favorise Valorise Redistribue On va travailler aujourd'hui sur cet étage (ou plutôt les fondations...)
  72. 72. ROLES DE L'OPTIMISATION STRUCTURELLE Auteur : Sébastien Billard (s.billard@free.fr) L'optimisation de la structure d'un site pour le référencement vise à satisfaire deux objectifs : - A minima, assurer l'indexabilité du site par les robots d'indexation (accessibilité technique) - Mettre en valeur le contenu pour un traitement optimal par les moteurs
  73. 73. CE QUI PEUT BLOQUER LES ROBOTS Auteur : Sébastien Billard (s.billard@free.fr) - Contenus au format Flash - Contenus dans des formats tiers nécessitant l'installation d'un plugin (Flash, Silverlight...) - Scripts javascript - Scripts Ajax (javascript et XML) - Contenus accessibles uniquement au travers d'un formulaire - Fichiers robots.txt
  74. 74. CE QUI PEUT COMPLIQUER LE TRAVAIL DES MOTEURS Auteur : Sébastien Billard (s.billard@free.fr) - Contenus sous forme d'images - Mauvais usage des balises sémantique (ou absence d'usage) - Contenus dupliqués - Méthodes de redirections non adaptées - Contenu délivrés en fonction de l'user-agent ou de l'adresse IP - Splash pages - Frames (cadres)
  75. 75. VOIR LE WEB COMME UN ROBOT Auteur : Sébastien Billard (s.billard@free.fr)
  76. 76. VOIR LE WEB COMME UN ROBOT : GRANDS PRINCIPES Auteur : Sébastien Billard (s.billard@free.fr) Une bonne façon d'appréhender la structure d'un site ou d'une page, outre l'examen du code, est de se mettre dans la peau d'un robot, c'est-à-dire de naviguer avec les même limitations : - Pas d'images (utilisation des attributs alt à la place) - Pas de mise en forme (CSS) - Pas de javascript - Pas de Flash - Pas de format tiers (Silverlight, Quicktime etc.) - Lecture dans l'ordre du code (linéarisation) - Pas de cookies - Eventuellement en changeant son agent-utilisateur
  77. 77. VOIR LE WEB COMME UN ROBOT : LYNX Auteur : Sébastien Billard (s.billard@free.fr) Ouvrir une URL : "g" Activer des liens : "↓" et "↑" Défiler : "espace" Cliquer : "entrée" Page prec/suiv : "←" et "→" Source : "" Aide : "?" Télécharger : https://www.cygwin.com/ (installer le package Lynx)
  78. 78. VOIR LE WEB COMME UN ROBOT : WEB DEVELOPER (CHROME) Auteur : Sébastien Billard (s.billard@free.fr) On désactive javascript… … les cookies… … les CSS… … on remplace les images par leurs attributs alt… … et on linéarise la page
  79. 79. VOIR LE WEB COMME UN ROBOT : WEB DEVELOPER (CHROME) Auteur : Sébastien Billard (s.billard@free.fr) Rendu standard navigateur Rendu robots
  80. 80. VOIR LE WEB COMME UN ROBOT : CACHE GOOGLE Auteur : Sébastien Billard (s.billard@free.fr) La commande « cache: » dans Google permet d’accéder à la dernière version indexée par le moteur L’option « version en texte seul » permet de voir la page comme la voit le robot
  81. 81. CE QUI PEUT BLOQUER LES ROBOTS Auteur : Sébastien Billard (s.billard@free.fr)
  82. 82. FLASH Auteur : Sébastien Billard (s.billard@free.fr) - Flash n'est à l'origine pas un outil de publication, mais d'animation. - Flash nécessite un plugin pour être lu (Flash Player). Ce n'est pas un standard du web, même si son usage est très répandu. - Flash n'est pas correctement lu par les moteurs, même s'ils arrivent à extraire quelques informations, car l’information y est mal structurée et contenue le plus souvent dans un fichier unique. D’ailleurs Google ne remonte plus aujourd’hui de fichiers swf dans ses résultats (commande filetype:swf) - Il faut donc encore aujourd'hui considérer Flash comme étant totalement inaccessible (et l'indexation éventuelle comme un bonus). L'indexation de Flash pose / posait de nombreux problèmes...
  83. 83. SITE 100% FLASH UN EXEMPLE Auteur : Sébastien Billard (s.billard@free.fr) Ce que voit l'utilisateur (s'il a Flash) Ce que voit le moteur (c'est à dire pas grand chose) Tout le site est inclus dans un fichier Flash (swf), non lisible par les moteurs
  84. 84. OPTIMISATION DES CONTENUS FLASH : APPROCHES POSSIBLES Auteur : Sébastien Billard (s.billard@free.fr) - Ne pas construire de sites 100% Flash. Par contre l'inclusion d'éléments Flash dans des sites majoritairement en HTML, avec du contenu autour, est parfaitement possible. - Construire deux versions, une Flash, une HTML. Problème : la version Flash devient inutile puisque c'est la version HTML qui sera la mieux référencée, et donc la plus visitée au final. - Fournir un contenu alternatif : pis-aller pour un site Flash ordinaire (URL unique), intéressant pour les sites Flash à plusieurs URLs. La méthode la plus connue est swfObject (http://code.google.com/p/swfobject/). <script type="text/javascript" src="swfobject.js"></script> <div id="flashcontent"> Texte alternatif, visible pour les utilisateurs sans Flash ou sans javascript, ainsi que pour les moteurs </div> <script type="text/javascript"> var so = new SWFObject("flash.swf", "flash", 200, 100, 7, "#336699"); so.write("flashcontent"); </script> Exemple d'utilisation de SWFObject
  85. 85. JAVASCRIPT Auteur : Sébastien Billard (s.billard@free.fr) - Javascript est un langage de programmation interprété coté client (c'est le navigateur qui exécute le code, pas le serveur). - Javascript n'est pas interprété par les moteurs, même si des chaines de caractères comme des URLs peuvent être extraites du code javascript et même si certains codes très spécifiques peuvent être interprétés au cas par cas. (il faut d’ailleurs bien penser à crypter son code quand on veut cacher des liens à Google...) - Il est souvent possible d'utiliser Javascript tout en restant accessible (concept de dégradation élégante ou d'amélioration progressive). - Les applications de Javascript les plus problématiques pour le référencement sont typiquement les menus, les pop-ups, les contenus AJAX et les lazy-loads.
  86. 86. EXEMPLES DE JAVASCRIPTS ACCESSIBLES ET NON-ACCESSIBLES Auteur : Sébastien Billard (s.billard@free.fr) Un clic sur ce lien ouvre un pop-up, grâce à javascript... Ce popup reste accessible aux moteurs et visiteurs, car le code javascript vient en surcouche de HTML <a href = "javascript:ouvreFenetre(‘http://s.billard.free.fr/radio.blog/index.php', 300, 222)">FS Radio (popup)</a> Ce code aurait été inaccessible
  87. 87. REFERENCEMENT ET JAVASCRIPT : APPROCHES POSSIBLES Auteur : Sébastien Billard (s.billard@free.fr) - Ne pas rendre la navigation d'un site dépendant de javascript : cela garantie un minimum d'accessibilité pour les moteurs, comme pour les visiteurs. - Pour être accessible, javascript doit venir en surcouche de HTML, pas en remplacement de celui-ci. - Si un menu javascript inaccessible ne peut être modifié, intégrer des liens alternatifs HTML qui seront suivis par les robots. Cela peut être fait dans le contenu lui-même, dans la balise <noscript>, dans le footer, dans un plan de site...
  88. 88. FORMULAIRES Auteur : Sébastien Billard (s.billard@free.fr) - Les moteurs ne savent par remplir un formulaire, ni sélectionner un élément, ni cliquer sur un bouton radio. - Seuls les résultats de type GET (avec paramètres passé dans l'URL) sont potentiellement indexables. - La méthode POST ne permet pas l'indexation, car le résultat du formulaire ne peut être rappelé via une URL (l'URL résultante est toujours la même).
  89. 89. FORMULAIRES : EXEMPLE Auteur : Sébastien Billard (s.billard@free.fr) Hormis quelques liens vers les recettes les plus populaires... ...la seule façon d'accéder à l'intégralité du contenu était de renseigner un formulaire Une navigation alternative a été proposée
  90. 90. FORMULAIRES : OPTIMISATIONS POSSIBLES Auteur : Sébastien Billard (s.billard@free.fr) - Ne pas utiliser de formulaires comme moyen unique de navigation si le site doit être indexé. - Utiliser la méthode GET (paramètres passé dans l'URL), et non pas POST. - Permettre une navigation arborescente alternative, utilisant des liens HTML. Exemple d'arborescence proposée pour un site de cuisine
  91. 91. ROBOTS.TXT Auteur : Sébastien Billard (s.billard@free.fr) - Ce protocole sert à restreindre volontairement l'indexation d'un site par les robots. Il y a de très bonnes raisons de ne pas souhaiter l'indexation de certaines pages (prévention du duplicate content, contenu inutiles...) - On oublie parfois d'enlever le fichier robots.txt lors d'une mise en ligne, ou bien on se trompe dans la syntaxe d'où des cas de non-indexation ou desindexation involontaires. - Le fichier est un simple fichier texte. Il se place obligatoirement à la racine du site. Ex: http://www.site.fr.robots.txt ou http://sous-domaine.site.fr/robots.txt. - Le fichiers robots.txt n'est pas une protection contre les intrusions. Il n'empêche pas l'accès aux pages. Les robots peuvent décider ou non de respecter le protocole (mais les moteurs courants respectent tous les directives robots.txt). - Attention à ne pas oublier le « s » à « robots » !
  92. 92. ROBOTS.TXT : SYNTAXE Auteur : Sébastien Billard (s.billard@free.fr) #commentaire# User-agent: * Disallow: /repertoire_un/ Disallow: /repertoire_deux/fichier.html Disallow: *.xml L’user-agent spécifie à quel(s) robot(s) s'adressent les directives. Le wildcard (*) signifie tous les robots. On aurait pu spécifier « Googlebot ». On peut donner des instructions différentes selon les robots. Le dièse permet d’insérer des commentaires ou de désactiver des instructions sans les supprimer Le disallow spécifie les répertoires ou fichiers interdits d'indexation En savoir plus : http://www.robotstxt.org/ Le wildcard est accepté par les moteurs majeurs pour les noms de fichiers, même si cela ne fait pas partie du protocole originel
  93. 93. CE QUI PEUT COMPLIQUER LE TRAVAIL DES MOTEURS Auteur : Sébastien Billard (s.billard@free.fr)
  94. 94. IMAGES Auteur : Sébastien Billard (s.billard@free.fr) - Les moteurs ne savent pas lire les images. Toute information contenue dans une image non optimisée peut être considérée comme inexistante pour les moteurs. - Toute image porteuse d'information devrait être dotée d'un attribut alt pertinent, idéalement de moins de 80 caractères (taille non critique). - Les images décoratives devraient comporter un attribut alt vide. - Une image peut être balisée sémantiquement, par exemple être intégrée dans une balise <hn> s'il s'agit d'un titre en image. - Un texte HTML est en général jugé plus efficace pour le référencement qu'un texte en image doté d'un attribut alt. <img src="logo-idemm.gif" alt="IDEMM – Ingénierie Documentaire, Edition et Mediation Multimedia " /> Exemple d'image dotée d'un attribut alt pertinent
  95. 95. BALISAGE SEMANTIQUE Auteur : Sébastien Billard (s.billard@free.fr) - Les balises sémantiques servent à définir la fonction, le « sens », de chaque élément dans le contenu. - Certaines balises sémantiques se voient reconnaître un poids plus fort par les moteurs de recherche : balises de titre (<hn>), emphases (<strong>)... - Il faut utiliser les balises pour leur fonction, et non pas pour leur impact supposé sur le référencement, ou leur rendu graphique (pas de détournement de balise !). - Le détournement de balise est souvent contre-productif. Les poids sont relatifs : si tout est balisé comme un titre, il n'y a alors plus de titre. - Un certain nombre de balises sémantiques n'ont a l'heure actuelle pas une grande utilité pour le référencement. Ce qui ne veut pas dire qu'il ne faut pas les utiliser, ni qu'elles ne seront jamais prises en compte. Spécifications HTML 4 en français : http://www.la-grange.net/w3c/html4.01/cover.html Spécifications HTML 5 en anglais : https://www.w3.org/TR/html5/sections.html
  96. 96. DES BALISES MOINS UTILES (POUR LE REFERENCEMENT ) Auteur : Sébastien Billard (s.billard@free.fr) Source : http://www.minet.net/spip/IMG/pdf/FichePratiqueHtmlSemantique-2-2-2.pdf
  97. 97. BALISAGE SEMANTIQUE : EXEMPLE DE RECOMMANDATIONS Auteur : Sébastien Billard (s.billard@free.fr)
  98. 98. COMMENT BALISER LES ELEMENTS DUNE PAGE WEB ? Auteur : Sébastien Billard (s.billard@free.fr) - Un logo-titre : rien, ou <h1> (différentes opinions sur le sujet, rien semble préférable) - Un titre ou un sous-titre : <h1>, <h2>, <h3>... - Un bloc de texte : <p> (peut être considéré comme la balise par défaut) - Un passage important, ou un chapô : <strong> (cette balise peut être incluse dans une autre, par ex <p>) - Une énumération non ordonnée (bullet points, tirets) : <ul> - Une énumération ordonnée : <ol> - Les liens d'un menu : <ul> (car un menu est une liste de liens)
  99. 99. TESTER LE BALISAGE SEMANTIQUE : LES OUTILS Auteur : Sébastien Billard (s.billard@free.fr) « Examiner l’élément » dans Firefox ou « inspecter » dans Chrome « Display element information » dans l’extension Web developer
  100. 100. DUPLICATION DE CONTENU Auteur : Sébastien Billard (s.billard@free.fr) - Les moteurs de recherche sont des bases de données, et font donc la chasse aux doublons. - Quand un même contenu est disponible sur plusieurs URLs, les moteurs vont en général favoriser une URL. La loi de Murphy étant universelle, ce sera rarement la bonne ;) - La duplication de contenu peut diluer la popularité, celle-ci se répartissant entre les différentes URLs au lieu de se concentrer sur une seule. - La duplication peut être complète, ou partielle (near duplicate).
  101. 101. SOURCES COURANTES DE DUPLICATION Auteur : Sébastien Billard (s.billard@free.fr) - Noms de domaines multiples (contenu visible sur un .fr et un .com, ou sur plusieurs domaines). - Non canonisation des domaines (site accessible avec et sans « www ») - Identifiants de sessions passé dans les URLs. - Mauvaise gestion de la réécriture d'URLs (absence de redirection 301) - Inversion de l'ordre des paramètres dans les URLs. - Pages d'impression. Mauvaise canonisation Identifiants de session Pages d'impression
  102. 102. EVITER LA DUPLICATION DE CONTENU Auteur : Sébastien Billard (s.billard@free.fr) - Utiliser un seul nom de domaine, et rediriger les autres vers celui-ci, via des redirections 301. - Canonisation : faire en sorte qu'une seule version d’URL soit accessible, en redirigeant les autres vers la première, via une redirection 301. - Eviter les identifiants de session passé dans les URLs. Préférer l'identification par cookies. - URL rewriting : toujours rediriger la version non-réécrite vers la version réécrite, via une redirection 301. - Inversion de l'ordre des paramètres dans les URLs : faire attention :) Trier les paramètre par ordre alphabétique peut aider. - Pages d'impression : interdire leur indexation par robots.txt, ou meta tags. - Eventuellement : utiliser la balise <link> rel=canonical. Attention cette balise est une indication, pas une directive. Les moteurs peuvent décider de les ignorer dans certains cas (rare).
  103. 103. EVITER LA DUPLICATION DE CONTENU : 301 ET REL=CANONICAL Auteur : Sébastien Billard (s.billard@free.fr) URL actuelleAncienne URL 301 Ok ! j'indexe l'URL actuelle et lui transfère le « linkjuice » des anciennes URLs URL canoniqueContenu dupliqué rel=canonical Ok ! j'indexe l'URL canonique et lui transfère le « linkjuice » des versions dupliquées La balise link rel=canonical s'insère dans le <head> des documents. Ne pas interdire l'indexation sinon la balise ne pourra être prise en compte. Syntaxe : <link rel="canonical" href="http://www.site.fr/version-canonique.html" />
  104. 104. REDIRECTIONS Auteur : Sébastien Billard (s.billard@free.fr) - Seules les redirections coté serveur (redirections HTTP) sont suivies par les moteurs. Elles peuvent être gérée au niveau du serveur (.htaccess, mod_rewrite) ou du code des pages (header en PHP). - Les redirections à base de javascript ou de balises meta refresh sont à éviter. - Parmi les redirections coté serveur, seules les redirections 301 (permanentes) transmettent correctement la popularité et permettent une bonne indexation des pages. Eviter les redirections 302 (temporaires) pour des redirections définitives. - Les redirections successives sont à éviter autant que possible, même les 301. <meta http-equiv="refresh" content="0;url=http://www.site.fr/" /> <script type="text/javascript"> <!-- window.location = "http://www.site.fr/" //--> </script> Exemple de redirection javascript, à placer dans le <head> Exemple de redirection utilisant la balise meta refresh
  105. 105. COMPORTEMENT DES MOTEURS FACE AUX REDIRECTIONS 301 ET 302 Auteur : Sébastien Billard (s.billard@free.fr) URL de destinationURL de base 302 Ok ! J'indexe le contenu de l'URL actuelle mais garde l'ancienne adresse. Mon linkgraph reste le même URL de destinationAncienne URL 301 Ok ! j'indexe l'URL actuelle et lui transfère le « linkjuice » des anciennes URLs
  106. 106. TESTER UNE REDIRECTION : LES OUTILS Auteur : Sébastien Billard (s.billard@free.fr) Outil « réseau » de Firefox Screaming Frog SEO spider en mode « list » Extension « link redirect trace » pour Firefox
  107. 107. TESTER LES REPONSES HTTP D’UN SITE : LES OUTILS Auteur : Sébastien Billard (s.billard@free.fr) Screaming Frog SEO spider en mode « spider » (500 URLs max dans la version gratuite)
  108. 108. NEGOCIATION DE CONTENU ET « CLOAKING » NON MALICIEUX Auteur : Sébastien Billard (s.billard@free.fr) - Il est possible de personnaliser le contenu d'une page en fonction de la localisation de l'utilisateur, ou de sa langue. Cela peut poser des problèmes en matière de référencement, pour trois raisons : - L'adresse IP d'un robot d'indexation n'est en général pas localisée dans la même région que vos visiteurs cibles. - Les robots d'indexation ne déclarent pas de langage. - Plusieurs versions d'un contenu vont se partager une URL unique, une seule version sera donc indexée. Mieux vaut donc éviter en général la négociation de contenu, et proposer à l'utilisateur de sélectionner la langue et/ou le pays de son choix.
  109. 109. STRUCTURATION DES SITES INTERNATIONAUX (LOCALISATION) Auteur : Sébastien Billard (s.billard@free.fr) - Les extensions locales sont souvent favorisées par les versions locales des moteurs. Des domaines séparés avec TLD locaux (.fr, .be, .co.uk...) sont donc la solution à préférer. - Si certains TLD locaux ne sont pas disponibles, envisager un domaine avec extension internationale (.com...). Le nom de domaine peut comporter un indicateur de localisation, par ex : nom-societe-usa.com. Si possible utiliser les codes ISO 3166-1. - Si tous les sites doivent être hébergés sur un domaine unique, bien séparer les versions locales, par des sous-domaines (ex : usa.societe.com) ou par des répertoires (ex : www.societe.com/usa/). - Les sous-domaines sont préférables, car il est plus facile d'effectuer des actions de référencement spécifiques. Codes internationaux ISO : https://fr.wikipedia.org/wiki/ISO_3166-1
  110. 110. STRUCTURATION DES SITES INTERNATIONAUX (LANGUE) Auteur : Sébastien Billard (s.billard@free.fr) - La langue des documents est déterminée automatiquement par les moteurs de recherche, en fonction des termes présents dans le contenu. - L'attribut « lang » n'est pas pris en compte par les principaux moteurs.
  111. 111. OPTIMISATION EDITORIALE POUR LE REFERENCEMENT Auteur : Sébastien Billard (s.billard@free.fr)
  112. 112. RAPPEL : LA PYRAMIDE DU REFERENCEMENT Auteur : Sébastien Billard (s.billard@free.fr) L'ensemble de ces composantes doit être optimisé pour obtenir une bonne visibilité : CONTENU STRUCTURE POPULARITE Le code qui contient le site et le met en forme Essentiellement le contenu textuel du site Ce que le web dit de votre site via les liens Crédibilise Favorise Valorise Redistribue On va travailler aujourd'hui sur ce qui est au coeur du web : le contenu !
  113. 113. ROLE DE L'OPTIMISATION EDITORIALE Auteur : Sébastien Billard (s.billard@free.fr) - L'optimisation éditoriale vise à satisfaire un double objectif : être trouvé, et être lu. - Il ne s'agit pas d'arbitrer entre utilisateurs et moteurs : il est parfaitement possible d'écrire des textes efficaces aussi bien pour les moteurs que pour les visiteurs. - Les bonnes pratiques d'optimisation éditoriale pour le référencement vont dans le sens d'une meilleure accessibilité et d'une meilleure ergonomie des contenus, d'où une plus grande satisfaction et de meilleures conversions. Ecrire pour les moteurs c'est nul ! Oui mais non : il s'agit d'écrire avant tout pour les utilisateurs, tout en prenant les moteurs en compte !
  114. 114. SPECIFICITES DE LA LECTURE SUR LE WEB Auteur : Sébastien Billard (s.billard@free.fr)
  115. 115. SPECIFICITES DE LA LECTURE SUR LE WEB Auteur : Sébastien Billard (s.billard@free.fr) - L’œil accorde instinctivement plus d’importance à certaines zones. Patterns souvent en « F » ou en « E » (mais pas toujours). - Le regards se pose d’abord sur les éléments de navigation (menus, liens…) puis seulement après sur les images. - Le contenu est d’abord scanné, puis ensuite lu (éventuellement). - Les internautes lisent ! Parfois plus même que sur papier. - L’efficacité d’un texte est plus grande quand le langage utilisé est simple, concis, scannable et objectif.
  116. 116. LECTURE EN « F » OU EN « E » Auteur : Sébastien Billard (s.billard@free.fr) Il s'agit d'une tendance, pour des pages, homogènes essentiellement textuelles. S'il y a bien une lecture en triangle à l'échelle d'une population d'internautes, ce n'est pas forcement le cas au niveau de l'individu. Source : http://www.useit.com/alertbox/reading_pattern.html
  117. 117. LECTURE EN « F » OU EN « E » Auteur : Sébastien Billard (s.billard@free.fr) L'insertion d'éléments rompant le rhytme des pages relativise par exemple le principe de lecture en « F » : Source : http://searchengineland.com/eye-tracking-on-universal-and-personalized-search-12233 Résultats classiques (2006) La saillance influe sur le parcours de l'oeil Résultats universels
  118. 118. LE REGARD SE POSE D'ABORD SUR LES ELEMENTS DE NAVIGATION Auteur : Sébastien Billard (s.billard@free.fr) Visionner : http://www.youtube.com/watch?v=lo_a2cfBUGc Les images attirent bien moins l'attention qu'on ne pourrait le penser
  119. 119. LES INTERNAUTES SCROLLENT, ET LISENT Auteur : Sébastien Billard (s.billard@free.fr) Les internautes n'hésitent pas à faire défiler le contenu des pages : Source : Source : http://blog.clicktale.com/?p=19
  120. 120. LES CONTENUS WEB ET LEUR OPTIMISATION Auteur : Sébastien Billard (s.billard@free.fr)
  121. 121. DIFFERENTES FORMES DE CONTENU Auteur : Sébastien Billard (s.billard@free.fr) Quand on parle de « contenus » en matière de SEO, on parle essentiellement des textes : De toute façon les contenus non-textuels pour être visibles dans les moteurs doivent être décrits avec... du texte.) Textes HTML ordinaires Balises <title> Balises <meta> description Attributs alt
  122. 122. NOTIONS DE DENSITE DES MOTS-CLES Auteur : Sébastien Billard (s.billard@free.fr) - Quelle couleur peut-on associer au carré de gauche ? à celui de droite ? - Pour qu'une page soit jugée pertinente pour une expression donnée, il faut que cette expression et ses variantes apparaissent un certain nombre de fois dans son contenu. On parle « d'occurences », ou de « densité » (A noter que la densité est une abstraction, et n'est pas utilisée en tant que tel par les moteurs. La densité idéale n'existe pas). - Les expressions-clés visées doivent apparaître dans la page, en particulier dans les zones chaudes (balises <title>, titres, ancres des liens...). - Il est bon de multiplier les occurrences et variations (expressions connexes, genre, nombre etc.) - Restez naturel ! Les répétitions abusives sont suspectes et altèrent la lisibilité.
  123. 123. EXEMPLE DE MAUVAISE GESTION DE LA DENSITE Auteur : Sébastien Billard (s.billard@free.fr) F490 : 12x iPhone : 6x Tactile : 6x SGH : 4x Mobile : 3x Téléphone : 0x Portable : 0x
  124. 124. LES ZONES CHAUDES D’UNE PAGE Auteur : Sébastien Billard (s.billard@free.fr) Balise <title> Titraille Liens Textes standards
  125. 125. LES ZONES CHAUDES D’UNE PAGE Auteur : Sébastien Billard (s.billard@free.fr) - Balise <title> : stratégique pour le positionnement ! Longueur idéale théorique de 40 à 80 caractères (environ 75 caractères max affichés par Google). Mais on peut faire plus long si nécessaire. Tout son contenu sera pris en compte par Google, même s’il est visuellement tronqué. Doit être unique, riche en mots-clés et décrire précisément le contenu de la page. - Titraille : doit être balisée comme telle (<hn>). Ce peut être un mot, une phrase, mais pas un paragraphe. Doit introduire le contenu qui suit immédiatement en dessous. - Liens : leur intitulé est spécialement important pour le positionnement de la page de destination du lien. Un lien doit être explicite, c'est-à-dire permettre de deviner ce dont parle la page de destination sans même la consulter. Il est donc important d'y faire figurer les mots-clés stratégiques. Attentions aux intitulés génériques (« en savoir plus », « suite » etc.) - Corps du texte : doit contenir vos expressions-clés, plus que pas assez, mais moins que trop ;) Favoriser un langage clair. Parlez le langage de vos visiteurs.
  126. 126. PARLEZ LE LANGUAGE DE VOS VISITEURS Auteur : Sébastien Billard (s.billard@free.fr) - Ne parlez pas votre langue : parlez la leur ! C’est avec leurs mots que les internautes recherchent dans les moteurs, pas avec les vôtres. - Utilisez un langage simple et clair, favorisez les mots communs. Evitez le jargon marketing, les termes métier (sauf si vous vous adressez à des professionnels). - Recherchez les bons mots-clés (outils de suggestions, communautés…) "Le groupe X réunit 39 000 personnes dans 36 pays. Son réseau mondial de services lui permet d’être concurrentiel sur un marché mondialisé [...] Européen, le modèle X ne propose pas de solution toute faite aux entreprises mais prend en compte leurs spécificités afin de leur proposer des services adaptés à leur culture et à leurs enjeux. Par ailleurs, la multiculturalité du groupe permet aux collaborateurs de X de s’enrichir des expériences et des best practices présentes dans l’ensemble des implantations afin de faire bénéficier à leurs clients de la maturité du groupe en termes d’expérience et d’offre [...] Parce que l’Homme tient une place particulièrement importante dans l’entreprise, X se donne pour mission d’offrir à ses clients des solutions innovantes en conjuguant talents et technologies. Les collaborateurs se reconnaissent dans trois valeurs clés : innover, s’engager et être ouvert." En savoir plus sur le langage clair : http://btb.termiumplus.gc.ca/redac-chap?lang=fra&lettr=chapsect10&info0=10
  127. 127. PARLEZ LE LANGUAGE DE VOS VISITEURS : EXEMPLES Auteur : Sébastien Billard (s.billard@free.fr) Rachète ? Achète ? Autorise ? Logiciels ? Applications ? Logiciels ?
  128. 128. PARLEZ LE LANGUAGE DE VOS VISITEURS : EXEMPLES Auteur : Sébastien Billard (s.billard@free.fr) Spécialistes de la peinture en trompe l’œil ? Formations Castorama ? Conseils pour bien ranger sa maison ? Décoration style années 50 ? Murs végétalisés ?
  129. 129. PARLEZ LE LANGUAGE DE VOS VISITEURS : EXEMPLES Auteur : Sébastien Billard (s.billard@free.fr) Un texte très abstrait proposé aux visiteurs… Le contenu alternatif par contre lui est très concret ;)
  130. 130. TROUVER LES BONS MOTS-CLES Auteur : Sébastien Billard (s.billard@free.fr) - Faites appel à votre bon sens, faites preuve d'empathie. - Brainstormez, observez les sites concurrents pour vous en inspirer (pas pour copier). - Observez comment s'expriment vos visiteurs (communautés, moteurs de recherche internes, questions aux intéressés…) - Utilisez Google Trends, Ubersuggest… - Utilisez les outils de suggestion de mots-clés des régies de liens sponsorisés telles que Adwords.
  131. 131. TROUVER LES BONS MOTS-CLES : UNE METHODE Auteur : Sébastien Billard (s.billard@free.fr) Brainstorm Données Google suggest Etude des concurrents Etudes des communautés 1ère liste de mots-clés Google Adwords (volumes de recherches et nouvelles suggestions) Liste finale de mots-clés Optionnel : étude de saisonnalité avec Google trends
  132. 132. UN RUBRIQUAGE ORIENTE MOTS-CLES Auteur : Sébastien Billard (s.billard@free.fr) - Plus de contenu = plus de visibilité potentielle (effet longue traîne) - 1 thème = 1 page (voire plusieurs) - Associer 1 à 5 expressions-clés à chaque page, qui guideront son optimisation (charte de mots- clés)
  133. 133. ABONDANCE DE CONTENU NE NUIT PAS Auteur : Sébastien Billard (s.billard@free.fr) Développer son contenu enrichit le champ lexical global du site et permet de développer un trafic de longue traîne, où les mots-clés rares vont souvent représenter la plus grosse partie du trafic : 5 premiers mots-clés : 16% du trafic 20 premiers : 25% 100 premiers : 40% 250 premiers : 50% 1000 premiers : 65% 5000 premiers : 81% 10000 premiers : 87% Total de 21568 mots-clés analysés
  134. 134. LA PYRAMIDE INVERSEE (FRONT LOADING) Auteur : Sébastien Billard (s.billard@free.fr) - Enoncez d'abord les faits essentiels pour ensuite détailler vos contenus (message le plus important en premier). - Les mots-clés visés doivent apparaître dès les premières phrases : cela est bon pour les utilisateurs comme pour les moteurs. INFORMATION PRINCIPALE (reprise dans le <title>) DEVELOPPEMENT DE L'INFORMATION PRINCIPALE INFORMATIONS DE MOINDRE IMPORTANCE 5W+2H Informations principales Développement Informations secondaires
  135. 135. LA PYRAMIDE INVERSEE : EXEMPLE Auteur : Sébastien Billard (s.billard@free.fr) Pour être efficace, sauf si vous êtes conteur ou romancier, évitez ce type d’introduction : "Il était une fois une petite fille de village, la plus jolie qu’on eût su voir ; sa mère en était folle, et sa mère-grand plus folle encore. Cette bonne femme lui fit faire un petit chaperon rouge, qui lui seyait si bien, que partout on l'appelait le Petit Chaperon rouge... " Préférez au contraire ceci : "Une petite fille se fait dévorer par un loup usant de malice alors qu'elle allait porter des galettes et du beurre à sa mère-grand, elle aussi victime de l'animal".
  136. 136. LES 5W+2H (OU QQOQP+CC) Auteur : Sébastien Billard (s.billard@free.fr) Ces questions peuvent vous aider à déterminer quelles informations sont les plus importantes. Il ne s'agit pas de répondre systématiquement à chacune d'entre elles. Tout est question de contexte. - Who (qui ?) - What (quoi ?) - When (quand ?) - Where (où ?) - Why (pourquoi ?) - How (comment ?) - How much (combien ?)
  137. 137. UNE TITRAILLE PRESENTE ET PERTINENTE Auteur : Sébastien Billard (s.billard@free.fr) - Titraille = titre + sous-titres (avec balises <h1> à <h6>) - Des titres et sous-titres explicites aident à une bonne visibilité - Ils améliorent également la "scannabilité" du texte Belle titraille ! Version d'origine Version optimisée
  138. 138. ECRITURE EN 3 DIMENSIONS Auteur : Sébastien Billard (s.billard@free.fr) - Les liens ne sont pas réservés aux menus et éléments de navigation ! - L'hypertexte permet de renvoyer à d'autres contenus hors de la page. - Ces liens sont fortement porteurs de pertinence, pour les moteurs de recherche comme pour les utilisateurs. Liens profonds au sein du contenu
  139. 139. OPTIMISATION DE LA POPULARITE Auteur : Sébastien Billard (s.billard@free.fr)
  140. 140. RAPPEL : LA PYRAMIDE DU REFERENCEMENT Auteur : Sébastien Billard (s.billard@free.fr) L'ensemble de ces composantes doit être optimisé pour obtenir une bonne visibilité : CONTENU STRUCTURE POPULARITE Le code qui contient le site et le met en forme Essentiellement le contenu textuel du site Ce que le web dit de votre site via les liens Crédibilise Favorise Valorise Redistribue Voyons aujourd'hui en quoi il n'y a pas de mal à se faire du lien !
  141. 141. LES LIENS : CONSIDERATIONS GENERALES Auteur : Sébastien Billard (s.billard@free.fr)
  142. 142. EN QUOI LES LIENS SONT IMPORTANTS ? Auteur : Sébastien Billard (s.billard@free.fr) - Les critères « on page » ne sont pas les seuls pris en compte par les moteurs de recherche : l'environnement d'une page web en dit aussi beaucoup sur sa pertinence. - Le linking sert surtout à départager des pages à la pertinence proche. De fait, plus la compétition est forte entre pages, plus la popularité est importante pour le positionnement. - Les liens transmettent en réalité plusieurs type de signaux : la popularité pure (Pagerank), mais aussi des informations relatives au contenu (ancres des liens), à la qualité (Trustrank et cie) etc. Les SEOs parlent de « linkjuice » pour désigner ces signaux. - Les liens permettent également d'être trouvé par les moteurs, et indexé. Un site populaire est indexé plus fréquemment, et plus profondément. Popularité Ancre Confiance LINKJUICE
  143. 143. PRECISIONS SUR LE PAGERANK GOOGLE Auteur : Sébastien Billard (s.billard@free.fr) - Le Pagerank (ou PR) est une valeur qui mesure uniquement la popularité relative d'une page par rapport au reste du web. Le PR est calculé à l'avance. Le Pagerank est un des élément du score final d'une page. - Le Pagerank d'une page mesure en fait la probabilité qu'a un surfeur aléatoire de visiter cette page. Sa valeur réelle est donc comprise entre 0 et 1. La somme des PR de l'ensemble des pages indexées par Google est égal à 1. - Le Pagerank est toujours celui d'une page. Quand on parle du Pagerank d'un site, on parle en général du PR de sa page d'accueil. Le PR d'un site est donc un abus de langage. - Toute page indexée, même dépourvue de liens entrants possède un PageRank « inné ». - Plus le PR d’une page est élevé, plus elle transmet du PR. Final score = IR score * Pagerank Score déterminant le positionnement dans la page de résultats Score de pertinence (lié au contenu, à la structure) Score de popularité
  144. 144. PAGERANK ET ALGORITHMES SIMILAIRES : FONCTIONNEMENT Auteur : Sébastien Billard (s.billard@free.fr) La formule originelle, décrite par Larry Page et Sergei Brin : Chaque lien présent sur une page transmet aux pages de destination une quantité de Pagerank égale à son propre PR, divisée par le nombre de liens présents sur la page, modéré par un facteur d'amortissement (0.85 dans le papier original). PR de la page T1 divisé par le nombre de liens sortants de la page T1 Facteur d'amortissement Web à 1 page Web à 2 pages isolées Web à 2 pages, lien unidirectionnel Web à 2 pages, lien réciproque
  145. 145. PAGERANK ET ALGORITHMES SIMILAIRES : FONCTIONNEMENT Auteur : Sébastien Billard (s.billard@free.fr) Simulateur de PageRank : http://caccio.blogdns.net/archives/71
  146. 146. QUALITE DES LIENS Auteur : Sébastien Billard (s.billard@free.fr) Tous les liens ne présentent pas le même intérêt pour le référencement, du fait de leur incapacité à être suivis ou à transmettre du PR : - Les liens dans des fichiers Flash doivent encore êtres considérés comme inexistants (même si les moteurs expérimentent). - Les liens codés en javascript ne sont pas suivis par les moteurs (en général). Les liens HTML additionnés de javascript peuvent être suivis et transmettre du Pagerank. - Les liens dotés d'un attribut nofollow peuvent être suivis ou non par les moteurs, mais dans tous les cas ils ne transmettent pas de « linkjuice ». - Les liens images transmettent du PageRank, mais aucun signal lié à l’ancre, sauf si un attribut alt est présent. <a href="http://www.site.fr" rel="nofollow">Ancre du lien</a> L'attribut nofollow « stérilise » le lien
  147. 147. PAGERANK ET ATTRIBUT NOFOLLOW Auteur : Sébastien Billard (s.billard@free.fr) Il a pu être tentant à une époque de sculpter le Pagerank en utilisant l'attribut nofollow, dans le but d'envoyer plus de PR vers les pages « utiles ». Ce n'est plus une technique efficace aujourd'hui (à supposer qu'elle l'ait un jour été) : 33% 33% 33% Le PR transmissible était redistribué vers les pages sans nofollow Le PR transmissible du lien nofollow s'évapore Depuis juin 2009 :Avant juin 2009 :Sans nofollow : 50% 50% nofollow 33% 33% nofollow
  148. 148. CRÉER DU LIEN ENTRANT Auteur : Sébastien Billard (s.billard@free.fr)
  149. 149. ESTIMER LA POPULARITE Auteur : Sébastien Billard (s.billard@free.fr) Pendant longtemps, Google a proposé une barre d’outil affichant une valeur de Pagerank sous forme de note entre 0 et 10. Mais ce Pagerank n’est plus proposé depuis 2016. La seule façon d’estimer la popularité d’une page désormais est de passer par des outils tiers (Majestic SEO, MOZ, Ahrefs…). Problème : rien ne dit que leur version du Pagerank soit équivalente à celle utilisée par Google, et leur index est de toute façon bien plus petit que celui de Google… Exemple d’alternative au Pagerank : le page authority de MOZ
  150. 150. EVALUER LE LINKING D'UN SITE : MAJESTIC SEO Auteur : Sébastien Billard (s.billard@free.fr) Majestic SEO prend en compte la dimension temporelle. Il possède son propre index : Evolution du nombre de liens
  151. 151. COMMENT CREER DU LIEN ENTRANT ? Auteur : Sébastien Billard (s.billard@free.fr) - Exploitez votre réseau immédiat (partenaires, institutionnels, clients, fournisseurs...) - Procédez à des échanges de liens avec des sites proches (privilégier la pertinence). - Soumettez votre site aux annuaires généralistes et spécialisés (de plus en plus obsolète). - Faites parler de vous, online et offline (interviews, communiqués, relations presse...) - Exprimez-vous dans des communautés (signatures de forums, commentaires de blogs...) - Proposez des contenus ou services attirant des liens spontanés (link baiting). - Soyez actif dans les réseaux sociaux (même si beaucoup de liens sont en nofollow, le SMO constitue une caisse de résonance de votre communication). - Travaillez votre référencement : la visibilité attire le lien. - Fuyez tout ce qui promet la création rapide de liens artificiels !
  152. 152. ANNUAIRES : CONSEILS POUR DES SOUMISSIONS DE QUALITE Auteur : Sébastien Billard (s.billard@free.fr) - Evitez les soumissions automatiques, les réseaux d'annuaires, les annuaires de mauvaise qualité (par exemple sans contrôle éditorial). - Evitez les annuaires exigeant un lien en retour. - Assurez-vous que les liens proposés soient « en dur » (liens directs, sans redirections). - Soumettez aux annuaire spécialisés (thématiques, locaux), et généralistes. - Ne soumettez que des sites finis (pas de sites en construction). - Sélectionnez la catégorie la plus pertinente de l'annuaire. - Utilisez la racine du site ou d'un sous-domaine comme lien. - Utilisez le nom du site comme titre, sauf indication contraire de l'éditeur. - Rédigez la description du site avec soin. Variez les descriptions si possible.
  153. 153. TROUVER DES ANNUAIRES Auteur : Sébastien Billard (s.billard@free.fr) - Utilisez les annuaires d'annuaires (pas forcément à jour). Maintenez une liste perso. - Cherchez des annuaires avec des requêtes de type « annuaire + mot-clé ». - Cherchez des annuaires en exploitant leurs signatures (ex : « mot-clé + "ajouter votre site" »). Avantage : on tombe souvent directement sur la bonne catégorie. - Etudiez les liens entrants des concurrents, par ex à l'aide de Majestic SEO. "Proposer un site" "Proposer votre site" "Ajouter un site" "Ajoutez votre site" "Inscrire votre site" "Soumettre un site" Signatures d'annuaires typiques
  154. 154. LIENS EN NOFOLLOW Auteur : Sébastien Billard (s.billard@free.fr) Beaucoup de sites utilisent l'attributs nofollow aujourd'hui. Ces liens sont inutiles pour la popularité, ce qui ne veut pas dire qu'ils n'aient aucune utilité : il peuvent générer du trafic et participer à la visibilité globale. L’extension nofollow permet de mettre en évidence les liens nofollow
  155. 155. LINK BAITING Auteur : Sébastien Billard (s.billard@free.fr) L'idée du link baiting est de pousser les internautes à faire des liens. Le link baiting comporte le plus souvent une dimension virale (bouche à oreille). Quelques moyens couramment employés : - Contenu qualitatif (même si ce n'est pas vraiment une technique) - Services, goodies, widgets ou logiciels gratuits. - Publications gratuites (ebooks, livre blanc). - Organisation de concours. - Publication d'articles polémiques. - Publications de vidéos ou contenus viraux. - Traduction de documents et ressources de références. - Etc.
  156. 156. MESURER L'EFFICACITE DU REFERENCEMENT Auteur : Sébastien Billard (s.billard@free.fr)
  157. 157. COMMENT CHOISIR DES INDICATEURS DE PERFORMANCE ? Auteur : Sébastien Billard (s.billard@free.fr) - Les indicateurs de performance (aussi appelés Key Performance Indicators, ou KPI) se définissent toujours en fonction d'un certain contexte : par exemple un deblacklistage peut être considéré comme un KPI pour un site auparavant banni. Pour un site e-commerce, le CA généré ou le taux de transformation seront plus important que pour un site d’information. - La difficulté en matière de SEO est de définir des KPIs qui soient fortement corrélés à la visibilité ou à la présence dans les moteurs de recherche. Le trafic moteurs ou les performances d'un site ne sont pas uniquement conditionnés par le référencement.
  158. 158. QUELQUES INDICATEURS DE PERFORMANCE POSSIBLES Auteur : Sébastien Billard (s.billard@free.fr) - Etendue de l'indexation (nombre ou pourcentage de pages indexées). - Evolution des positions sur une sélection de mots-clés. - Evolution du trafic en provenance des moteurs (hors notoriété). - Part des différents moteurs dans le trafic. - Couverture sémantique (nombre d’expressions générant du trafic). - Pertinence des mots-clés tapés. - Evolution de la réalisation d'objectifs. - Evolution des indicateurs commerciaux pour le trafic SEO
  159. 159. LE MINIMUM DE LA VISIBILITE : LA PRESENCE Auteur : Sébastien Billard (s.billard@free.fr) Il est pertinent pour un nouveau site web de s'assurer que celui-ci est bien indexé par les moteurs, et dans quel mesure : - Comptabiliser le nombre d'URLs utiles indexables, via les sitemaps XML ou via des outils de crawl. - Regarder le nombre d'URLs indexées par les moteurs, à l'aide de la commande « site: » (Le chiffre obtenu peut ne pas être 100% exact, mais donne un ordre de grandeur raisonnablement précis la plupart du temps).
  160. 160. VISIBILITE : LE CONTRÔLE DE POSITIONNEMENT Auteur : Sébastien Billard (s.billard@free.fr)
  161. 161. CONTRÔLE DE POSITIONNEMENT : A SAVOIR Auteur : Sébastien Billard (s.billard@free.fr) - Quantité de logiciels et services existent : Ranks, Yooda Seeurank, Advanced Web Ranking... Certains sont gratuits. Si on suit un grand nombre d’expressions les services en ligne sont préférables aux logiciels. - On peut soit suivre des mots-clés que l’on détermine, soit utiliser le panel de mots-clés préconstitué de l’outil. - Il ne faut pas utiliser les APIs des moteurs, car les résultats des APIs sont différents des résultats standards. - Les requêtes automatisées ne sont pas autorisées par les moteurs (sauf APIs).Si le moteur est trop requêté, l'adresse IP peut être bloquée temporairement. Pas de risque cependant pour le site lui-même. - Il peut y avoir de légère fluctuations dans les résultats, en fonction des datacenters interrogés. Cela est normal. De même les résultats peuvent différer avec la personnalisation. - Il est tout à fait normal que la position pour un mot-clé donné évolue d’un jour à l’autre. Un mot- clé peut même disparaitre le temps d’un relevé. C’est quand la position évolue fortement et durablement qu’il faut s’inquiéter ou se réjouir.
  162. 162. EXEMPLE D’OUTIL : RANKS Auteur : Sébastien Billard (s.billard@free.fr) Les mots-clés peuvent être ajouté individuellement, ou par lots Un groupe thématique peut être associé aux mots-clés On peut choisir les moteurs interrogés
  163. 163. EXEMPLE D’OUTIL : RANKS Auteur : Sébastien Billard (s.billard@free.fr) Une vue synthétique permet de se faire une idée de la bonne santé SEO du site
  164. 164. EXEMPLE D’OUTIL : RANKS Auteur : Sébastien Billard (s.billard@free.fr) Les mêmes indicateurs sont consultables pour les groupes thématiques
  165. 165. EXEMPLE D’OUTIL : RANKS Auteur : Sébastien Billard (s.billard@free.fr) Le détail des positions permet une analyse pour chaque mot-clé
  166. 166. EXEMPLE D’OUTIL : RANKS Auteur : Sébastien Billard (s.billard@free.fr) Il est possible d’obtenir des graphes, par exemple sur le positionnement d’un mot-clé
  167. 167. GOOGLE SEARCH CONSOLE Auteur : Sébastien Billard (s.billard@free.fr)
  168. 168. GOOGLE SEARCH CONSOLE Auteur : Sébastien Billard (s.billard@free.fr) Google Search Console (ex Webmaster Tools) est une interface à destination des webmasters, proposé par Google. Après vérification du site, Webmaster Tools permet notamment : - D'obtenir des informations sur la visibilité d'un site et sur le trafic généré par Google (jusque 16 mois en arrière) - D’obtenir des informations sur les mots-clés tapés par les internautes. Cela est d’autant plus utile que les mots-clés sont supprimés des référers Google depuis 2014 (remplacés par « not provided »). - D'accéder à une partie des liens entrants. - De détecter et résoudre divers problème techniques. - De contrôler l’indexation des pages du site (en complément au fichier robots.txt) - De soumettre un sitemap XML.
  169. 169. MOTS CLES, VISIBILITE, TRAFIC Auteur : Sébastien Billard (s.billard@free.fr) L’outil performance permet de voir l’évolution des visites en provenance de Google, du nombre d’impressions, du taux de clic ainsi que l’évolution de la position moyenne. Des options de filtrage sur les mots-clés, les URLs, le pays ou l’appareil sont proposées
  170. 170. MOTS CLES, VISIBILITE, TRAFIC Auteur : Sébastien Billard (s.billard@free.fr) Search Console permet d’obtenir 999 mots-clés en une vue. Mais on peut en obtenir bien plus en multipliant les vues grâce aux options de filtrage
  171. 171. LIENS ENTRANTS Auteur : Sébastien Billard (s.billard@free.fr) L’outil liens vers votre site donne accès à un certain nombre de lien, aux pages les plus plus liées ainsi qu’aux ancres des liens
  172. 172. STATISTIQUES SUR L’EXPLORATION Auteur : Sébastien Billard (s.billard@free.fr) L’outil statistiques sur l’exploration fournit une vue de l’activité de Googlebot sur le site
  173. 173. STATISTIQUES SUR L’EXPLORATION Auteur : Sébastien Billard (s.billard@free.fr) L’outil erreurs d’exploration permet de diagnostiquer les difficultés que Googlebot rencontre pour explorer le site
  174. 174. MESURE D’AUDIENCE Auteur : Sébastien Billard (s.billard@free.fr)
  175. 175. DIFFERENTS TYPES DE MESURE D’AUDIENCE Auteur : Sébastien Billard (s.billard@free.fr) - La mesure de l'audience d'un site peut être « site centric » ou « user centric ». - Les méthodes « user centric » se basent sur l'étude d'un panel d'utilisateurs, donc d’un échantillon. Elles sont intéressantes pour comparer les trafic des sites en incluant des dimension socio-démographiques. Mais elles apportent peu d'information pour un site en particulier, et sont surtout réservées aux sites à fort trafic. - Les méthodes « site centric » se basent sur l'étude du comportement de l’ensemble des visiteurs du site. Les dimensions socio-démographiques ne sont pas prises en compte (en général), mais l'information sur le comportement du visiteur dans le site est très précise. Les méthodes « site centric » reposent soit sur l'analyse des fichiers log, soit sur l'insertion de tags javascript (parfois d'images également). - L'analyse des fichiers log permet d'obtenir des informations sur les visites des robots, ce que les tags javascript ne permettent pas. Un script est à installer localement. Exemples d'analyseurs de logs : Awstats, Webalizer... - L'utilisation de tags javascript est plus aisée et permet de recueillir plus de données. Il s'agit généralement de services web. C'est la méthode proposée par Xiti, eStats, Omniture, Google Analytics...
  176. 176. GOOGLE ANALYTICS : INTERFACE GENERALE Auteur : Sébastien Billard (s.billard@free.fr) Période(s) considéré(s)Segments personnalisables
  177. 177. GOOGLE ANALYTICS : VOIR LE TRAFIC MOTEURS Auteur : Sébastien Billard (s.billard@free.fr) Aller dans « Acquisition » / « Canaux » puis sélectionner « organic search » dans le tableau
  178. 178. GOOGLE ANALYTICS : REPARTITION DU TRAFIC MOTEURS Auteur : Sébastien Billard (s.billard@free.fr) Aller dans « Acquisition » / « Canaux », sélectionner « organic search » dans le tableau, et « source » comme dimension principale Un clic sur l’icône secteur permet d’obtenir une visualisation par secteur
  179. 179. GOOGLE ANALYTICS : TROUVER LES REFERERS (LIENS ENTRANTS) Auteur : Sébastien Billard (s.billard@free.fr) Aller dans « Acquisition » / « Sites référents » On accède aux pages referers en cliquant sur les domaines listés.
  180. 180. GOOGLE ANALYTICS : RAPPORTS PERSONNALISES Auteur : Sébastien Billard (s.billard@free.fr) Au quotidien il est plus pratique de créer des rapports personnalisés, qui regrouperont les indicateurs favoris.
  181. 181. REFERENCEMENTS SPECIFIQUES Auteur : Sébastien Billard (s.billard@free.fr)
  182. 182. LA RECHERCHE UNIVERSELLE OFFRE DE NOUVELLES OPPORTUNITES Auteur : Sébastien Billard (s.billard@free.fr) Images Actualités Vidéos Résultats locaux
  183. 183. REFERENCEMENT LOCAL Auteur : Sébastien Billard (s.billard@free.fr)
  184. 184. REFERENCEMENT LOCAL : CE QU'IL FAUT SAVOIR Auteur : Sébastien Billard (s.billard@free.fr) - Environ 15% des pages de résultats Google affichent une carte. Le pack local recevrait environ 1% des clics aux USA. 73% des activités en ligne incluraient une dimension locale (du moins aux USA). - Les méthodes d'optimisation classiques reste valables : optimisez les balises <title> et les contenus en incluant la dimension locale quand cela est pertinent. - Le meilleur moyen d'être visible lors des recherches locales est d'inscrire son site dans le Local Business Center Google. L'inscription se fait par la complétion d'un formulaire suivie d'une confirmation par courrier ou SMS.
  185. 185. REFERENCEMENT LOCAL : PISTES POUR L'OPTIMISATION DES PAGES Auteur : Sébastien Billard (s.billard@free.fr) La balise <title> est évidemment un bon endroit pour mentionner sa ville, son département, sa région... Le contenu permet lui d'élargir le champ sémantique local et de renforcer sa pertinence... Le fait de mentionner son adresse sur toutes les pages pourrait être pris en compte par les moteurs. Cela permet en tout cas à l'internaute de vérifier que le résultat est pertinent.
  186. 186. OPTIMISER UN LISTING LOCAL BUSINESS CENTER Auteur : Sébastien Billard (s.billard@free.fr) - Le nom influe fortement sur le positionnement. Inclure éventuellement des mots-clés, quand votre activité n’est pas évidente sur la base de votre seul nom, sans spammer (ex : « François Dupont – Plombier chauffagiste »). - L'adresse a aussi une influence considérable, mais difficile de tricher ;) - Fournir une description riche en mots-clés et incitant au clic. - Pour les activités, utiliser les catégories qui vous definissent le mieux. https://support.google.com/business/answer/3038177
  187. 187. OPTIMISER UN LISTING LOCAL BUSINESS CENTER Auteur : Sébastien Billard (s.billard@free.fr) Lorsque une société ou un organisme possède plus de 10 établissements, il est possible d'effectuer un transfert groupé des fiches, grâce à un tableau au format CSV.
  188. 188. REFERENCEMENT DANS GOOGLE ACTUALITES Auteur : Sébastien Billard (s.billard@free.fr)
  189. 189. REFERENCEMENT DANS GOOGLE ACTUALITES Auteur : Sébastien Billard (s.billard@free.fr) - L'inclusion dans Google News est manuelle. - Seules les sources d'information à plusieurs rédacteurs peuvent être incluses. - La durée de vie d'une actualité dans l'index est de 30 jours. - Seuls les contenus originaux sont indexés. Les contenus repris sont filtrés. - Chaque actualité doit posséder une URL unique et permanente. - Les sitemaps pour Google Actualité permettent une indexation plus efficaces, et autorisent l'insertion de meta données. - Une structure de page simple est préférable (idéalement mise en page CSS, avec divisions logiques). - Les contenus inaccessibles car réservés aux abonnés peuvent être indexés, si utilisation du « premier clic gratuit ». Possibilité de limiter à 5 le nombre de clics gratuits par utilisateur et par jour).
  190. 190. REFERENCEMENT DES IMAGES Auteur : Sébastien Billard (s.billard@free.fr)
  191. 191. REFERENCEMENT DANS GOOGLE ACTUALITES Auteur : Sébastien Billard (s.billard@free.fr) - Les moteurs sont incapables de déterminer ce que représente une image. - L'optimisation des images passe toujours par l'association de texte. Le texte associé peut être interne (attribut alt, texte à proximité) ou externe à la page (ancres des liens, textes à proximité des ancres). - La popularité a une influence, de même que les critères usuels. Attributs alt Textes à proximité des liens vers les images Textes à proximité de l'image Le nom du fichier est pris en compte mais son poids n'est pas si fort comparé aux attributs alt et textes associés
  192. 192. REFERENCEMENT DES VIDEOS Auteur : Sébastien Billard (s.billard@free.fr)
  193. 193. REFERENCEMENT DES VIDEOS : CONSIDERATIONS GENERALES Auteur : Sébastien Billard (s.billard@free.fr) - Les moteurs ne sont pas capables de lire les vidéos (sauf expérimentations de transcription automatique et moteurs spécialisés). - Comme pour les images, l'optimisation des vidéos passe par l'adjonction de textes. - La façon la plus simple de rendre visibles ses vidéos reste de passer par les services du type Youtube, Google vidéo, Dailymotion etc. La transcription automatique reste perfectible…
  194. 194. REFERENCEMENT DES VIDEOS : PUBLICATION SUR SITE Auteur : Sébastien Billard (s.billard@free.fr) - L'indexation d'une vidéo publiée sur son propre site n'est jamais garantie, mais on peut la favoriser. - Les vidéos doivent être accessibles en HTTP. Le streaming n'est pas pris en charge par Google. Format supportés : .mpg, .mpeg, .mp4, .mov, .wmv, .asf, .avi, .ra, .ram, .rm, .flv - La taille des vidéos doit être inférieure à 30 Mo. - L’utilisation du microformats schema.org/VideoObject est conseillées. - Il est possible d'utiliser un fichier Sitemap pour vidéos, ou un fichier media RSS. Les deux formats permettent l'insertion de meta données optimisables : titres, descriptions, tags, transcripts (mRSS uniquement)... - Il est vital d'associer du texte aux vidéos : balise <title>, titres, descriptions, idéalement un transcript. - Les méthodes habituelles d'optimisation des pages continuent d'être valables (balisage sémantique, popularité...).
  195. 195. REFERENCEMENT DES VIDEOS : PUBLICATION SUR SITE Auteur : Sébastien Billard (s.billard@free.fr) Titres et textes optimisés Insertion d'un transcript
  196. 196. REFERENCEMENT DES VIDEOS : PUBLICATION SUR PLATEFORME Auteur : Sébastien Billard (s.billard@free.fr) - La publication sur les plateformes est la plus simple. Du fait que les pages sont structurées et les plateformes populaires, les vidéos sont indexées facilement. - La publication sur plateforme peut venir en complément d’une publication sur site. - La publication sur plateforme permet de bénéficier de l'effet de communauté et favorise la diffusion de la vidéo. Elle génère cependant assez peu de trafic sur le site source.
  197. 197. OPTIMISER SON REFERENCEMENT SUR YOUTUBE (ET CONSORTS) Auteur : Sébastien Billard (s.billard@free.fr) Où placer ses mots-clés ? Titre de la vidéo Description Les tags ne sont plus affichés depuis quelques années, mais restent présent dans l’interface de gestion des vidéos. Ils sont donc à optimiser

×