Cours de 20 heures donné aux étudiant du Master IDEMM de l'université de Lille 3 sur le SEO (référencement naturel). Ce cours couvre l'histoire des moteurs de recherche, les fonctionnement des moteurs et les différentes méthodes d'optimisation.
1. Cours de 20h, donné auprès des étudiants du Master
IDEMM, université de Lille 3
Auteur : Sébastien Billard (s.billard@free.fr)
SEO (référencement naturel)
2. THEME ABORDES DURANT CES 20 HEURES
Auteur : Sébastien Billard (s.billard@free.fr)
- Notions de base : le web, son histoire, notions-clés
- Les outils de recherche : typologie, fonctionnement, fonctionnalités
- Le search marketing en général : marché, métier, bonnes et mauvaises pratiques
- Optimisation structurelle et accessibilité technique
- Optimisation éditoriale : écrire pour le web
- Optimisation de la popularité : créer du lien
- Mesure d'audience, analyse de trafic et contrôle de positionnement
- Contenus spécifiques : réferencement local, images,vidéos, flux RSS, actualités...
- Les liens sponsorisés : fonctionnement, marché, techniques d'optimisation
3. ORGANISATION DES COURS ET DE L'EXAMEN
Auteur : Sébastien Billard (s.billard@free.fr)
- Les questions et partages d'expériences sont bienvenus, aussi bien sur le contenu du cours
que sur l'actualité du référencement.
- L'examen se fait sous forme de QCM et de questions ouvertes (40 questions).
- La durée de l’examen est de 2 heures.
- Notes de cours, smartphones et ordinateurs sont interdits durant l’examen.
- Des points négatifs seront attribués en cas de mauvaises réponse à une question fermée.
- Les questions ouvertes et les questions avec plusieurs réponses bonnes possibles seront
notées au prorata.
- Des questions sur ce qui aura été vu et évoqué en cours seront posées.
4. AVERTISSEMENT PREALABLE
Auteur : Sébastien Billard (s.billard@free.fr)
- Le référencement n'est ni de la magie, ni de la science.
- Le référencement est un art (au sens d'artisan).
- Ne prenez pas ce que disent les experts pour argent comptant (le prof y compris).
- Expérimentez, faites-vous votre propre opinion !
5. LE WEB : NOTIONS FONDAMENTALES
Auteur : Sébastien Billard (s.billard@free.fr)
6. UNE BREVE HISTOIRE DU WEB ET DES OUTILS DE RECHERCHE
Auteur : Sébastien Billard (s.billard@free.fr)
1945 : Le Memex, décrit dans « As we may think » de Vannevar Bush.
1963 : Le terme « hypertexte » créé par Ted Nelson.
1971 : « A theory of indexing », par Gerard Salton, inventeur de cosinus du même nom.
1974 : Naissance du protocole TCP/IP.
1990: 1er serveur web, au CERN, par Tim Berners Lee et Robert Cailliau.
1991 : Le web devient public. Archie,1er moteur FTP . Virtual Librairy, 1er annuaire.
1993 : Wanderer, 1er robot (crawler). Jumpstation, 1er vrai moteur de recherche. HTML 1.0.
1994 : Annuaire Yahoo. Webcrawler 1er moteur full text. 1ère bannière publicitaire.
1995 : Naissance d'Altavista, et du terme SEO. HTML 2.0. Javascript apparaît.
1996 : Inktomi crée l'inclusion payante, naissance de Echo, futur Voila. Flash apparaît.
7. UNE BREVE HISTOIRE DU WEB ET DES OUTILS DE RECHERCHE
Auteur : Sébastien Billard (s.billard@free.fr)
1997 : Naissance d'Askjeeves. John Kleinberg invente HITS. HTML 3.2 et 4.0.
1998 : Naissances de Google, DMOZ, Goto qui crée les liens sponsorisés.
2000 : Lancement d'Adwords, effondrement de la bulle Internet.
2004 : Naissance de MSN Search. Lancement du moteur Yahoo.
2009 : Le moteur Yahoo disparaît au profit de Microsoft Bing.
2014 : Lancement d’HTML 5.
8. LE MEMEX DE VANNEVAR BUSH (AS WE MAY THINK)
Auteur : Sébastien Billard (s.billard@free.fr)
« Imaginons un appareil de l’avenir à usage individuel,
une sorte de classeur et de bibliothèque personnels et
mécaniques (...) Un memex, c’est un appareil dans lequel
une personne stocke tous ses livres, ses archives et sa
correspondance, et qui est mécanisé de façon à
permettre la consultation à une vitesse énorme et avec
une grande souplesse. Il s’agit d’un supplément agrandi
et intime de sa mémoire (...)
Une étape s’avère indispensable au classement par
association, dont le principe reposerait sur un système
permettant à tout article d’en sélectionner immédiatement
et automatiquement un autre. C’est ce processus reliant
deux articles l’un à l’autre qui caractérise le memex (...)
Ainsi, à tout moment, quand l’un de ces documents est
visible, l’autre peut être rappelé instantanément (...)
Des formes entièrement nouvelles d’encyclopédies vont
apparaître, prêtes à l’emploi avec un réseau de pistes
fonctionnant par association les traversant, prêtes à être
insérées et amplifiées dans le memex... »
« Le memex sous la forme d'un
bureau serait capable de
mettre à portée de main de
l'operateur les fichiers et
documents relatifs à n'importe
quel sujet »
9. LE COSINUS DE SALTON
Auteur : Sébastien Billard (s.billard@free.fr)
Documents dans l'index :
Texte 1 : « la loutre est dans la rivière »
Texte 2 : « la loutre est avec les loutres dans la rivière »
Lemmatisation + suppression des verbes et stopwords :
Texte 1 : loutre, rivière
Texte 2 : loutre, loutre, rivière
Calcul des fréquence et vectorisation dans l’espace des fréquences des mots rivière, loutre
(dans cet ordre) :
Texte 1 : (1/2, 1/2 )
Texte 2 : (1/3, 2/3)
Requête : « je suis dans la rivière
avec les loutres de la rivière »
Vecteur : 2/3, 1/3
Source : http://www.spoonylife.org/algorithms-and-computation/modele-vectoriel-et-cosinus-de-salton
10. LE WEB DECRIT PAR TIM BERNERS LEE ET ROBERT CAILLIAU
Auteur : Sébastien Billard (s.billard@free.fr)
11. STRUCTURE DU WEB : HOTES, DOMAINES ET DOCUMENTS
Auteur : Sébastien Billard (s.billard@free.fr)
World Wide Web
Hôtes
identifiés par leurs adresses IP
(ex : 209.85.229.147)
Domaines (sites)
Identifiés par leurs noms de domaines
(ex : google.fr)
Documents (pages)
Identifiés par leurs URLs
(ex : http://www.site.fr/page.html )
Note : une IP est spécifique à un hôte, mais un hôte peut avoir plusieurs IPs
12. QUE SE PASSE-T-IL LORS DE L'ACCES A UNE PAGE ?
DNS du FAI
Serveur web
« J'aimerais accéder à
www.exemple.fr/index.html »
« Bonjour hôte 209.85.229.99,
j'aimerais accéder à l'URL
www.exemple.fr/index.html »
« Je regarde dans ma base...
Ok ! L'IP du domaine exemple.fr est 209.85.229.99 »
« Voyons voir... Le domaine existe bien chez moi...
...Le document demandé également... Je vous envoie
le fichier ! »
HTTP
L’accès à une page se fait en réalité en deux temps :
Auteur : Sébastien Billard (s.billard@free.fr)
13. QUE SE PASSE-T-IL LORS DE L'ACCES A UNE PAGE ?
GET /referencement/ HTTP/1.1
Host: s.billard.free.fr
Connection: close
Accept: */*
User-Agent: Mozilla/4.0 (compatible; MSIE 7.0;
Windows NT 5.1; GTB6; .NET CLR 2.0.50727;
InfoPath.2; .NET CLR 3.0.4506.2152; .NET
CLR 3.5.30729)
HTTP/1.1 200 OK
Date: Fri, 02 Oct 2009 10:36:31 GMT
Server: Apache/ProXad [Aug 9 2008 02:45:09]
Cache-Control: must-revalidate, max-age=0
Pragma:
X-Powered-By: PHP/4.4.3-dev
Last-Modified: Wed, 30 Sep 2009 14:39:48 GMT
Connection: close
Content-Type: text/html; charset=ISO-8859-1
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0
Strict//EN" (...)
Exemple de requête HTTP : Exemple de réponse HTTP :
Auteur : Sébastien Billard (s.billard@free.fr)
14. Auteur : Sébastien Billard (s.billard@free.fr)
PLUSIEURS TYPES DE REPONSES HTTP
2XX : Succès
3XX : Redirections
4XX : Erreurs coté client
5XX : Erreurs coté serveur Pour voir les entêtes HTTP : outils
de développement web de Firefox,
rubrique réseau.
15. Auteur : Sébastien Billard (s.billard@free.fr)
LES CODES DE REPONSE HTTP (AUTRES QUE 200)
« Voyons voir... Le domaine existe bien chez moi...
...par contre je ne connais pas votre fichier »
« Voyons voir... Le domaine existe bien chez moi...
...par contre le fichier a définitivement changé d'adresse. La voici »
« Voyons voir... Le domaine existe bien chez moi...
...par contre le fichier e temporairement changé
d'adresse. La voici »
« Voyons voir... Le domaine existe bien chez moi...
...par contre l'accès au fichier est interdit »
« Voyons voir... Le domaine existe bien chez moi...
...par contre le site web est en panne »
404
301
404
302
500
403
« Voyons voir... Le domaine existe bien chez moi...
...par contre revenez plus tard le site est en
maintenance »
503
16. Auteur : Sébastien Billard (s.billard@free.fr)
PAGES STATIQUES ET DYNAMIQUES
Sites statiques
Chaque page pré-existe sur le serveur (1 page = 1 fichier HTML).
Sites dynamiques
Les pages sont générées à la demande, par un langage de script (PHP, ASP...). Les paramètres
pour construire la page sont souvent passés dans l'URL. Ex :
www.site.fr/index.php?paramètre1=a¶metre2=b
Attention : L'URL ne permet pas à 100% de déterminer si un site est statique.
« www.site.fr/catalogue/chemises-rouges.html » peut très bien être une page dynamique
18. Auteur : Sébastien Billard (s.billard@free.fr)
STRUCTURE D'UNE PAGE WEB : LE CODE HTML
Les balises définissent la fonction de chaque élément.
Elles s'ouvrent et se ferment. On peut les imbriquer.
Syntaxe : <balise>élément</balise> (en général)
Les attributs précisent les propriétés de
chaque élément. On peut les cumuler. Syntaxe
: <balise attribut= "valeur">élément</balise>
19. Auteur : Sébastien Billard (s.billard@free.fr)
STRUCTURE D'UNE PAGE WEB : PRINCIPALES BALISES ET ATTRIBUTS
Les balises fondamentales les balises <meta>
<html> <meta> description
<head> <meta> robots
<body>
<title>
Les balises structurantes du contenu (dans le <body>)
<a>
<p>
<h1> à <h6>
<strong>
<b>
<ul>,<ol> et <li>
<table>, <tr> et <td>
Les balises riches et multimedia (dans le <body>)
<img>
<script>
<embed> ou <object>
20. Auteur : Sébastien Billard (s.billard@free.fr)
SUGGESTIONS DE LECTURE
L'essentiel sur le
référencement
Un condensé sur
l'écriture web
Un pavé sur l'écriture
web, davantage
orienté SEO
Une référence sur le
« bien chercher »
21. Auteur : Sébastien Billard (s.billard@free.fr)
QUELQUES SITES POUR LA VEILLE
En français :
www.abondance.com
www.webrankinfo.com
webmaster-fr.googleblog.com
lemusclereferencement.com
www.seomix.fr
En anglais :
searchengineland.com
www.seobythesea.com
www.seomoz.org
webmasters.googleblog.com
22. LES OUTILS DE RECHERCHE
Auteur : Sébastien Billard (s.billard@free.fr)
23. Auteur : Sébastien Billard (s.billard@free.fr)
TYPOLOGIE DES OUTILS DE RECHERCHE : MOTEURS ET ANNUAIRES
Moteurs
- Gestion automatisée
- Entrée par indexation
- Tout le web a vocation à être indexé
- Tout le contenu des pages est indexé
- Navigation par requêtes
Annuaires
- Gestion humaine
- Entrée par soumission
- Des choix éditoriaux sont faits
- Seules les références aux sites sont
indexées
- Navigation arborescente (recherche
possible)
24. Auteur : Sébastien Billard (s.billard@free.fr)
FONCTIONNEMENT D'UN MOTEUR DE RECHERCHE (VERSION SIMPLE)
Index
Moteur
de recherche
IndexeurWeb
26. COMMENT PENSE UN MOTEUR ?
Juger de la pertinence d'une page web, c'est un peu comme juger du contenu
d'un livre dans une bibliothèque :
Contenu Titre
4ème de couverture
Table des matière
Contenu général
Balise <title>
Balise <meta> description
Titraille (balises <h1> à <h6>)
Ensemble des textes
Structure Lisibilité Accessibilité technique et
structuration
Popularité Recommandations Quantité, qualité et teneur des
liens entrants
Auteur : Sébastien Billard (s.billard@free.fr)
27. ANATOMIE GENERALE D’UNE PAGE DE RESULTATS
Auteur : Sébastien Billard (s.billard@free.fr)
Résultats
sponsorisés
Résultats
naturels
Résultats Google Shopping
(sponsorisés)
28. ELEMENTS D’INTERFACE GOOGLE
Auteur : Sébastien Billard (s.billard@free.fr)
Sitelinks
- Déterminés algorithmiquement
- Jusque 10 éléments
Classic sitelinks
- Déterminés algorithmiquement
- Jusque 4 éléments
Sitelinks searchbox
- Pour des requêtes « marque »
- Uniquement pour certains sites
- Mieux vaut mettre en place le script Google
Hiérarchie de site
- Basés sur le fil d’ariane
Jumplinks
- Contextuels
- Basés sur les ancres
29. ELEMENTS D’INTERFACE GOOGLE
Auteur : Sébastien Billard (s.billard@free.fr)
Position zéro
- Site source déterminé algorithmiquement
Résultats Onebox
- Réponses fournies directement par Google
- Réponses à de multiples questions
Carousel Knowledge graphBloc Knowledge graph
- Issus de la base de connaissance Google
30. RECHERCHE UNIVERSELLE
Auteur : Sébastien Billard (s.billard@free.fr)
Actualités
Knowledge graph
ages web
Images
La recherche universelle consiste à
présenter dans la page de résultats
(SERP) par défaut des résultats
issus des divers moteurs de
recherche verticaux.
Objectif : « faire tomber les silos de
l'information qui existent sur le
web » (Marissa Mayer, 16/05/07)
Peuvent apparaître dans les SERP
en plus des pages web : actualités,
images, vidéo, blocs Knowledge
Graph…
La recherche universelle ne doit pas
être confondue avec les
enrichissement visuels via les
microformats (ex : cas des recettes
de cuisine).
31. RECHERCHE UNIVERSELLE
Auteur : Sébastien Billard (s.billard@free.fr)
Plusieurs critères concourent à la personnalisation et à la contextualisation des résultats :
Localisation de l'utilisateur
(IP, langue du navigateur)
Comportement de
l'utilisateur (recherches
précédentes, sites
préférés)
Saisonnalité, actualité
de la requête
Interface utilisée
(.com, .fr...)
Depuis 2019, les résultats de recherche sont personnalisés pour tout le monde, que les
utilisateurs soient loggés ou non.
32. LES OPERATEURS UTILES A LA RECHERCHE ET AU SEO
Auteur : Sébastien Billard (s.billard@free.fr)
Les guillemets, pour rechercher une chaine de caractères, ou un terme exact sans synonymie :
Le signe « - », pour exclure un mot, une expression ou un autre critère de recherche :
La commande « site: » pour chercher sur un TLD, un domaine, un sous-domaine, un répertoire :
La commande « filetype: » pour chercher un type de fichier donné :
« inurl: » et « allinurl: » pour chercher les pages dont l'URL contient une expression :
33. LES OPERATEURS UTILES A LA RECHERCHE ET AU SEO
Auteur : Sébastien Billard (s.billard@free.fr)
« intitle: » et « allintitle: » pour chercher les pages dont le <title> contient une expression :
« cache: » pour obtenir la version en cache d’une page :
« src: » pour chercher les images hébergées sur un domaine ou sous-domaine :
« OR » pour chercher l’un ou l’autre des termes :
Les parenthèses pour grouper des termes :
34. COMBINAISONS ET EXEMPLES CONCRETS
Auteur : Sébastien Billard (s.billard@free.fr)
Trouver des sites qui hotlinkent vos images :
Trouver les sous-domaine d’un domaine :
Trouver les sous-rayons d’un site e-commerce :
Trouver produits épuisés d’un site e-commerce :
35. LE SEARCH MARKETING EN GENERAL
Auteur : Sébastien Billard (s.billard@free.fr)
36. Auteur : Sébastien Billard (s.billard@free.fr)
QU'EST CE QUE LE SEARCH MARKETING ?
Il s'agit de l'ensemble des moyens permettant de rendre un site visible dans un contexte de
recherche sur le web :
Référencement naturel (SEO)
Liens sponsorisés (SEA)
Shopping feeds
(comparateurs)
37. Auteur : Sébastien Billard (s.billard@free.fr)
LES MOTS ONT LEUR IMPORTANCE
Le « Search Marketing » ou SEM ne désigne pas les seuls liens sponsorisés comme cela est
parfois présenté !
SEM=SEO+SEA+SF
38. Auteur : Sébastien Billard (s.billard@free.fr)
LA JUNGLE DES TERMINOLOGIES
Le jargon du Search comprend de nombreux synonymes :
REFERENCEMENT
NATUREL
LIENS
SPONSORISES« référencement » « SEO »
« référencement organique »
« searche engine optimization »
« positionnement publicitaire »
«SEA »
« PPC »
« pay per click »
« search engine advertising »
« référencement payant »
SHOPPING FEEDS
« shop bots »
« comparateurs de prix »
« products feeds »
40. REFERENCEMENT NATUREL
Auteur : Sébastien Billard (s.billard@free.fr)
- Visibilité dans les moteurs de recherche généralistes et portails
- L'indexation est automatique, sans action obligatoire de l'éditeur
- C'est le contenu des pages qui est indexé
- L'indexation est gratuite
- Pas de garantie de position (classement algorithmique en fonction de la pertinence)
41. LIENS SPONSORISES
Auteur : Sébastien Billard (s.billard@free.fr)
- Visibilité dans les moteurs de recherche généralistes, portails et site de contenu
- Il faut enchérir sur des expressions-clés pour être visible
- Modèle de paiement au clic, avec prix variable déterminé par enchères
- La position est dépendante de ce que l'annonceur est prêt à payer (principalement)
42. SHOPPING FEEDS
Auteur : Sébastien Billard (s.billard@free.fr)
- Visibilité dans les comparateurs de prix et sites de contenu affiliés
- C'est un flux XML qui est indexé (base produits)
- Visibilité uniquement si l'on paye
- Modèle de paiement au clic, avec prix fixé par forfait ou enchères
- La position est dépendante en partie de ce que l'annonceur est prêt à payer
43. LE MARCHE DU SEARCH MARKETING
Auteur : Sébastien Billard (s.billard@free.fr)
44. LE PAYSAGE DES MOTEURS DE RECHERCHE : EUROPE
Auteur : Sébastien Billard (s.billard@free.fr)
45. LE PAYSAGE DES MOTEURS DE RECHERCHE : USA
Auteur : Sébastien Billard (s.billard@free.fr)
46. LE PAYSAGE DES MOTEURS DE RECHERCHE : RUSSIE
Auteur : Sébastien Billard (s.billard@free.fr)
47. LE PAYSAGE DES MOTEURS DE RECHERCHE : CHINE
Auteur : Sébastien Billard (s.billard@free.fr)
48. LE PAYSAGE DES MOTEURS DE RECHERCHE : JAPON
Auteur : Sébastien Billard (s.billard@free.fr)
49. QUELQUES DONNEES CLES
Auteur : Sébastien Billard (s.billard@free.fr)
- 46,6 millions d'internautes soit 89% des français (Mediametrie, septembre 2017)
- 82,7% des internautes effectuent des achats en ligne (Fevad, juin 2017)
- 1 consommateur sur 2 effectue au moins un achat par mois sur internet (Ipsos media, janvier
2015)
- La recherche d'information est l'activité la plus pratiquée sur le web, devant le web (Insee, mai
2006)
- Les moteurs représentent de 30 à 40% du trafic d'un site en moyenne
- Plus de 90% des clics ont lieu sur les 3 premières pages de résultats (iProspect, avril 2006)
50. DISTRIBUTION DES CLICS SUR UNE PAGE DE RESULTATS
Auteur : Sébastien Billard (s.billard@free.fr)
Position = visibilité = trafic . Mais le taux de clic décroît rapidement avec la position…
51. DISTRIBUTION DES CLICS SUR UNE PAGE DE RESULTATS
Auteur : Sébastien Billard (s.billard@free.fr)
y = 29,498x-0,855
0
10
20
30
40
50
60
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
CTR
… y compris sur les requêtes hors-marque (génériques)
52. REPARTITION DES CLICS : SEO vs SEA
Auteur : Sébastien Billard (s.billard@free.fr)
D’après une étude Seomoz de
décembre 2017, les liens naturels
draineraient 20X plus de trafic que
les liens sponsorisés
53. LE TRAVAIL DU REFERENCEUR
Auteur : Sébastien Billard (s.billard@free.fr)
54. Auteur : Sébastien Billard (s.billard@free.fr)
LA PYRAMIDE DU REFERENCEMENT
L'ensemble de ces composantes doit être optimisé pour obtenir une bonne visibilité :
CONTENU
STRUCTURE
POPULARITE
Le code qui contient le site et le met en forme
Essentiellement le contenu textuel du site
Ce que le web dit de votre site via les liens
Crédibilise Favorise
Valorise Redistribue
Le travail de référencement va consister à activer chacun de ces leviers.
55. Auteur : Sébastien Billard (s.billard@free.fr)
LA PYRAMIDE DU REFERENCEMENT
Le référenceur va ainsi agir sur les différents étages de la pyramide, par de multiples actions.
Quelques exemples (liste non exhaustive) :
CONTENU
STRUCTURE
POPULARITE
Accessibilité technique
Soumission aux annuaires Réseaux spécifiques
Communiqués de presseRéseaux sociaux
Optimisation des textes
Micro contenus
Recherche de mots-clés
Architecture de l'information
Intitulés des liens
Distribution interne de la popularité
Formation des rédacteurs
Balisage sémantique
Duplication de contenu
Qualité du code
Noms de domaine
Link baiting
56. Auteur : Sébastien Billard (s.billard@free.fr)
LA PYRAMIDE DU REFERENCEMENT
Pour mener à bien sa mission, le référenceur va devoir développer un certain nombre de
compétences :
57. CE QUI EST PERMIS, CE QUI NE L’EST PAS
Auteur : Sébastien Billard (s.billard@free.fr)
58. BONNES PRATIQUES PRONEES PAR LES MOTEURS
Auteur : Sébastien Billard (s.billard@free.fr)
Source : https://support.google.com/webmasters/answer/35769?hl=fr
59. PRATIQUES INTERDITES PAR LES MOTEURS
Auteur : Sébastien Billard (s.billard@free.fr)
- Systèmes de liens pour améliorer artificiellement la popularité
- Textes et liens cachés
- Cloaking et redirections trompeuses
- Mots-clés sans rapport avec le site
- Répétition abusives de mots-clés
- Contenus dupliqués dans le seul but de mieux se positionner
- Pages satellites
- Requêtes automatisées
60. SYSTEMES DES LIENS ARTIFICIELS
Auteur : Sébastien Billard (s.billard@free.fr)
Les private blog networks (PBN)
sont à la mode mais ne sont pas
appréciés des moteurs….
L’achat de liens (si découvert)
est également sanctionné
De même que les échanges
automatisés de liens
61. TEXTES ET LIENS CACHES
Auteur : Sébastien Billard (s.billard@free.fr)
Un snippet a priori pertinent,
quoique suspect...
Tiens ! Aucun
contenu visible...
L'examen du code source montre du texte caché
grâce à la balise <noembed>, texte qui plus est
visiblement écrit à destination des moteurs.
62. TEXTES ET LIENS CACHES
Auteur : Sébastien Billard (s.billard@free.fr)
Un site très ordinaire...
Mais la désactivation des CSS montre
des textes cachés visiblement
optimisés pour les moteurs
63. TEXTES ET LIENS CACHES : PRINCIPALES TECHNIQUES
Auteur : Sébastien Billard (s.billard@free.fr)
- Insertion dans balises <noframe>, <noscript>, <noembed>
- Utilisation d'une couleur de police similaire à celle du fond (via HTML ou CSS)
- Utilisation des propriétés CSS visibility:hidden et display:none
- Positionnement CSS hors de l'écran (coordonnées négatives)
64. CLOAKING
Auteur : Sébastien Billard (s.billard@free.fr)
Cloaking pour la bonne cause : le
site fournit un contenu différent en
mobile et en desktop
Mais la même technique pourrait
être utilisée pour tricher, par ex par
insertion de contenu invisible pour
les visiteurs humains
65. 2 FORMES DE CLOAKING (+1)
Auteur : Sébastien Billard (s.billard@free.fr)
- IP delivery : le contenu affiché est déterminé en fonction de l'adresse IP du visiteur (IP d'un
moteur ? IP d'un FAI ?)
- User-agent delivery : le contenu est affiché en fonction de l'user-agent du visiteur (navigateur
desktop ? Navigateur mobile ? Googlebot ?)
- Cloaking sur referer : le contenu est affiché en fonction de la provenance du visiteur. Pas
d'utilité pour spammer, les moteurs ne transmettant pas de referers. Mais d'autres utilités...
66. PAGES SATELLITES
Auteur : Sébastien Billard (s.billard@free.fr)
Pas de redirection, pas de texte caché,
mais un contenu visiblement pensé pour
les seuls moteurs
67. REDIRECTIONS TROMPEUSES
Auteur : Sébastien Billard (s.billard@free.fr)
Un listing d'apparence ordinaire...
Mais la page renvoie
automatiquement vers
l'accueil du site
La désactivation de javascript
montre une page satellite, avec
texte caché par CSS, comprenant
une redirection javascript
68. REQUETES AUTOMATISEES
Auteur : Sébastien Billard (s.billard@free.fr)
Les moteurs n’apprécient pas les
requêtes automatisées
Mais il faut bien avouer qu'elle
peuvent être utiles au référenceur :).
69. QUELQUES PISTES POUR DETECTER LE SPAM
Auteur : Sébastien Billard (s.billard@free.fr)
- Contenu camouflé : Ctrl+A, et scrolling
- Contenu caché : examen du code source
- Redirections : désactivation de javascript (barre d'outils Web Developer pour Chrome)
- Répétitions abusives et mots-clés hors propos : lire !
- Cloaking sur user-agent : simulation de l'user agent d'un moteur (extension User agent
switcher pour Firefox)
- Cloaking sur IP : cache Google (rare), affichage dans Google Translate ou Google Analytics
(synthèse données/site)
- Réseaux de liens artificiels : analyse des liens
71. RAPPEL : LA PYRAMIDE DU REFERENCEMENT
Auteur : Sébastien Billard (s.billard@free.fr)
L'ensemble de ces composantes doit être optimisé pour obtenir une bonne visibilité :
CONTENU
STRUCTURE
POPULARITE
Le code qui contient le site et le met en forme
Essentiellement le contenu textuel du site
Ce que le web dit de votre site via les liens
Crédibilise Favorise
Valorise Redistribue
On va travailler aujourd'hui sur
cet étage (ou plutôt les fondations...)
72. ROLES DE L'OPTIMISATION STRUCTURELLE
Auteur : Sébastien Billard (s.billard@free.fr)
L'optimisation de la structure d'un site pour le référencement vise à satisfaire deux objectifs :
- A minima, assurer l'indexabilité du site par les robots d'indexation (accessibilité technique)
- Mettre en valeur le contenu pour un traitement optimal par les moteurs
73. CE QUI PEUT BLOQUER LES ROBOTS
Auteur : Sébastien Billard (s.billard@free.fr)
- Contenus au format Flash
- Contenus dans des formats tiers nécessitant l'installation d'un plugin (Flash, Silverlight...)
- Scripts javascript
- Scripts Ajax (javascript et XML)
- Contenus accessibles uniquement au travers d'un formulaire
- Fichiers robots.txt
74. CE QUI PEUT COMPLIQUER LE TRAVAIL DES MOTEURS
Auteur : Sébastien Billard (s.billard@free.fr)
- Contenus sous forme d'images
- Mauvais usage des balises sémantique (ou absence d'usage)
- Contenus dupliqués
- Méthodes de redirections non adaptées
- Contenu délivrés en fonction de l'user-agent ou de l'adresse IP
- Splash pages
- Frames (cadres)
75. VOIR LE WEB COMME UN ROBOT
Auteur : Sébastien Billard (s.billard@free.fr)
76. VOIR LE WEB COMME UN ROBOT : GRANDS PRINCIPES
Auteur : Sébastien Billard (s.billard@free.fr)
Une bonne façon d'appréhender la structure d'un site ou d'une page, outre l'examen du code,
est de se mettre dans la peau d'un robot, c'est-à-dire de naviguer avec les même limitations :
- Pas d'images (utilisation des attributs alt à la place)
- Pas de mise en forme (CSS)
- Pas de javascript
- Pas de Flash
- Pas de format tiers (Silverlight, Quicktime etc.)
- Lecture dans l'ordre du code (linéarisation)
- Pas de cookies
- Eventuellement en changeant son agent-utilisateur
77. VOIR LE WEB COMME UN ROBOT : LYNX
Auteur : Sébastien Billard (s.billard@free.fr)
Ouvrir une URL : "g"
Activer des liens : "↓" et "↑"
Défiler : "espace"
Cliquer : "entrée"
Page prec/suiv : "←" et "→"
Source : ""
Aide : "?"
Télécharger : https://www.cygwin.com/ (installer le package Lynx)
78. VOIR LE WEB COMME UN ROBOT : WEB DEVELOPER (CHROME)
Auteur : Sébastien Billard (s.billard@free.fr)
On désactive javascript…
… les cookies…
… les CSS…
… on remplace les images par
leurs attributs alt…
… et on linéarise la page
79. VOIR LE WEB COMME UN ROBOT : WEB DEVELOPER (CHROME)
Auteur : Sébastien Billard (s.billard@free.fr)
Rendu standard
navigateur
Rendu robots
80. VOIR LE WEB COMME UN ROBOT : CACHE GOOGLE
Auteur : Sébastien Billard (s.billard@free.fr)
La commande « cache: » dans Google permet
d’accéder à la dernière version indexée par le moteur
L’option « version en texte
seul » permet de voir la
page comme la voit le robot
81. CE QUI PEUT BLOQUER LES ROBOTS
Auteur : Sébastien Billard (s.billard@free.fr)
82. FLASH
Auteur : Sébastien Billard (s.billard@free.fr)
- Flash n'est à l'origine pas un outil de publication, mais d'animation.
- Flash nécessite un plugin pour être lu (Flash Player). Ce n'est pas un standard du web, même
si son usage est très répandu.
- Flash n'est pas correctement lu par les moteurs, même s'ils arrivent à extraire quelques
informations, car l’information y est mal structurée et contenue le plus souvent dans un fichier
unique. D’ailleurs Google ne remonte plus aujourd’hui de fichiers swf dans ses résultats
(commande filetype:swf)
- Il faut donc encore aujourd'hui considérer Flash comme étant totalement inaccessible (et
l'indexation éventuelle comme un bonus).
L'indexation de Flash pose / posait
de nombreux problèmes...
83. SITE 100% FLASH UN EXEMPLE
Auteur : Sébastien Billard (s.billard@free.fr)
Ce que voit l'utilisateur
(s'il a Flash)
Ce que voit le moteur
(c'est à dire pas grand chose)
Tout le site est inclus dans un fichier
Flash (swf), non lisible par les moteurs
84. OPTIMISATION DES CONTENUS FLASH : APPROCHES POSSIBLES
Auteur : Sébastien Billard (s.billard@free.fr)
- Ne pas construire de sites 100% Flash. Par contre l'inclusion d'éléments Flash dans des sites
majoritairement en HTML, avec du contenu autour, est parfaitement possible.
- Construire deux versions, une Flash, une HTML. Problème : la version Flash devient inutile
puisque c'est la version HTML qui sera la mieux référencée, et donc la plus visitée au final.
- Fournir un contenu alternatif : pis-aller pour un site Flash ordinaire (URL unique), intéressant
pour les sites Flash à plusieurs URLs. La méthode la plus connue est swfObject
(http://code.google.com/p/swfobject/).
<script type="text/javascript" src="swfobject.js"></script>
<div id="flashcontent">
Texte alternatif, visible pour les utilisateurs sans Flash ou sans javascript, ainsi que pour les moteurs
</div>
<script type="text/javascript"> var so = new SWFObject("flash.swf", "flash", 200, 100, 7, "#336699");
so.write("flashcontent");
</script>
Exemple d'utilisation de
SWFObject
85. JAVASCRIPT
Auteur : Sébastien Billard (s.billard@free.fr)
- Javascript est un langage de programmation interprété coté client (c'est le navigateur qui
exécute le code, pas le serveur).
- Javascript n'est pas interprété par les moteurs, même si des chaines de caractères comme
des URLs peuvent être extraites du code javascript et même si certains codes très spécifiques
peuvent être interprétés au cas par cas. (il faut d’ailleurs bien penser à crypter son code quand
on veut cacher des liens à Google...)
- Il est souvent possible d'utiliser Javascript tout en restant accessible (concept de dégradation
élégante ou d'amélioration progressive).
- Les applications de Javascript les plus problématiques pour le référencement sont
typiquement les menus, les pop-ups, les contenus AJAX et les lazy-loads.
86. EXEMPLES DE JAVASCRIPTS ACCESSIBLES ET NON-ACCESSIBLES
Auteur : Sébastien Billard (s.billard@free.fr)
Un clic sur ce lien ouvre
un pop-up, grâce à
javascript...
Ce popup reste accessible
aux moteurs et visiteurs, car
le code javascript vient en
surcouche de HTML
<a href = "javascript:ouvreFenetre(‘http://s.billard.free.fr/radio.blog/index.php', 300, 222)">FS Radio (popup)</a>
Ce code aurait été inaccessible
87. REFERENCEMENT ET JAVASCRIPT : APPROCHES POSSIBLES
Auteur : Sébastien Billard (s.billard@free.fr)
- Ne pas rendre la navigation d'un site dépendant de javascript : cela garantie un minimum
d'accessibilité pour les moteurs, comme pour les visiteurs.
- Pour être accessible, javascript doit venir en surcouche de HTML, pas en remplacement de
celui-ci.
- Si un menu javascript inaccessible ne peut être modifié, intégrer des liens alternatifs HTML
qui seront suivis par les robots. Cela peut être fait dans le contenu lui-même, dans la balise
<noscript>, dans le footer, dans un plan de site...
88. FORMULAIRES
Auteur : Sébastien Billard (s.billard@free.fr)
- Les moteurs ne savent par remplir un formulaire, ni sélectionner un élément, ni cliquer sur un
bouton radio.
- Seuls les résultats de type GET (avec paramètres passé dans l'URL) sont potentiellement
indexables.
- La méthode POST ne permet pas l'indexation, car le résultat du formulaire ne peut être
rappelé via une URL (l'URL résultante est toujours la même).
89. FORMULAIRES : EXEMPLE
Auteur : Sébastien Billard (s.billard@free.fr)
Hormis quelques liens vers les
recettes les plus populaires...
...la seule façon d'accéder à
l'intégralité du contenu était
de renseigner un formulaire
Une navigation alternative
a été proposée
90. FORMULAIRES : OPTIMISATIONS POSSIBLES
Auteur : Sébastien Billard (s.billard@free.fr)
- Ne pas utiliser de formulaires comme moyen unique de navigation si le site doit être indexé.
- Utiliser la méthode GET (paramètres passé dans l'URL), et non pas POST.
- Permettre une navigation arborescente alternative, utilisant des liens HTML.
Exemple d'arborescence
proposée pour un site de cuisine
91. ROBOTS.TXT
Auteur : Sébastien Billard (s.billard@free.fr)
- Ce protocole sert à restreindre volontairement l'indexation d'un site par les robots. Il y a de très
bonnes raisons de ne pas souhaiter l'indexation de certaines pages (prévention du duplicate
content, contenu inutiles...)
- On oublie parfois d'enlever le fichier robots.txt lors d'une mise en ligne, ou bien on se trompe
dans la syntaxe d'où des cas de non-indexation ou desindexation involontaires.
- Le fichier est un simple fichier texte. Il se place obligatoirement à la racine du site. Ex:
http://www.site.fr.robots.txt ou http://sous-domaine.site.fr/robots.txt.
- Le fichiers robots.txt n'est pas une protection contre les intrusions. Il n'empêche pas l'accès aux
pages. Les robots peuvent décider ou non de respecter le protocole (mais les moteurs courants
respectent tous les directives robots.txt).
- Attention à ne pas oublier le « s » à « robots » !
92. ROBOTS.TXT : SYNTAXE
Auteur : Sébastien Billard (s.billard@free.fr)
#commentaire#
User-agent: *
Disallow: /repertoire_un/
Disallow: /repertoire_deux/fichier.html
Disallow: *.xml
L’user-agent spécifie à quel(s) robot(s) s'adressent
les directives. Le wildcard (*) signifie tous les robots.
On aurait pu spécifier « Googlebot ». On peut
donner des instructions différentes selon les robots.
Le dièse permet d’insérer
des commentaires ou de
désactiver des instructions
sans les supprimer
Le disallow spécifie les
répertoires ou fichiers
interdits d'indexation
En savoir plus : http://www.robotstxt.org/
Le wildcard est accepté par les moteurs
majeurs pour les noms de fichiers, même si
cela ne fait pas partie du protocole originel
93. CE QUI PEUT COMPLIQUER LE
TRAVAIL DES MOTEURS
Auteur : Sébastien Billard (s.billard@free.fr)
94. IMAGES
Auteur : Sébastien Billard (s.billard@free.fr)
- Les moteurs ne savent pas lire les images. Toute information contenue dans une image non
optimisée peut être considérée comme inexistante pour les moteurs.
- Toute image porteuse d'information devrait être dotée d'un attribut alt pertinent, idéalement de
moins de 80 caractères (taille non critique).
- Les images décoratives devraient comporter un attribut alt vide.
- Une image peut être balisée sémantiquement, par exemple être intégrée dans une balise <hn>
s'il s'agit d'un titre en image.
- Un texte HTML est en général jugé plus efficace pour le référencement qu'un texte en image
doté d'un attribut alt.
<img src="logo-idemm.gif" alt="IDEMM – Ingénierie Documentaire, Edition et Mediation Multimedia " />
Exemple d'image dotée d'un
attribut alt pertinent
95. BALISAGE SEMANTIQUE
Auteur : Sébastien Billard (s.billard@free.fr)
- Les balises sémantiques servent à définir la fonction, le « sens », de chaque élément dans le
contenu.
- Certaines balises sémantiques se voient reconnaître un poids plus fort par les moteurs de
recherche : balises de titre (<hn>), emphases (<strong>)...
- Il faut utiliser les balises pour leur fonction, et non pas pour leur impact supposé sur le
référencement, ou leur rendu graphique (pas de détournement de balise !).
- Le détournement de balise est souvent contre-productif. Les poids sont relatifs : si tout est
balisé comme un titre, il n'y a alors plus de titre.
- Un certain nombre de balises sémantiques n'ont a l'heure actuelle pas une grande utilité pour le
référencement. Ce qui ne veut pas dire qu'il ne faut pas les utiliser, ni qu'elles ne seront jamais
prises en compte.
Spécifications HTML 4 en français : http://www.la-grange.net/w3c/html4.01/cover.html
Spécifications HTML 5 en anglais : https://www.w3.org/TR/html5/sections.html
96. DES BALISES MOINS UTILES (POUR LE REFERENCEMENT )
Auteur : Sébastien Billard (s.billard@free.fr)
Source : http://www.minet.net/spip/IMG/pdf/FichePratiqueHtmlSemantique-2-2-2.pdf
97. BALISAGE SEMANTIQUE : EXEMPLE DE RECOMMANDATIONS
Auteur : Sébastien Billard (s.billard@free.fr)
98. COMMENT BALISER LES ELEMENTS DUNE PAGE WEB ?
Auteur : Sébastien Billard (s.billard@free.fr)
- Un logo-titre : rien, ou <h1> (différentes opinions sur le sujet, rien semble préférable)
- Un titre ou un sous-titre : <h1>, <h2>, <h3>...
- Un bloc de texte : <p> (peut être considéré comme la balise par défaut)
- Un passage important, ou un chapô : <strong> (cette balise peut être incluse dans une autre,
par ex <p>)
- Une énumération non ordonnée (bullet points, tirets) : <ul>
- Une énumération ordonnée : <ol>
- Les liens d'un menu : <ul> (car un menu est une liste de liens)
99. TESTER LE BALISAGE SEMANTIQUE : LES OUTILS
Auteur : Sébastien Billard (s.billard@free.fr)
« Examiner l’élément » dans Firefox
ou « inspecter » dans Chrome
« Display element information »
dans l’extension Web developer
100. DUPLICATION DE CONTENU
Auteur : Sébastien Billard (s.billard@free.fr)
- Les moteurs de recherche sont des bases de données, et font donc la chasse aux doublons.
- Quand un même contenu est disponible sur plusieurs URLs, les moteurs vont en général
favoriser une URL. La loi de Murphy étant universelle, ce sera rarement la bonne ;)
- La duplication de contenu peut diluer la popularité, celle-ci se répartissant entre les différentes
URLs au lieu de se concentrer sur une seule.
- La duplication peut être complète, ou partielle (near duplicate).
101. SOURCES COURANTES DE DUPLICATION
Auteur : Sébastien Billard (s.billard@free.fr)
- Noms de domaines multiples (contenu visible sur un .fr et un .com, ou sur plusieurs domaines).
- Non canonisation des domaines (site accessible avec et sans « www »)
- Identifiants de sessions passé dans les URLs.
- Mauvaise gestion de la réécriture d'URLs (absence de redirection 301)
- Inversion de l'ordre des paramètres dans les URLs.
- Pages d'impression.
Mauvaise canonisation
Identifiants de session
Pages d'impression
102. EVITER LA DUPLICATION DE CONTENU
Auteur : Sébastien Billard (s.billard@free.fr)
- Utiliser un seul nom de domaine, et rediriger les autres vers celui-ci, via des redirections 301.
- Canonisation : faire en sorte qu'une seule version d’URL soit accessible, en redirigeant les
autres vers la première, via une redirection 301.
- Eviter les identifiants de session passé dans les URLs. Préférer l'identification par cookies.
- URL rewriting : toujours rediriger la version non-réécrite vers la version réécrite, via une
redirection 301.
- Inversion de l'ordre des paramètres dans les URLs : faire attention :) Trier les paramètre par
ordre alphabétique peut aider.
- Pages d'impression : interdire leur indexation par robots.txt, ou meta tags.
- Eventuellement : utiliser la balise <link> rel=canonical. Attention cette balise est une indication,
pas une directive. Les moteurs peuvent décider de les ignorer dans certains cas (rare).
103. EVITER LA DUPLICATION DE CONTENU : 301 ET REL=CANONICAL
Auteur : Sébastien Billard (s.billard@free.fr)
URL actuelleAncienne URL
301
Ok ! j'indexe l'URL
actuelle et lui transfère
le « linkjuice » des
anciennes URLs
URL canoniqueContenu dupliqué
rel=canonical
Ok ! j'indexe l'URL
canonique et lui
transfère le « linkjuice »
des versions dupliquées
La balise link rel=canonical s'insère dans le <head> des documents. Ne pas interdire
l'indexation sinon la balise ne pourra être prise en compte. Syntaxe :
<link rel="canonical" href="http://www.site.fr/version-canonique.html" />
104. REDIRECTIONS
Auteur : Sébastien Billard (s.billard@free.fr)
- Seules les redirections coté serveur (redirections HTTP) sont suivies par les moteurs. Elles
peuvent être gérée au niveau du serveur (.htaccess, mod_rewrite) ou du code des pages (header
en PHP).
- Les redirections à base de javascript ou de balises meta refresh sont à éviter.
- Parmi les redirections coté serveur, seules les redirections 301 (permanentes) transmettent
correctement la popularité et permettent une bonne indexation des pages. Eviter les redirections
302 (temporaires) pour des redirections définitives.
- Les redirections successives sont à éviter autant que possible, même les 301.
<meta http-equiv="refresh" content="0;url=http://www.site.fr/" />
<script type="text/javascript">
<!--
window.location = "http://www.site.fr/"
//-->
</script>
Exemple de redirection javascript,
à placer dans le <head>
Exemple de redirection utilisant
la balise meta refresh
105. COMPORTEMENT DES MOTEURS FACE AUX REDIRECTIONS 301 ET 302
Auteur : Sébastien Billard (s.billard@free.fr)
URL de destinationURL de base
302
Ok ! J'indexe le contenu
de l'URL actuelle mais
garde l'ancienne adresse.
Mon linkgraph reste le
même
URL de destinationAncienne URL
301
Ok ! j'indexe l'URL
actuelle et lui transfère le
« linkjuice » des
anciennes URLs
106. TESTER UNE REDIRECTION : LES OUTILS
Auteur : Sébastien Billard (s.billard@free.fr)
Outil « réseau » de Firefox
Screaming Frog SEO spider
en mode « list »
Extension « link redirect
trace » pour Firefox
107. TESTER LES REPONSES HTTP D’UN SITE : LES OUTILS
Auteur : Sébastien Billard (s.billard@free.fr)
Screaming Frog SEO spider en
mode « spider » (500 URLs max
dans la version gratuite)
108. NEGOCIATION DE CONTENU ET « CLOAKING » NON MALICIEUX
Auteur : Sébastien Billard (s.billard@free.fr)
- Il est possible de personnaliser le contenu d'une page en fonction de la localisation de
l'utilisateur, ou de sa langue. Cela peut poser des problèmes en matière de référencement, pour
trois raisons :
- L'adresse IP d'un robot d'indexation n'est en général pas localisée dans la même région que
vos visiteurs cibles.
- Les robots d'indexation ne déclarent pas de langage.
- Plusieurs versions d'un contenu vont se partager une URL unique, une seule version sera donc
indexée.
Mieux vaut donc éviter en général la négociation de contenu, et proposer à l'utilisateur de
sélectionner la langue et/ou le pays de son choix.
109. STRUCTURATION DES SITES INTERNATIONAUX (LOCALISATION)
Auteur : Sébastien Billard (s.billard@free.fr)
- Les extensions locales sont souvent favorisées par les versions locales des moteurs. Des
domaines séparés avec TLD locaux (.fr, .be, .co.uk...) sont donc la solution à préférer.
- Si certains TLD locaux ne sont pas disponibles, envisager un domaine avec extension
internationale (.com...). Le nom de domaine peut comporter un indicateur de localisation, par ex
: nom-societe-usa.com. Si possible utiliser les codes ISO 3166-1.
- Si tous les sites doivent être hébergés sur un domaine unique, bien séparer les versions
locales, par des sous-domaines (ex : usa.societe.com) ou par des répertoires (ex :
www.societe.com/usa/).
- Les sous-domaines sont préférables, car il est plus facile d'effectuer des actions de
référencement spécifiques.
Codes internationaux ISO : https://fr.wikipedia.org/wiki/ISO_3166-1
110. STRUCTURATION DES SITES INTERNATIONAUX (LANGUE)
Auteur : Sébastien Billard (s.billard@free.fr)
- La langue des documents est déterminée automatiquement par les moteurs de recherche, en
fonction des termes présents dans le contenu.
- L'attribut « lang » n'est pas pris en compte par les principaux moteurs.
112. RAPPEL : LA PYRAMIDE DU REFERENCEMENT
Auteur : Sébastien Billard (s.billard@free.fr)
L'ensemble de ces composantes doit être optimisé pour obtenir une bonne visibilité :
CONTENU
STRUCTURE
POPULARITE
Le code qui contient le site et le met en forme
Essentiellement le contenu textuel du site
Ce que le web dit de votre site via les liens
Crédibilise Favorise
Valorise Redistribue
On va travailler aujourd'hui sur ce qui
est au coeur du web : le contenu !
113. ROLE DE L'OPTIMISATION EDITORIALE
Auteur : Sébastien Billard (s.billard@free.fr)
- L'optimisation éditoriale vise à satisfaire un double objectif : être trouvé, et être lu.
- Il ne s'agit pas d'arbitrer entre utilisateurs et moteurs : il est parfaitement possible d'écrire des
textes efficaces aussi bien pour les moteurs que pour les visiteurs.
- Les bonnes pratiques d'optimisation éditoriale pour le référencement vont dans le sens d'une
meilleure accessibilité et d'une meilleure ergonomie des contenus, d'où une plus grande
satisfaction et de meilleures conversions.
Ecrire pour les
moteurs c'est
nul !
Oui mais non : il s'agit
d'écrire avant tout pour
les utilisateurs, tout en
prenant les moteurs en
compte !
114. SPECIFICITES DE LA LECTURE SUR LE WEB
Auteur : Sébastien Billard (s.billard@free.fr)
115. SPECIFICITES DE LA LECTURE SUR LE WEB
Auteur : Sébastien Billard (s.billard@free.fr)
- L’œil accorde instinctivement plus d’importance à certaines zones. Patterns souvent en « F » ou
en « E » (mais pas toujours).
- Le regards se pose d’abord sur les éléments de navigation (menus, liens…) puis seulement
après sur les images.
- Le contenu est d’abord scanné, puis ensuite lu (éventuellement).
- Les internautes lisent ! Parfois plus même que sur papier.
- L’efficacité d’un texte est plus grande quand le langage utilisé est simple, concis, scannable et
objectif.
116. LECTURE EN « F » OU EN « E »
Auteur : Sébastien Billard (s.billard@free.fr)
Il s'agit d'une tendance, pour des pages, homogènes essentiellement textuelles. S'il y a bien une
lecture en triangle à l'échelle d'une population d'internautes, ce n'est pas forcement le cas au
niveau de l'individu.
Source : http://www.useit.com/alertbox/reading_pattern.html
117. LECTURE EN « F » OU EN « E »
Auteur : Sébastien Billard (s.billard@free.fr)
L'insertion d'éléments rompant le rhytme des pages relativise par exemple le principe de lecture
en « F » :
Source : http://searchengineland.com/eye-tracking-on-universal-and-personalized-search-12233
Résultats classiques (2006)
La saillance influe sur
le parcours de l'oeil
Résultats universels
118. LE REGARD SE POSE D'ABORD SUR LES ELEMENTS DE NAVIGATION
Auteur : Sébastien Billard (s.billard@free.fr)
Visionner : http://www.youtube.com/watch?v=lo_a2cfBUGc
Les images attirent bien
moins l'attention qu'on ne
pourrait le penser
119. LES INTERNAUTES SCROLLENT, ET LISENT
Auteur : Sébastien Billard (s.billard@free.fr)
Les internautes n'hésitent pas à faire défiler le contenu des pages :
Source : Source : http://blog.clicktale.com/?p=19
120. LES CONTENUS WEB ET LEUR OPTIMISATION
Auteur : Sébastien Billard (s.billard@free.fr)
121. DIFFERENTES FORMES DE CONTENU
Auteur : Sébastien Billard (s.billard@free.fr)
Quand on parle de « contenus » en matière de SEO, on parle essentiellement des textes :
De toute façon les contenus non-textuels pour être visibles dans les moteurs doivent être décrits avec...
du texte.)
Textes HTML ordinaires
Balises <title>
Balises <meta> description
Attributs alt
122. NOTIONS DE DENSITE DES MOTS-CLES
Auteur : Sébastien Billard (s.billard@free.fr)
- Quelle couleur peut-on associer au carré de gauche ? à celui de droite ?
- Pour qu'une page soit jugée pertinente pour une expression donnée, il faut que cette
expression et ses variantes apparaissent un certain nombre de fois dans son contenu. On parle
« d'occurences », ou de « densité » (A noter que la densité est une abstraction, et n'est pas
utilisée en tant que tel par les moteurs. La densité idéale n'existe pas).
- Les expressions-clés visées doivent apparaître dans la page, en particulier dans les zones
chaudes (balises <title>, titres, ancres des liens...).
- Il est bon de multiplier les occurrences et variations (expressions connexes, genre, nombre etc.)
- Restez naturel ! Les répétitions abusives sont suspectes et altèrent la lisibilité.
123. EXEMPLE DE MAUVAISE GESTION DE LA DENSITE
Auteur : Sébastien Billard (s.billard@free.fr)
F490 : 12x
iPhone : 6x
Tactile : 6x
SGH : 4x
Mobile : 3x
Téléphone : 0x
Portable : 0x
124. LES ZONES CHAUDES D’UNE PAGE
Auteur : Sébastien Billard (s.billard@free.fr)
Balise <title>
Titraille
Liens
Textes standards
125. LES ZONES CHAUDES D’UNE PAGE
Auteur : Sébastien Billard (s.billard@free.fr)
- Balise <title> : stratégique pour le positionnement ! Longueur idéale théorique de 40 à 80
caractères (environ 75 caractères max affichés par Google). Mais on peut faire plus long si
nécessaire. Tout son contenu sera pris en compte par Google, même s’il est visuellement
tronqué. Doit être unique, riche en mots-clés et décrire précisément le contenu de la page.
- Titraille : doit être balisée comme telle (<hn>). Ce peut être un mot, une phrase, mais pas un
paragraphe. Doit introduire le contenu qui suit immédiatement en dessous.
- Liens : leur intitulé est spécialement important pour le positionnement de la page de destination
du lien. Un lien doit être explicite, c'est-à-dire permettre de deviner ce dont parle la page de
destination sans même la consulter. Il est donc important d'y faire figurer les mots-clés
stratégiques. Attentions aux intitulés génériques (« en savoir plus », « suite » etc.)
- Corps du texte : doit contenir vos expressions-clés, plus que pas assez, mais moins que trop ;)
Favoriser un langage clair. Parlez le langage de vos visiteurs.
126. PARLEZ LE LANGUAGE DE VOS VISITEURS
Auteur : Sébastien Billard (s.billard@free.fr)
- Ne parlez pas votre langue : parlez la leur ! C’est avec leurs mots que les internautes
recherchent dans les moteurs, pas avec les vôtres.
- Utilisez un langage simple et clair, favorisez les mots communs. Evitez le jargon marketing, les
termes métier (sauf si vous vous adressez à des professionnels).
- Recherchez les bons mots-clés (outils de suggestions, communautés…)
"Le groupe X réunit 39 000 personnes dans 36 pays. Son réseau mondial de
services lui permet d’être concurrentiel sur un marché mondialisé [...]
Européen, le modèle X ne propose pas de solution toute faite aux entreprises
mais prend en compte leurs spécificités afin de leur proposer des services
adaptés à leur culture et à leurs enjeux. Par ailleurs, la multiculturalité du
groupe permet aux collaborateurs de X de s’enrichir des expériences et des
best practices présentes dans l’ensemble des implantations afin de faire
bénéficier à leurs clients de la maturité du groupe en termes d’expérience et
d’offre [...] Parce que l’Homme tient une place particulièrement importante dans
l’entreprise, X se donne pour mission d’offrir à ses clients des solutions
innovantes en conjuguant talents et technologies. Les collaborateurs se
reconnaissent dans trois valeurs clés : innover, s’engager et être ouvert."
En savoir plus sur le langage clair :
http://btb.termiumplus.gc.ca/redac-chap?lang=fra&lettr=chapsect10&info0=10
127. PARLEZ LE LANGUAGE DE VOS VISITEURS : EXEMPLES
Auteur : Sébastien Billard (s.billard@free.fr)
Rachète ? Achète ?
Autorise ?
Logiciels ? Applications ?
Logiciels ?
128. PARLEZ LE LANGUAGE DE VOS VISITEURS : EXEMPLES
Auteur : Sébastien Billard (s.billard@free.fr)
Spécialistes de la peinture en trompe l’œil ?
Formations Castorama ?
Conseils pour bien ranger sa maison ?
Décoration style années 50 ?
Murs végétalisés ?
129. PARLEZ LE LANGUAGE DE VOS VISITEURS : EXEMPLES
Auteur : Sébastien Billard (s.billard@free.fr)
Un texte très abstrait
proposé aux visiteurs…
Le contenu alternatif par
contre lui est très concret ;)
130. TROUVER LES BONS MOTS-CLES
Auteur : Sébastien Billard (s.billard@free.fr)
- Faites appel à votre bon sens, faites preuve d'empathie.
- Brainstormez, observez les sites concurrents pour vous en inspirer (pas pour copier).
- Observez comment s'expriment vos visiteurs (communautés, moteurs de recherche internes,
questions aux intéressés…)
- Utilisez Google Trends, Ubersuggest…
- Utilisez les outils de suggestion de mots-clés des régies de liens sponsorisés telles que
Adwords.
131. TROUVER LES BONS MOTS-CLES : UNE METHODE
Auteur : Sébastien Billard (s.billard@free.fr)
Brainstorm
Données Google suggest
Etude des concurrents
Etudes des communautés
1ère liste de
mots-clés
Google Adwords
(volumes de
recherches et
nouvelles
suggestions)
Liste finale
de mots-clés
Optionnel : étude de
saisonnalité avec
Google trends
132. UN RUBRIQUAGE ORIENTE MOTS-CLES
Auteur : Sébastien Billard (s.billard@free.fr)
- Plus de contenu = plus de visibilité potentielle (effet longue traîne)
- 1 thème = 1 page (voire plusieurs)
- Associer 1 à 5 expressions-clés à chaque page, qui guideront son optimisation (charte de mots-
clés)
133. ABONDANCE DE CONTENU NE NUIT PAS
Auteur : Sébastien Billard (s.billard@free.fr)
Développer son contenu enrichit le champ lexical global du site et permet de développer un trafic
de longue traîne, où les mots-clés rares vont souvent représenter la plus grosse partie du trafic :
5 premiers mots-clés : 16% du trafic
20 premiers : 25%
100 premiers : 40%
250 premiers : 50%
1000 premiers : 65%
5000 premiers : 81%
10000 premiers : 87%
Total de 21568 mots-clés analysés
134. LA PYRAMIDE INVERSEE (FRONT LOADING)
Auteur : Sébastien Billard (s.billard@free.fr)
- Enoncez d'abord les faits essentiels pour ensuite détailler vos contenus (message le plus
important en premier).
- Les mots-clés visés doivent apparaître dès les premières phrases : cela est bon pour les
utilisateurs comme pour les moteurs.
INFORMATION PRINCIPALE
(reprise dans le <title>)
DEVELOPPEMENT DE L'INFORMATION PRINCIPALE
INFORMATIONS DE MOINDRE IMPORTANCE
5W+2H
Informations principales
Développement
Informations secondaires
135. LA PYRAMIDE INVERSEE : EXEMPLE
Auteur : Sébastien Billard (s.billard@free.fr)
Pour être efficace, sauf si vous êtes conteur ou romancier, évitez ce type d’introduction :
"Il était une fois une petite fille de village, la plus jolie qu’on eût su voir ; sa mère en était folle, et
sa mère-grand plus folle encore. Cette bonne femme lui fit faire un petit chaperon rouge, qui lui
seyait si bien, que partout on l'appelait le Petit Chaperon rouge... "
Préférez au contraire ceci :
"Une petite fille se fait dévorer par un loup usant de malice alors qu'elle allait porter des galettes
et du beurre à sa mère-grand, elle aussi victime de l'animal".
136. LES 5W+2H (OU QQOQP+CC)
Auteur : Sébastien Billard (s.billard@free.fr)
Ces questions peuvent vous aider à déterminer quelles informations sont les plus importantes. Il
ne s'agit pas de répondre systématiquement à chacune d'entre elles. Tout est question de
contexte.
- Who (qui ?)
- What (quoi ?)
- When (quand ?)
- Where (où ?)
- Why (pourquoi ?)
- How (comment ?)
- How much (combien ?)
137. UNE TITRAILLE PRESENTE ET PERTINENTE
Auteur : Sébastien Billard (s.billard@free.fr)
- Titraille = titre + sous-titres (avec balises <h1> à <h6>)
- Des titres et sous-titres explicites aident à une bonne visibilité
- Ils améliorent également la "scannabilité" du texte
Belle
titraille !
Version d'origine Version optimisée
138. ECRITURE EN 3 DIMENSIONS
Auteur : Sébastien Billard (s.billard@free.fr)
- Les liens ne sont pas réservés aux menus et éléments de navigation !
- L'hypertexte permet de renvoyer à d'autres contenus hors de la page.
- Ces liens sont fortement porteurs de pertinence, pour les moteurs de recherche comme pour
les utilisateurs.
Liens profonds au
sein du contenu
139. OPTIMISATION DE LA POPULARITE
Auteur : Sébastien Billard (s.billard@free.fr)
140. RAPPEL : LA PYRAMIDE DU REFERENCEMENT
Auteur : Sébastien Billard (s.billard@free.fr)
L'ensemble de ces composantes doit être optimisé pour obtenir une bonne visibilité :
CONTENU
STRUCTURE
POPULARITE
Le code qui contient le site et le met en forme
Essentiellement le contenu textuel du site
Ce que le web dit de votre site via les liens
Crédibilise Favorise
Valorise Redistribue
Voyons aujourd'hui en quoi il n'y a pas
de mal à se faire du lien !
141. LES LIENS : CONSIDERATIONS GENERALES
Auteur : Sébastien Billard (s.billard@free.fr)
142. EN QUOI LES LIENS SONT IMPORTANTS ?
Auteur : Sébastien Billard (s.billard@free.fr)
- Les critères « on page » ne sont pas les seuls pris en compte par les moteurs de recherche :
l'environnement d'une page web en dit aussi beaucoup sur sa pertinence.
- Le linking sert surtout à départager des pages à la pertinence proche. De fait, plus la
compétition est forte entre pages, plus la popularité est importante pour le positionnement.
- Les liens transmettent en réalité plusieurs type de signaux : la popularité pure (Pagerank), mais
aussi des informations relatives au contenu (ancres des liens), à la qualité (Trustrank et cie) etc.
Les SEOs parlent de « linkjuice » pour désigner ces signaux.
- Les liens permettent également d'être trouvé par les moteurs, et indexé. Un site populaire est
indexé plus fréquemment, et plus profondément.
Popularité
Ancre
Confiance
LINKJUICE
143. PRECISIONS SUR LE PAGERANK GOOGLE
Auteur : Sébastien Billard (s.billard@free.fr)
- Le Pagerank (ou PR) est une valeur qui mesure uniquement la popularité relative d'une page
par rapport au reste du web. Le PR est calculé à l'avance. Le Pagerank est un des élément du
score final d'une page.
- Le Pagerank d'une page mesure en fait la probabilité qu'a un surfeur aléatoire de visiter cette
page. Sa valeur réelle est donc comprise entre 0 et 1. La somme des PR de l'ensemble des
pages indexées par Google est égal à 1.
- Le Pagerank est toujours celui d'une page. Quand on parle du Pagerank d'un site, on parle en
général du PR de sa page d'accueil. Le PR d'un site est donc un abus de langage.
- Toute page indexée, même dépourvue de liens entrants possède un PageRank « inné ».
- Plus le PR d’une page est élevé, plus elle transmet du PR.
Final score = IR score * Pagerank
Score déterminant le
positionnement dans la
page de résultats
Score de pertinence
(lié au contenu, à la
structure)
Score de popularité
144. PAGERANK ET ALGORITHMES SIMILAIRES : FONCTIONNEMENT
Auteur : Sébastien Billard (s.billard@free.fr)
La formule originelle, décrite par Larry Page et Sergei Brin :
Chaque lien présent sur une page transmet aux pages de destination une quantité de Pagerank
égale à son propre PR, divisée par le nombre de liens présents sur la page, modéré par un
facteur d'amortissement (0.85 dans le papier original).
PR de la page T1 divisé par
le nombre de liens sortants
de la page T1
Facteur
d'amortissement
Web à 1 page Web à 2 pages
isolées
Web à 2 pages,
lien unidirectionnel
Web à 2 pages,
lien réciproque
145. PAGERANK ET ALGORITHMES SIMILAIRES : FONCTIONNEMENT
Auteur : Sébastien Billard (s.billard@free.fr)
Simulateur de PageRank : http://caccio.blogdns.net/archives/71
146. QUALITE DES LIENS
Auteur : Sébastien Billard (s.billard@free.fr)
Tous les liens ne présentent pas le même intérêt pour le référencement, du fait de leur incapacité
à être suivis ou à transmettre du PR :
- Les liens dans des fichiers Flash doivent encore êtres considérés comme inexistants (même si
les moteurs expérimentent).
- Les liens codés en javascript ne sont pas suivis par les moteurs (en général). Les liens HTML
additionnés de javascript peuvent être suivis et transmettre du Pagerank.
- Les liens dotés d'un attribut nofollow peuvent être suivis ou non par les moteurs, mais dans
tous les cas ils ne transmettent pas de « linkjuice ».
- Les liens images transmettent du PageRank, mais aucun signal lié à l’ancre, sauf si un attribut
alt est présent.
<a href="http://www.site.fr" rel="nofollow">Ancre du lien</a>
L'attribut nofollow
« stérilise » le lien
147. PAGERANK ET ATTRIBUT NOFOLLOW
Auteur : Sébastien Billard (s.billard@free.fr)
Il a pu être tentant à une époque de sculpter le Pagerank en utilisant l'attribut nofollow, dans le
but d'envoyer plus de PR vers les pages « utiles ». Ce n'est plus une technique efficace
aujourd'hui (à supposer qu'elle l'ait un jour été) :
33%
33%
33%
Le PR transmissible
était redistribué vers les
pages sans nofollow
Le PR transmissible du
lien nofollow s'évapore
Depuis juin 2009 :Avant juin 2009 :Sans nofollow :
50%
50%
nofollow
33%
33%
nofollow
148. CRÉER DU LIEN ENTRANT
Auteur : Sébastien Billard (s.billard@free.fr)
149. ESTIMER LA POPULARITE
Auteur : Sébastien Billard (s.billard@free.fr)
Pendant longtemps, Google a proposé une barre d’outil affichant une valeur de Pagerank sous
forme de note entre 0 et 10. Mais ce Pagerank n’est plus proposé depuis 2016.
La seule façon d’estimer la popularité d’une page désormais est de passer par des outils tiers
(Majestic SEO, MOZ, Ahrefs…). Problème : rien ne dit que leur version du Pagerank soit
équivalente à celle utilisée par Google, et leur index est de toute façon bien plus petit que celui
de Google…
Exemple d’alternative au Pagerank :
le page authority de MOZ
150. EVALUER LE LINKING D'UN SITE : MAJESTIC SEO
Auteur : Sébastien Billard (s.billard@free.fr)
Majestic SEO prend en compte la dimension temporelle. Il possède son propre index :
Evolution du
nombre de liens
151. COMMENT CREER DU LIEN ENTRANT ?
Auteur : Sébastien Billard (s.billard@free.fr)
- Exploitez votre réseau immédiat (partenaires, institutionnels, clients, fournisseurs...)
- Procédez à des échanges de liens avec des sites proches (privilégier la pertinence).
- Soumettez votre site aux annuaires généralistes et spécialisés (de plus en plus obsolète).
- Faites parler de vous, online et offline (interviews, communiqués, relations presse...)
- Exprimez-vous dans des communautés (signatures de forums, commentaires de blogs...)
- Proposez des contenus ou services attirant des liens spontanés (link baiting).
- Soyez actif dans les réseaux sociaux (même si beaucoup de liens sont en nofollow, le SMO
constitue une caisse de résonance de votre communication).
- Travaillez votre référencement : la visibilité attire le lien.
- Fuyez tout ce qui promet la création rapide de liens artificiels !
152. ANNUAIRES : CONSEILS POUR DES SOUMISSIONS DE QUALITE
Auteur : Sébastien Billard (s.billard@free.fr)
- Evitez les soumissions automatiques, les réseaux d'annuaires, les annuaires de mauvaise
qualité (par exemple sans contrôle éditorial).
- Evitez les annuaires exigeant un lien en retour.
- Assurez-vous que les liens proposés soient « en dur » (liens directs, sans redirections).
- Soumettez aux annuaire spécialisés (thématiques, locaux), et généralistes.
- Ne soumettez que des sites finis (pas de sites en construction).
- Sélectionnez la catégorie la plus pertinente de l'annuaire.
- Utilisez la racine du site ou d'un sous-domaine comme lien.
- Utilisez le nom du site comme titre, sauf indication contraire de l'éditeur.
- Rédigez la description du site avec soin. Variez les descriptions si possible.
153. TROUVER DES ANNUAIRES
Auteur : Sébastien Billard (s.billard@free.fr)
- Utilisez les annuaires d'annuaires (pas forcément à jour). Maintenez une liste perso.
- Cherchez des annuaires avec des requêtes de type « annuaire + mot-clé ».
- Cherchez des annuaires en exploitant leurs signatures (ex : « mot-clé + "ajouter votre site" »).
Avantage : on tombe souvent directement sur la bonne catégorie.
- Etudiez les liens entrants des concurrents, par ex à l'aide de Majestic SEO.
"Proposer un site"
"Proposer votre site"
"Ajouter un site"
"Ajoutez votre site"
"Inscrire votre site"
"Soumettre un site"
Signatures
d'annuaires typiques
154. LIENS EN NOFOLLOW
Auteur : Sébastien Billard (s.billard@free.fr)
Beaucoup de sites utilisent l'attributs nofollow aujourd'hui. Ces liens sont inutiles pour la
popularité, ce qui ne veut pas dire qu'ils n'aient aucune utilité : il peuvent générer du trafic et
participer à la visibilité globale.
L’extension nofollow permet
de mettre en évidence les
liens nofollow
155. LINK BAITING
Auteur : Sébastien Billard (s.billard@free.fr)
L'idée du link baiting est de pousser les internautes à faire des liens. Le link baiting comporte le
plus souvent une dimension virale (bouche à oreille). Quelques moyens couramment employés :
- Contenu qualitatif (même si ce n'est pas vraiment une technique)
- Services, goodies, widgets ou logiciels gratuits.
- Publications gratuites (ebooks, livre blanc).
- Organisation de concours.
- Publication d'articles polémiques.
- Publications de vidéos ou contenus viraux.
- Traduction de documents et ressources de références.
- Etc.
157. COMMENT CHOISIR DES INDICATEURS DE PERFORMANCE ?
Auteur : Sébastien Billard (s.billard@free.fr)
- Les indicateurs de performance (aussi appelés Key Performance Indicators, ou KPI) se
définissent toujours en fonction d'un certain contexte : par exemple un deblacklistage peut être
considéré comme un KPI pour un site auparavant banni. Pour un site e-commerce, le CA généré
ou le taux de transformation seront plus important que pour un site d’information.
- La difficulté en matière de SEO est de définir des KPIs qui soient fortement corrélés à la
visibilité ou à la présence dans les moteurs de recherche. Le trafic moteurs ou les performances
d'un site ne sont pas uniquement conditionnés par le référencement.
158. QUELQUES INDICATEURS DE PERFORMANCE POSSIBLES
Auteur : Sébastien Billard (s.billard@free.fr)
- Etendue de l'indexation (nombre ou pourcentage de pages indexées).
- Evolution des positions sur une sélection de mots-clés.
- Evolution du trafic en provenance des moteurs (hors notoriété).
- Part des différents moteurs dans le trafic.
- Couverture sémantique (nombre d’expressions générant du trafic).
- Pertinence des mots-clés tapés.
- Evolution de la réalisation d'objectifs.
- Evolution des indicateurs commerciaux pour le trafic SEO
159. LE MINIMUM DE LA VISIBILITE : LA PRESENCE
Auteur : Sébastien Billard (s.billard@free.fr)
Il est pertinent pour un nouveau site web de s'assurer que celui-ci est bien indexé par les
moteurs, et dans quel mesure :
- Comptabiliser le nombre d'URLs utiles indexables, via les sitemaps XML ou via des outils de
crawl.
- Regarder le nombre d'URLs indexées par les moteurs, à l'aide de la commande « site: » (Le
chiffre obtenu peut ne pas être 100% exact, mais donne un ordre de grandeur raisonnablement
précis la plupart du temps).
160. VISIBILITE : LE CONTRÔLE DE POSITIONNEMENT
Auteur : Sébastien Billard (s.billard@free.fr)
161. CONTRÔLE DE POSITIONNEMENT : A SAVOIR
Auteur : Sébastien Billard (s.billard@free.fr)
- Quantité de logiciels et services existent : Ranks, Yooda Seeurank, Advanced Web Ranking...
Certains sont gratuits. Si on suit un grand nombre d’expressions les services en ligne sont
préférables aux logiciels.
- On peut soit suivre des mots-clés que l’on détermine, soit utiliser le panel de mots-clés
préconstitué de l’outil.
- Il ne faut pas utiliser les APIs des moteurs, car les résultats des APIs sont différents des
résultats standards.
- Les requêtes automatisées ne sont pas autorisées par les moteurs (sauf APIs).Si le moteur est
trop requêté, l'adresse IP peut être bloquée temporairement. Pas de risque cependant pour le
site lui-même.
- Il peut y avoir de légère fluctuations dans les résultats, en fonction des datacenters interrogés.
Cela est normal. De même les résultats peuvent différer avec la personnalisation.
- Il est tout à fait normal que la position pour un mot-clé donné évolue d’un jour à l’autre. Un mot-
clé peut même disparaitre le temps d’un relevé. C’est quand la position évolue fortement et
durablement qu’il faut s’inquiéter ou se réjouir.
162. EXEMPLE D’OUTIL : RANKS
Auteur : Sébastien Billard (s.billard@free.fr)
Les mots-clés peuvent être
ajouté individuellement, ou
par lots
Un groupe thématique
peut être associé aux
mots-clés
On peut choisir les
moteurs interrogés
163. EXEMPLE D’OUTIL : RANKS
Auteur : Sébastien Billard (s.billard@free.fr)
Une vue synthétique permet
de se faire une idée de la
bonne santé SEO du site
164. EXEMPLE D’OUTIL : RANKS
Auteur : Sébastien Billard (s.billard@free.fr)
Les mêmes indicateurs sont
consultables pour les
groupes thématiques
165. EXEMPLE D’OUTIL : RANKS
Auteur : Sébastien Billard (s.billard@free.fr)
Le détail des positions
permet une analyse pour
chaque mot-clé
166. EXEMPLE D’OUTIL : RANKS
Auteur : Sébastien Billard (s.billard@free.fr)
Il est possible d’obtenir des
graphes, par exemple sur le
positionnement d’un mot-clé
168. GOOGLE SEARCH CONSOLE
Auteur : Sébastien Billard (s.billard@free.fr)
Google Search Console (ex Webmaster Tools) est une interface à destination des webmasters,
proposé par Google. Après vérification du site, Webmaster Tools permet notamment :
- D'obtenir des informations sur la visibilité d'un site et sur le trafic généré par Google (jusque 16
mois en arrière)
- D’obtenir des informations sur les mots-clés tapés par les internautes. Cela est d’autant plus
utile que les mots-clés sont supprimés des référers Google depuis 2014 (remplacés par « not
provided »).
- D'accéder à une partie des liens entrants.
- De détecter et résoudre divers problème techniques.
- De contrôler l’indexation des pages du site (en complément au fichier robots.txt)
- De soumettre un sitemap XML.
169. MOTS CLES, VISIBILITE, TRAFIC
Auteur : Sébastien Billard (s.billard@free.fr)
L’outil performance permet de voir l’évolution
des visites en provenance de Google, du
nombre d’impressions, du taux de clic ainsi
que l’évolution de la position moyenne.
Des options de filtrage sur les
mots-clés, les URLs, le pays
ou l’appareil sont proposées
170. MOTS CLES, VISIBILITE, TRAFIC
Auteur : Sébastien Billard (s.billard@free.fr)
Search Console permet d’obtenir 999
mots-clés en une vue. Mais on peut en
obtenir bien plus en multipliant les vues
grâce aux options de filtrage
171. LIENS ENTRANTS
Auteur : Sébastien Billard (s.billard@free.fr)
L’outil liens vers votre site donne accès à un
certain nombre de lien, aux pages les plus
plus liées ainsi qu’aux ancres des liens
172. STATISTIQUES SUR L’EXPLORATION
Auteur : Sébastien Billard (s.billard@free.fr)
L’outil statistiques sur
l’exploration fournit une vue de
l’activité de Googlebot sur le site
173. STATISTIQUES SUR L’EXPLORATION
Auteur : Sébastien Billard (s.billard@free.fr)
L’outil erreurs d’exploration
permet de diagnostiquer les
difficultés que Googlebot
rencontre pour explorer le site
175. DIFFERENTS TYPES DE MESURE D’AUDIENCE
Auteur : Sébastien Billard (s.billard@free.fr)
- La mesure de l'audience d'un site peut être « site centric » ou « user centric ».
- Les méthodes « user centric » se basent sur l'étude d'un panel d'utilisateurs, donc d’un
échantillon. Elles sont intéressantes pour comparer les trafic des sites en incluant des dimension
socio-démographiques. Mais elles apportent peu d'information pour un site en particulier, et sont
surtout réservées aux sites à fort trafic.
- Les méthodes « site centric » se basent sur l'étude du comportement de l’ensemble des
visiteurs du site. Les dimensions socio-démographiques ne sont pas prises en compte (en
général), mais l'information sur le comportement du visiteur dans le site est très précise. Les
méthodes « site centric » reposent soit sur l'analyse des fichiers log, soit sur l'insertion de tags
javascript (parfois d'images également).
- L'analyse des fichiers log permet d'obtenir des informations sur les visites des robots, ce que
les tags javascript ne permettent pas. Un script est à installer localement. Exemples d'analyseurs
de logs : Awstats, Webalizer...
- L'utilisation de tags javascript est plus aisée et permet de recueillir plus de données. Il s'agit
généralement de services web. C'est la méthode proposée par Xiti, eStats, Omniture, Google
Analytics...
176. GOOGLE ANALYTICS : INTERFACE GENERALE
Auteur : Sébastien Billard (s.billard@free.fr)
Période(s)
considéré(s)Segments personnalisables
177. GOOGLE ANALYTICS : VOIR LE TRAFIC MOTEURS
Auteur : Sébastien Billard (s.billard@free.fr)
Aller dans « Acquisition » /
« Canaux » puis sélectionner
« organic search » dans le tableau
178. GOOGLE ANALYTICS : REPARTITION DU TRAFIC MOTEURS
Auteur : Sébastien Billard (s.billard@free.fr)
Aller dans « Acquisition » /
« Canaux », sélectionner « organic
search » dans le tableau, et
« source » comme dimension
principale
Un clic sur l’icône secteur
permet d’obtenir une
visualisation par secteur
179. GOOGLE ANALYTICS : TROUVER LES REFERERS (LIENS ENTRANTS)
Auteur : Sébastien Billard (s.billard@free.fr)
Aller dans « Acquisition »
/ « Sites référents »
On accède aux pages referers en
cliquant sur les domaines listés.
180. GOOGLE ANALYTICS : RAPPORTS PERSONNALISES
Auteur : Sébastien Billard (s.billard@free.fr)
Au quotidien il est plus pratique de
créer des rapports personnalisés, qui
regrouperont les indicateurs favoris.
184. REFERENCEMENT LOCAL : CE QU'IL FAUT SAVOIR
Auteur : Sébastien Billard (s.billard@free.fr)
- Environ 15% des pages de résultats Google affichent une carte. Le pack local recevrait environ
1% des clics aux USA. 73% des activités en ligne incluraient une dimension locale (du moins aux
USA).
- Les méthodes d'optimisation classiques reste valables : optimisez les balises <title> et les
contenus en incluant la dimension locale quand cela est pertinent.
- Le meilleur moyen d'être visible lors des recherches locales est d'inscrire son site dans le Local
Business Center Google. L'inscription se fait par la complétion d'un formulaire suivie d'une
confirmation par courrier ou SMS.
185. REFERENCEMENT LOCAL : PISTES POUR L'OPTIMISATION DES PAGES
Auteur : Sébastien Billard (s.billard@free.fr)
La balise <title> est évidemment
un bon endroit pour mentionner sa
ville, son département, sa région...
Le contenu permet lui d'élargir le
champ sémantique local et de
renforcer sa pertinence...
Le fait de mentionner son adresse sur toutes
les pages pourrait être pris en compte par les
moteurs. Cela permet en tout cas à l'internaute
de vérifier que le résultat est pertinent.
186. OPTIMISER UN LISTING LOCAL BUSINESS CENTER
Auteur : Sébastien Billard (s.billard@free.fr)
- Le nom influe fortement sur le positionnement. Inclure éventuellement des mots-clés, quand
votre activité n’est pas évidente sur la base de votre seul nom, sans spammer (ex : « François
Dupont – Plombier chauffagiste »).
- L'adresse a aussi une influence considérable, mais difficile de tricher ;)
- Fournir une description riche en mots-clés et incitant au clic.
- Pour les activités, utiliser les catégories qui vous definissent le mieux.
https://support.google.com/business/answer/3038177
187. OPTIMISER UN LISTING LOCAL BUSINESS CENTER
Auteur : Sébastien Billard (s.billard@free.fr)
Lorsque une société ou un organisme possède plus de 10 établissements, il est possible
d'effectuer un transfert groupé des fiches, grâce à un tableau au format CSV.
189. REFERENCEMENT DANS GOOGLE ACTUALITES
Auteur : Sébastien Billard (s.billard@free.fr)
- L'inclusion dans Google News est manuelle.
- Seules les sources d'information à plusieurs rédacteurs peuvent être incluses.
- La durée de vie d'une actualité dans l'index est de 30 jours.
- Seuls les contenus originaux sont indexés. Les contenus repris sont filtrés.
- Chaque actualité doit posséder une URL unique et permanente.
- Les sitemaps pour Google Actualité permettent une indexation plus efficaces, et autorisent
l'insertion de meta données.
- Une structure de page simple est préférable (idéalement mise en page CSS, avec divisions
logiques).
- Les contenus inaccessibles car réservés aux abonnés peuvent être indexés, si utilisation du
« premier clic gratuit ». Possibilité de limiter à 5 le nombre de clics gratuits par utilisateur et par
jour).
191. REFERENCEMENT DANS GOOGLE ACTUALITES
Auteur : Sébastien Billard (s.billard@free.fr)
- Les moteurs sont incapables de déterminer ce que représente une image.
- L'optimisation des images passe toujours par l'association de texte. Le texte associé peut être
interne (attribut alt, texte à proximité) ou externe à la page (ancres des liens, textes à proximité
des ancres).
- La popularité a une influence, de même que les critères usuels.
Attributs alt
Textes à proximité des
liens vers les images
Textes à proximité
de l'image
Le nom du fichier est pris en
compte mais son poids n'est pas
si fort comparé aux attributs alt et
textes associés
193. REFERENCEMENT DES VIDEOS : CONSIDERATIONS GENERALES
Auteur : Sébastien Billard (s.billard@free.fr)
- Les moteurs ne sont pas capables de lire les vidéos (sauf expérimentations de transcription
automatique et moteurs spécialisés).
- Comme pour les images, l'optimisation des vidéos passe par l'adjonction de textes.
- La façon la plus simple de rendre visibles ses vidéos reste de passer par les services du type
Youtube, Google vidéo, Dailymotion etc.
La transcription automatique
reste perfectible…
194. REFERENCEMENT DES VIDEOS : PUBLICATION SUR SITE
Auteur : Sébastien Billard (s.billard@free.fr)
- L'indexation d'une vidéo publiée sur son propre site n'est jamais garantie, mais on peut la
favoriser.
- Les vidéos doivent être accessibles en HTTP. Le streaming n'est pas pris en charge par
Google. Format supportés : .mpg, .mpeg, .mp4, .mov, .wmv, .asf, .avi, .ra, .ram, .rm, .flv
- La taille des vidéos doit être inférieure à 30 Mo.
- L’utilisation du microformats schema.org/VideoObject est conseillées.
- Il est possible d'utiliser un fichier Sitemap pour vidéos, ou un fichier media RSS. Les deux
formats permettent l'insertion de meta données optimisables : titres, descriptions, tags,
transcripts (mRSS uniquement)...
- Il est vital d'associer du texte aux vidéos : balise <title>, titres, descriptions, idéalement un
transcript.
- Les méthodes habituelles d'optimisation des pages continuent d'être valables (balisage
sémantique, popularité...).
195. REFERENCEMENT DES VIDEOS : PUBLICATION SUR SITE
Auteur : Sébastien Billard (s.billard@free.fr)
Titres et textes optimisés
Insertion d'un transcript
196. REFERENCEMENT DES VIDEOS : PUBLICATION SUR PLATEFORME
Auteur : Sébastien Billard (s.billard@free.fr)
- La publication sur les plateformes est la plus simple. Du fait que les pages sont structurées et
les plateformes populaires, les vidéos sont indexées facilement.
- La publication sur plateforme peut venir en complément d’une publication sur site.
- La publication sur plateforme permet de bénéficier de l'effet de communauté et favorise la
diffusion de la vidéo. Elle génère cependant assez peu de trafic sur le site source.
197. OPTIMISER SON REFERENCEMENT SUR YOUTUBE (ET CONSORTS)
Auteur : Sébastien Billard (s.billard@free.fr)
Où placer ses mots-clés ?
Titre de la vidéo
Description
Les tags ne sont plus affichés depuis
quelques années, mais restent présent
dans l’interface de gestion des vidéos.
Ils sont donc à optimiser