Adiós a la gestión de parámetros de URL. Todo lo que deberías saber para mantener la indexación de tu sitio bajo control.
May. 25, 2022•0 likes
0 likes
Be the first to like this
Show More
•863 views
views
Total views
0
On Slideshare
0
From embeds
0
Number of embeds
0
Download to read offline
Report
Marketing
Explora la presentación de Fernando Maciá para el evento online #TerritorioDSM, emitida durante la primera jornada #TerritorioTrafico. Nuestro director mostró en esta ponencia cómo mejorar y mantener a raya la indexación de un sitio web.
Adiós a la gestión de parámetros de URL. Todo lo que deberías saber para mantener la indexación de tu sitio bajo control.
Adiós a la gestión de parámetros de URL
Todo lo que deberías saber para mantener la indexación de tu sitio bajo control
TERRITORIO DSM
S E A R C H ( R ) E V O L U T I O N
¿Qué es una indexación perfecta?
Todas las páginas que deseamos posicionar están
indexadas
Las nuevas páginas se indexan rápidamente
Las páginas redireccionadas son sustituidas por la
nueva URL rápidamente y sin perder posicionamiento
Las páginas obsoletas son desindexadas rápidamente
(para no desperdiciar crawl-budget)
Todas las páginas indexadas lo están con su URL
canónica
Google no puede descubrir/rastrear/indexar páginas
que no deseamos posicionar:
‣ Contenido duplicado
‣ Contenido débil
‣ Páginas con errores
‣ Páginas sin contenido
@fernandomacia
4
TERRITORIO
DSM
#TerritorioTrafico
Adiós Gestión de parámetros de URL
28/03/2022
@fernandomacia
5
TERRITORIO
DSM
El 28 de marzo pasado,Google
desactivó la funcionalidad de gestión de
parámetros en Google Search Console
Según Google,la funcionalidad de
gestión de parámetros ya no es
necesaria porque:
‣ Google es mucho mejor adivinando qué
parámetros son necesarios y cuáles no
‣ Los CMS modernos a menudo ya no
dependen tanto de variables y valores
pasadas a través de una query string, es
decir, de URLs parametrizadas
#TerritorioTrafico
¿Qué son los parámetros de URL?
@fernandomacia
6
TERRITORIO
DSM
#TerritorioTrafico
Pero…¿qué son los parámetros de URL?
Una forma de comunicar o
transferir información al
servidor.
Los parámetros constan de
un nombre y un valor
separados por el signo “=“ y
se unen entre sí por medio
del signo “&”
.
@fernandomacia
7
TERRITORIO
DSM
#TerritorioTrafico
¿Qué son los parámetros de URL?
@fernandomacia
8
TERRITORIO
DSM
#TerritorioTrafico
https://www.musicstore.com/es_ES/EUR/Guitarras/Guitarras-el-ctricas/cat-GITARRE
-
GITEGIT
?
SearchTerm=&SortingAttribute=MSESEUR
~
~
€-asc&PageSize=30&ViewType=1&FollowSearch=&
SourceReference=INVALID&CatalogID
=
GITARRE&CategoryName=GITEGIT&SearchDirection=
&SearchParameter=@QueryTerm=&SourceReference=INVALID&FollowSearch=&Forma+de+construc
ción=Stratocaster&Manufacturer=Fender&Isondemand=false
¿Qué son los parámetros de URL?
URL canónica
@fernandomacia
9
TERRITORIO
DSM
#TerritorioTrafico
https://www.musicstore.com/es_ES/EUR/Guitarras/Guitarras-el-ctricas/cat-GITARRE
-
GITEGIT
?
SearchTerm=&SortingAttribute=MSESEUR
~
~
€-asc&PageSize=30&ViewType=1&FollowSearch=&
SourceReference=INVALID&CatalogID
=
GITARRE&CategoryName=GITEGIT&SearchDirection=
&SearchParameter=@QueryTerm=&SourceReference=INVALID&FollowSearch=&Forma+de+construc
ción=Stratocaster&Manufacturer=Fender&Isondemand=false
URL CANÓNICA
DOMINIO ID/PAÍS/DIV CAT SUBCAT
¿Qué son los parámetros de URL?
Nombres de variables
@fernandomacia
10
TERRITORIO
DSM
#TerritorioTrafico
https://www.musicstore.com/es_ES/EUR/Guitarras/Guitarras-el-ctricas/cat-GITARRE
-
GITEGIT
?
SearchTerm=&SortingAttribute=MSESEUR
~
~
€-asc&PageSize=30&ViewType=1&FollowSearch=&
SourceReference=INVALID&CatalogID
=
GITARRE&CategoryName=GITEGIT&SearchDirection=
&SearchParameter=@QueryTerm=&SourceReference=INVALID&FollowSearch=&Forma+de+construc
ción=Stratocaster&Manufacturer=Fender&Isondemand=false
URL CANÓNICA
DOMINIO ID/PAÍS/DIV CAT SUBCAT
¿Qué son los parámetros de URL?
Valores de las variables
@fernandomacia
11
TERRITORIO
DSM
#TerritorioTrafico
https://www.musicstore.com/es_ES/EUR/Guitarras/Guitarras-el-ctricas/cat-GITARRE
-
GITEGIT
?
SearchTerm=&SortingAttribute=MSESEUR
~
~
€-asc&PageSize=30&ViewType=1&FollowSearch=&
SourceReference=INVALID&CatalogID
=
GITARRE&CategoryName=GITEGIT&SearchDirection=
&SearchParameter=@QueryTerm=&SourceReference=INVALID&FollowSearch=&Forma+de+construc
ción=Stratocaster&Manufacturer=Fender&Isondemand=false
URL CANÓNICA
DOMINIO ID/PAÍS/DIV CAT SUBCAT
¿Qué son los parámetros de URL?
Conectores
@fernandomacia
12
TERRITORIO
DSM
#TerritorioTrafico
https://www.musicstore.com/es_ES/EUR/Guitarras/Guitarras-el-ctricas/cat-GITARRE
-
GITEGIT
?
SearchTerm=&SortingAttribute=MSESEUR
~
~
€-asc&PageSize=30&ViewType=1&FollowSearch=&
SourceReference=INVALID&CatalogID
=
GITARRE&CategoryName=GITEGIT&SearchDirection=
&SearchParameter=@QueryTerm=&SourceReference=INVALID&FollowSearch=&Forma+de+construc
ción=Stratocaster&Manufacturer=Fender&Isondemand=false
URL CANÓNICA
DOMINIO ID/PAÍS/DIV CAT SUBCAT
Métodos de comunicar información al servidor
Formularios método GET
@fernandomacia
13
TERRITORIO
DSM
#TerritorioTrafico
SearchTerm=&SortingAttribute=MSESEUR
~
~
€-asc&PageSize=30&ViewType=1&FollowSearch=&
SourceReference=INVALID&CatalogID
=
GITARRE&CategoryName=GITEGIT&SearchDirection=
&SearchParameter=@QueryTerm=&SourceReference=INVALID&FollowSearch=&Forma+de+construc
ción=Stratocaster&Manufacturer=Fender&Isondemand=false
QUERY STRING
Otros métodos de comunicar información al servidor
Formularios: método POST
@fernandomacia
14
TERRITORIO
DSM
#TerritorioTrafico
https://www.paginasamarillas.es/search/fontaneros/all-ma/alicante/all-is/alicante-capital/all-ba/all-pu/all-
nc/1?what=fontaneros&where=alicante+capital&qc=true
Otros métodos de comunicar información al servidor
Formularios: método POST
@fernandomacia
15
TERRITORIO
DSM
#TerritorioTrafico
https://www.paginasamarillas.es/search/fontaneros/all-ma/alicante/all-is/alicante-capital/all-ba/all-pu/all-
nc/1?what=fontaneros&where=alicante+capital&qc=true
OJO
:
PARÁMETROS DE SEGUIMIENTO PARA ANALÍTICA
:
NO CAMBIAN EL CONTENIDO DE LA PÁGINA
Otros métodos de comunicar información al servidor
Variables de sesión/cookies
Los valores
seleccionados en el
formulario se
almacenan en una
cookie
O en una variable de
sesión en el servidor,
cuyo identificador
también se almacena
en una cookie
@fernandomacia
16
TERRITORIO
DSM
#TerritorioTrafico
Otros métodos de comunicar información al servidor
Variables de sesión/cookies
Si borramos esta cookie,
la web de Zara.com
vuelve a cargar la página
home por defecto
No para Google ;)
@fernandomacia
17
TERRITORIO
DSM
#TerritorioTrafico
¿Para qué se utilizan los parámetros de URL?
@fernandomacia
18
TERRITORIO
DSM
#TerritorioTrafico
¿Para qué se utilizan los parámetros de URL?
URL canónica
@fernandomacia
19
TERRITORIO
DSM
#TerritorioTrafico
https://www.musicstore.com/es_ES/EUR/Guitarras/Guitarras-el-ctricas/cat-GITARRE
-
GITEGIT
URL CANÓNICA
¿Para qué se utilizan los parámetros de URL?
URL canónica + parámetros de ordenación/tamaño de matriz
@fernandomacia
22
TERRITORIO
DSM
#TerritorioTrafico
https://www.musicstore.com/es_ES/EUR/Guitarras/Guitarras-el-ctricas/cat-GITARRE
-
GITEGIT
?
PageSize=48
&
SearchTerm=
&
SortingAttribute=MSESEUR
~
~
€-desc
&
PageSize=48
&
ViewType=1
&
FollowSearch=
&
SourceReference=INVALID
&
CatalogID
=
GITARRE
&
CategoryName=GITEGIT
&
SearchDirection=
&
SearchParameter=@QueryTerm=
&
SourceReference=INVALID
&
FollowSearch=
&
Forma+de+construcci%C3%B3n=Stratocaster
&
Manufacturer=Fender
¿Para qué se utilizan los parámetros de URL?
Paginación
Junto con la referencia
en los sitemaps,el
enlazado de las
páginas de categorías y
subcategorías es
fundamental en la
indexación de
productos long-tail
Ya no es necesario usar
el marcado prev y next
@fernandomacia
23
TERRITORIO
DSM
#TerritorioTrafico
¿Para qué se utilizan los parámetros de URL?
Versiones de idioma
Para servir
versiones en
diferentes
idiomas de un
mismo
contenido
Es mejor
estructurar las
versiones como
subdirectorios,
subdominios o
dominios
distintos
@fernandomacia
24
TERRITORIO
DSM
#TerritorioTrafico
¿Para qué se utilizan los parámetros de URL?
Parámetros de seguimiento de campañas/análisis de navegación…
@fernandomacia
25
TERRITORIO
DSM
#TerritorioTrafico
https://kschool.com/estrategia-
de-comunicacion-estirando-el-
chicle/
?
utm_source=twitter
&
utm_medium=social_organico
&
utm_campaign=2022_otono
&
utm_content=evento
&
utm_term=estirando_chicle
¿Para qué se utilizan los parámetros de URL?
Parámetros de seguimiento de campañas/análisis de navegación…
@fernandomacia
26
No afectan al contenido del
sitio Web
Solo son utilizados por
sistemas de analítica de
tráfico para hacer un
seguimiento de la
procedencia de las visitas,
campañas,navegación,etc.
Es mejor no utilizar enlaces
internos a URLs
parametrizadas
TERRITORIO
DSM
#TerritorioTrafico
¿Para qué se utilizan los parámetros de URL?
Identificación de sesiones de usuario
@fernandomacia
27
TERRITORIO
DSM
#TerritorioTrafico
https://electrohogar.eroski.es/
electroventa/es/productFull/
81022704/
BatidorademanoCecotecPowerf
ulTitanium1000;
jsessionid=DE513364729451DC
797567C9031B8B7F
¿Para qué se utilizan los parámetros de URL?
Identificación de sesiones de usuario
@fernandomacia
28
Se utilizan para almacenar
datos como el carrito de la
compra
Es mejor mantener la sesión
en el servidor y almacenar su
identificador en una cookie
Si debemos incluirlas en la
URL,mejor hacerlo solo tras la
autenticación del usuario,así
Google no puede verla
TERRITORIO
DSM
#TerritorioTrafico
¿Para qué servía la gestión de parámetros de URL?
La gestión de parámetros servía para
controlar la indexación en casos como:
‣ Aplicación de filtros en navegación facetada
‣ Ordenación de productos por distintos criterios
‣ Paginaciones en páginas de listados
‣ Versiones de un mismo contenido en distintos idiomas
‣ URLs con IDs de usuarios o datos de seguimiento de
campañas
Evitando la indexación de contenido
duplicado
Ahorrando crawl-budget
@fernandomacia
30
TERRITORIO
DSM
#TerritorioTrafico
¿Cuáles son las alternativas?
Lo más sencillo
@fernandomacia
31
TERRITORIO
DSM
#TerritorioTrafico
CMS
¿Cuáles son las alternativas?
Si queremos indexar: incluye enlaces rastreables a URLs semánticas
Idealista presenta una
sección de filtros con
aspecto de formulario,pero
los campos son,a su vez,
enlaces rastreables que
apuntan a URL no
parametrizadas
correspondientes a los
distintos filtros
Una regla en el robots.txt
evita la indexación de
cruces de filtros
@fernandomacia
32
TERRITORIO
DSM
#TerritorioTrafico
¿Cuáles son las alternativas?
Si no queremos indexar: enlaces ofuscados a páginas bloqueadas a indexación
Yaencontre.com ofusca
los enlaces de los distintos
criterios de ordenación de
resultados
Así evita la indexación de
contenido duplicado y
ahorra crawl-budget
(Google no llega a esas
páginas)
@fernandomacia
33
TERRITORIO
DSM
#TerritorioTrafico
¿Cuáles son las alternativas?
Si no queremos indexar: variables de sesión/cookies
@fernandomacia
34
TERRITORIO
DSM
#TerritorioTrafico
¿Cuáles son las alternativas?
Si no queremos indexar: variables pasadas por formularios usando el método POST
@fernandomacia
35
TERRITORIO
DSM
Interesante para evitar la indexación de resultados de búsqueda interna (aunque no
se podría guardar la referencia)
#TerritorioTrafico
Pero…¿y si mi CMS/plantilla sigue necesitando parámetros de URL?
@fernandomacia
36
TERRITORIO
DSM
#TerritorioTrafico
canonical
meta robots robots.txt
alternate/hreflang
alternate/mobile
respuesta HTTP
CMS
Comprueba si tu web tiene problemas de indexación en GSC
En Google Search Console,
busca errores de cobertura
como:
‣ Rastreada, actualmente sin
indexar
‣ Duplicada: Google ha elegido
una versión canónica diferente
a la del usuario
‣ Descubierta: actualmente sin
indexar
‣ Duplicada: el usuario no ha
indicado ninguna versión
canónica
‣ Duplicada: la URL enviada no se
ha seleccionado como canónica
@fernandomacia
37
TERRITORIO
DSM
#TerritorioTrafico
Algo que ya nos queda claro…
@fernandomacia
38
TERRITORIO
DSM
#TerritorioTrafico
Descubrimiento !
=
Rastreo !
=
Indexación
¿Cómo decide Google si indexa una página?
@fernandomacia
39
TERRITORIO
DSM
#TerritorioTrafico
Factores de indexación
Técnicos y semánticos
@fernandomacia
40
TERRITORIO
DSM
#TerritorioTrafico
Técnicos Semánticos
Enlazado Contenido único y original
Archivo sitemap Orientado a una intención de búsqueda clara
Archivo robots.txt Y con un objetivo explícito para el usuario
Meta robots
Cabecera HTTP x-robots-tag
Factores de indexación técnicos
Enlazado
41
¿Está enlazada la página
desde el menú principal?
¿Hay otros enlaces
internos o externos
apuntando a la URL?
¿Son enlaces “limpios” o
URL con parámetros?
¿Son enlaces HTML o
dependen de Javascript,
formularios…?
@fernandomacia
TERRITORIO
DSM
#TerritorioTrafico
Factores de indexación técnicos
Sitemap
¿Está incluida la URL en el
archivo sitemap?
¿Está dado de alta en
Google Search Console?
¿Está referenciado en el
archivo robots.txt?
¿Ha podido encontrar y
procesar correctamente el
archivo Google?
@fernandomacia
42
TERRITORIO
DSM
#TerritorioTrafico
Factores de indexación técnicos
Archivo robots.txt
¿Tiene el dominio un
archivo robots.txt?
¿Tiene problemas Google
para encontrar el archivo?
¿Hay algún error o
advertencia?
¿Permite el rastreo de la
URL?
@fernandomacia
43
TERRITORIO
DSM
#TerritorioTrafico
Factores de indexación técnicos
Meta robots
¿Cuenta la página con
una meta robots?
¿Permite la indexación
de la página?
@fernandomacia
44
TERRITORIO
DSM
#TerritorioTrafico
Factores de indexación técnicos - menos frecuentes
Cabecera HTTP robots
¿Cuenta la página con
una cabecera HTTP x-
robots-tag?
¿Permite la indexación de
la página?
@fernandomacia
45
TERRITORIO
DSM
#TerritorioTrafico
Factores de indexación semánticos
Contenido único
Google define un
contenido como de “muy
alta calidad” cuando es
único y original:
‣ Breaking news o datos no
aportados por otros medios
‣ Contenido artístico original
‣ Artículos científicos originales,
bien comunicados y
presentados
profesionalmente…
@fernandomacia
46
TERRITORIO
DSM
#TerritorioTrafico
https://static.googleusercontent.com/media/guidelines.raterhub.com/en//searchqualityevaluatorguidelines.pdf
Factores de indexación semánticos
Intención de búsqueda
Google identifica
distintas intenciones de
búsqueda de los
usuarios
El contenido debe
enfocarse
principalmente en
responder a alguna de
estas intenciones
principales
@fernandomacia
47
TERRITORIO
DSM
#TerritorioTrafico
https://static.googleusercontent.com/media/guidelines.raterhub.com/en//searchqualityevaluatorguidelines.pdf
Factores de indexación semánticos
Objetivo claro
Una página debe tener
un propósito u objetivo
claros
Un contenido para el
que no se puede
identificar un objetivo
claro merece la más
baja calificación de
calidad
@fernandomacia
48
TERRITORIO
DSM
#TerritorioTrafico
https://static.googleusercontent.com/media/guidelines.raterhub.com/en//searchqualityevaluatorguidelines.pdf
Factores de indexación semánticos
Contenido diferencial - Paginaciones/Tags
Las paginaciones
extensas de categorías
genéricas es difícil que se
indexen: no hay una
intención de búsqueda
clara o ya está cubierta
por las primeras de la serie
Mejor optar por portadillas
navegacionales hacia
subcategorías más
específicas y ahí
desplegar paginaciones
para preservar el enlazado
interno
@fernandomacia
49
TERRITORIO
DSM
#TerritorioTrafico
¿Y con qué URL decide indexarla?
@fernandomacia
50
TERRITORIO
DSM
#TerritorioTrafico
Factores de canonicalización
@fernandomacia
51
TERRITORIO
DSM
#TerritorioTrafico
Múltiples indicios de cuál debería ser la URL de una página
URL seguida en el descubrimiento URL más popular en enlaces internos
URL referenciada en el elemento de enlace
canonical
URL referenciada en cabecera HTTP canonical
URL referenciada en el archivo sitemap URL referenciada en alternate/hreflang en el
archivo sitemap
URL referenciada en el elemento de enlace
alternate/hreflang
URL referenciada en alternate/hreflang en
cabecera HTTP
Cabecera HTTP x-robots-tag URL referenciada como versión alternate desde
URL mobile o AMP
URL referenciada en el marcado de datos
estructurados
URL como destino de redirecciones/migraciones
Factores de canonicalización
URL seguida para descubrir la página
Podemos comprobar la URL
de referencia en el inspector
de URLs de Google Search
Console
Es la URL con el enlace que
sirvió a Google para
descubrir la nueva URL
@fernandomacia
52
TERRITORIO
DSM
#TerritorioTrafico
Factores de canonicalización
URL declarada en elemento de enlace canonical
Podemos comprobar la URL
declarada como canonical en
el código fuente de la página
o en el inspector de URLs de
Google Search Console
Normalmente,debe existir
siempre y ser autorreferencial
Estas URLs siempre deben
ser absolutas (incluyendo el
protocolo)
@fernandomacia
53
TERRITORIO
DSM
#TerritorioTrafico
Factores de canonicalización
URL declarada en marcado de datos estructurados
Debemos comprobar si la URL
de la página está también
correctamente identificada en
la implementación de los
datos estructurados
Debe coincidir con la URL
enlazada internamente y con
la referenciada en el canonical
Estas URLs siempre deben ser
absolutas (incluyendo el
protocolo
@fernandomacia
54
TERRITORIO
DSM
#TerritorioTrafico
Factores de canonicalización
URL referenciada en el sitemap
Comprobamos la URL
referenciada en el archivo
sitemap
Debe coincidir con la URL
enlazada internamente y las
declaradas en el canonical y
en los datos estructurados
Estas URLs siempre deben
ser absolutas (incluyendo el
protocolo)
@fernandomacia
55
TERRITORIO
DSM
#TerritorioTrafico
Factores de canonicalización
URL referenciada en elementos de enlace alternate/hreflang
Los elementos de enlace
alternate/hreflang deben
apuntar a URL canónicas
(excepto en el caso de URLs
de versiones mobile m.)
Estas URLs siempre deben
ser absolutas (incluyendo el
protocolo)
@fernandomacia
56
TERRITORIO
DSM
#TerritorioTrafico
Factores de canonicalización
URL referenciada en redirecciones/migraciones
Google también puede
mostrar como página
de referencia una URL
de un acortador o una
URL de una versión
anterior,por lo que
también debemos
cuidar la sintaxis de
URLs definidas en
redirecciones
@fernandomacia
57
TERRITORIO
DSM
#TerritorioTrafico
Factores de canonicalización
URL más popular en enlaces internos
Es importante que la URL
se enlace siempre igual
Atención con:
‣ Espacios
‣ Caracteres especiales
‣ Letras acentuadas
‣ Mayúsculas y minúsculas
‣ Dobles barras
@fernandomacia
58
TERRITORIO
DSM
#TerritorioTrafico
Factores de canonicalización (menos frecuentes)
URL declarada en cabecera HTTP canonical
Podemos comprobar la
URL declarada como
canonical inspeccionando
las cabeceras HTTP
Ojo: no implementar ambas
formas simultáneamente
(cabecera HTTP y
elemento de enlace)
Estas URLs siempre deben
ser absolutas (incluyendo
el protocolo)
@fernandomacia
59
TERRITORIO
DSM
#TerritorioTrafico
Factores de canonicalización (menos frecuentes)
URL referenciada en sitemap alternate/hreflang
Podemos definir los
alternate/hreflang en el
archivo sitemap
Deben apuntar a URL
canónicas
Ojo: no implementar junto
con marcado HTML
simultáneamente
Estas URLs siempre deben
ser absolutas (incluyendo el
protocolo)
@fernandomacia
60
TERRITORIO
DSM
#TerritorioTrafico
Factores de canonicalización (menos frecuentes)
URL declarada en cabecera HTTP alternate/hreflang
Podemos definir los alternate/hreflang
también en una cabecera HTTP
Deben apuntar a URL canónicas
@fernandomacia
61
TERRITORIO
DSM
#TerritorioTrafico
Ojo: no implementar junto con
marcado HTML o sitemap
simultáneamente
Estas URLs siempre deben ser
absolutas (incluyendo el protocolo)
Factores de canonicalización
URL declarada en elementos de enlace alternate de versiones mobile/AMP
En los canonical de
versiones mobile o AMP
también se define la URL
canonical
Debe apuntar a la URL
canónica
correspondiente
Estas URLs siempre
deben ser absolutas
(incluyendo el protocolo)
@fernandomacia
62
TERRITORIO
DSM
#TerritorioTrafico
Cómo decidimos si queremos indexar o no
Cuándo debemos decidir si un contenido es o no
indexable?
‣ Tiene potencial de búsqueda y, además…
‣ Tenemos suficiente portfolio de producto/contenido para
satisfacer al usuario que hace esa búsqueda (suficientes
modelos, tallas, stock, artículos, etc.)
‣ Es importante para el negocio
‣ Cuidado con páginas de listado (categorías, subcategorías,
tags) con muy pocos elementos o listados de cientos de
páginas
@fernandomacia
63
TERRITORIO
DSM
#TerritorioTrafico
Qué hacer cuando SÍ queremos indexar
Enlazado
<a href=“http://
www.dominio.com/
destino.html”>
Anchor text
</a>
@fernandomacia
64
TERRITORIO
DSM
#TerritorioTrafico
Qué hacer cuando SÍ queremos indexar
Elemento de enlace canonical autorreferencial
@fernandomacia
65
TERRITORIO
DSM
#TerritorioTrafico
https://www.dominio.com/destino.html
<link rel="canonical" href=“https://www.dominio.com/destino.html" />
<a href=“http://www.dominio.com/destino.html”>
Anchor text
</a>
Qué hacer cuando SÍ queremos indexar
Sitemap
@fernandomacia
66
TERRITORIO
DSM
#TerritorioTrafico
https://www.dominio.com/destino.html
<link rel="canonical" href=“https://www.dominio.com/destino.html" />
<url>
<loc>https://www.dominio.com/destino.html</loc>
<lastmod>2022-05-02T11:37:33+00:00</lastmod>
</url>
Qué hacer cuando SÍ queremos indexar
Elemento de enlace alternate/hreflang
@fernandomacia
67
TERRITORIO
DSM
#TerritorioTrafico
https://www.dominio.com/destino.html
<link rel="canonical" href=“https://www.dominio.com/destino.html" />
<link rel="alternate" hreflang="es" href=“https://www.dominio.com/destino.html"/>
<link rel="alternate" hreflang="en" href=“https://www.dominio.com/en/target.html”/>
<link rel="alternate" hreflang="es" href=“https://
www.dominio.com/destino.html"/>
<link rel="alternate" hreflang="en" href=“https://
www.dominio.com/en/target.html”/>
https://www.dominio.com/en/target.html
Qué hacer cuando SÍ queremos indexar
Meta robots
@fernandomacia
68
TERRITORIO
DSM
No habrá meta robots o
esta estará configurada
como “index,follow”
#TerritorioTrafico
Qué hacer cuando SÍ queremos indexar
Archivo robots.txt
Comprobamos que las
reglas definidas en el
archivo robots.txt no
impiden el rastreo de
la URL
@fernandomacia
69
TERRITORIO
DSM
#TerritorioTrafico
Qué hacer cuando SÍ queremos indexar
Elemento de enlace alternate de versiones mobile/AMP
@fernandomacia
70
TERRITORIO
DSM
#TerritorioTrafico
https://www.dominio.com/destino.html
<link rel="canonical" href=“https://www.dominio.com/destino.html" />
<link href="https://www.dominio.com/AMP/destino.html" rel="amphtml">
https://www.dominio.com/AMP/destino.html
<link rel="canonical" href=“https://
www.dominio.com/destino.html" />
Qué hacer cuando SÍ queremos indexar
Controlar con la API de status de indexación de GSC
Podemos controlar la
indexación con
Screaming Frog
conectando con la API
de Google Search
Console
@fernandomacia
71
TERRITORIO
DSM
#TerritorioTrafico
Qué hacer cuando SÍ queremos indexar
Inspector de URL
Idealmente,la página que
deseamos indexar:
‣ Está bien enlazada
internamente
‣ Aporta contenido único y de
calidad orientado a cubrir una
intención de búsqueda con un
objetivo claro
‣ Los factores de indexación
permiten su rastreo e
indexación
‣ Todos los factores de
canonicalización son coherentes
en la definición de la URL
@fernandomacia
72
TERRITORIO
DSM
#TerritorioTrafico
¿Y si no queremos indexar esa URL?
@fernandomacia
73
TERRITORIO
DSM
#TerritorioTrafico
Cómo decidimos si queremos indexar o no
El contenido no corresponde a una intención de búsqueda distinta o no tenemos
contenido de valor para la necesidad del usuario
Bloquear páginas a la
indexación,o bien
Canonicalizar al nivel
superior
Ofuscar los enlaces
Simplificar la arquitectura
(disminuir la
granularidad)
@fernandomacia
74
TERRITORIO
DSM
#TerritorioTrafico
Qué hacer cuando NO queremos indexar
Enlazado,robots.txt y meta robots
Si no deseamos indexar una
página,pero es necesaria
para los usuarios,
ofuscaremos los enlaces
para evitar desperdiciar
crawl-budget
Bloquearemos el rastreo
desde robots.txt
Bloquearemos la indexación
con una meta robots
configurada como
“noindex,nofollow”
@fernandomacia
75
TERRITORIO
DSM
#TerritorioTrafico
<meta name="robots" content="noindex,nofollow" />
<a href=“http://www.dominio.com/
destino.html”>
Anchor text
</a>
Qué hacer cuando NO queremos indexar
Elemento de enlace canonical y sitemap
OJO
:
debemos eliminar
la referencia a esa URL
en el sitemap y eliminar
el canonical
@fernandomacia
76
TERRITORIO
DSM
#TerritorioTrafico
<meta name="robots" content="noindex,nofollow" />
<link rel="canonical" href="https://www.dominio.com/destino.html" />
<url>
<loc>https://www.dominio.com/
destino.html</loc>
<lastmod>2022-05-02T11:37:33+00:00</
lastmod>
</url>
Qué hacer cuando NO queremos indexar
Elemento de enlace alternate/hreflang
La URL no debe estar
referenciada desde
elementos de enlace
alternate/hreflang de
otras versiones de
idioma/país
@fernandomacia
77
TERRITORIO
DSM
#TerritorioTrafico
<meta name="robots" content="noindex,nofollow" />
<link rel="canonical" href="https://www.dominio.com/destino.html" />
<link rel="alternate" hreflang="es"
href=“https://www.dominio.com/
destino.html"/>
<link rel="alternate" hreflang="en"
href=“https://www.dominio.com/en/
target.html”/>
Qué hacer cuando NO queremos indexar
Elemento de enlace alternate de versiones mobile/AMP
La URL no debe estar
referenciada desde
elementos de enlace
alternate de otras
versiones mobile (m.) o
AMP
@fernandomacia
78
TERRITORIO
DSM
#TerritorioTrafico
<meta name="robots" content="noindex,nofollow" />
<link rel="canonical" href="https://www.dominio.com/destino.html" />
https://www.dominio.com/AMP/destino.html
<link rel="canonical" href=“https://
www.dominio.com/destino.html" />
¿Y si ya se ha indexado?
Controlar enlaces internos con Screaming Frog y corregir,
eliminar u ofuscar para evitar desperdiciar popularidad y
crawl-budget
Eliminar enlace canonical
Suprimir referencia en el sitemap
Suprimir referencias desde elementos de enlace alternate/
hreflang
Suprimir referencias desde elementos de enlace alternate de
versiones mobile/AMP
Suprimir referencias desde marcado de datos estructurados
OJO
:
No bloquear en robots.txt hasta que se haya
desindexado.Google debe poder acceder para ver la meta
robots
Añadir noindex en la meta robots (no todavía en robots.txt)
@fernandomacia
79
TERRITORIO
DSM
#TerritorioTrafico
¿Y si ya se ha indexado?
Solicitud de desindexación desde GSC
@fernandomacia
80
TERRITORIO
DSM
#TerritorioTrafico
¿Y si ya se ha indexado?
Archivo robots.txt
@fernandomacia
81
TERRITORIO
DSM
#TerritorioTrafico
Después de que se haya desindexado,podemos
bloquearla desde robots.txt
Si ya no es útil para los usuarios,mejor devolver
un 404 o un 410