SlideShare a Scribd company logo
1 of 69
Lino Uruñuela
17 de junio del 2022
@errioxa
info@funnelpunk.com
www.mecagoenlos.com
☏ 637167218
Agrupa y vencerás!
SEonthebeach 2022
Hola!
Soy Lino Uruñuela
He trabajado en algunos de los mayores sites de España
Link to ppt ⤴
https://www.mecagoenlos.com/SOB2022.pdf
Lino Uruñuela
17 de junio del 2022
@errioxa
info@funnelpunk.com
www.mecagoenlos.com
☏ 637167218
¿ De dónde venimos ?
Extraemos datos de GSC
¿De dónde venimos?
Extraemos datos de GSC
¿De dónde venimos?
Extraemos datos de GSC
¿De dónde venimos?
Extraemos datos de GSC
¿De dónde venimos? -Índice de Cobertura - Coverage
¿ Cómo se han creado
tantas URLs ?
Extraemos datos de GSC
¿Cómo se han creado tantas URLs?
●Creadas a mano ●Búsquedas Internas
Extraemos datos de GSC
Creadas a mano - ¿Cómo se han creado tantas URLs?
●Creadas a mano
■ Decisiones de negocio
■ Decisiones SEO
●Búsquedas Internas
Extraemos datos de GSC
Creadas a mano - ¿Cómo se han creado tantas URLs?
●Creadas a mano
■ Decisiones de negocio
■ Decisiones SEO
○ Tendencias históricas
○ Intuición humana
●Búsquedas Internas
Extraemos datos de GSC
Búsquedas Internas - ¿Cómo se han creado tantas URLs?
●Creadas a mano
■ Decisiones de negocio
■ Decisiones SEO
○ Tendencias históricas
○ Intuición humana
●Búsquedas Internas
■ Ninguna regla
■ Se generan en cada
categoría
Extraemos datos de GSC
Problemas - Búsquedas Internas
●URLs duplicadas ●URLs sin sentido
/ejercicio/cinta-correr/
/ejercicio/cinta-corres/
/ejercicio/cinta-corr/
/ejercicio/cinta-de-correr/
/ejercicio/cinta-de.correr/
/ejercicio/cinta-de-corre/
/ejercicio/cintas-de-corre/
/ejercicio/cintas-de-correr/
/ejercicio/cintas-de-corres/
/ejercicio/cintas-correer/
/ejercicio/cintas-para-corres/
Extraemos datos de GSC
Problemas - Búsquedas Internas
●URLs duplicadas ●URLs sin sentido
/ejercicio/cinta-correr/
/ejercicio/cinta-corres/
/ejercicio/cinta-corr/
/ejercicio/cinta-de-correr/
/ejercicio/cinta-de.correr/
/ejercicio/cinta-de-corre/
/ejercicio/cintas-de-corre/
/ejercicio/cintas-de-correr/
/ejercicio/cintas-de-corres/
/ejercicio/cintas-correer/
/ejercicio/cintas-para-corres/
/categoria/cadaver/
/categoria/cambio-por-algo-de-mi-interes/
/categoria/ir-a-mi-gimnasio/
/categoria/cambio-mi-coche-por-otro-ya/
● URLs malsonantes
● URLs porno
● URLs spam
¿ Qué podemos hacer ?
●Dejarlo así
●¿Eliminar URLs?
●¿Redireccionar URL?
○ ¿Reglas para definir
las URLs de origen y destino?
●Dejarlo así
●¿Eliminar URLs?
●¿Redireccionar URL?
○ ¿Reglas para definir
las URLs de origen y destino?
1.Analizar tráfico
2.Eliminar URLs sin tráfico
3.Mapear redirecciones
Extraemos datos de GSC
1.Analizar tráfico
A.Obtener TODAS las URLs
B.¿Cuáles han tenido tráfico en los últimos meses?
Extraemos datos de GSC
1.Analizar tráfico
A.Obtener TODAS las URLs
¿Cómo las podemos obtener?
○ El equipo de IT
○ Logs del servidor
○ Crawler
Extraemos datos de GSC
1.Analizar tráfico
A.Obtener TODAS las URLs
B.¿Cuáles han tenido tráfico en los últimos meses?
Extraemos datos de GSC
1.Analizar tráfico
A.Obtener TODAS las URLs
B.¿Cuáles han tenido tráfico en los últimos meses?
¿Cómo las podemos obtener?
a.Google Analytics
b.Google Search Console
c. Logs del servidor
Extraemos datos de GSC
2. Eliminar URLs sin tráfico
Las que NO han tenido tráfico ? → ELIMINAR
Extraemos datos de GSC
3. Mapear redirecciones
¿Cómo decidimos qué URLs redirigen a qué URLs?
Extraemos datos de GSC
3. Mapear redirecciones
A.A Mano
B.Machine Learning
Extraemos datos de GSC
3. Mapear redirecciones
A.A Mano
B.Machine Learning
Extraemos datos de GSC
3. Mapear redirecciones
●Existen multitud de métodos para agrupar (o clusterizar)
palabras o/y frases → Escoger el más sencillo para nosotros
●Debemos tener en cuenta otros datos además del texto
○ Tráfico orgánico
○ Accesos de Google
○ Definiciones “humanas”
Extraemos datos de GSC
3. Mapear redirecciones - Tokenización
La tokenización es básicamente hacer una lista de
palabras de lo que vayas a tratar
Extraemos datos de GSC
3. Mapear redirecciones - Normalización
La normalización es el eliminar acentos, poner todas
las palabras en minúscula, eliminar caracteres extraños
o que no sean convenientes que entren en nuestros
procesos.
Extraemos datos de GSC
Lemmatizar Vs Raíces
●Lematizar
De manera resumida, la lematización es extraer
para cada palabra su lexema que puede ser
diferente para una misma palabra. es decir. es
dependiente de su contexto.
La manera compleja "La lematización es el
proceso mediante el cual las palabras de un
texto que pertenecen a un mismo paradigma
flexivo o derivativo son llevadas a una forma
normal que representa a toda la clase"
●Raíces
Quedarse con la raíz pero no tiene en cuenta el
contexto.
Extraemos datos de GSC
Lemmatizar Vs Raíces
Lemmatizar
alquilar piso sebastiar
alquiler piso sebastiar
alquilar piso sebastiar
alquiler piso sebastiar
Raices
alquil pis san sebasti
alquil pis san sebasti
alquil pis san sebasti
alquil pis san sebasti
Texto Original
alquilar piso en San Sebastián
alquiler de pisos en San sebastian
alquilar pisos en San Sebastian
piso en alquiler en San Sebastian
Extraemos datos de GSC
Lemmatizar Vs Raíces
Lemmatizar
cinta correr ejercicio
cinta corr ejercicio
cinta corr ejercicio
cinta correr ejercicio
cinta correr ejercicio
cinta correr ejercicio
cinta correr ejercicio
cinta correr ejercicio
cinta corr ejercicio
cinta correer ejercicio
Raices
cint corr ejercici
cint corr ejercici
cint corr ejercici
cint corr ejercici
cint corr ejercici
cint corr ejercici
cint corr ejercici
cint corr ejercici
cint corr ejercici
cint corr ejercici
Texto Original
ejercicio cinta correr
ejercicio cinta corres
ejercicio cinta corr
ejercicio cinta de correr
ejercicio cinta para correr
ejercicio cinta de corre
ejercicio cintas de corre
ejercicio cintas de correr
ejercicio cintas de corres
ejercicio cintas correer
Extraemos datos de GSC
Definir redirecciones
Extraemos datos de GSC
Definir redirecciones - ¿usamos la raíz?
Extraemos datos de GSC
¿Cuál es la URL que más tráfico tiene?
Extraemos datos de GSC
Definimos URL del grupo la URL con más tráfico
Implementar en un mundo real !
Agrupación - Clustering de keywords - Google Search Console
https://www.mecagoenlos.com/Posicionamiento/matriz-de-keywords-seo.php
50.000 filas !
Link ⤴
Extraemos datos de GSC
50.000 filas usando Pandas - En un mundo real
Extraemos datos de GSC
50.000 filas usando Dask - En un mundo real
Python Vs SQL !
Extraemos datos de GSC
Lemmatizar y Raíces en SQL
Extraemos datos de GSC
Lemmatizar y Raíces en SQL
Extraemos datos de GSC
Lemmatizar y Raíces en SQL
Extraemos datos de GSC
Lemmatizar y Raíces en SQL
PostgreSQL ClickHouse
ElasticSearch
Extraemos datos de GSC
Lemmatizar y Raíces en SQL
Extraemos datos de GSC
Python Vs SQL
Ahora sí podemos
Implementar en un mundo real !
con decenas de millones de URLs
Extraemos datos de GSC
Resultado final
Extraemos datos de GSC
Resultado final
Extraemos datos de GSC
Resultado final
Extraemos datos de GSC
Resultado final
Extraemos datos de GSC
Resultado final
Extraemos datos de GSC
Resultado final
Extraemos datos de GSC
Resultado final
Extraemos datos de GSC
Resultado final
Extraemos datos de GSC
Resultado final
Extraemos datos de GSC
¿De dónde venimos?
Extraemos datos de GSC
¿De dónde venimos?
Extraemos datos de GSC
¿Dónde estamos?
Extraemos datos de GSC
¿De dónde venimos?
Extraemos datos de GSC
¿A dónde vamos? - Hasta el infinito y más allá
Extra Ball !
Extraemos datos de GSC
Otros casos de uso - cluster de keywords
Extraemos datos de GSC
Otros casos de uso - cluster de keywords
Extraemos datos de GSC
Otros casos de uso - cluster de keywords
Extraemos datos de GSC
Beta MyDomain.dev
¿Quieres probarlo totalmente gratis?
https://mydomain.dev/clustering
Lino Uruñuela
17 de junio del 2022
@errioxa
info@funnelpunk.com
www.mecagoenlos.com
☏ 637167218
¡¡Gracias!!
SEonthebeach 2022
Lino Uruñuela
17 de junio del 2022
@errioxa
info@funnelpunk.com
www.mecagoenlos.com
☏ 637167218
¡¡Gracias!!
SEonthebeach 2022
¡Me voy de VACACIONES!

More Related Content

What's hot

What's hot (20)

Machine Learning use cases for Technical SEO Automation Brighton SEO Patrick ...
Machine Learning use cases for Technical SEO Automation Brighton SEO Patrick ...Machine Learning use cases for Technical SEO Automation Brighton SEO Patrick ...
Machine Learning use cases for Technical SEO Automation Brighton SEO Patrick ...
 
Cómo Gestionar Proyectos SEO Complejos de Forma Exitosa #SEonthebeach
Cómo Gestionar Proyectos SEO Complejos de Forma Exitosa #SEonthebeachCómo Gestionar Proyectos SEO Complejos de Forma Exitosa #SEonthebeach
Cómo Gestionar Proyectos SEO Complejos de Forma Exitosa #SEonthebeach
 
Brighton SEO April 2022 - Automate the technical SEO stuff
Brighton SEO April 2022 - Automate the technical SEO stuffBrighton SEO April 2022 - Automate the technical SEO stuff
Brighton SEO April 2022 - Automate the technical SEO stuff
 
Data Studio for SEOs: Reporting Automation Tips - Weekly SEO with Lazarina Stoy
Data Studio for SEOs: Reporting Automation Tips - Weekly SEO with Lazarina StoyData Studio for SEOs: Reporting Automation Tips - Weekly SEO with Lazarina Stoy
Data Studio for SEOs: Reporting Automation Tips - Weekly SEO with Lazarina Stoy
 
Influencing Discovery, Indexing Strategies For Complex Websites
Influencing Discovery, Indexing Strategies For Complex WebsitesInfluencing Discovery, Indexing Strategies For Complex Websites
Influencing Discovery, Indexing Strategies For Complex Websites
 
PubCon, Lazarina Stoy. - Machine Learning in Search: Google's ML APIs vs Open...
PubCon, Lazarina Stoy. - Machine Learning in Search: Google's ML APIs vs Open...PubCon, Lazarina Stoy. - Machine Learning in Search: Google's ML APIs vs Open...
PubCon, Lazarina Stoy. - Machine Learning in Search: Google's ML APIs vs Open...
 
eCommerce Internal Linking - Into the Spider-Verse (BrightonSEO edition)
eCommerce Internal Linking - Into the Spider-Verse (BrightonSEO edition)eCommerce Internal Linking - Into the Spider-Verse (BrightonSEO edition)
eCommerce Internal Linking - Into the Spider-Verse (BrightonSEO edition)
 
How to Use Search Intent to Dominate Google Discover
How to Use Search Intent to Dominate Google DiscoverHow to Use Search Intent to Dominate Google Discover
How to Use Search Intent to Dominate Google Discover
 
Probabilistic Thinking in SEO - BrightonSEO October 2022
Probabilistic Thinking in SEO - BrightonSEO October 2022Probabilistic Thinking in SEO - BrightonSEO October 2022
Probabilistic Thinking in SEO - BrightonSEO October 2022
 
SEO Automation Without Using Hard Code by Tevfik Mert Azizoglu - BrightonSEO ...
SEO Automation Without Using Hard Code by Tevfik Mert Azizoglu - BrightonSEO ...SEO Automation Without Using Hard Code by Tevfik Mert Azizoglu - BrightonSEO ...
SEO Automation Without Using Hard Code by Tevfik Mert Azizoglu - BrightonSEO ...
 
Why your tech optimisations are still sat in the backlog
Why your tech optimisations are still sat in the backlogWhy your tech optimisations are still sat in the backlog
Why your tech optimisations are still sat in the backlog
 
The Full Scoop on Google's Title Rewrites
The Full Scoop on Google's Title RewritesThe Full Scoop on Google's Title Rewrites
The Full Scoop on Google's Title Rewrites
 
Ashley Liddell - BrightonSEO 2023.pdf
Ashley Liddell - BrightonSEO 2023.pdfAshley Liddell - BrightonSEO 2023.pdf
Ashley Liddell - BrightonSEO 2023.pdf
 
How to Incorporate ML in your SERP Analysis, Lazarina Stoy -BrightonSEO Oct, ...
How to Incorporate ML in your SERP Analysis, Lazarina Stoy -BrightonSEO Oct, ...How to Incorporate ML in your SERP Analysis, Lazarina Stoy -BrightonSEO Oct, ...
How to Incorporate ML in your SERP Analysis, Lazarina Stoy -BrightonSEO Oct, ...
 
How SEO changes, as we say bye bye to cookies
How SEO changes, as we say bye bye to cookiesHow SEO changes, as we say bye bye to cookies
How SEO changes, as we say bye bye to cookies
 
Stoicism in Digital - brightonSEO April 2022.pdf
Stoicism in Digital  - brightonSEO April 2022.pdfStoicism in Digital  - brightonSEO April 2022.pdf
Stoicism in Digital - brightonSEO April 2022.pdf
 
How Search Works
How Search WorksHow Search Works
How Search Works
 
GretaMunari - The redemption of content automation
GretaMunari - The redemption of content automationGretaMunari - The redemption of content automation
GretaMunari - The redemption of content automation
 
SEOWars: Rstudio aplicado a SEO #sob22
SEOWars: Rstudio aplicado a SEO #sob22SEOWars: Rstudio aplicado a SEO #sob22
SEOWars: Rstudio aplicado a SEO #sob22
 
How to overcome the fear of taking time off.pptx
How to overcome the fear of taking time off.pptxHow to overcome the fear of taking time off.pptx
How to overcome the fear of taking time off.pptx
 

Similar to Agrupa y vencerás - SEO técnico

BDAS-2017 | sanselix jobranke_rpptx
BDAS-2017 | sanselix jobranke_rpptxBDAS-2017 | sanselix jobranke_rpptx
BDAS-2017 | sanselix jobranke_rpptx
Big-Data-Summit
 
Black Hat SEO y Ecommerce ponencia de Chuiso Chuisez
Black Hat SEO y Ecommerce ponencia de Chuiso ChuisezBlack Hat SEO y Ecommerce ponencia de Chuiso Chuisez
Black Hat SEO y Ecommerce ponencia de Chuiso Chuisez
Ecommaster
 

Similar to Agrupa y vencerás - SEO técnico (20)

BDAS-2017 | sanselix jobranke_rpptx
BDAS-2017 | sanselix jobranke_rpptxBDAS-2017 | sanselix jobranke_rpptx
BDAS-2017 | sanselix jobranke_rpptx
 
Analítica Web Páginas Virtuales y Tracking Telefónico
Analítica Web Páginas Virtuales y Tracking TelefónicoAnalítica Web Páginas Virtuales y Tracking Telefónico
Analítica Web Páginas Virtuales y Tracking Telefónico
 
Clinic seo crawling & logs
Clinic seo crawling & logsClinic seo crawling & logs
Clinic seo crawling & logs
 
Taller de Analítica Web - Congreso CID-Murcia
Taller de Analítica Web - Congreso CID-MurciaTaller de Analítica Web - Congreso CID-Murcia
Taller de Analítica Web - Congreso CID-Murcia
 
SEO para e-commerce
SEO para e-commerceSEO para e-commerce
SEO para e-commerce
 
Caso de Estudio SEO: Elige tu propia aventura #CW17
Caso de Estudio SEO: Elige tu propia aventura #CW17Caso de Estudio SEO: Elige tu propia aventura #CW17
Caso de Estudio SEO: Elige tu propia aventura #CW17
 
SEO y Web Semántica en Congreso Web
SEO y Web Semántica en Congreso WebSEO y Web Semántica en Congreso Web
SEO y Web Semántica en Congreso Web
 
Busquedas por voz y SEO
Busquedas por voz y SEOBusquedas por voz y SEO
Busquedas por voz y SEO
 
SEO para WordPress - SEO Galicia 16/11/2018
SEO para WordPress - SEO Galicia 16/11/2018SEO para WordPress - SEO Galicia 16/11/2018
SEO para WordPress - SEO Galicia 16/11/2018
 
¡Esto es La Voz! @mjcachon en #ensaladaSEO
¡Esto es La Voz! @mjcachon en #ensaladaSEO¡Esto es La Voz! @mjcachon en #ensaladaSEO
¡Esto es La Voz! @mjcachon en #ensaladaSEO
 
Estadísticas
EstadísticasEstadísticas
Estadísticas
 
Evento Be! Blogger en el Campus Madrid - Marketing Online y SEO
Evento Be! Blogger en el Campus Madrid - Marketing Online y SEOEvento Be! Blogger en el Campus Madrid - Marketing Online y SEO
Evento Be! Blogger en el Campus Madrid - Marketing Online y SEO
 
Cómo mejorar-la-velocidad-de-tu-web (Cámara madrid)
Cómo mejorar-la-velocidad-de-tu-web (Cámara madrid)Cómo mejorar-la-velocidad-de-tu-web (Cámara madrid)
Cómo mejorar-la-velocidad-de-tu-web (Cámara madrid)
 
Crawling e Indexacion mejorando la eficacia de tus urls
Crawling e Indexacion mejorando la eficacia de tus urlsCrawling e Indexacion mejorando la eficacia de tus urls
Crawling e Indexacion mejorando la eficacia de tus urls
 
Black Hat SEO y Ecommerce ponencia de Chuiso Chuisez
Black Hat SEO y Ecommerce ponencia de Chuiso ChuisezBlack Hat SEO y Ecommerce ponencia de Chuiso Chuisez
Black Hat SEO y Ecommerce ponencia de Chuiso Chuisez
 
Analítica avanzada de forma fácil, paso a paso, ¡y sin complejos! :) - Eduard...
Analítica avanzada de forma fácil, paso a paso, ¡y sin complejos! :) - Eduard...Analítica avanzada de forma fácil, paso a paso, ¡y sin complejos! :) - Eduard...
Analítica avanzada de forma fácil, paso a paso, ¡y sin complejos! :) - Eduard...
 
Taller de Screaming Frog con Rubén Merino
Taller de Screaming Frog con Rubén MerinoTaller de Screaming Frog con Rubén Merino
Taller de Screaming Frog con Rubén Merino
 
¿Es Posible Posicionar un Sitio Web en tan solo 15 Días? Aprende Cómo Aquí!
¿Es Posible Posicionar un Sitio Web en tan solo 15 Días? Aprende Cómo Aquí!¿Es Posible Posicionar un Sitio Web en tan solo 15 Días? Aprende Cómo Aquí!
¿Es Posible Posicionar un Sitio Web en tan solo 15 Días? Aprende Cómo Aquí!
 
SEO y SEM . Todos SEMos amigos en el SEOnthebeach
SEO y SEM . Todos SEMos amigos en el SEOnthebeachSEO y SEM . Todos SEMos amigos en el SEOnthebeach
SEO y SEM . Todos SEMos amigos en el SEOnthebeach
 
SEO para Progressive Web Apps (PWA) y JavaScript
SEO para Progressive Web Apps (PWA) y JavaScriptSEO para Progressive Web Apps (PWA) y JavaScript
SEO para Progressive Web Apps (PWA) y JavaScript
 

More from Lino Uruñuela

SEO para periodistas por Lino Uruñuela (2008)
SEO para periodistas por Lino Uruñuela (2008)SEO para periodistas por Lino Uruñuela (2008)
SEO para periodistas por Lino Uruñuela (2008)
Lino Uruñuela
 

More from Lino Uruñuela (13)

SEO desde la línea de comandos
SEO desde la línea de comandosSEO desde la línea de comandos
SEO desde la línea de comandos
 
Google Search Console - el dato de Schrödinger
Google Search Console - el dato de  SchrödingerGoogle Search Console - el dato de  Schrödinger
Google Search Console - el dato de Schrödinger
 
Que no te den dato por liebre - enpresadigitala 2022
Que no te den dato por liebre - enpresadigitala 2022Que no te den dato por liebre - enpresadigitala 2022
Que no te den dato por liebre - enpresadigitala 2022
 
SeoQL: SQL para SEO
SeoQL: SQL para SEOSeoQL: SQL para SEO
SeoQL: SQL para SEO
 
Obtener un listado de keywords en base a su potencial SEO (Google Search Cons...
Obtener un listado de keywords en base a su potencial SEO (Google Search Cons...Obtener un listado de keywords en base a su potencial SEO (Google Search Cons...
Obtener un listado de keywords en base a su potencial SEO (Google Search Cons...
 
Search Console, descifrando las cifras
Search Console, descifrando las cifrasSearch Console, descifrando las cifras
Search Console, descifrando las cifras
 
Seo Técnico - Del mito al dato - Seonthebeach 2018
Seo Técnico - Del mito al dato - Seonthebeach 2018Seo Técnico - Del mito al dato - Seonthebeach 2018
Seo Técnico - Del mito al dato - Seonthebeach 2018
 
eShow 2017 SEO grandes webs - Lino urunuela
eShow 2017 SEO grandes webs - Lino urunuelaeShow 2017 SEO grandes webs - Lino urunuela
eShow 2017 SEO grandes webs - Lino urunuela
 
Optimiza tu crawl budget se onthebeach 2017
Optimiza tu crawl budget   se onthebeach 2017Optimiza tu crawl budget   se onthebeach 2017
Optimiza tu crawl budget se onthebeach 2017
 
Cómo hacer una migración y no morir en el intento
Cómo hacer una migración y no morir en el intentoCómo hacer una migración y no morir en el intento
Cómo hacer una migración y no morir en el intento
 
Seo Logs y Big Data, Lino Uruñuela en Seonthebeach 2016
Seo Logs y Big Data, Lino Uruñuela en Seonthebeach 2016Seo Logs y Big Data, Lino Uruñuela en Seonthebeach 2016
Seo Logs y Big Data, Lino Uruñuela en Seonthebeach 2016
 
SEO para periodistas por Lino Uruñuela (2008)
SEO para periodistas por Lino Uruñuela (2008)SEO para periodistas por Lino Uruñuela (2008)
SEO para periodistas por Lino Uruñuela (2008)
 
Monitorizar GoogleBot usando Google Analytics por Lino Uruñuela
Monitorizar GoogleBot usando Google Analytics por Lino UruñuelaMonitorizar GoogleBot usando Google Analytics por Lino Uruñuela
Monitorizar GoogleBot usando Google Analytics por Lino Uruñuela
 

Recently uploaded

Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
BESTTech1
 

Recently uploaded (20)

Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
 
diseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptxdiseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptx
 
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
 
Principales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto RicoPrincipales Retos Demográficos de Puerto Rico
Principales Retos Demográficos de Puerto Rico
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdf
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
 
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILASistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
 
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdfCALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
CALENDARIZACIÓN ACTUALIZADA DEL 2024 alt.pdf
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptx
 
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdfPorcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.ppt
 
Los países por porcentaje de población blanca europea en AL (2024).pdf
Los países por porcentaje de población blanca europea en AL (2024).pdfLos países por porcentaje de población blanca europea en AL (2024).pdf
Los países por porcentaje de población blanca europea en AL (2024).pdf
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...
 
Trabajo Final de Powerbi DMC Indicadores.pptx
Trabajo Final de Powerbi DMC Indicadores.pptxTrabajo Final de Powerbi DMC Indicadores.pptx
Trabajo Final de Powerbi DMC Indicadores.pptx
 
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docxAA CUADRO DE TEORIA DEL CASO. (1) (1).docx
AA CUADRO DE TEORIA DEL CASO. (1) (1).docx
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .
 

Agrupa y vencerás - SEO técnico

  • 1. Lino Uruñuela 17 de junio del 2022 @errioxa info@funnelpunk.com www.mecagoenlos.com ☏ 637167218 Agrupa y vencerás! SEonthebeach 2022
  • 2. Hola! Soy Lino Uruñuela He trabajado en algunos de los mayores sites de España Link to ppt ⤴ https://www.mecagoenlos.com/SOB2022.pdf Lino Uruñuela 17 de junio del 2022 @errioxa info@funnelpunk.com www.mecagoenlos.com ☏ 637167218
  • 3. ¿ De dónde venimos ?
  • 4. Extraemos datos de GSC ¿De dónde venimos?
  • 5. Extraemos datos de GSC ¿De dónde venimos?
  • 6. Extraemos datos de GSC ¿De dónde venimos?
  • 7. Extraemos datos de GSC ¿De dónde venimos? -Índice de Cobertura - Coverage
  • 8. ¿ Cómo se han creado tantas URLs ?
  • 9. Extraemos datos de GSC ¿Cómo se han creado tantas URLs? ●Creadas a mano ●Búsquedas Internas
  • 10. Extraemos datos de GSC Creadas a mano - ¿Cómo se han creado tantas URLs? ●Creadas a mano ■ Decisiones de negocio ■ Decisiones SEO ●Búsquedas Internas
  • 11. Extraemos datos de GSC Creadas a mano - ¿Cómo se han creado tantas URLs? ●Creadas a mano ■ Decisiones de negocio ■ Decisiones SEO ○ Tendencias históricas ○ Intuición humana ●Búsquedas Internas
  • 12. Extraemos datos de GSC Búsquedas Internas - ¿Cómo se han creado tantas URLs? ●Creadas a mano ■ Decisiones de negocio ■ Decisiones SEO ○ Tendencias históricas ○ Intuición humana ●Búsquedas Internas ■ Ninguna regla ■ Se generan en cada categoría
  • 13. Extraemos datos de GSC Problemas - Búsquedas Internas ●URLs duplicadas ●URLs sin sentido /ejercicio/cinta-correr/ /ejercicio/cinta-corres/ /ejercicio/cinta-corr/ /ejercicio/cinta-de-correr/ /ejercicio/cinta-de.correr/ /ejercicio/cinta-de-corre/ /ejercicio/cintas-de-corre/ /ejercicio/cintas-de-correr/ /ejercicio/cintas-de-corres/ /ejercicio/cintas-correer/ /ejercicio/cintas-para-corres/
  • 14. Extraemos datos de GSC Problemas - Búsquedas Internas ●URLs duplicadas ●URLs sin sentido /ejercicio/cinta-correr/ /ejercicio/cinta-corres/ /ejercicio/cinta-corr/ /ejercicio/cinta-de-correr/ /ejercicio/cinta-de.correr/ /ejercicio/cinta-de-corre/ /ejercicio/cintas-de-corre/ /ejercicio/cintas-de-correr/ /ejercicio/cintas-de-corres/ /ejercicio/cintas-correer/ /ejercicio/cintas-para-corres/ /categoria/cadaver/ /categoria/cambio-por-algo-de-mi-interes/ /categoria/ir-a-mi-gimnasio/ /categoria/cambio-mi-coche-por-otro-ya/ ● URLs malsonantes ● URLs porno ● URLs spam
  • 15. ¿ Qué podemos hacer ?
  • 16. ●Dejarlo así ●¿Eliminar URLs? ●¿Redireccionar URL? ○ ¿Reglas para definir las URLs de origen y destino?
  • 17. ●Dejarlo así ●¿Eliminar URLs? ●¿Redireccionar URL? ○ ¿Reglas para definir las URLs de origen y destino?
  • 18. 1.Analizar tráfico 2.Eliminar URLs sin tráfico 3.Mapear redirecciones
  • 19. Extraemos datos de GSC 1.Analizar tráfico A.Obtener TODAS las URLs B.¿Cuáles han tenido tráfico en los últimos meses?
  • 20. Extraemos datos de GSC 1.Analizar tráfico A.Obtener TODAS las URLs ¿Cómo las podemos obtener? ○ El equipo de IT ○ Logs del servidor ○ Crawler
  • 21. Extraemos datos de GSC 1.Analizar tráfico A.Obtener TODAS las URLs B.¿Cuáles han tenido tráfico en los últimos meses?
  • 22. Extraemos datos de GSC 1.Analizar tráfico A.Obtener TODAS las URLs B.¿Cuáles han tenido tráfico en los últimos meses? ¿Cómo las podemos obtener? a.Google Analytics b.Google Search Console c. Logs del servidor
  • 23. Extraemos datos de GSC 2. Eliminar URLs sin tráfico Las que NO han tenido tráfico ? → ELIMINAR
  • 24. Extraemos datos de GSC 3. Mapear redirecciones ¿Cómo decidimos qué URLs redirigen a qué URLs?
  • 25. Extraemos datos de GSC 3. Mapear redirecciones A.A Mano B.Machine Learning
  • 26. Extraemos datos de GSC 3. Mapear redirecciones A.A Mano B.Machine Learning
  • 27. Extraemos datos de GSC 3. Mapear redirecciones ●Existen multitud de métodos para agrupar (o clusterizar) palabras o/y frases → Escoger el más sencillo para nosotros ●Debemos tener en cuenta otros datos además del texto ○ Tráfico orgánico ○ Accesos de Google ○ Definiciones “humanas”
  • 28. Extraemos datos de GSC 3. Mapear redirecciones - Tokenización La tokenización es básicamente hacer una lista de palabras de lo que vayas a tratar
  • 29. Extraemos datos de GSC 3. Mapear redirecciones - Normalización La normalización es el eliminar acentos, poner todas las palabras en minúscula, eliminar caracteres extraños o que no sean convenientes que entren en nuestros procesos.
  • 30. Extraemos datos de GSC Lemmatizar Vs Raíces ●Lematizar De manera resumida, la lematización es extraer para cada palabra su lexema que puede ser diferente para una misma palabra. es decir. es dependiente de su contexto. La manera compleja "La lematización es el proceso mediante el cual las palabras de un texto que pertenecen a un mismo paradigma flexivo o derivativo son llevadas a una forma normal que representa a toda la clase" ●Raíces Quedarse con la raíz pero no tiene en cuenta el contexto.
  • 31. Extraemos datos de GSC Lemmatizar Vs Raíces Lemmatizar alquilar piso sebastiar alquiler piso sebastiar alquilar piso sebastiar alquiler piso sebastiar Raices alquil pis san sebasti alquil pis san sebasti alquil pis san sebasti alquil pis san sebasti Texto Original alquilar piso en San Sebastián alquiler de pisos en San sebastian alquilar pisos en San Sebastian piso en alquiler en San Sebastian
  • 32. Extraemos datos de GSC Lemmatizar Vs Raíces Lemmatizar cinta correr ejercicio cinta corr ejercicio cinta corr ejercicio cinta correr ejercicio cinta correr ejercicio cinta correr ejercicio cinta correr ejercicio cinta correr ejercicio cinta corr ejercicio cinta correer ejercicio Raices cint corr ejercici cint corr ejercici cint corr ejercici cint corr ejercici cint corr ejercici cint corr ejercici cint corr ejercici cint corr ejercici cint corr ejercici cint corr ejercici Texto Original ejercicio cinta correr ejercicio cinta corres ejercicio cinta corr ejercicio cinta de correr ejercicio cinta para correr ejercicio cinta de corre ejercicio cintas de corre ejercicio cintas de correr ejercicio cintas de corres ejercicio cintas correer
  • 33. Extraemos datos de GSC Definir redirecciones
  • 34. Extraemos datos de GSC Definir redirecciones - ¿usamos la raíz?
  • 35. Extraemos datos de GSC ¿Cuál es la URL que más tráfico tiene?
  • 36. Extraemos datos de GSC Definimos URL del grupo la URL con más tráfico
  • 37. Implementar en un mundo real !
  • 38. Agrupación - Clustering de keywords - Google Search Console https://www.mecagoenlos.com/Posicionamiento/matriz-de-keywords-seo.php 50.000 filas ! Link ⤴
  • 39. Extraemos datos de GSC 50.000 filas usando Pandas - En un mundo real
  • 40. Extraemos datos de GSC 50.000 filas usando Dask - En un mundo real
  • 42. Extraemos datos de GSC Lemmatizar y Raíces en SQL
  • 43. Extraemos datos de GSC Lemmatizar y Raíces en SQL
  • 44. Extraemos datos de GSC Lemmatizar y Raíces en SQL
  • 45. Extraemos datos de GSC Lemmatizar y Raíces en SQL PostgreSQL ClickHouse ElasticSearch
  • 46. Extraemos datos de GSC Lemmatizar y Raíces en SQL
  • 47. Extraemos datos de GSC Python Vs SQL
  • 48. Ahora sí podemos Implementar en un mundo real ! con decenas de millones de URLs
  • 49. Extraemos datos de GSC Resultado final
  • 50. Extraemos datos de GSC Resultado final
  • 51. Extraemos datos de GSC Resultado final
  • 52. Extraemos datos de GSC Resultado final
  • 53. Extraemos datos de GSC Resultado final
  • 54. Extraemos datos de GSC Resultado final
  • 55. Extraemos datos de GSC Resultado final
  • 56. Extraemos datos de GSC Resultado final
  • 57. Extraemos datos de GSC Resultado final
  • 58. Extraemos datos de GSC ¿De dónde venimos?
  • 59. Extraemos datos de GSC ¿De dónde venimos?
  • 60. Extraemos datos de GSC ¿Dónde estamos?
  • 61. Extraemos datos de GSC ¿De dónde venimos?
  • 62. Extraemos datos de GSC ¿A dónde vamos? - Hasta el infinito y más allá
  • 64. Extraemos datos de GSC Otros casos de uso - cluster de keywords
  • 65. Extraemos datos de GSC Otros casos de uso - cluster de keywords
  • 66. Extraemos datos de GSC Otros casos de uso - cluster de keywords
  • 67. Extraemos datos de GSC Beta MyDomain.dev ¿Quieres probarlo totalmente gratis? https://mydomain.dev/clustering
  • 68. Lino Uruñuela 17 de junio del 2022 @errioxa info@funnelpunk.com www.mecagoenlos.com ☏ 637167218 ¡¡Gracias!! SEonthebeach 2022
  • 69. Lino Uruñuela 17 de junio del 2022 @errioxa info@funnelpunk.com www.mecagoenlos.com ☏ 637167218 ¡¡Gracias!! SEonthebeach 2022 ¡Me voy de VACACIONES!