Agrupa y vencerás - SEO técnico

Lino Uruñuela
Lino UruñuelaSEO & Web Analytics at Funnel Punk
Lino Uruñuela
17 de junio del 2022
@errioxa
info@funnelpunk.com
www.mecagoenlos.com
☏ 637167218
Agrupa y vencerás!
SEonthebeach 2022
Hola!
Soy Lino Uruñuela
He trabajado en algunos de los mayores sites de España
Link to ppt ⤴
https://www.mecagoenlos.com/SOB2022.pdf
Lino Uruñuela
17 de junio del 2022
@errioxa
info@funnelpunk.com
www.mecagoenlos.com
☏ 637167218
¿ De dónde venimos ?
Extraemos datos de GSC
¿De dónde venimos?
Extraemos datos de GSC
¿De dónde venimos?
Extraemos datos de GSC
¿De dónde venimos?
Extraemos datos de GSC
¿De dónde venimos? -Índice de Cobertura - Coverage
¿ Cómo se han creado
tantas URLs ?
Extraemos datos de GSC
¿Cómo se han creado tantas URLs?
●Creadas a mano ●Búsquedas Internas
Extraemos datos de GSC
Creadas a mano - ¿Cómo se han creado tantas URLs?
●Creadas a mano
■ Decisiones de negocio
■ Decisiones SEO
●Búsquedas Internas
Extraemos datos de GSC
Creadas a mano - ¿Cómo se han creado tantas URLs?
●Creadas a mano
■ Decisiones de negocio
■ Decisiones SEO
○ Tendencias históricas
○ Intuición humana
●Búsquedas Internas
Extraemos datos de GSC
Búsquedas Internas - ¿Cómo se han creado tantas URLs?
●Creadas a mano
■ Decisiones de negocio
■ Decisiones SEO
○ Tendencias históricas
○ Intuición humana
●Búsquedas Internas
■ Ninguna regla
■ Se generan en cada
categoría
Extraemos datos de GSC
Problemas - Búsquedas Internas
●URLs duplicadas ●URLs sin sentido
/ejercicio/cinta-correr/
/ejercicio/cinta-corres/
/ejercicio/cinta-corr/
/ejercicio/cinta-de-correr/
/ejercicio/cinta-de.correr/
/ejercicio/cinta-de-corre/
/ejercicio/cintas-de-corre/
/ejercicio/cintas-de-correr/
/ejercicio/cintas-de-corres/
/ejercicio/cintas-correer/
/ejercicio/cintas-para-corres/
Extraemos datos de GSC
Problemas - Búsquedas Internas
●URLs duplicadas ●URLs sin sentido
/ejercicio/cinta-correr/
/ejercicio/cinta-corres/
/ejercicio/cinta-corr/
/ejercicio/cinta-de-correr/
/ejercicio/cinta-de.correr/
/ejercicio/cinta-de-corre/
/ejercicio/cintas-de-corre/
/ejercicio/cintas-de-correr/
/ejercicio/cintas-de-corres/
/ejercicio/cintas-correer/
/ejercicio/cintas-para-corres/
/categoria/cadaver/
/categoria/cambio-por-algo-de-mi-interes/
/categoria/ir-a-mi-gimnasio/
/categoria/cambio-mi-coche-por-otro-ya/
● URLs malsonantes
● URLs porno
● URLs spam
¿ Qué podemos hacer ?
●Dejarlo así
●¿Eliminar URLs?
●¿Redireccionar URL?
○ ¿Reglas para definir
las URLs de origen y destino?
●Dejarlo así
●¿Eliminar URLs?
●¿Redireccionar URL?
○ ¿Reglas para definir
las URLs de origen y destino?
1.Analizar tráfico
2.Eliminar URLs sin tráfico
3.Mapear redirecciones
Extraemos datos de GSC
1.Analizar tráfico
A.Obtener TODAS las URLs
B.¿Cuáles han tenido tráfico en los últimos meses?
Extraemos datos de GSC
1.Analizar tráfico
A.Obtener TODAS las URLs
¿Cómo las podemos obtener?
○ El equipo de IT
○ Logs del servidor
○ Crawler
Extraemos datos de GSC
1.Analizar tráfico
A.Obtener TODAS las URLs
B.¿Cuáles han tenido tráfico en los últimos meses?
Extraemos datos de GSC
1.Analizar tráfico
A.Obtener TODAS las URLs
B.¿Cuáles han tenido tráfico en los últimos meses?
¿Cómo las podemos obtener?
a.Google Analytics
b.Google Search Console
c. Logs del servidor
Extraemos datos de GSC
2. Eliminar URLs sin tráfico
Las que NO han tenido tráfico ? → ELIMINAR
Extraemos datos de GSC
3. Mapear redirecciones
¿Cómo decidimos qué URLs redirigen a qué URLs?
Extraemos datos de GSC
3. Mapear redirecciones
A.A Mano
B.Machine Learning
Extraemos datos de GSC
3. Mapear redirecciones
A.A Mano
B.Machine Learning
Extraemos datos de GSC
3. Mapear redirecciones
●Existen multitud de métodos para agrupar (o clusterizar)
palabras o/y frases → Escoger el más sencillo para nosotros
●Debemos tener en cuenta otros datos además del texto
○ Tráfico orgánico
○ Accesos de Google
○ Definiciones “humanas”
Extraemos datos de GSC
3. Mapear redirecciones - Tokenización
La tokenización es básicamente hacer una lista de
palabras de lo que vayas a tratar
Extraemos datos de GSC
3. Mapear redirecciones - Normalización
La normalización es el eliminar acentos, poner todas
las palabras en minúscula, eliminar caracteres extraños
o que no sean convenientes que entren en nuestros
procesos.
Extraemos datos de GSC
Lemmatizar Vs Raíces
●Lematizar
De manera resumida, la lematización es extraer
para cada palabra su lexema que puede ser
diferente para una misma palabra. es decir. es
dependiente de su contexto.
La manera compleja "La lematización es el
proceso mediante el cual las palabras de un
texto que pertenecen a un mismo paradigma
flexivo o derivativo son llevadas a una forma
normal que representa a toda la clase"
●Raíces
Quedarse con la raíz pero no tiene en cuenta el
contexto.
Extraemos datos de GSC
Lemmatizar Vs Raíces
Lemmatizar
alquilar piso sebastiar
alquiler piso sebastiar
alquilar piso sebastiar
alquiler piso sebastiar
Raices
alquil pis san sebasti
alquil pis san sebasti
alquil pis san sebasti
alquil pis san sebasti
Texto Original
alquilar piso en San Sebastián
alquiler de pisos en San sebastian
alquilar pisos en San Sebastian
piso en alquiler en San Sebastian
Extraemos datos de GSC
Lemmatizar Vs Raíces
Lemmatizar
cinta correr ejercicio
cinta corr ejercicio
cinta corr ejercicio
cinta correr ejercicio
cinta correr ejercicio
cinta correr ejercicio
cinta correr ejercicio
cinta correr ejercicio
cinta corr ejercicio
cinta correer ejercicio
Raices
cint corr ejercici
cint corr ejercici
cint corr ejercici
cint corr ejercici
cint corr ejercici
cint corr ejercici
cint corr ejercici
cint corr ejercici
cint corr ejercici
cint corr ejercici
Texto Original
ejercicio cinta correr
ejercicio cinta corres
ejercicio cinta corr
ejercicio cinta de correr
ejercicio cinta para correr
ejercicio cinta de corre
ejercicio cintas de corre
ejercicio cintas de correr
ejercicio cintas de corres
ejercicio cintas correer
Extraemos datos de GSC
Definir redirecciones
Extraemos datos de GSC
Definir redirecciones - ¿usamos la raíz?
Extraemos datos de GSC
¿Cuál es la URL que más tráfico tiene?
Extraemos datos de GSC
Definimos URL del grupo la URL con más tráfico
Implementar en un mundo real !
Agrupación - Clustering de keywords - Google Search Console
https://www.mecagoenlos.com/Posicionamiento/matriz-de-keywords-seo.php
50.000 filas !
Link ⤴
Extraemos datos de GSC
50.000 filas usando Pandas - En un mundo real
Extraemos datos de GSC
50.000 filas usando Dask - En un mundo real
Python Vs SQL !
Extraemos datos de GSC
Lemmatizar y Raíces en SQL
Extraemos datos de GSC
Lemmatizar y Raíces en SQL
Extraemos datos de GSC
Lemmatizar y Raíces en SQL
Extraemos datos de GSC
Lemmatizar y Raíces en SQL
PostgreSQL ClickHouse
ElasticSearch
Extraemos datos de GSC
Lemmatizar y Raíces en SQL
Extraemos datos de GSC
Python Vs SQL
Ahora sí podemos
Implementar en un mundo real !
con decenas de millones de URLs
Extraemos datos de GSC
Resultado final
Extraemos datos de GSC
Resultado final
Extraemos datos de GSC
Resultado final
Extraemos datos de GSC
Resultado final
Extraemos datos de GSC
Resultado final
Extraemos datos de GSC
Resultado final
Extraemos datos de GSC
Resultado final
Extraemos datos de GSC
Resultado final
Extraemos datos de GSC
Resultado final
Extraemos datos de GSC
¿De dónde venimos?
Extraemos datos de GSC
¿De dónde venimos?
Extraemos datos de GSC
¿Dónde estamos?
Extraemos datos de GSC
¿De dónde venimos?
Extraemos datos de GSC
¿A dónde vamos? - Hasta el infinito y más allá
Extra Ball !
Extraemos datos de GSC
Otros casos de uso - cluster de keywords
Extraemos datos de GSC
Otros casos de uso - cluster de keywords
Extraemos datos de GSC
Otros casos de uso - cluster de keywords
Extraemos datos de GSC
Beta MyDomain.dev
¿Quieres probarlo totalmente gratis?
https://mydomain.dev/clustering
Lino Uruñuela
17 de junio del 2022
@errioxa
info@funnelpunk.com
www.mecagoenlos.com
☏ 637167218
¡¡Gracias!!
SEonthebeach 2022
Lino Uruñuela
17 de junio del 2022
@errioxa
info@funnelpunk.com
www.mecagoenlos.com
☏ 637167218
¡¡Gracias!!
SEonthebeach 2022
¡Me voy de VACACIONES!
1 of 69

Recommended

Improving Crawling and Indexing using Real-Time Log File Insights by
Improving Crawling and Indexing using Real-Time Log File InsightsImproving Crawling and Indexing using Real-Time Log File Insights
Improving Crawling and Indexing using Real-Time Log File InsightsSteven van Vessum
2K views65 slides
How to get more traffic with less content - BrightonSEO by
How to get more traffic with less content - BrightonSEOHow to get more traffic with less content - BrightonSEO
How to get more traffic with less content - BrightonSEOAnna Gregory-Hall
1.6K views55 slides
BrightonSEO October 2022 - Log File Analysis - Steven van Vessum.pdf by
BrightonSEO October 2022 - Log File Analysis - Steven van Vessum.pdfBrightonSEO October 2022 - Log File Analysis - Steven van Vessum.pdf
BrightonSEO October 2022 - Log File Analysis - Steven van Vessum.pdfSteven van Vessum
689 views77 slides
The Value of Featured Snippets (BrightonSEO 2023).pdf by
The Value of Featured Snippets (BrightonSEO 2023).pdfThe Value of Featured Snippets (BrightonSEO 2023).pdf
The Value of Featured Snippets (BrightonSEO 2023).pdfNiki Mosier
744 views80 slides
A beginner's guide to machine learning for SEOs - WTSFest 2022 by
A beginner's guide to machine learning for SEOs  - WTSFest 2022A beginner's guide to machine learning for SEOs  - WTSFest 2022
A beginner's guide to machine learning for SEOs - WTSFest 2022LazarinaStoyanova
4.9K views105 slides
How SEO changes, as we say bye bye to cookies by
How SEO changes, as we say bye bye to cookiesHow SEO changes, as we say bye bye to cookies
How SEO changes, as we say bye bye to cookiesAccuraCast
485 views31 slides

More Related Content

What's hot

Staying Sane: How To Prioritise and Manage Your Mental Health As An SEO by
Staying Sane: How To Prioritise and Manage Your Mental Health As An SEOStaying Sane: How To Prioritise and Manage Your Mental Health As An SEO
Staying Sane: How To Prioritise and Manage Your Mental Health As An SEOCharlotteMcIntyre5
1.6K views22 slides
Product, service and category page links (and how to get them) - Rebecca Moss... by
Product, service and category page links (and how to get them) - Rebecca Moss...Product, service and category page links (and how to get them) - Rebecca Moss...
Product, service and category page links (and how to get them) - Rebecca Moss...Rebecca Moss
1.3K views104 slides
Brighton SEO April 2022 - Talk by Nicole Osborne - Explode Your Agency Growth by
Brighton SEO April 2022 - Talk by Nicole Osborne  - Explode Your Agency Growth Brighton SEO April 2022 - Talk by Nicole Osborne  - Explode Your Agency Growth
Brighton SEO April 2022 - Talk by Nicole Osborne - Explode Your Agency Growth Nicole Osborne
1.7K views53 slides
SEO Reporting to Impress: How to Successfully Report your SEO Efforts & Resul... by
SEO Reporting to Impress: How to Successfully Report your SEO Efforts & Resul...SEO Reporting to Impress: How to Successfully Report your SEO Efforts & Resul...
SEO Reporting to Impress: How to Successfully Report your SEO Efforts & Resul...Aleyda Solís
9K views73 slides
Brighton SEO April 2022 - Automate the technical SEO stuff by
Brighton SEO April 2022 - Automate the technical SEO stuffBrighton SEO April 2022 - Automate the technical SEO stuff
Brighton SEO April 2022 - Automate the technical SEO stuffMichael Van Den Reym
6.3K views81 slides
BrightonSEO Oct 2022 Similar_ai.pdf by
BrightonSEO Oct 2022 Similar_ai.pdfBrightonSEO Oct 2022 Similar_ai.pdf
BrightonSEO Oct 2022 Similar_ai.pdfDylan Fuler
246 views49 slides

What's hot(20)

Staying Sane: How To Prioritise and Manage Your Mental Health As An SEO by CharlotteMcIntyre5
Staying Sane: How To Prioritise and Manage Your Mental Health As An SEOStaying Sane: How To Prioritise and Manage Your Mental Health As An SEO
Staying Sane: How To Prioritise and Manage Your Mental Health As An SEO
CharlotteMcIntyre51.6K views
Product, service and category page links (and how to get them) - Rebecca Moss... by Rebecca Moss
Product, service and category page links (and how to get them) - Rebecca Moss...Product, service and category page links (and how to get them) - Rebecca Moss...
Product, service and category page links (and how to get them) - Rebecca Moss...
Rebecca Moss1.3K views
Brighton SEO April 2022 - Talk by Nicole Osborne - Explode Your Agency Growth by Nicole Osborne
Brighton SEO April 2022 - Talk by Nicole Osborne  - Explode Your Agency Growth Brighton SEO April 2022 - Talk by Nicole Osborne  - Explode Your Agency Growth
Brighton SEO April 2022 - Talk by Nicole Osborne - Explode Your Agency Growth
Nicole Osborne 1.7K views
SEO Reporting to Impress: How to Successfully Report your SEO Efforts & Resul... by Aleyda Solís
SEO Reporting to Impress: How to Successfully Report your SEO Efforts & Resul...SEO Reporting to Impress: How to Successfully Report your SEO Efforts & Resul...
SEO Reporting to Impress: How to Successfully Report your SEO Efforts & Resul...
Aleyda Solís9K views
Brighton SEO April 2022 - Automate the technical SEO stuff by Michael Van Den Reym
Brighton SEO April 2022 - Automate the technical SEO stuffBrighton SEO April 2022 - Automate the technical SEO stuff
Brighton SEO April 2022 - Automate the technical SEO stuff
BrightonSEO Oct 2022 Similar_ai.pdf by Dylan Fuler
BrightonSEO Oct 2022 Similar_ai.pdfBrightonSEO Oct 2022 Similar_ai.pdf
BrightonSEO Oct 2022 Similar_ai.pdf
Dylan Fuler246 views
BrightonSEO Slides April 2023 by Cheryl Luzet
BrightonSEO Slides April 2023BrightonSEO Slides April 2023
BrightonSEO Slides April 2023
Cheryl Luzet343 views
Mo Kanjilal - Brighton SEO - The Power of Being Different.pdf by Mo Kanjilal
Mo Kanjilal - Brighton SEO - The Power of Being Different.pdfMo Kanjilal - Brighton SEO - The Power of Being Different.pdf
Mo Kanjilal - Brighton SEO - The Power of Being Different.pdf
Mo Kanjilal1.2K views
El SEO en medios: En busca del engranaje perfecto en una redacción by Clara Soteras
El SEO en medios: En busca del engranaje perfecto en una redacciónEl SEO en medios: En busca del engranaje perfecto en una redacción
El SEO en medios: En busca del engranaje perfecto en una redacción
Clara Soteras309 views
Data-driven SEO & content strategy to reduce your customer acquisition costs by adlift
Data-driven SEO & content strategy to reduce your customer acquisition costsData-driven SEO & content strategy to reduce your customer acquisition costs
Data-driven SEO & content strategy to reduce your customer acquisition costs
adlift582 views
Get Your Ticket Effective zero-volume keyword research and why it’s important by MarkWilliamsCook1
 Get Your Ticket Effective zero-volume keyword research and why it’s important Get Your Ticket Effective zero-volume keyword research and why it’s important
Get Your Ticket Effective zero-volume keyword research and why it’s important
MarkWilliamsCook11.7K views
Making Magento Magnificent for Marketing - Brighton SEO Spring 2023.pdf by PushON Ltd
Making Magento Magnificent for Marketing - Brighton SEO Spring 2023.pdfMaking Magento Magnificent for Marketing - Brighton SEO Spring 2023.pdf
Making Magento Magnificent for Marketing - Brighton SEO Spring 2023.pdf
PushON Ltd276 views
Why your tech optimisations are still sat in the backlog by Vicky481083
Why your tech optimisations are still sat in the backlogWhy your tech optimisations are still sat in the backlog
Why your tech optimisations are still sat in the backlog
Vicky481083294 views
Influencing Discovery, Indexing Strategies For Complex Websites by Dan Taylor
Influencing Discovery, Indexing Strategies For Complex WebsitesInfluencing Discovery, Indexing Strategies For Complex Websites
Influencing Discovery, Indexing Strategies For Complex Websites
Dan Taylor193 views
EAT: Have We Been Looking At It Backwards by EdwardZiubrzynski1
EAT: Have We Been Looking At It BackwardsEAT: Have We Been Looking At It Backwards
EAT: Have We Been Looking At It Backwards
EdwardZiubrzynski12.1K views
BrightonSEO - Master Crawl Budget Optimization for Enterprise Websites by Manick Bhan
BrightonSEO - Master Crawl Budget Optimization for Enterprise WebsitesBrightonSEO - Master Crawl Budget Optimization for Enterprise Websites
BrightonSEO - Master Crawl Budget Optimization for Enterprise Websites
Manick Bhan2.2K views
Shining a light on the dark funnel by Riaz Kanani
Shining a light on the dark funnelShining a light on the dark funnel
Shining a light on the dark funnel
Riaz Kanani302 views
Accessibility, strategy and schema - do they go hand in hand? Beth Barnham Br... by BethBarnham1
Accessibility, strategy and schema - do they go hand in hand? Beth Barnham Br...Accessibility, strategy and schema - do they go hand in hand? Beth Barnham Br...
Accessibility, strategy and schema - do they go hand in hand? Beth Barnham Br...
BethBarnham1464 views
[BrightonSEO Oct 2022] Remarketing SEO - Himani Kankaria - Missive Digital.pdf by Himani Kankaria
[BrightonSEO Oct 2022] Remarketing SEO - Himani Kankaria - Missive Digital.pdf[BrightonSEO Oct 2022] Remarketing SEO - Himani Kankaria - Missive Digital.pdf
[BrightonSEO Oct 2022] Remarketing SEO - Himani Kankaria - Missive Digital.pdf
Himani Kankaria1.3K views

Similar to Agrupa y vencerás - SEO técnico

BDAS-2017 | sanselix jobranke_rpptx by
BDAS-2017 | sanselix jobranke_rpptxBDAS-2017 | sanselix jobranke_rpptx
BDAS-2017 | sanselix jobranke_rpptxBig-Data-Summit
68 views13 slides
Analítica Web Páginas Virtuales y Tracking Telefónico by
Analítica Web Páginas Virtuales y Tracking TelefónicoAnalítica Web Páginas Virtuales y Tracking Telefónico
Analítica Web Páginas Virtuales y Tracking TelefónicoEduardo Sánchez González
1.1K views59 slides
Clinic seo crawling & logs by
Clinic seo crawling & logsClinic seo crawling & logs
Clinic seo crawling & logsClinic Seo
781 views82 slides
Taller de Analítica Web - Congreso CID-Murcia by
Taller de Analítica Web - Congreso CID-MurciaTaller de Analítica Web - Congreso CID-Murcia
Taller de Analítica Web - Congreso CID-MurciaElBlogdelSEO y SEOStar
152 views96 slides
SEO para e-commerce by
SEO para e-commerceSEO para e-commerce
SEO para e-commerceVíctor M. Guerrero Azcona
761 views70 slides
Caso de Estudio SEO: Elige tu propia aventura #CW17 by
Caso de Estudio SEO: Elige tu propia aventura #CW17Caso de Estudio SEO: Elige tu propia aventura #CW17
Caso de Estudio SEO: Elige tu propia aventura #CW17MJ Cachón Yáñez
2.7K views74 slides

Similar to Agrupa y vencerás - SEO técnico(20)

BDAS-2017 | sanselix jobranke_rpptx by Big-Data-Summit
BDAS-2017 | sanselix jobranke_rpptxBDAS-2017 | sanselix jobranke_rpptx
BDAS-2017 | sanselix jobranke_rpptx
Big-Data-Summit68 views
Clinic seo crawling & logs by Clinic Seo
Clinic seo crawling & logsClinic seo crawling & logs
Clinic seo crawling & logs
Clinic Seo781 views
Caso de Estudio SEO: Elige tu propia aventura #CW17 by MJ Cachón Yáñez
Caso de Estudio SEO: Elige tu propia aventura #CW17Caso de Estudio SEO: Elige tu propia aventura #CW17
Caso de Estudio SEO: Elige tu propia aventura #CW17
MJ Cachón Yáñez2.7K views
SEO y Web Semántica en Congreso Web by Lakil Essady
SEO y Web Semántica en Congreso WebSEO y Web Semántica en Congreso Web
SEO y Web Semántica en Congreso Web
Lakil Essady13.8K views
SEO para WordPress - SEO Galicia 16/11/2018 by Estela Franco
SEO para WordPress - SEO Galicia 16/11/2018SEO para WordPress - SEO Galicia 16/11/2018
SEO para WordPress - SEO Galicia 16/11/2018
Estela Franco1.2K views
¡Esto es La Voz! @mjcachon en #ensaladaSEO by SISTRIX
¡Esto es La Voz! @mjcachon en #ensaladaSEO¡Esto es La Voz! @mjcachon en #ensaladaSEO
¡Esto es La Voz! @mjcachon en #ensaladaSEO
SISTRIX868 views
Estadísticas by Emagister
EstadísticasEstadísticas
Estadísticas
Emagister139 views
Evento Be! Blogger en el Campus Madrid - Marketing Online y SEO by Diego Criado Pérez
Evento Be! Blogger en el Campus Madrid - Marketing Online y SEOEvento Be! Blogger en el Campus Madrid - Marketing Online y SEO
Evento Be! Blogger en el Campus Madrid - Marketing Online y SEO
Diego Criado Pérez4.4K views
Cómo mejorar-la-velocidad-de-tu-web (Cámara madrid) by SiteGround España
Cómo mejorar-la-velocidad-de-tu-web (Cámara madrid)Cómo mejorar-la-velocidad-de-tu-web (Cámara madrid)
Cómo mejorar-la-velocidad-de-tu-web (Cámara madrid)
Crawling e Indexacion mejorando la eficacia de tus urls by SiteGround España
Crawling e Indexacion mejorando la eficacia de tus urlsCrawling e Indexacion mejorando la eficacia de tus urls
Crawling e Indexacion mejorando la eficacia de tus urls
SiteGround España409 views
Black Hat SEO y Ecommerce ponencia de Chuiso Chuisez by Ecommaster
Black Hat SEO y Ecommerce ponencia de Chuiso ChuisezBlack Hat SEO y Ecommerce ponencia de Chuiso Chuisez
Black Hat SEO y Ecommerce ponencia de Chuiso Chuisez
Ecommaster2.8K views
Analítica avanzada de forma fácil, paso a paso, ¡y sin complejos! :) - Eduard... by Lucía Marín
Analítica avanzada de forma fácil, paso a paso, ¡y sin complejos! :) - Eduard...Analítica avanzada de forma fácil, paso a paso, ¡y sin complejos! :) - Eduard...
Analítica avanzada de forma fácil, paso a paso, ¡y sin complejos! :) - Eduard...
Lucía Marín10.9K views
Taller de Screaming Frog con Rubén Merino by Rubén Merino
Taller de Screaming Frog con Rubén MerinoTaller de Screaming Frog con Rubén Merino
Taller de Screaming Frog con Rubén Merino
Rubén Merino85 views
¿Es Posible Posicionar un Sitio Web en tan solo 15 Días? Aprende Cómo Aquí! by Hernan Vazquez
¿Es Posible Posicionar un Sitio Web en tan solo 15 Días? Aprende Cómo Aquí!¿Es Posible Posicionar un Sitio Web en tan solo 15 Días? Aprende Cómo Aquí!
¿Es Posible Posicionar un Sitio Web en tan solo 15 Días? Aprende Cómo Aquí!
Hernan Vazquez596 views
SEO y SEM . Todos SEMos amigos en el SEOnthebeach by Edgar Sánchez
SEO y SEM . Todos SEMos amigos en el SEOnthebeachSEO y SEM . Todos SEMos amigos en el SEOnthebeach
SEO y SEM . Todos SEMos amigos en el SEOnthebeach
Edgar Sánchez1.9K views
SEO para Progressive Web Apps (PWA) y JavaScript by Natzir Turrado
SEO para Progressive Web Apps (PWA) y JavaScriptSEO para Progressive Web Apps (PWA) y JavaScript
SEO para Progressive Web Apps (PWA) y JavaScript
Natzir Turrado13.3K views

More from Lino Uruñuela

SEO desde la línea de comandos by
SEO desde la línea de comandosSEO desde la línea de comandos
SEO desde la línea de comandosLino Uruñuela
354 views58 slides
Google Search Console - el dato de Schrödinger by
Google Search Console - el dato de  SchrödingerGoogle Search Console - el dato de  Schrödinger
Google Search Console - el dato de SchrödingerLino Uruñuela
389 views41 slides
Que no te den dato por liebre - enpresadigitala 2022 by
Que no te den dato por liebre - enpresadigitala 2022Que no te den dato por liebre - enpresadigitala 2022
Que no te den dato por liebre - enpresadigitala 2022Lino Uruñuela
272 views30 slides
SeoQL: SQL para SEO by
SeoQL: SQL para SEOSeoQL: SQL para SEO
SeoQL: SQL para SEOLino Uruñuela
1.4K views33 slides
Obtener un listado de keywords en base a su potencial SEO (Google Search Cons... by
Obtener un listado de keywords en base a su potencial SEO (Google Search Cons...Obtener un listado de keywords en base a su potencial SEO (Google Search Cons...
Obtener un listado de keywords en base a su potencial SEO (Google Search Cons...Lino Uruñuela
1.3K views30 slides
Search Console, descifrando las cifras by
Search Console, descifrando las cifrasSearch Console, descifrando las cifras
Search Console, descifrando las cifrasLino Uruñuela
1.6K views48 slides

More from Lino Uruñuela(13)

SEO desde la línea de comandos by Lino Uruñuela
SEO desde la línea de comandosSEO desde la línea de comandos
SEO desde la línea de comandos
Lino Uruñuela354 views
Google Search Console - el dato de Schrödinger by Lino Uruñuela
Google Search Console - el dato de  SchrödingerGoogle Search Console - el dato de  Schrödinger
Google Search Console - el dato de Schrödinger
Lino Uruñuela389 views
Que no te den dato por liebre - enpresadigitala 2022 by Lino Uruñuela
Que no te den dato por liebre - enpresadigitala 2022Que no te den dato por liebre - enpresadigitala 2022
Que no te den dato por liebre - enpresadigitala 2022
Lino Uruñuela272 views
Obtener un listado de keywords en base a su potencial SEO (Google Search Cons... by Lino Uruñuela
Obtener un listado de keywords en base a su potencial SEO (Google Search Cons...Obtener un listado de keywords en base a su potencial SEO (Google Search Cons...
Obtener un listado de keywords en base a su potencial SEO (Google Search Cons...
Lino Uruñuela1.3K views
Search Console, descifrando las cifras by Lino Uruñuela
Search Console, descifrando las cifrasSearch Console, descifrando las cifras
Search Console, descifrando las cifras
Lino Uruñuela1.6K views
Seo Técnico - Del mito al dato - Seonthebeach 2018 by Lino Uruñuela
Seo Técnico - Del mito al dato - Seonthebeach 2018Seo Técnico - Del mito al dato - Seonthebeach 2018
Seo Técnico - Del mito al dato - Seonthebeach 2018
Lino Uruñuela4.1K views
eShow 2017 SEO grandes webs - Lino urunuela by Lino Uruñuela
eShow 2017 SEO grandes webs - Lino urunuelaeShow 2017 SEO grandes webs - Lino urunuela
eShow 2017 SEO grandes webs - Lino urunuela
Lino Uruñuela10.5K views
Optimiza tu crawl budget se onthebeach 2017 by Lino Uruñuela
Optimiza tu crawl budget   se onthebeach 2017Optimiza tu crawl budget   se onthebeach 2017
Optimiza tu crawl budget se onthebeach 2017
Lino Uruñuela2.1K views
Cómo hacer una migración y no morir en el intento by Lino Uruñuela
Cómo hacer una migración y no morir en el intentoCómo hacer una migración y no morir en el intento
Cómo hacer una migración y no morir en el intento
Lino Uruñuela3.5K views
Seo Logs y Big Data, Lino Uruñuela en Seonthebeach 2016 by Lino Uruñuela
Seo Logs y Big Data, Lino Uruñuela en Seonthebeach 2016Seo Logs y Big Data, Lino Uruñuela en Seonthebeach 2016
Seo Logs y Big Data, Lino Uruñuela en Seonthebeach 2016
Lino Uruñuela3.4K views
SEO para periodistas por Lino Uruñuela (2008) by Lino Uruñuela
SEO para periodistas por Lino Uruñuela (2008)SEO para periodistas por Lino Uruñuela (2008)
SEO para periodistas por Lino Uruñuela (2008)
Lino Uruñuela789 views
Monitorizar GoogleBot usando Google Analytics por Lino Uruñuela by Lino Uruñuela
Monitorizar GoogleBot usando Google Analytics por Lino UruñuelaMonitorizar GoogleBot usando Google Analytics por Lino Uruñuela
Monitorizar GoogleBot usando Google Analytics por Lino Uruñuela
Lino Uruñuela8.2K views

Recently uploaded

Santo Grial (2).pptx by
Santo Grial (2).pptxSanto Grial (2).pptx
Santo Grial (2).pptxVictorCarreteroMoren
22 views14 slides
FUTBOL-CLUB-BARCELONA-CLUB-DE-FORMACION-.pdf by
FUTBOL-CLUB-BARCELONA-CLUB-DE-FORMACION-.pdfFUTBOL-CLUB-BARCELONA-CLUB-DE-FORMACION-.pdf
FUTBOL-CLUB-BARCELONA-CLUB-DE-FORMACION-.pdfjuliagili
7 views44 slides
Taller Fundamentos de Electricidad y Electrónica..pdf by
Taller Fundamentos de Electricidad y Electrónica..pdfTaller Fundamentos de Electricidad y Electrónica..pdf
Taller Fundamentos de Electricidad y Electrónica..pdfangelica gutierrez
6 views17 slides
BOLETIN AGORA CONSULTORIAS COMPARATIVO DELITOS DE MAYOR IMPACTO SOCIAL E... by
BOLETIN AGORA CONSULTORIAS  COMPARATIVO DELITOS  DE  MAYOR IMPACTO  SOCIAL  E...BOLETIN AGORA CONSULTORIAS  COMPARATIVO DELITOS  DE  MAYOR IMPACTO  SOCIAL  E...
BOLETIN AGORA CONSULTORIAS COMPARATIVO DELITOS DE MAYOR IMPACTO SOCIAL E...Orlando Hernandez
301 views25 slides
Informe (1).pdf by
Informe (1).pdfInforme (1).pdf
Informe (1).pdfsaraialvarez20
6 views14 slides
GRUPO1_ TAREA N3.pdf by
GRUPO1_ TAREA N3.pdfGRUPO1_ TAREA N3.pdf
GRUPO1_ TAREA N3.pdfVictorMendozaLlaja
9 views20 slides

Recently uploaded(20)

FUTBOL-CLUB-BARCELONA-CLUB-DE-FORMACION-.pdf by juliagili
FUTBOL-CLUB-BARCELONA-CLUB-DE-FORMACION-.pdfFUTBOL-CLUB-BARCELONA-CLUB-DE-FORMACION-.pdf
FUTBOL-CLUB-BARCELONA-CLUB-DE-FORMACION-.pdf
juliagili7 views
Taller Fundamentos de Electricidad y Electrónica..pdf by angelica gutierrez
Taller Fundamentos de Electricidad y Electrónica..pdfTaller Fundamentos de Electricidad y Electrónica..pdf
Taller Fundamentos de Electricidad y Electrónica..pdf
BOLETIN AGORA CONSULTORIAS COMPARATIVO DELITOS DE MAYOR IMPACTO SOCIAL E... by Orlando Hernandez
BOLETIN AGORA CONSULTORIAS  COMPARATIVO DELITOS  DE  MAYOR IMPACTO  SOCIAL  E...BOLETIN AGORA CONSULTORIAS  COMPARATIVO DELITOS  DE  MAYOR IMPACTO  SOCIAL  E...
BOLETIN AGORA CONSULTORIAS COMPARATIVO DELITOS DE MAYOR IMPACTO SOCIAL E...
Orlando Hernandez301 views
Proyecto Tercer Periodo Informática - 9-2 -1.pdf56 by DanielDavila95
Proyecto Tercer Periodo Informática - 9-2 -1.pdf56Proyecto Tercer Periodo Informática - 9-2 -1.pdf56
Proyecto Tercer Periodo Informática - 9-2 -1.pdf56
DanielDavila9520 views
Análisis de preguntas Grafotécnicas by ShuduSnuff
Análisis de preguntas GrafotécnicasAnálisis de preguntas Grafotécnicas
Análisis de preguntas Grafotécnicas
ShuduSnuff5 views
Desarrollo de Habilidades de Pensamiento tecnologia.docx by Saritaxuvu
Desarrollo de Habilidades de Pensamiento tecnologia.docxDesarrollo de Habilidades de Pensamiento tecnologia.docx
Desarrollo de Habilidades de Pensamiento tecnologia.docx
Saritaxuvu10 views
Informe What Worries the World_Resumen global - Octubre 2023.pdf by AproximacionAlFuturo
Informe What Worries the World_Resumen global - Octubre 2023.pdfInforme What Worries the World_Resumen global - Octubre 2023.pdf
Informe What Worries the World_Resumen global - Octubre 2023.pdf
Portafolio acción psicosocial y trabajo.pdf by adela928205
Portafolio acción psicosocial y trabajo.pdfPortafolio acción psicosocial y trabajo.pdf
Portafolio acción psicosocial y trabajo.pdf
adela92820512 views
BOLETIN AGΩRA CONSULTORIAS DELITOS DE MAYOR IMPACTO SOCIAL EN COLOMBIA ... by Orlando Hernandez
BOLETIN AGΩRA CONSULTORIAS  DELITOS  DE  MAYOR IMPACTO  SOCIAL  EN  COLOMBIA ...BOLETIN AGΩRA CONSULTORIAS  DELITOS  DE  MAYOR IMPACTO  SOCIAL  EN  COLOMBIA ...
BOLETIN AGΩRA CONSULTORIAS DELITOS DE MAYOR IMPACTO SOCIAL EN COLOMBIA ...

Agrupa y vencerás - SEO técnico

  • 1. Lino Uruñuela 17 de junio del 2022 @errioxa info@funnelpunk.com www.mecagoenlos.com ☏ 637167218 Agrupa y vencerás! SEonthebeach 2022
  • 2. Hola! Soy Lino Uruñuela He trabajado en algunos de los mayores sites de España Link to ppt ⤴ https://www.mecagoenlos.com/SOB2022.pdf Lino Uruñuela 17 de junio del 2022 @errioxa info@funnelpunk.com www.mecagoenlos.com ☏ 637167218
  • 3. ¿ De dónde venimos ?
  • 4. Extraemos datos de GSC ¿De dónde venimos?
  • 5. Extraemos datos de GSC ¿De dónde venimos?
  • 6. Extraemos datos de GSC ¿De dónde venimos?
  • 7. Extraemos datos de GSC ¿De dónde venimos? -Índice de Cobertura - Coverage
  • 8. ¿ Cómo se han creado tantas URLs ?
  • 9. Extraemos datos de GSC ¿Cómo se han creado tantas URLs? ●Creadas a mano ●Búsquedas Internas
  • 10. Extraemos datos de GSC Creadas a mano - ¿Cómo se han creado tantas URLs? ●Creadas a mano ■ Decisiones de negocio ■ Decisiones SEO ●Búsquedas Internas
  • 11. Extraemos datos de GSC Creadas a mano - ¿Cómo se han creado tantas URLs? ●Creadas a mano ■ Decisiones de negocio ■ Decisiones SEO ○ Tendencias históricas ○ Intuición humana ●Búsquedas Internas
  • 12. Extraemos datos de GSC Búsquedas Internas - ¿Cómo se han creado tantas URLs? ●Creadas a mano ■ Decisiones de negocio ■ Decisiones SEO ○ Tendencias históricas ○ Intuición humana ●Búsquedas Internas ■ Ninguna regla ■ Se generan en cada categoría
  • 13. Extraemos datos de GSC Problemas - Búsquedas Internas ●URLs duplicadas ●URLs sin sentido /ejercicio/cinta-correr/ /ejercicio/cinta-corres/ /ejercicio/cinta-corr/ /ejercicio/cinta-de-correr/ /ejercicio/cinta-de.correr/ /ejercicio/cinta-de-corre/ /ejercicio/cintas-de-corre/ /ejercicio/cintas-de-correr/ /ejercicio/cintas-de-corres/ /ejercicio/cintas-correer/ /ejercicio/cintas-para-corres/
  • 14. Extraemos datos de GSC Problemas - Búsquedas Internas ●URLs duplicadas ●URLs sin sentido /ejercicio/cinta-correr/ /ejercicio/cinta-corres/ /ejercicio/cinta-corr/ /ejercicio/cinta-de-correr/ /ejercicio/cinta-de.correr/ /ejercicio/cinta-de-corre/ /ejercicio/cintas-de-corre/ /ejercicio/cintas-de-correr/ /ejercicio/cintas-de-corres/ /ejercicio/cintas-correer/ /ejercicio/cintas-para-corres/ /categoria/cadaver/ /categoria/cambio-por-algo-de-mi-interes/ /categoria/ir-a-mi-gimnasio/ /categoria/cambio-mi-coche-por-otro-ya/ ● URLs malsonantes ● URLs porno ● URLs spam
  • 15. ¿ Qué podemos hacer ?
  • 16. ●Dejarlo así ●¿Eliminar URLs? ●¿Redireccionar URL? ○ ¿Reglas para definir las URLs de origen y destino?
  • 17. ●Dejarlo así ●¿Eliminar URLs? ●¿Redireccionar URL? ○ ¿Reglas para definir las URLs de origen y destino?
  • 18. 1.Analizar tráfico 2.Eliminar URLs sin tráfico 3.Mapear redirecciones
  • 19. Extraemos datos de GSC 1.Analizar tráfico A.Obtener TODAS las URLs B.¿Cuáles han tenido tráfico en los últimos meses?
  • 20. Extraemos datos de GSC 1.Analizar tráfico A.Obtener TODAS las URLs ¿Cómo las podemos obtener? ○ El equipo de IT ○ Logs del servidor ○ Crawler
  • 21. Extraemos datos de GSC 1.Analizar tráfico A.Obtener TODAS las URLs B.¿Cuáles han tenido tráfico en los últimos meses?
  • 22. Extraemos datos de GSC 1.Analizar tráfico A.Obtener TODAS las URLs B.¿Cuáles han tenido tráfico en los últimos meses? ¿Cómo las podemos obtener? a.Google Analytics b.Google Search Console c. Logs del servidor
  • 23. Extraemos datos de GSC 2. Eliminar URLs sin tráfico Las que NO han tenido tráfico ? → ELIMINAR
  • 24. Extraemos datos de GSC 3. Mapear redirecciones ¿Cómo decidimos qué URLs redirigen a qué URLs?
  • 25. Extraemos datos de GSC 3. Mapear redirecciones A.A Mano B.Machine Learning
  • 26. Extraemos datos de GSC 3. Mapear redirecciones A.A Mano B.Machine Learning
  • 27. Extraemos datos de GSC 3. Mapear redirecciones ●Existen multitud de métodos para agrupar (o clusterizar) palabras o/y frases → Escoger el más sencillo para nosotros ●Debemos tener en cuenta otros datos además del texto ○ Tráfico orgánico ○ Accesos de Google ○ Definiciones “humanas”
  • 28. Extraemos datos de GSC 3. Mapear redirecciones - Tokenización La tokenización es básicamente hacer una lista de palabras de lo que vayas a tratar
  • 29. Extraemos datos de GSC 3. Mapear redirecciones - Normalización La normalización es el eliminar acentos, poner todas las palabras en minúscula, eliminar caracteres extraños o que no sean convenientes que entren en nuestros procesos.
  • 30. Extraemos datos de GSC Lemmatizar Vs Raíces ●Lematizar De manera resumida, la lematización es extraer para cada palabra su lexema que puede ser diferente para una misma palabra. es decir. es dependiente de su contexto. La manera compleja "La lematización es el proceso mediante el cual las palabras de un texto que pertenecen a un mismo paradigma flexivo o derivativo son llevadas a una forma normal que representa a toda la clase" ●Raíces Quedarse con la raíz pero no tiene en cuenta el contexto.
  • 31. Extraemos datos de GSC Lemmatizar Vs Raíces Lemmatizar alquilar piso sebastiar alquiler piso sebastiar alquilar piso sebastiar alquiler piso sebastiar Raices alquil pis san sebasti alquil pis san sebasti alquil pis san sebasti alquil pis san sebasti Texto Original alquilar piso en San Sebastián alquiler de pisos en San sebastian alquilar pisos en San Sebastian piso en alquiler en San Sebastian
  • 32. Extraemos datos de GSC Lemmatizar Vs Raíces Lemmatizar cinta correr ejercicio cinta corr ejercicio cinta corr ejercicio cinta correr ejercicio cinta correr ejercicio cinta correr ejercicio cinta correr ejercicio cinta correr ejercicio cinta corr ejercicio cinta correer ejercicio Raices cint corr ejercici cint corr ejercici cint corr ejercici cint corr ejercici cint corr ejercici cint corr ejercici cint corr ejercici cint corr ejercici cint corr ejercici cint corr ejercici Texto Original ejercicio cinta correr ejercicio cinta corres ejercicio cinta corr ejercicio cinta de correr ejercicio cinta para correr ejercicio cinta de corre ejercicio cintas de corre ejercicio cintas de correr ejercicio cintas de corres ejercicio cintas correer
  • 33. Extraemos datos de GSC Definir redirecciones
  • 34. Extraemos datos de GSC Definir redirecciones - ¿usamos la raíz?
  • 35. Extraemos datos de GSC ¿Cuál es la URL que más tráfico tiene?
  • 36. Extraemos datos de GSC Definimos URL del grupo la URL con más tráfico
  • 37. Implementar en un mundo real !
  • 38. Agrupación - Clustering de keywords - Google Search Console https://www.mecagoenlos.com/Posicionamiento/matriz-de-keywords-seo.php 50.000 filas ! Link ⤴
  • 39. Extraemos datos de GSC 50.000 filas usando Pandas - En un mundo real
  • 40. Extraemos datos de GSC 50.000 filas usando Dask - En un mundo real
  • 42. Extraemos datos de GSC Lemmatizar y Raíces en SQL
  • 43. Extraemos datos de GSC Lemmatizar y Raíces en SQL
  • 44. Extraemos datos de GSC Lemmatizar y Raíces en SQL
  • 45. Extraemos datos de GSC Lemmatizar y Raíces en SQL PostgreSQL ClickHouse ElasticSearch
  • 46. Extraemos datos de GSC Lemmatizar y Raíces en SQL
  • 47. Extraemos datos de GSC Python Vs SQL
  • 48. Ahora sí podemos Implementar en un mundo real ! con decenas de millones de URLs
  • 49. Extraemos datos de GSC Resultado final
  • 50. Extraemos datos de GSC Resultado final
  • 51. Extraemos datos de GSC Resultado final
  • 52. Extraemos datos de GSC Resultado final
  • 53. Extraemos datos de GSC Resultado final
  • 54. Extraemos datos de GSC Resultado final
  • 55. Extraemos datos de GSC Resultado final
  • 56. Extraemos datos de GSC Resultado final
  • 57. Extraemos datos de GSC Resultado final
  • 58. Extraemos datos de GSC ¿De dónde venimos?
  • 59. Extraemos datos de GSC ¿De dónde venimos?
  • 60. Extraemos datos de GSC ¿Dónde estamos?
  • 61. Extraemos datos de GSC ¿De dónde venimos?
  • 62. Extraemos datos de GSC ¿A dónde vamos? - Hasta el infinito y más allá
  • 64. Extraemos datos de GSC Otros casos de uso - cluster de keywords
  • 65. Extraemos datos de GSC Otros casos de uso - cluster de keywords
  • 66. Extraemos datos de GSC Otros casos de uso - cluster de keywords
  • 67. Extraemos datos de GSC Beta MyDomain.dev ¿Quieres probarlo totalmente gratis? https://mydomain.dev/clustering
  • 68. Lino Uruñuela 17 de junio del 2022 @errioxa info@funnelpunk.com www.mecagoenlos.com ☏ 637167218 ¡¡Gracias!! SEonthebeach 2022
  • 69. Lino Uruñuela 17 de junio del 2022 @errioxa info@funnelpunk.com www.mecagoenlos.com ☏ 637167218 ¡¡Gracias!! SEonthebeach 2022 ¡Me voy de VACACIONES!