Protege a tu rey. Defiende tu contenido de amenazas, scraping, IA o malos actores

Fernando Puente
Fernando PuenteCOO/IT Consultant at Embajador de marca de Raiola Networks
Protege a tu rey
Defiende tu contenido de amenazas,
scraping, IA o malos actores
FERNANDO PUENTE
Content is King
“El contenido es de donde espero que se
obtenga el dinero real en Internet”
Bill Gates (January 3, 1996)
Fernando Puente
Informático de vocación y de profesión, formador ocasional
y un enamorado de comer y beber.
● Embajador de marca de Raiola Networks
● Profesor Curso Superior de Periodismo Deportivo
● Consultor especializado en Web Performance
@fpuenteonline
linkedin.com/in/fpuente/
Protegiendo el contenido
Solución
Legal y sencilla
Detallar en los términos y
condiciones de uso las
Condiciones Generales y las
responsabilidades derivadas del
acceso y la utilización de sus
contenidos
Los derechos de propiedad intelectual del Sitio Web de los distintos elementos en ella contenidos
son titularidad de la Sociedad, a quien corresponde el ejercicio exclusivo de los derechos de
explotación de los mismos en cualquier forma y en especial, los derechos de reproducción,
distribución, comunicación pública y transformación, de acuerdo con la legislación española y de
la unión europea aplicable. Así mismo, el Sitio Web es fruto de la información de cualquier tipo
relacionada con las actividades de la Sociedad (información creada por la Sociedad o creada por
terceros), que habilita a un uso personal y no comercial de la propia información por parte de
los Usuarios.
TODOS LOS DERECHOS RESERVADOS en relación con los contenidos de la Sociedad, del Medio y, en su
caso, de otras empresas del grupo de la empresa del cual forma parte la Sociedad o de terceros.
Queda prohibida la reproducción total o parcial, distribución, puesta a disposición, comunicación
pública y utilización, total o parcial, de los contenidos de esta web, en cualquier forma o
modalidad, sin previa, expresa y escrita autorización, incluyendo, en particular, su mera
reproducción y/o puesta a disposición como resúmenes, reseñas o revistas de prensa con fines
comerciales o directa o indirectamente lucrativos, a la que se manifiesta oposición expresa. Así
mismo, también queda prohibida la presentación de páginas del Sitio Web y la inserción de
imágenes difundidas en el Sitio Web en páginas no pertenecientes a la Sociedad (sea cual sea la
técnica que se use para ello). La utilización no autorizada de estos contenidos dará lugar a las
responsabilidades legalmente establecidas. La Sociedad, de conformidad con lo establecido en la
LSSI, no responderá de las infracciones realizadas por el Usuario del Sitio Web que afecten a
terceros, salvo que la misma tenga un "conocimiento efectivo" de dicha infracción. La Sociedad
informa a los Usuarios de que, salvo autorización previa, expresa y por escrito, no concede
licencia o autorización expresa o implícita alguna sobre los derechos de propiedad intelectual
y/o industrial o sobre cualquier otro derecho o propiedad relacionada, directa o indirectamente,
con los contenidos incluidos en el Sitio Web, quedando prohibida cualquier alteración o
modificación de los contenidos y de cualquier otro elemento.
Protege tu contenido de
visitantes
Humanos
Deshabilitar menú contextual (click derecho)
* Usuarios avanzados pueden acceder al contenido
* Posibilidad de usar plugins del repositorio
Deshabilitar selección de texto
* Usuarios avanzados pueden acceder al contenido
Estrategias de protección adicional
● Marcas de agua y/o copyright en contenido multimedia
● Metadatos en imágenes
● Muro de pago/Paywall
● Registro de usuario o modelo freemium
● Generar el contenido dinámicamente (Javascript)
● Acceso condicional al contenido (restringir por usuario,
zona geográfica o número de visitas/páginas)
* SEO y UX pueden verse afectados de manera importante
* Metadatos y marcas de agua pueden ser eliminadas
Protección ante traducciones de la página
* Existen herramientas/extensiones que no obedecen a estas etiquetas
Protección ante traducciones de elementos
* Existen herramientas/extensiones que no obedecen a estas etiquetas
Protege tu contenido de
visitantes
No solo SEOcotillas
Qué buscan las herramientas SEO
● Enlazado interno/externo
● Estructura web
● Palabras clave
● Datos sensibles o de negocio
● Contenido
Protección anti-competencia
● Eliminar feeds de contenido/Crear feeds incompletos
● Bloquear/moderar comentarios
● Marcas de agua en imágenes
● Habilitar la protección de hotlink
● Deshabilitar incrustado como iframe
* Hotlink puede afectar al contenido compartido en medios fuera de la web
Bloquear competencia (user-agent)
* Pueden realizar el rastreo usando el user agent de Google
Reforzar la seguridad de tu sitio
● Proveedor de hosting de confianza
● Certificado de seguridad
● WordPress y componentes actualizados
● Capas adicionales de seguridad (plugin, WAF, htaccess…)
● Política de roles, usuarios y contraseñas
● Entornos de test y producción (actualizaciones y cambios)
● En general, buenas prácticas
En último caso
● Publicar un aviso de eliminación DMCA (Digital
Millennium Copyright Act)
● Solicitar retirada de contenido por infracciones de derechos
de autor en buscadores
Protege tu contenido de
enlaces dañinos
Disavow links
Desautorizar enlaces
1. Identificar (fraudulentos, artificiales o de baja calidad)
2. Crear lista de enlaces a desautorizar
3. Subir lista por buscador:
https://search.google.com/search-console/disavow-links
Protege tu contenido de
visitantes
No humanos
Estrategias anti-scraping
● Reglas específicas en archivo robots.txt
● Filtrar user-agent
● Bloquear servidores por IP
● Añadir Completely Automated Public Turing test to
tell Computers and Humans Apart (aka CAPTCHA)
● Colocar «honeypots»
● Desativar feed
● Bloquear REST API
Proteger el sitio de scrapeadores (user-agent)
* Pueden realizar el rastreo usando el user agent de Google
Desactivar el feed
Proteger acceso a WordPress REST API
Protege tu contenido de
redes sociales
Difusión
Proteger cómo compartir el contenido
● Marcas de agua y/o copyright en contenido multimedia
● Metadata y etiquetas Open Graph falsas
● Bloqueo, contenido erróneo o redirección para bots
(facebookexternalhit, Twitterbot, TelegramBot,
LinkedInBot…)
* SEO puede verse afectado de manera importante
Protege tu contenido de
motores de búsqueda
Invisibilidad
Proteger el sitio de ser rastreado e indexado
* Cualquier contenido, no solo HTML
Proteger el sitio de ser indexado
* Solo HTML
Proteger cada página de ser almacenada
* Solo HTML
* Aplica a la caché de Google
Protege tu contenido de la
Inteligencia Artificial
Base de conocimiento
Proteger del entrenamiento
* No funciona en todos los modelos de entrenamiento (ejemplo basado en
varios modelos LLM utilizando Common Crawl)
* Puede cambiar en el futuro
Proteger del entrenamiento (nuevo)
* No funciona en todos los modelos de entrenamiento (ejemplo basado en
OpenAI’s web crawler)
* https://platform.openai.com/docs/gptbot (agosto/2023)
Proteger del acceso
* Sólo usado por los plugins de ChatGPT para acceso (live query), no
entrenamiento
* Puede cambiar en el futuro
¿La mejor defensa es un
buen ataque?
Gracias
1 of 38

Recommended

Redes sociales nov. 2011 [tanoira cassagne] by
Redes sociales nov. 2011  [tanoira cassagne]Redes sociales nov. 2011  [tanoira cassagne]
Redes sociales nov. 2011 [tanoira cassagne]juanpozzo
517 views36 slides
Contenidos creados por usuarios en Redes Sociales. Cuestiones Jurídicas by
Contenidos creados por usuarios en Redes Sociales. Cuestiones JurídicasContenidos creados por usuarios en Redes Sociales. Cuestiones Jurídicas
Contenidos creados por usuarios en Redes Sociales. Cuestiones JurídicasJesús Martín Calvo
335 views12 slides
Derechos de los usuarios de redes sociales by
Derechos de los usuarios de redes socialesDerechos de los usuarios de redes sociales
Derechos de los usuarios de redes socialesAbanlex
504 views12 slides
Privacidad en Internet by
Privacidad en InternetPrivacidad en Internet
Privacidad en InternetJose Manuel Ortega Candel
181 views3 slides
Clase 4 tecno i- 2019 by
Clase 4  tecno i- 2019Clase 4  tecno i- 2019
Clase 4 tecno i- 2019Viviana Mercedes Ponce
845 views60 slides
Clase 4 tecno i- 2018 by
Clase 4  tecno i- 2018Clase 4  tecno i- 2018
Clase 4 tecno i- 2018Viviana Mercedes Ponce
466 views54 slides

More Related Content

Similar to Protege a tu rey. Defiende tu contenido de amenazas, scraping, IA o malos actores

Que es la ley sopa by
Que es la ley sopaQue es la ley sopa
Que es la ley sopagero31
85 views1 slide
Aviso Legal by
Aviso LegalAviso Legal
Aviso Legalaurapark
172 views8 slides
Comunicación Web y Social Media by
Comunicación Web y Social MediaComunicación Web y Social Media
Comunicación Web y Social MediaLucila Voces de Barro
160 views22 slides
Terminos y condiciones de uso by
Terminos y condiciones de usoTerminos y condiciones de uso
Terminos y condiciones de usoPortal Educativo Colombia Aprende
214 views6 slides
Banner by
BannerBanner
BannerLeiidy Siierra Torres
121 views7 slides
Web 2.0 by
Web 2.0Web 2.0
Web 2.0Angelica Mendoza
193 views4 slides

Similar to Protege a tu rey. Defiende tu contenido de amenazas, scraping, IA o malos actores(20)

Que es la ley sopa by gero31
Que es la ley sopaQue es la ley sopa
Que es la ley sopa
gero3185 views
Aviso Legal by aurapark
Aviso LegalAviso Legal
Aviso Legal
aurapark172 views
El derecho a la privacidad del usuario en relación a las políticas de uso by Software Guru
 El derecho a la privacidad del usuario en relación a las políticas de uso El derecho a la privacidad del usuario en relación a las políticas de uso
El derecho a la privacidad del usuario en relación a las políticas de uso
Software Guru673 views
Blogueras Barcelona Aspectos Legales by AvaticAbogados
Blogueras Barcelona Aspectos LegalesBlogueras Barcelona Aspectos Legales
Blogueras Barcelona Aspectos Legales
AvaticAbogados606 views
propuesta tecica y economica.pdf by jorge977764
propuesta tecica y economica.pdfpropuesta tecica y economica.pdf
propuesta tecica y economica.pdf
jorge977764136 views
Taller SEO. Asier Barainka by andalucialab
Taller SEO. Asier BarainkaTaller SEO. Asier Barainka
Taller SEO. Asier Barainka
andalucialab469 views

More from Fernando Puente

¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto… by
¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…
¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…Fernando Puente
57 views21 slides
Qué es y para que sirve la carga condicional by
Qué es y para que sirve la carga condicionalQué es y para que sirve la carga condicional
Qué es y para que sirve la carga condicionalFernando Puente
41 views33 slides
Optimiza tus webs a bajo costo - WCVenezuela2021 by
Optimiza tus webs a bajo costo - WCVenezuela2021Optimiza tus webs a bajo costo - WCVenezuela2021
Optimiza tus webs a bajo costo - WCVenezuela2021Fernando Puente
104 views20 slides
WordPress y cómo llegar al 50% de Internet by
WordPress y cómo llegar al 50% de InternetWordPress y cómo llegar al 50% de Internet
WordPress y cómo llegar al 50% de InternetFernando Puente
79 views30 slides
Mitos y realidades sobre el WPO en WordPress by
Mitos y realidades sobre el WPO en WordPressMitos y realidades sobre el WPO en WordPress
Mitos y realidades sobre el WPO en WordPressFernando Puente
285 views35 slides
HTTP/3, PHP 7.4 y otras novedades en WPO para WordPress by
HTTP/3, PHP 7.4 y otras novedades en WPO para WordPressHTTP/3, PHP 7.4 y otras novedades en WPO para WordPress
HTTP/3, PHP 7.4 y otras novedades en WPO para WordPressFernando Puente
371 views41 slides

More from Fernando Puente(20)

¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto… by Fernando Puente
¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…
¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…
Fernando Puente57 views
Qué es y para que sirve la carga condicional by Fernando Puente
Qué es y para que sirve la carga condicionalQué es y para que sirve la carga condicional
Qué es y para que sirve la carga condicional
Fernando Puente41 views
Optimiza tus webs a bajo costo - WCVenezuela2021 by Fernando Puente
Optimiza tus webs a bajo costo - WCVenezuela2021Optimiza tus webs a bajo costo - WCVenezuela2021
Optimiza tus webs a bajo costo - WCVenezuela2021
Fernando Puente104 views
WordPress y cómo llegar al 50% de Internet by Fernando Puente
WordPress y cómo llegar al 50% de InternetWordPress y cómo llegar al 50% de Internet
WordPress y cómo llegar al 50% de Internet
Fernando Puente79 views
Mitos y realidades sobre el WPO en WordPress by Fernando Puente
Mitos y realidades sobre el WPO en WordPressMitos y realidades sobre el WPO en WordPress
Mitos y realidades sobre el WPO en WordPress
Fernando Puente285 views
HTTP/3, PHP 7.4 y otras novedades en WPO para WordPress by Fernando Puente
HTTP/3, PHP 7.4 y otras novedades en WPO para WordPressHTTP/3, PHP 7.4 y otras novedades en WPO para WordPress
HTTP/3, PHP 7.4 y otras novedades en WPO para WordPress
Fernando Puente371 views
El editor clásico como ejemplo de deuda tecnológica - WordCamp Granada 2019 by Fernando Puente
El editor clásico como ejemplo de deuda tecnológica - WordCamp Granada 2019El editor clásico como ejemplo de deuda tecnológica - WordCamp Granada 2019
El editor clásico como ejemplo de deuda tecnológica - WordCamp Granada 2019
Fernando Puente129 views
Tipologías de migración - WordCamp Valencia 2019 by Fernando Puente
Tipologías de migración - WordCamp Valencia 2019Tipologías de migración - WordCamp Valencia 2019
Tipologías de migración - WordCamp Valencia 2019
Fernando Puente472 views
Básicos para medir tu web - Taller de iniciación by Fernando Puente
Básicos para medir tu web - Taller de iniciaciónBásicos para medir tu web - Taller de iniciación
Básicos para medir tu web - Taller de iniciación
Fernando Puente136 views
Primeros pasos con WPO: aprende a analizar tu web - Taller by Fernando Puente
Primeros pasos con WPO: aprende a analizar tu web - TallerPrimeros pasos con WPO: aprende a analizar tu web - Taller
Primeros pasos con WPO: aprende a analizar tu web - Taller
Fernando Puente252 views
Tu posicionamiento mejora con la velocidad de tu web ¡WPO para todos! by Fernando Puente
Tu posicionamiento mejora con la velocidad de tu web ¡WPO para todos!Tu posicionamiento mejora con la velocidad de tu web ¡WPO para todos!
Tu posicionamiento mejora con la velocidad de tu web ¡WPO para todos!
Fernando Puente446 views
WordPress de la A a la Z. Guía de todos los términos que debes conocer y que ... by Fernando Puente
WordPress de la A a la Z. Guía de todos los términos que debes conocer y que ...WordPress de la A a la Z. Guía de todos los términos que debes conocer y que ...
WordPress de la A a la Z. Guía de todos los términos que debes conocer y que ...
Fernando Puente827 views
La analítica nos hace mejores by Fernando Puente
La analítica nos hace mejoresLa analítica nos hace mejores
La analítica nos hace mejores
Fernando Puente9.8K views
Retos de WordPress para llegar al 50% de Internet by Fernando Puente
Retos de WordPress para llegar al 50% de Internet Retos de WordPress para llegar al 50% de Internet
Retos de WordPress para llegar al 50% de Internet
Fernando Puente562 views
Taller WPO - Carga condicional de plugins by Fernando Puente
Taller WPO - Carga condicional de pluginsTaller WPO - Carga condicional de plugins
Taller WPO - Carga condicional de plugins
Fernando Puente66.2K views
Extender la funcionalidad de WordPress by Fernando Puente
Extender la funcionalidad de WordPressExtender la funcionalidad de WordPress
Extender la funcionalidad de WordPress
Fernando Puente319 views
Niveles de escalado para WordPress by Fernando Puente
Niveles de escalado para WordPressNiveles de escalado para WordPress
Niveles de escalado para WordPress
Fernando Puente277 views
WordPress - Oportunidades laborales by Fernando Puente
WordPress - Oportunidades laboralesWordPress - Oportunidades laborales
WordPress - Oportunidades laborales
Fernando Puente239 views

Recently uploaded

Manual Slideshare.pdf by
Manual Slideshare.pdfManual Slideshare.pdf
Manual Slideshare.pdfBFPablitoytBFPablito
5 views10 slides
Herramientas de reputación online by
Herramientas de reputación onlineHerramientas de reputación online
Herramientas de reputación onlinemdelgadolosa
8 views9 slides
Minitemas ilustrados .pdf by
Minitemas ilustrados .pdfMinitemas ilustrados .pdf
Minitemas ilustrados .pdfVictorCarreteroMoren
11 views67 slides
E-LEARNING y sus características.pdf by
E-LEARNING y sus características.pdfE-LEARNING y sus características.pdf
E-LEARNING y sus características.pdfgisellacastro0819
5 views12 slides
textoargumentativosobrelabasura-230327011758-bd48ae2d.docx by
textoargumentativosobrelabasura-230327011758-bd48ae2d.docxtextoargumentativosobrelabasura-230327011758-bd48ae2d.docx
textoargumentativosobrelabasura-230327011758-bd48ae2d.docxLauraSofiaCardonaSol
12 views2 slides
Transformacion digital_Nov23_v2.pdf by
Transformacion digital_Nov23_v2.pdfTransformacion digital_Nov23_v2.pdf
Transformacion digital_Nov23_v2.pdfChristian Palau
13 views203 slides

Recently uploaded(20)

Herramientas de reputación online by mdelgadolosa
Herramientas de reputación onlineHerramientas de reputación online
Herramientas de reputación online
mdelgadolosa8 views
textoargumentativosobrelabasura-230327011758-bd48ae2d.docx by LauraSofiaCardonaSol
textoargumentativosobrelabasura-230327011758-bd48ae2d.docxtextoargumentativosobrelabasura-230327011758-bd48ae2d.docx
textoargumentativosobrelabasura-230327011758-bd48ae2d.docx
Transformacion digital_Nov23_v2.pdf by Christian Palau
Transformacion digital_Nov23_v2.pdfTransformacion digital_Nov23_v2.pdf
Transformacion digital_Nov23_v2.pdf
Christian Palau13 views
RECURSOS INCLUSIVOS Teclados ergonómicos Y pantallas táctiles.pdf by KaterinGL
RECURSOS INCLUSIVOS Teclados ergonómicos Y pantallas táctiles.pdfRECURSOS INCLUSIVOS Teclados ergonómicos Y pantallas táctiles.pdf
RECURSOS INCLUSIVOS Teclados ergonómicos Y pantallas táctiles.pdf
KaterinGL6 views
EXPRESIONES ALGEBRAICAS.pptx by durannakay7
EXPRESIONES ALGEBRAICAS.pptxEXPRESIONES ALGEBRAICAS.pptx
EXPRESIONES ALGEBRAICAS.pptx
durannakay710 views
El Mejor Buscador en la Web del Mundo.pdf by gfmb504
El Mejor Buscador en la Web del Mundo.pdfEl Mejor Buscador en la Web del Mundo.pdf
El Mejor Buscador en la Web del Mundo.pdf
gfmb5047 views
El internet de las cosas.pptx by canek4
El internet de las cosas.pptxEl internet de las cosas.pptx
El internet de las cosas.pptx
canek45 views
Manual Slideshare.pdf by milinco50
Manual Slideshare.pdfManual Slideshare.pdf
Manual Slideshare.pdf
milinco5016 views

Protege a tu rey. Defiende tu contenido de amenazas, scraping, IA o malos actores

  • 1. Protege a tu rey Defiende tu contenido de amenazas, scraping, IA o malos actores FERNANDO PUENTE
  • 2. Content is King “El contenido es de donde espero que se obtenga el dinero real en Internet” Bill Gates (January 3, 1996)
  • 3. Fernando Puente Informático de vocación y de profesión, formador ocasional y un enamorado de comer y beber. ● Embajador de marca de Raiola Networks ● Profesor Curso Superior de Periodismo Deportivo ● Consultor especializado en Web Performance @fpuenteonline linkedin.com/in/fpuente/
  • 6. Detallar en los términos y condiciones de uso las Condiciones Generales y las responsabilidades derivadas del acceso y la utilización de sus contenidos
  • 7. Los derechos de propiedad intelectual del Sitio Web de los distintos elementos en ella contenidos son titularidad de la Sociedad, a quien corresponde el ejercicio exclusivo de los derechos de explotación de los mismos en cualquier forma y en especial, los derechos de reproducción, distribución, comunicación pública y transformación, de acuerdo con la legislación española y de la unión europea aplicable. Así mismo, el Sitio Web es fruto de la información de cualquier tipo relacionada con las actividades de la Sociedad (información creada por la Sociedad o creada por terceros), que habilita a un uso personal y no comercial de la propia información por parte de los Usuarios. TODOS LOS DERECHOS RESERVADOS en relación con los contenidos de la Sociedad, del Medio y, en su caso, de otras empresas del grupo de la empresa del cual forma parte la Sociedad o de terceros. Queda prohibida la reproducción total o parcial, distribución, puesta a disposición, comunicación pública y utilización, total o parcial, de los contenidos de esta web, en cualquier forma o modalidad, sin previa, expresa y escrita autorización, incluyendo, en particular, su mera reproducción y/o puesta a disposición como resúmenes, reseñas o revistas de prensa con fines comerciales o directa o indirectamente lucrativos, a la que se manifiesta oposición expresa. Así mismo, también queda prohibida la presentación de páginas del Sitio Web y la inserción de imágenes difundidas en el Sitio Web en páginas no pertenecientes a la Sociedad (sea cual sea la técnica que se use para ello). La utilización no autorizada de estos contenidos dará lugar a las responsabilidades legalmente establecidas. La Sociedad, de conformidad con lo establecido en la LSSI, no responderá de las infracciones realizadas por el Usuario del Sitio Web que afecten a terceros, salvo que la misma tenga un "conocimiento efectivo" de dicha infracción. La Sociedad informa a los Usuarios de que, salvo autorización previa, expresa y por escrito, no concede licencia o autorización expresa o implícita alguna sobre los derechos de propiedad intelectual y/o industrial o sobre cualquier otro derecho o propiedad relacionada, directa o indirectamente, con los contenidos incluidos en el Sitio Web, quedando prohibida cualquier alteración o modificación de los contenidos y de cualquier otro elemento.
  • 8. Protege tu contenido de visitantes Humanos
  • 9. Deshabilitar menú contextual (click derecho) * Usuarios avanzados pueden acceder al contenido * Posibilidad de usar plugins del repositorio
  • 10. Deshabilitar selección de texto * Usuarios avanzados pueden acceder al contenido
  • 11. Estrategias de protección adicional ● Marcas de agua y/o copyright en contenido multimedia ● Metadatos en imágenes ● Muro de pago/Paywall ● Registro de usuario o modelo freemium ● Generar el contenido dinámicamente (Javascript) ● Acceso condicional al contenido (restringir por usuario, zona geográfica o número de visitas/páginas) * SEO y UX pueden verse afectados de manera importante * Metadatos y marcas de agua pueden ser eliminadas
  • 12. Protección ante traducciones de la página * Existen herramientas/extensiones que no obedecen a estas etiquetas
  • 13. Protección ante traducciones de elementos * Existen herramientas/extensiones que no obedecen a estas etiquetas
  • 14. Protege tu contenido de visitantes No solo SEOcotillas
  • 15. Qué buscan las herramientas SEO ● Enlazado interno/externo ● Estructura web ● Palabras clave ● Datos sensibles o de negocio ● Contenido
  • 16. Protección anti-competencia ● Eliminar feeds de contenido/Crear feeds incompletos ● Bloquear/moderar comentarios ● Marcas de agua en imágenes ● Habilitar la protección de hotlink ● Deshabilitar incrustado como iframe * Hotlink puede afectar al contenido compartido en medios fuera de la web
  • 17. Bloquear competencia (user-agent) * Pueden realizar el rastreo usando el user agent de Google
  • 18. Reforzar la seguridad de tu sitio ● Proveedor de hosting de confianza ● Certificado de seguridad ● WordPress y componentes actualizados ● Capas adicionales de seguridad (plugin, WAF, htaccess…) ● Política de roles, usuarios y contraseñas ● Entornos de test y producción (actualizaciones y cambios) ● En general, buenas prácticas
  • 19. En último caso ● Publicar un aviso de eliminación DMCA (Digital Millennium Copyright Act) ● Solicitar retirada de contenido por infracciones de derechos de autor en buscadores
  • 20. Protege tu contenido de enlaces dañinos Disavow links
  • 21. Desautorizar enlaces 1. Identificar (fraudulentos, artificiales o de baja calidad) 2. Crear lista de enlaces a desautorizar 3. Subir lista por buscador: https://search.google.com/search-console/disavow-links
  • 22. Protege tu contenido de visitantes No humanos
  • 23. Estrategias anti-scraping ● Reglas específicas en archivo robots.txt ● Filtrar user-agent ● Bloquear servidores por IP ● Añadir Completely Automated Public Turing test to tell Computers and Humans Apart (aka CAPTCHA) ● Colocar «honeypots» ● Desativar feed ● Bloquear REST API
  • 24. Proteger el sitio de scrapeadores (user-agent) * Pueden realizar el rastreo usando el user agent de Google
  • 26. Proteger acceso a WordPress REST API
  • 27. Protege tu contenido de redes sociales Difusión
  • 28. Proteger cómo compartir el contenido ● Marcas de agua y/o copyright en contenido multimedia ● Metadata y etiquetas Open Graph falsas ● Bloqueo, contenido erróneo o redirección para bots (facebookexternalhit, Twitterbot, TelegramBot, LinkedInBot…) * SEO puede verse afectado de manera importante
  • 29. Protege tu contenido de motores de búsqueda Invisibilidad
  • 30. Proteger el sitio de ser rastreado e indexado * Cualquier contenido, no solo HTML
  • 31. Proteger el sitio de ser indexado * Solo HTML
  • 32. Proteger cada página de ser almacenada * Solo HTML * Aplica a la caché de Google
  • 33. Protege tu contenido de la Inteligencia Artificial Base de conocimiento
  • 34. Proteger del entrenamiento * No funciona en todos los modelos de entrenamiento (ejemplo basado en varios modelos LLM utilizando Common Crawl) * Puede cambiar en el futuro
  • 35. Proteger del entrenamiento (nuevo) * No funciona en todos los modelos de entrenamiento (ejemplo basado en OpenAI’s web crawler) * https://platform.openai.com/docs/gptbot (agosto/2023)
  • 36. Proteger del acceso * Sólo usado por los plugins de ChatGPT para acceso (live query), no entrenamiento * Puede cambiar en el futuro
  • 37. ¿La mejor defensa es un buen ataque?