Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Aspectos legales del Data Scraping por Jorge Morell de Terminios y Condiciones.es

348 views

Published on

El pasado 13 de marzo de 2019, Jorge Morell, de Términos y Condiciones nos explicó los aspectos legales del Data scraping, o el sistema que usan las empresas para recopilar datos de las webs para un uso propio. Como experto en derecho y tecnologías nos advirtió sobre sus límites legales.
El data scraping no es algo nuevo. Todo empezó con Pete Warden en 2010, ingeniero de software, que creó dataset con datos de perfiles públicos en Facebook. Facebook le amenazó. Conclusión: “Big data? Cheap. Lawyers? Not so much”.
¿Qué és datascraping? Es como tirar una red de arrastre. Software para extraer de forma automatizada datos de un sitio web simulando la navegación de un humano. ¿Es legal? No es más que un instrumento, la tecnología en sí es legal, pero hay que poner atención al uso que se hace.
Los datos son clave y lo serán más para los negocios, vivimos en la era de los datos.
Más información en drtic.fundaciobit.org

Published in: Law
  • Be the first to comment

  • Be the first to like this

Aspectos legales del Data Scraping por Jorge Morell de Terminios y Condiciones.es

  1. 1. #ParcbitInspira - Parcbit Aspectos legales del data scraping Jorge Morell Ramos @jorge_morell 13 de Marzo de 2019
  2. 2. ¿Qué es Términos y Condiciones? Prestamos servicios legales en nuevas tecnologías. Por ejemplo, comercio electrónico, protección de datos, marcas y la vertiente legal de cualquier proyecto tecnológico. In English too!
  3. 3. ¿Qué es Términos y Condiciones? ¡También tenemos un Legal LAB! Y allí hemos escrapeado por ejemplo miles de términos y condiciones. Para saber cómo y cuándo cambian
  4. 4. ¿Qué es Términos y Condiciones?
  5. 5. Jorge Morell Ramos Email: hola@terminosycondiciones.es Web: www.terminosycondiciones.es Twitter: @tyc_es
  6. 6. Story time @tyc_es 2010, Pete Warden, ingeniero de software, web scraping y Facebook
  7. 7. Story time @tyc_es
  8. 8. Story time Su conclusión: “Big data? Cheap. Lawyers? Not so much.” @tyc_es
  9. 9. Índice 1. Tres ideas previas 2. Precedentes judiciales 3. Cuestiones legales ❖ Términos y condiciones ❖ Propiedad intelectual ❖ Datos personales ❖ Otros 4. Conclusiones @tyc_es
  10. 10. Tres ideas previas 1.- ¿Qué es web scraping? Software para extraer de forma automatizada los datos de un sitio web, simulando la navegación de un humano @tyc_es
  11. 11. Tres ideas previas 2.- ¿Es legal un web scraper? Obviamente sí, no es más que un instrumento. La tecnología en sí no es ilegal, su uso sí puede serlo @tyc_es
  12. 12. Tres ideas previas 3.- Hoy es pieza clave, y lo será más Por razones económicas, sociales e incluso políticas, vivimos en la era del dato y su valor es obvio @tyc_es
  13. 13. ¡Pero ojo! @tyc_es
  14. 14. Precedentes judiciales En EE.UU., eBay en el año 2000 Caso Bidder’s Edge: 100.000 accesos al día, 1,53% del tráfico diario @tyc_es
  15. 15. Precedentes judiciales En Europa, Ryanair en 2008-2009 Su campaña contra las agencias online o, como los denominó: “los parásitos del sector” @tyc_es
  16. 16. Precedentes judiciales En Europa, caso Fixtures Marketing En relación a los calendarios de fútbol de la Liga escocesa e inglesa y si podían ser protegidos como obra @tyc_es
  17. 17. Precedentes judiciales En Europa, caso Football Dataco vs Yahoo! UK En relación a si Yahoo podía escrapear los calendarios de la Premier League y mostrarlos en su web @tyc_es
  18. 18. ¡Ojo de nuevo! @tyc_es
  19. 19. Cuestiones legales Entrando en materia… cómo nos podemos meter en un lío jurídico por hacer web scraping @tyc_es
  20. 20. Cuestiones legales Planteado desde la perspectiva del “scraper”, pero se le puede dar la vuelta fácilmente @tyc_es
  21. 21. Cuestiones legales ¡Ojo, las vulneraciones son acumulables! @tyc_es
  22. 22. Términos y condiciones ¿Qué dicen las condiciones legales del sitio que voy a scrapear? @tyc_es
  23. 23. Términos y condiciones Cláusula habitual “Se prohíbe el uso de cualquier sistema automatizado o software para extraer datos de este sitio web para fines comerciales.” @tyc_es
  24. 24. Términos y condiciones @tyc_es
  25. 25. Términos y condiciones ¿Por tanto, usar un web scraper vulnera esas condiciones? ¿Debería responder por un incumplimiento contractual? @tyc_es
  26. 26. Términos y condiciones Uso personal o no comercial Si el uso es no comercial o personal, normalmente no debería dar problema @tyc_es
  27. 27. Términos y condiciones Uso comercial Definitivamente debe verse el caso concreto, ya que podría haber vulneración, pero hay algunas pautas básicas… @tyc_es
  28. 28. Términos y condiciones Uso comercial ❖ Necesitas una “aceptación” de las condiciones ❖ El acceso y uso de la web por el bot no basta ❖ No equivale a un “derecho de admisión digital” @tyc_es
  29. 29. Términos y condiciones ¿Cómo puede el servicio protegerse y convertir el scraping en vulneración? ❖ Adoptar medidas tecnológicas apropiadas ❖ Exigir la aceptación de condiciones para acceder al sitio o los datos @tyc_es
  30. 30. Términos y condiciones El poder del servicio @tyc_es En todo caso, si el servicio considera que se han vulnerado las condiciones legales, sin duda va a cerrarte el acceso al mismo
  31. 31. ¿Es una obra? @tyc_es
  32. 32. Propiedad intelectual ¿Hay una base de datos en el sitio web scrapeado y/o puede la web ser considerada como tal? @tyc_es
  33. 33. Propiedad intelectual Entonces puede que estemos extrayendo algo que resulta una creación intelectual protegible @tyc_es
  34. 34. Propiedad intelectual Bien por el 1) derecho de autor o por el 2) derecho “sui generis” sobre las bases de datos @tyc_es
  35. 35. Propiedad intelectual Es decir, el dato en sí (un número, por ejemplo) no está amparado por la propiedad intelectual @tyc_es
  36. 36. Propiedad intelectual Cuestión distinta puede ser otro tipo de contenido, como fotografías, vídeos o textos @tyc_es
  37. 37. Propiedad intelectual Pero de los datos se puede crear una estructura original que haya implicado una inversión sustancial @tyc_es
  38. 38. Propiedad intelectual Generando una base de datos que por los recursos invertidos para su obtención, verificación o presentación, sea protegible @tyc_es
  39. 39. Propiedad intelectual Aunque el criterio jurisprudencial es bastante estricto, a efectos de considerar protegible una base de datos | Casos Ryanair, Football Dataco o Yahoo UK @tyc_es
  40. 40. Propiedad intelectual Por tanto, el scraping de una base de datos protegida por la propiedad intelectual sí puede suponer un lío legal @tyc_es
  41. 41. Propiedad intelectual En todo caso, luego habrá que ver el carácter sustancial o no de la utilización de los datos scrapeados @tyc_es
  42. 42. ¡Ojo con el tipo de dato! @tyc_es
  43. 43. Datos personales Si vas a escrapear datos personales, el RGPD quiere hablar contigo :p @tyc_es
  44. 44. Datos personales Primer problema, ¿qué es un dato personal? Con el RGPD, metadatos o identificadores numéricos asociables a una persona son datos personales @tyc_es
  45. 45. Datos personales Segundo problema, ¿sobre qué base legal los recojo? Consentimiento, un contrato, interés legítimo u otros. Sea como sea, el consentimiento no es la única opción @tyc_es
  46. 46. Datos personales Tercer problema, ¿medidas de seguridad? Cómo cifro los datos, los debo anonimizar o solo seudonimizar, durante cuánto tiempo los conservo… @tyc_es
  47. 47. Datos personales Cuarto problema, ¿para qué los uso? Muchas veces se escrapean datos con una finalidad y meses o años después se descubre otra utilidad @tyc_es
  48. 48. Datos personales Quinto problema, ¿el scraping implica algún perfilado o tratamiento automatizado? Por ejemplo, para detectar un fraude bancario o en un proceso de compra @tyc_es
  49. 49. Otros ❖ Competencia desleal ❖ Intrusión informática no autorizada ❖ Consumo de recursos ❖ Pérdida de ingresos por publicidad ❖ Daños informáticos @tyc_es
  50. 50. Data everywhere @tyc_es
  51. 51. Conclusiones ❖ Importancia del uso (personal/comercial) que se hará de los datos escrapeados ❖ Los términos y condiciones deben leerse; muchas veces no supondrán incumplimiento contractual pero sí pérdida de acceso al dato ❖ Se puede estar escrapeando una base de datos protegida por la propiedad intelectual ❖ Mucho ojo cuando se extraen y gestionan datos de carácter personal, en especial con el RGPD mediante ❖ No conviene escrapear datos públicos sin autorización ❖ El scraping no debe sobrecargar técnicamente los servicios y equipos de quien lo sufre @tyc_es
  52. 52. Jorge Morell Ramos Email: hola@terminosycondiciones.es Web: www.terminosycondiciones.es Twitter: @tyc_es

×