2. William Méndez
Open Source Web Developer
Avanet Member / Web Development Manager at Mozilla - Ecuador.
wilo@avanet.org | wilo@mozilla.ec | @willirocker | wmendezc.wordpress.com
Acerca de mí
4. Es la técnica que se emplea para extraer datos usando herramientas
de software, está relacionado con la indexación de información que
está en la web empleando un robot, es una metodología universal
adoptada por la mayoría de los motores de búsqueda.
¿Qué es Web Scraping?
6. Con scraping podemos tener nuestra propia api con datos que son de
interés tanto personal como corporativo como por ejemplo el listado de
precios que están en las webs de empresas que son la competencia a
fin de tener un estudio y toma de decisiones.
¿Qué es problemas podemos resolver con web
scraping?
8. No se puede aplicar el scraping a sitios que se han protegido contra
estos, en archivos pdf, sitios con captcha, etc.
Nota.- Utilizar esta tecnología para estudio estadístico, o para
informarse de las nuevas tendencias, pero no es recomendable para
copiar entradas de sitios y generar duplicidad de la información en la
web por motivos legales.
¿Qué es problemas no podemos resolver con
web scraping?
13. Listado de herramientas usada en el ejercicio –
Categoría Backend
python
Scrapy framework de sraping para python
Pyramid Web framework + Mozilla Cornice Rest
Framework