Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Web scraping, Codeando México

3,974 views

Published on

Herramientas para hacer web scraping básico

Published in: Technology
  • Be the first to comment

Web scraping, Codeando México

  1. 1. Web Scraping Codeando México
  2. 2. Problema El diario oficial de la federación tiene información muy valiosa del país. Pero está en un formato horrible. http://www.dof.gob.mx/index.php
  3. 3. Solución Si pudiéramos obtener la información, almacenarla y presentarla en un formato amigable para el lector en forma de una suscripción para recibir notificaciones a ciertos temas de interés.
  4. 4. Web Scraping Es una técnica utilizada para la extracción de información de sitios web utilizando un programa de computadora que actúa de forma similar a un explorador web.
  5. 5. Herramientas para web scraping ● Scrapy, scraping and web crawling framework para Python: https://github. com/scrapy/scrapy/ ● Scraper wiki, es un servicio de workers automáticos que se quedan “scrapeando”: https://scraperwiki.com/
  6. 6. Demo Scrapy Código del demo en: https://github.com/CodeandoMexico/web-scraping Guardar información en un archivo json: $ scrapy crawl dof -o notes.json -t json
  7. 7. Gracias Braulio Chávez braulio@codeandomexico.org @HackerOfDreams

×