Web Crawling

Loading...

Flash Player 9 (or above) is needed to view presentations.
We have detected that you do not have it on your computer. To install it, go here.

0 comments

Post a comment

    Post a comment
    Embed Video
    Edit your comment Cancel

    1 Favorite

    Web Crawling - Presentation Transcript

    1. I MiniBarCamp Caracas 2009 ¿Web Crawling? Buscando opciones para rastrear info en la web (Mi propio google search) Iria Puyosa Iria Puyosa
    2. Problema Herramientas de búsqueda web producen: - Resultados incompletos - Datos des-estructurados
    3. Problema Investigación requiere: - Corpus exhaustivo (todos los documentos que se han producido) - Estructuración de los resultados en una base de datos que responda a queries específicas
    4. ¿Solución? ¿Focused crawling? - URL semilla - Relevantes keywords (Vectores de términos) - Definición de la frontera - Clasificación basada en relevancia - Extracción de nuevas URLs - Recuperación y almacenaje de datos - Indización
    5. ¿Soluciones? ¿Sugerencias? ¿Propuestas?
    6. Estructuración de base de datos indizados - Definición de atributos - Datasets Entrenamiento / Validación - Clasificación - Generación de algoritmo para clustering - Modelos

    + Iria PuyosaIria Puyosa, 4 months ago

    custom

    215 views, 1 favs, 0 embeds more stats

    ¿Web Crawling?
    Buscando opciones para rastrear in more

    More info about this document

    © All Rights Reserved

    Go to text version

    • Total Views 215
      • 215 on SlideShare
      • 0 from embeds
    • Comments 0
    • Favorites 1
    • Downloads 4
    Most viewed embeds

    more

    All embeds

    less

    Flagged as inappropriate Flag as inappropriate
    Flag as inappropriate

    Select your reason for flagging this presentation as inappropriate. If needed, use the feedback form to let us know more details.

    Cancel
    File a copyright complaint
    Having problems? Go to our helpdesk?

    Categories