SlideShare a Scribd company logo
1 of 49
Download to read offline
Washington Bastidas Santos Jesús González Vera http://www.espol.edu.ec/
INTRODUCCIÓN PROBLEMA METODOLOGÍA IMPLEMENTACIÓN EVALUACIÓN Y RESULTADOS CONCLUSIÓN TRABAJO FUTURO BIBLIOGRAFÍA Agenda
INTRODUCCIÓN 1
[object Object],[object Object],[object Object],[object Object],   Introducción Problema Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía INTRODUCCIÓN
[object Object],   Introducción Problema Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía WEBSPAM [1]: Z. Gyongyiand H. Garcia-Molina. Web spam taxonomy. In First International Workshop on Adversarial Information Retrieval on the Web, 2005
   Introducción Problema Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MOTIVACIÓN Suplir a las personas a través de una solución automatizada y que aprenda con el tiempo .
PROBLEMA 2
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],¿POR QUÉ EL WEBSPAM ES MALO?
Introducción    Problema Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía PROBLEMA PALABRAS CLAVES + LINKS MÁQUINAS DE BÚSQUEDA PUBLICIDAD
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Introducción    Problema Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía PROBLEMA
[object Object],[object Object],[object Object],[object Object],Introducción    Problema Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía SPAM BASADO EN CONTENIDO Keyword Stuffing
[object Object],[object Object],[object Object],[object Object],Introducción    Problema Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía SPAM BASADO EN LINK Granja de Enlaces
METODOLOGÍA 3
[object Object],[object Object],Introducción Problema    Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía APRENDIZAJE AUTOMÁTICO
[object Object],[object Object],[object Object],Introducción Problema    Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía SUPERVISADO Y CLASIFICACIÓN Nuevo dato
[object Object],[object Object],[object Object],Introducción Problema    Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO
Introducción Problema    Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO  ¿cómo clasificar estos datos? +1 -1
Introducción Problema    Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO  ¿cómo clasificar estos datos? +1 -1
Introducción Problema    Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO  ¿cómo clasificar estos datos? +1 -1
Introducción Problema    Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO  ¿cómo clasificar estos datos? +1 -1
Introducción Problema    Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO  ¿cómo clasificar estos datos? +1 -1
Introducción Problema    Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO  Definimos el hiperplano w · x +b=0 +1 -1
Introducción Problema    Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO  Definimos el margen +1 -1
Introducción Problema    Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO  La idea es maximizar el margen. +1 -1
Introducción Problema    Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO  El hiperplano que tenga el mayor margen es el mejor clasificador de los datos. +1 -1
Introducción Problema    Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO  Los vectores de apoyo son los puntos que tocan el límite del margen. +1 -1
Introducción Problema    Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO  Veamos los hiperplanos “positivo” y “negativo” +1 -1
Introducción Problema    Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO  w · x +b = -1 w · x +b = +1 margen d - d + hiperplano “positivo”:  w · x +b = +1 hiperplano “negativo”:  w · x +b = -1 +1 -1
Introducción Problema    Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO  Al final lo que resulta es una función de correspondencia para la clasificación Son los valores de  son los multiplicadores de LaGrange de la ecuación Es la función Kernel utilizada y  b  la variable independiente. Los vectores de apoyo están implícitos en la función Kernel
Introducción Problema    Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía SVM EN CASCADA ,[object Object],[object Object],SVM en cascada
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Introducción Problema    Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía VECTORES DE CARACTERÍSTICAS <input type=&quot;hidden“  value=“Internet&quot;>  <a href=&quot;/deportes/&quot; title=&quot;Deportes&quot;>  Deportes  </a>  Texto ancla
Introducción Problema    Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MAPREDUCE
Introducción Problema    Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía AMAZON WEB SERVICE
Introducción Problema    Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MODELO GENERAL Kernel RBF
IMPLEMENTACIÓN 4
Introducción Problema Metodología    Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía DATASET ,[object Object],[object Object],[object Object],[object Object],[object Object]
Introducción Problema Metodología    Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía DATASET ,[object Object],Dirección_página_web1    f11 ; f12 ; f13 ; f14 ; f15 ; etiqueta1 Dirección_página_web2    f21 ; f22 ; f23 ; f24 ; f25 ; etiqueta2 Dirección_página_web :  P ágina Web   : C arácter de tabulación  fn1 ; fn2 ; fn3 ; fn4 ; fn5 :  Características de una página n cualquiera. Etiqueta :  -1  spam y  1  no spam
Introducción Problema Metodología    Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía LIBRERÍAS Paradigma MapReduce Hadoop 1.8   Distribución Linux  Cloudera   Software de virtualización  VMware Player   Gestión instancias de Amazon EC2   Ec2 Api tools   SVM LibSVM   Gestionar Amazon S3 Plugin  S3 Organizer Gestionar EC2   Plugin  ElasticFox
EVALUACIÓN Y RESULTADOS 5
Introducción Problema Metodología Implementación    Evaluación y resultados Conclusión Trabajo Futuro Bibliografía ANÁLISIS DEL KERNEL Vectores Iniciales Vectores de Soporte Kernel Gaussiano Kernel Lineal Kernel Polinomial 500 156 500 156 7600 3300 7600 3300 55000 20370 55000 20370 100000 37037 100000 37037
Introducción Problema Metodología Implementación    Evaluación y resultados Conclusión Trabajo Futuro Bibliografía ANÁLISIS DE LAS CARACTERÍSTICAS Tabla 4.3. Número de Palabras Título y Prom. de Tamaño de Palabra Spam y No Spam Tipo Numero De Palabras No Spam 444,79 Spam 583,3 Características Tipo Numero Palabras Título Promedio Tamaño Palabra No Spam 6,39 7,69 Spam 6,27 7,67
Introducción Problema Metodología Implementación    Evaluación y resultados Conclusión Trabajo Futuro Bibliografía ANÁLISIS DE LAS CARACTERÍSTICAS Características Tipo Porcentaje Texto Ancla Porcentaje Texto Visible No Spam 34% 76% Spam 37% 87%
Introducción Problema Metodología Implementación    Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MATRIZ DE CONFUSIÓN ,[object Object],[object Object],Clases Predichas     1 -1 Clases Conocidas   1 89,00% 0 -1 10,30% 0
Introducción Problema Metodología Implementación    Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MEDICIONES EC2 Mediciones realizadas en los clusters de  Amazon Kernel:  RBF (Radial Basis Function) Número de vectores:  67,577 Número de vectores de apoyo:  20,338 Nodos EC2 Extracción Tiempo (seg.) Entrenamiento  Tiempo (seg.) 3 83.127 302 8 50.54 250
CONCLUSIONES Y TRABAJOS FUTUROS 5
Introducción Problema Metodología Implementación Evaluación y resultados    Conclusión Trabajo Futuro Bibliografía CONCLUSIONES ,[object Object],[object Object],[object Object],[object Object]
Introducción Problema Metodología Implementación Evaluación y resultados Conclusión    Trabajo Futuro Bibliografía TRABAJO FUTURO Otra solución en &quot;Sub-problemas cuadráticos&quot; Extender la cantidad de características. Mecanismos de validación cruzada para el ajuste de parámetros.
Preguntas
Introducción Problema    Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía EXTRAER Y CUANTIFICAR

More Related Content

Similar to WebSpam

Clasificación de Páginas web usando Marcadores sociales
Clasificación de Páginas web usando Marcadores socialesClasificación de Páginas web usando Marcadores sociales
Clasificación de Páginas web usando Marcadores socialesNicolás Tourné
 
Testing técnico - Automatización en web y mobile para pruebas funcionales y p...
Testing técnico - Automatización en web y mobile para pruebas funcionales y p...Testing técnico - Automatización en web y mobile para pruebas funcionales y p...
Testing técnico - Automatización en web y mobile para pruebas funcionales y p...Abstracta
 
Charla en Universidad ORT 2014 - Testing técnico (automatización, mobile, pe...
 Charla en Universidad ORT 2014 - Testing técnico (automatización, mobile, pe... Charla en Universidad ORT 2014 - Testing técnico (automatización, mobile, pe...
Charla en Universidad ORT 2014 - Testing técnico (automatización, mobile, pe...Federico Toledo
 
2 problema, formulación, objetivos y justificación
2 problema, formulación, objetivos y justificación2 problema, formulación, objetivos y justificación
2 problema, formulación, objetivos y justificaciónMarina Vintimilla
 
Gestión de Proyectos.pptx
Gestión de Proyectos.pptxGestión de Proyectos.pptx
Gestión de Proyectos.pptxLuzCastaneda
 
Aplicación Multimedia #3 álgebra lineal. CALCULADORA DE MATRICES. Actividad d...
Aplicación Multimedia #3 álgebra lineal. CALCULADORA DE MATRICES. Actividad d...Aplicación Multimedia #3 álgebra lineal. CALCULADORA DE MATRICES. Actividad d...
Aplicación Multimedia #3 álgebra lineal. CALCULADORA DE MATRICES. Actividad d...JAVIER SOLIS NOYOLA
 
¿Quality Control = Project Control?
¿Quality Control = Project Control?¿Quality Control = Project Control?
¿Quality Control = Project Control?Excelza
 
Calendarización de Proyectos de Software
Calendarización de Proyectos de SoftwareCalendarización de Proyectos de Software
Calendarización de Proyectos de SoftwareJavier Capa
 
Conper 2010 version final
Conper 2010 version finalConper 2010 version final
Conper 2010 version finaljcarica
 
CONTENIDO DE SIMULADOR INFORMATICO.pdf
CONTENIDO DE SIMULADOR INFORMATICO.pdfCONTENIDO DE SIMULADOR INFORMATICO.pdf
CONTENIDO DE SIMULADOR INFORMATICO.pdfZoilaNagua1
 
Sesión #1 Introduccion al curso.pptx
Sesión #1 Introduccion al curso.pptxSesión #1 Introduccion al curso.pptx
Sesión #1 Introduccion al curso.pptxAndersonHernandezara
 
Aplicación Multimedia #8 Álgebra Lineal. SOLUCIÓN DE SISTEMAS DE ECUACIONES L...
Aplicación Multimedia #8 Álgebra Lineal. SOLUCIÓN DE SISTEMAS DE ECUACIONES L...Aplicación Multimedia #8 Álgebra Lineal. SOLUCIÓN DE SISTEMAS DE ECUACIONES L...
Aplicación Multimedia #8 Álgebra Lineal. SOLUCIÓN DE SISTEMAS DE ECUACIONES L...JAVIER SOLIS NOYOLA
 
095 Estrategias Y Practicas De Integracion Con Genexus
095 Estrategias Y Practicas De Integracion Con Genexus095 Estrategias Y Practicas De Integracion Con Genexus
095 Estrategias Y Practicas De Integracion Con GenexusGeneXus
 
TechNoa 2007 - Visual Studio Team Systems
TechNoa 2007 - Visual Studio Team SystemsTechNoa 2007 - Visual Studio Team Systems
TechNoa 2007 - Visual Studio Team Systemsfmmeson
 
Metodologías y herramientas para la solución de Problemas.
Metodologías y herramientas para la solución de Problemas.Metodologías y herramientas para la solución de Problemas.
Metodologías y herramientas para la solución de Problemas.EDSON GUERRA
 
Introduccion Posicionamiento Buscadores Modulo 6
Introduccion Posicionamiento Buscadores Modulo 6Introduccion Posicionamiento Buscadores Modulo 6
Introduccion Posicionamiento Buscadores Modulo 6Jorge Serrano-Cobos
 

Similar to WebSpam (20)

POLINOMIOS
POLINOMIOSPOLINOMIOS
POLINOMIOS
 
Clasificación de Páginas web usando Marcadores sociales
Clasificación de Páginas web usando Marcadores socialesClasificación de Páginas web usando Marcadores sociales
Clasificación de Páginas web usando Marcadores sociales
 
Testing técnico - Automatización en web y mobile para pruebas funcionales y p...
Testing técnico - Automatización en web y mobile para pruebas funcionales y p...Testing técnico - Automatización en web y mobile para pruebas funcionales y p...
Testing técnico - Automatización en web y mobile para pruebas funcionales y p...
 
Charla en Universidad ORT 2014 - Testing técnico (automatización, mobile, pe...
 Charla en Universidad ORT 2014 - Testing técnico (automatización, mobile, pe... Charla en Universidad ORT 2014 - Testing técnico (automatización, mobile, pe...
Charla en Universidad ORT 2014 - Testing técnico (automatización, mobile, pe...
 
GuíA Para La OptimizacióN De Consultas
GuíA Para La OptimizacióN De ConsultasGuíA Para La OptimizacióN De Consultas
GuíA Para La OptimizacióN De Consultas
 
2 problema, formulación, objetivos y justificación
2 problema, formulación, objetivos y justificación2 problema, formulación, objetivos y justificación
2 problema, formulación, objetivos y justificación
 
Gestión de Proyectos.pptx
Gestión de Proyectos.pptxGestión de Proyectos.pptx
Gestión de Proyectos.pptx
 
Aplicación Multimedia #3 álgebra lineal. CALCULADORA DE MATRICES. Actividad d...
Aplicación Multimedia #3 álgebra lineal. CALCULADORA DE MATRICES. Actividad d...Aplicación Multimedia #3 álgebra lineal. CALCULADORA DE MATRICES. Actividad d...
Aplicación Multimedia #3 álgebra lineal. CALCULADORA DE MATRICES. Actividad d...
 
¿Quality Control = Project Control?
¿Quality Control = Project Control?¿Quality Control = Project Control?
¿Quality Control = Project Control?
 
Calendarización de Proyectos de Software
Calendarización de Proyectos de SoftwareCalendarización de Proyectos de Software
Calendarización de Proyectos de Software
 
Conper 2010 version final
Conper 2010 version finalConper 2010 version final
Conper 2010 version final
 
Seis sigma iio09004 2013
Seis sigma iio09004 2013Seis sigma iio09004 2013
Seis sigma iio09004 2013
 
CONTENIDO DE SIMULADOR INFORMATICO.pdf
CONTENIDO DE SIMULADOR INFORMATICO.pdfCONTENIDO DE SIMULADOR INFORMATICO.pdf
CONTENIDO DE SIMULADOR INFORMATICO.pdf
 
Sesión #1 Introduccion al curso.pptx
Sesión #1 Introduccion al curso.pptxSesión #1 Introduccion al curso.pptx
Sesión #1 Introduccion al curso.pptx
 
Aplicación Multimedia #8 Álgebra Lineal. SOLUCIÓN DE SISTEMAS DE ECUACIONES L...
Aplicación Multimedia #8 Álgebra Lineal. SOLUCIÓN DE SISTEMAS DE ECUACIONES L...Aplicación Multimedia #8 Álgebra Lineal. SOLUCIÓN DE SISTEMAS DE ECUACIONES L...
Aplicación Multimedia #8 Álgebra Lineal. SOLUCIÓN DE SISTEMAS DE ECUACIONES L...
 
095 Estrategias Y Practicas De Integracion Con Genexus
095 Estrategias Y Practicas De Integracion Con Genexus095 Estrategias Y Practicas De Integracion Con Genexus
095 Estrategias Y Practicas De Integracion Con Genexus
 
TechNoa 2007 - Visual Studio Team Systems
TechNoa 2007 - Visual Studio Team SystemsTechNoa 2007 - Visual Studio Team Systems
TechNoa 2007 - Visual Studio Team Systems
 
Metodologías y herramientas para la solución de Problemas.
Metodologías y herramientas para la solución de Problemas.Metodologías y herramientas para la solución de Problemas.
Metodologías y herramientas para la solución de Problemas.
 
Introduccion Posicionamiento Buscadores Modulo 6
Introduccion Posicionamiento Buscadores Modulo 6Introduccion Posicionamiento Buscadores Modulo 6
Introduccion Posicionamiento Buscadores Modulo 6
 
Calidad del Software
Calidad del SoftwareCalidad del Software
Calidad del Software
 

Recently uploaded

Matriz de integración de tecnologías- Paola Carvajal.docx
Matriz de integración de tecnologías- Paola Carvajal.docxMatriz de integración de tecnologías- Paola Carvajal.docx
Matriz de integración de tecnologías- Paola Carvajal.docxPaolaCarolinaCarvaja
 
Inmersión global en ciberseguridad e IA en la conferencia RSA.pdf
Inmersión global en ciberseguridad e IA en la conferencia RSA.pdfInmersión global en ciberseguridad e IA en la conferencia RSA.pdf
Inmersión global en ciberseguridad e IA en la conferencia RSA.pdfOBr.global
 
Presentación - Diseño de Algoritmos Paralelos - Grupo 2.pdf
Presentación - Diseño de Algoritmos Paralelos - Grupo 2.pdfPresentación - Diseño de Algoritmos Paralelos - Grupo 2.pdf
Presentación - Diseño de Algoritmos Paralelos - Grupo 2.pdfymiranda2
 
Carta de Premio y Excel angeline 11-2pdf
Carta de Premio y Excel angeline 11-2pdfCarta de Premio y Excel angeline 11-2pdf
Carta de Premio y Excel angeline 11-2pdfangelinebocanegra1
 
De Código a Ejecución: El Papel Fundamental del MSIL en .NET
De Código a Ejecución: El Papel Fundamental del MSIL en .NETDe Código a Ejecución: El Papel Fundamental del MSIL en .NET
De Código a Ejecución: El Papel Fundamental del MSIL en .NETGermán Küber
 
La tablet trabajo en grupo del grado 9-2
La tablet trabajo en grupo del grado 9-2La tablet trabajo en grupo del grado 9-2
La tablet trabajo en grupo del grado 9-2montoyagabriela340
 
TENDENCIAS DE IA Explorando el futuro de la tecnologia.pdf
TENDENCIAS DE IA Explorando el futuro de la tecnologia.pdfTENDENCIAS DE IA Explorando el futuro de la tecnologia.pdf
TENDENCIAS DE IA Explorando el futuro de la tecnologia.pdfJoseAlejandroPerezBa
 
Los mejores simuladores de circuitos electrónicos.pdf
Los mejores simuladores de circuitos electrónicos.pdfLos mejores simuladores de circuitos electrónicos.pdf
Los mejores simuladores de circuitos electrónicos.pdfodalistar77
 
La Electricidad y La Electrónica.pdf....
La Electricidad y La Electrónica.pdf....La Electricidad y La Electrónica.pdf....
La Electricidad y La Electrónica.pdf....Aaron Betancourt
 
Actividad 14_ Diseño de Algoritmos Paralelos.pdf
Actividad 14_ Diseño de Algoritmos Paralelos.pdfActividad 14_ Diseño de Algoritmos Paralelos.pdf
Actividad 14_ Diseño de Algoritmos Paralelos.pdfalejandrogomezescoto
 
Análisis de artefactos tecnologicos .pdf
Análisis de artefactos tecnologicos .pdfAnálisis de artefactos tecnologicos .pdf
Análisis de artefactos tecnologicos .pdfcastrodanna185
 
El diseño de Algoritmos Paralelos.pdf - analisis de algortimos
El diseño de Algoritmos Paralelos.pdf - analisis de algortimosEl diseño de Algoritmos Paralelos.pdf - analisis de algortimos
El diseño de Algoritmos Paralelos.pdf - analisis de algortimosLCristinaForchue
 
Tecnológia 2024.docx.Tecnológia 2024.docx.
Tecnológia 2024.docx.Tecnológia 2024.docx.Tecnológia 2024.docx.Tecnológia 2024.docx.
Tecnológia 2024.docx.Tecnológia 2024.docx.marianarodriguezc797
 
PRESENTACION DEL TEMA LOS MEJORES SIMULADORES DE CIRCUITOS ELCTRONICOS
PRESENTACION DEL TEMA LOS MEJORES SIMULADORES DE CIRCUITOS ELCTRONICOSPRESENTACION DEL TEMA LOS MEJORES SIMULADORES DE CIRCUITOS ELCTRONICOS
PRESENTACION DEL TEMA LOS MEJORES SIMULADORES DE CIRCUITOS ELCTRONICOSLincangoKevin
 
Actividad 14: Diseño de Algoritmos Paralelos Actividad 14: Diseño de Algoritm...
Actividad 14: Diseño de Algoritmos Paralelos Actividad 14: Diseño de Algoritm...Actividad 14: Diseño de Algoritmos Paralelos Actividad 14: Diseño de Algoritm...
Actividad 14: Diseño de Algoritmos Paralelos Actividad 14: Diseño de Algoritm...RaymondCode
 
VIDEOS DE APOYO.docx E
VIDEOS DE APOYO.docx                                  EVIDEOS DE APOYO.docx                                  E
VIDEOS DE APOYO.docx Emialexsolar
 
Actividad 1-PRESENTACIÓN ANIMADA.pptxPreservación y conservación de los docum...
Actividad 1-PRESENTACIÓN ANIMADA.pptxPreservación y conservación de los docum...Actividad 1-PRESENTACIÓN ANIMADA.pptxPreservación y conservación de los docum...
Actividad 1-PRESENTACIÓN ANIMADA.pptxPreservación y conservación de los docum...OLGAMILENAMONTAEZNIO
 
Inteligencia artificial dentro de la contabilidad
Inteligencia artificial dentro de la contabilidadInteligencia artificial dentro de la contabilidad
Inteligencia artificial dentro de la contabilidaddanik1023m
 

Recently uploaded (20)

Matriz de integración de tecnologías- Paola Carvajal.docx
Matriz de integración de tecnologías- Paola Carvajal.docxMatriz de integración de tecnologías- Paola Carvajal.docx
Matriz de integración de tecnologías- Paola Carvajal.docx
 
Inmersión global en ciberseguridad e IA en la conferencia RSA.pdf
Inmersión global en ciberseguridad e IA en la conferencia RSA.pdfInmersión global en ciberseguridad e IA en la conferencia RSA.pdf
Inmersión global en ciberseguridad e IA en la conferencia RSA.pdf
 
Presentación - Diseño de Algoritmos Paralelos - Grupo 2.pdf
Presentación - Diseño de Algoritmos Paralelos - Grupo 2.pdfPresentación - Diseño de Algoritmos Paralelos - Grupo 2.pdf
Presentación - Diseño de Algoritmos Paralelos - Grupo 2.pdf
 
Carta de Premio y Excel angeline 11-2pdf
Carta de Premio y Excel angeline 11-2pdfCarta de Premio y Excel angeline 11-2pdf
Carta de Premio y Excel angeline 11-2pdf
 
De Código a Ejecución: El Papel Fundamental del MSIL en .NET
De Código a Ejecución: El Papel Fundamental del MSIL en .NETDe Código a Ejecución: El Papel Fundamental del MSIL en .NET
De Código a Ejecución: El Papel Fundamental del MSIL en .NET
 
La tablet trabajo en grupo del grado 9-2
La tablet trabajo en grupo del grado 9-2La tablet trabajo en grupo del grado 9-2
La tablet trabajo en grupo del grado 9-2
 
TENDENCIAS DE IA Explorando el futuro de la tecnologia.pdf
TENDENCIAS DE IA Explorando el futuro de la tecnologia.pdfTENDENCIAS DE IA Explorando el futuro de la tecnologia.pdf
TENDENCIAS DE IA Explorando el futuro de la tecnologia.pdf
 
BEDEC Sostenibilidad, novedades 2024 - Laura Silva
BEDEC Sostenibilidad, novedades 2024 - Laura SilvaBEDEC Sostenibilidad, novedades 2024 - Laura Silva
BEDEC Sostenibilidad, novedades 2024 - Laura Silva
 
Los mejores simuladores de circuitos electrónicos.pdf
Los mejores simuladores de circuitos electrónicos.pdfLos mejores simuladores de circuitos electrónicos.pdf
Los mejores simuladores de circuitos electrónicos.pdf
 
La Electricidad y La Electrónica.pdf....
La Electricidad y La Electrónica.pdf....La Electricidad y La Electrónica.pdf....
La Electricidad y La Electrónica.pdf....
 
Actividad 14_ Diseño de Algoritmos Paralelos.pdf
Actividad 14_ Diseño de Algoritmos Paralelos.pdfActividad 14_ Diseño de Algoritmos Paralelos.pdf
Actividad 14_ Diseño de Algoritmos Paralelos.pdf
 
Análisis de artefactos tecnologicos .pdf
Análisis de artefactos tecnologicos .pdfAnálisis de artefactos tecnologicos .pdf
Análisis de artefactos tecnologicos .pdf
 
El diseño de Algoritmos Paralelos.pdf - analisis de algortimos
El diseño de Algoritmos Paralelos.pdf - analisis de algortimosEl diseño de Algoritmos Paralelos.pdf - analisis de algortimos
El diseño de Algoritmos Paralelos.pdf - analisis de algortimos
 
Tecnológia 2024.docx.Tecnológia 2024.docx.
Tecnológia 2024.docx.Tecnológia 2024.docx.Tecnológia 2024.docx.Tecnológia 2024.docx.
Tecnológia 2024.docx.Tecnológia 2024.docx.
 
PRESENTACION DEL TEMA LOS MEJORES SIMULADORES DE CIRCUITOS ELCTRONICOS
PRESENTACION DEL TEMA LOS MEJORES SIMULADORES DE CIRCUITOS ELCTRONICOSPRESENTACION DEL TEMA LOS MEJORES SIMULADORES DE CIRCUITOS ELCTRONICOS
PRESENTACION DEL TEMA LOS MEJORES SIMULADORES DE CIRCUITOS ELCTRONICOS
 
Actividad 14: Diseño de Algoritmos Paralelos Actividad 14: Diseño de Algoritm...
Actividad 14: Diseño de Algoritmos Paralelos Actividad 14: Diseño de Algoritm...Actividad 14: Diseño de Algoritmos Paralelos Actividad 14: Diseño de Algoritm...
Actividad 14: Diseño de Algoritmos Paralelos Actividad 14: Diseño de Algoritm...
 
VIDEOS DE APOYO.docx E
VIDEOS DE APOYO.docx                                  EVIDEOS DE APOYO.docx                                  E
VIDEOS DE APOYO.docx E
 
Actividad 1-PRESENTACIÓN ANIMADA.pptxPreservación y conservación de los docum...
Actividad 1-PRESENTACIÓN ANIMADA.pptxPreservación y conservación de los docum...Actividad 1-PRESENTACIÓN ANIMADA.pptxPreservación y conservación de los docum...
Actividad 1-PRESENTACIÓN ANIMADA.pptxPreservación y conservación de los docum...
 
Inteligencia artificial dentro de la contabilidad
Inteligencia artificial dentro de la contabilidadInteligencia artificial dentro de la contabilidad
Inteligencia artificial dentro de la contabilidad
 
BEDEC Proyecto y obra , novedades 2024 - Xavier Folch
BEDEC Proyecto y obra , novedades 2024 - Xavier FolchBEDEC Proyecto y obra , novedades 2024 - Xavier Folch
BEDEC Proyecto y obra , novedades 2024 - Xavier Folch
 

WebSpam

  • 1. Washington Bastidas Santos Jesús González Vera http://www.espol.edu.ec/
  • 2. INTRODUCCIÓN PROBLEMA METODOLOGÍA IMPLEMENTACIÓN EVALUACIÓN Y RESULTADOS CONCLUSIÓN TRABAJO FUTURO BIBLIOGRAFÍA Agenda
  • 4.
  • 5.
  • 6. Introducción Problema Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MOTIVACIÓN Suplir a las personas a través de una solución automatizada y que aprenda con el tiempo .
  • 8.
  • 9. Introducción  Problema Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía PROBLEMA PALABRAS CLAVES + LINKS MÁQUINAS DE BÚSQUEDA PUBLICIDAD
  • 10.
  • 11.
  • 12.
  • 14.
  • 15.
  • 16.
  • 17. Introducción Problema  Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO ¿cómo clasificar estos datos? +1 -1
  • 18. Introducción Problema  Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO ¿cómo clasificar estos datos? +1 -1
  • 19. Introducción Problema  Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO ¿cómo clasificar estos datos? +1 -1
  • 20. Introducción Problema  Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO ¿cómo clasificar estos datos? +1 -1
  • 21. Introducción Problema  Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO ¿cómo clasificar estos datos? +1 -1
  • 22. Introducción Problema  Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO Definimos el hiperplano w · x +b=0 +1 -1
  • 23. Introducción Problema  Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO Definimos el margen +1 -1
  • 24. Introducción Problema  Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO La idea es maximizar el margen. +1 -1
  • 25. Introducción Problema  Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO El hiperplano que tenga el mayor margen es el mejor clasificador de los datos. +1 -1
  • 26. Introducción Problema  Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO Los vectores de apoyo son los puntos que tocan el límite del margen. +1 -1
  • 27. Introducción Problema  Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO Veamos los hiperplanos “positivo” y “negativo” +1 -1
  • 28. Introducción Problema  Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO w · x +b = -1 w · x +b = +1 margen d - d + hiperplano “positivo”: w · x +b = +1 hiperplano “negativo”: w · x +b = -1 +1 -1
  • 29. Introducción Problema  Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MÁQUINA DE VECTORES DE APOYO Al final lo que resulta es una función de correspondencia para la clasificación Son los valores de son los multiplicadores de LaGrange de la ecuación Es la función Kernel utilizada y b la variable independiente. Los vectores de apoyo están implícitos en la función Kernel
  • 30.
  • 31.
  • 32. Introducción Problema  Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MAPREDUCE
  • 33. Introducción Problema  Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía AMAZON WEB SERVICE
  • 34. Introducción Problema  Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MODELO GENERAL Kernel RBF
  • 36.
  • 37.
  • 38. Introducción Problema Metodología  Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía LIBRERÍAS Paradigma MapReduce Hadoop 1.8 Distribución Linux Cloudera Software de virtualización VMware Player Gestión instancias de Amazon EC2 Ec2 Api tools SVM LibSVM Gestionar Amazon S3 Plugin S3 Organizer Gestionar EC2 Plugin ElasticFox
  • 40. Introducción Problema Metodología Implementación  Evaluación y resultados Conclusión Trabajo Futuro Bibliografía ANÁLISIS DEL KERNEL Vectores Iniciales Vectores de Soporte Kernel Gaussiano Kernel Lineal Kernel Polinomial 500 156 500 156 7600 3300 7600 3300 55000 20370 55000 20370 100000 37037 100000 37037
  • 41. Introducción Problema Metodología Implementación  Evaluación y resultados Conclusión Trabajo Futuro Bibliografía ANÁLISIS DE LAS CARACTERÍSTICAS Tabla 4.3. Número de Palabras Título y Prom. de Tamaño de Palabra Spam y No Spam Tipo Numero De Palabras No Spam 444,79 Spam 583,3 Características Tipo Numero Palabras Título Promedio Tamaño Palabra No Spam 6,39 7,69 Spam 6,27 7,67
  • 42. Introducción Problema Metodología Implementación  Evaluación y resultados Conclusión Trabajo Futuro Bibliografía ANÁLISIS DE LAS CARACTERÍSTICAS Características Tipo Porcentaje Texto Ancla Porcentaje Texto Visible No Spam 34% 76% Spam 37% 87%
  • 43.
  • 44. Introducción Problema Metodología Implementación  Evaluación y resultados Conclusión Trabajo Futuro Bibliografía MEDICIONES EC2 Mediciones realizadas en los clusters de Amazon Kernel: RBF (Radial Basis Function) Número de vectores: 67,577 Número de vectores de apoyo: 20,338 Nodos EC2 Extracción Tiempo (seg.) Entrenamiento Tiempo (seg.) 3 83.127 302 8 50.54 250
  • 46.
  • 47. Introducción Problema Metodología Implementación Evaluación y resultados Conclusión  Trabajo Futuro Bibliografía TRABAJO FUTURO Otra solución en &quot;Sub-problemas cuadráticos&quot; Extender la cantidad de características. Mecanismos de validación cruzada para el ajuste de parámetros.
  • 49. Introducción Problema  Metodología Implementación Evaluación y resultados Conclusión Trabajo Futuro Bibliografía EXTRAER Y CUANTIFICAR