Este documento presenta un estudio sobre la caracterización geográfica de la población de la Ciudad de México a través del análisis de datos. Se propone una metodología que utiliza técnicas de aprendizaje automático como clustering y regresión para procesar datos estructurados y no estructurados con el fin de explorar la relación entre la población y su entorno. Los resultados incluyen la creación de conjuntos de datos que caracterizan aspectos sociales y mapas basados en este análisis.
Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...CIMAT
Salvador Ruiz Correa (https://www.cimat.mx/~src/), Jean Bernard Hayet (https://www.cimat.mx/~jbhayet/) and Diego Jiménez Badillo (http://archaeology.asu.edu/tm/Pages/equipodiego.html).
Resumen:
La capacidad de reconocer objetos en tiempo real es de gran utilidad en aplicaciones en visión computacional. Por ejemplo en aplicaciones de Realidad
Aumentada, la cual estudia las técnicas que permiten integrar, en tiempo real, contenido virtual con el mundo real, a través de un
dispositivo, como una computadora portátil o un dispositivo móvil.
El presente trabajo propone una metodología para el reconocimiento de objetos, utilizando descriptores SIFT para representar a un objeto y un
esquema de vecino más cercano para clasificar aquellos puntos sobresalientes en una escena que correspondan a un objeto, para posteriormente estimar la ubicación del mismo.
Al conocer una estimación de la ubicación del objeto, podemos crear diferentes aplicaciones que utilicen la ubicación estimada para realizar alguna
acción. En particular desarrollamos un sistema de Realidad Aumentada como parte de nuestro trabajo de investigación. Este sistema funge de asistencia a visitantes de museos, particularmente el Museo del Templo Mayor de la Ciudad de México.
El sistema diseñado cuenta con una interfaz gráfica, la cual utiliza la ubicación del objeto para dibujar sobre su contorno un polígono complejo
para señalizar que el objeto ha sido reconocido. De esta forma la interacción del usuario con el sistema es natural y dinámica.
La interacción se da cuando el usuario selecciona al objeto, en ese momento se despliega información acerca del objeto a través de una
página web que contiene elementos multimedia, mapas satelitales, visión de calle y vídeos.
Como parte de nuestros resultados generamos diferentes vídeos donde se muestra el funcionamiento del sistema, estos se pueden consultar en la
siguiente dirección web (http://mariocanulku.awardspace.info/).
La teoría de conjuntos difusos surgió hace cincuenta años. Esta teoría permite dar un tratamiento matemático-computacional a conceptos vagos del lenguaje natural. El interés de aplicar esta teoría a las bases de datos tiene ya unos treinta años. Sin embargo, hasta la fecha este es un tema que no ha sido completamente explorado. Los sistemas gestores de bases de datos en la actualidad siguen adoleciendo de problemas de rigidez en la representación de datos imperfectos y consultas basadas en preferencias del usuario y el contexto. Hace unos veinte años se propuso el un modelo de datos llamado GEFRED (GEneralized Fuzzy RElational Datamodel). Éste que permite representar relaciones difusas y atributos difusos. Basado en este modelo se han definido extensiones a SQL y se han implementado prototipos de sistemas gestores de bases de datos difusas. Sin embargo, aún hay desafíos que se presentan como temas de investigación y desarrollo: No está completamente resuelto para los datos difusos los problemas de ordenamiento, particionamiento, agregación y aritmética. Las estructuras de almacenamiento físico y recuperación de los manejadores relacional no se adecúan en forma directa. Hay mucho trabajo por hacer en Matemáticas e Informática para dar soporte consistente y eficiente a bases de datos difusas.
Conceptos básicos de lo que se conoce popularmente como Datamining y Machine Learning como introducción a un taller practico en análisis de genómica funcional.
es una operación de tratamiento o manipulación de datos espaciales realizada en un entorno SIG. Un Geoprocesamiento típico sería la operación de acceso a una base de datos espaciales, operar en aquella base de datos espaciales e incorporar el resultado de la operación como un nuevo dato al conjunto de datos espaciales.
Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...CIMAT
Salvador Ruiz Correa (https://www.cimat.mx/~src/), Jean Bernard Hayet (https://www.cimat.mx/~jbhayet/) and Diego Jiménez Badillo (http://archaeology.asu.edu/tm/Pages/equipodiego.html).
Resumen:
La capacidad de reconocer objetos en tiempo real es de gran utilidad en aplicaciones en visión computacional. Por ejemplo en aplicaciones de Realidad
Aumentada, la cual estudia las técnicas que permiten integrar, en tiempo real, contenido virtual con el mundo real, a través de un
dispositivo, como una computadora portátil o un dispositivo móvil.
El presente trabajo propone una metodología para el reconocimiento de objetos, utilizando descriptores SIFT para representar a un objeto y un
esquema de vecino más cercano para clasificar aquellos puntos sobresalientes en una escena que correspondan a un objeto, para posteriormente estimar la ubicación del mismo.
Al conocer una estimación de la ubicación del objeto, podemos crear diferentes aplicaciones que utilicen la ubicación estimada para realizar alguna
acción. En particular desarrollamos un sistema de Realidad Aumentada como parte de nuestro trabajo de investigación. Este sistema funge de asistencia a visitantes de museos, particularmente el Museo del Templo Mayor de la Ciudad de México.
El sistema diseñado cuenta con una interfaz gráfica, la cual utiliza la ubicación del objeto para dibujar sobre su contorno un polígono complejo
para señalizar que el objeto ha sido reconocido. De esta forma la interacción del usuario con el sistema es natural y dinámica.
La interacción se da cuando el usuario selecciona al objeto, en ese momento se despliega información acerca del objeto a través de una
página web que contiene elementos multimedia, mapas satelitales, visión de calle y vídeos.
Como parte de nuestros resultados generamos diferentes vídeos donde se muestra el funcionamiento del sistema, estos se pueden consultar en la
siguiente dirección web (http://mariocanulku.awardspace.info/).
La teoría de conjuntos difusos surgió hace cincuenta años. Esta teoría permite dar un tratamiento matemático-computacional a conceptos vagos del lenguaje natural. El interés de aplicar esta teoría a las bases de datos tiene ya unos treinta años. Sin embargo, hasta la fecha este es un tema que no ha sido completamente explorado. Los sistemas gestores de bases de datos en la actualidad siguen adoleciendo de problemas de rigidez en la representación de datos imperfectos y consultas basadas en preferencias del usuario y el contexto. Hace unos veinte años se propuso el un modelo de datos llamado GEFRED (GEneralized Fuzzy RElational Datamodel). Éste que permite representar relaciones difusas y atributos difusos. Basado en este modelo se han definido extensiones a SQL y se han implementado prototipos de sistemas gestores de bases de datos difusas. Sin embargo, aún hay desafíos que se presentan como temas de investigación y desarrollo: No está completamente resuelto para los datos difusos los problemas de ordenamiento, particionamiento, agregación y aritmética. Las estructuras de almacenamiento físico y recuperación de los manejadores relacional no se adecúan en forma directa. Hay mucho trabajo por hacer en Matemáticas e Informática para dar soporte consistente y eficiente a bases de datos difusas.
Conceptos básicos de lo que se conoce popularmente como Datamining y Machine Learning como introducción a un taller practico en análisis de genómica funcional.
es una operación de tratamiento o manipulación de datos espaciales realizada en un entorno SIG. Un Geoprocesamiento típico sería la operación de acceso a una base de datos espaciales, operar en aquella base de datos espaciales e incorporar el resultado de la operación como un nuevo dato al conjunto de datos espaciales.
Clasificación de acciones sociales usando computer visionSoftware Guru
En esta charla presentaré un proyecto surgido de la observación del proceso realizado para la evaluación de proyectos de impacto social.
Presentado por Ludim Sanchez
MACHINE LEARNING (Aprendizaje Automático) es la ciencia que permite que las computadoras aprendan y actúen como lo hacen los humanos, mejorando su aprendizaje a lo largo del tiempo de una forma autónoma, alimentándolas con datos e información en forma de observaciones e interacciones con el mundo real.
Explicación del algoritmo del Clustering K-Means.
Incluye un ejemplo numérico con la explicación matemática
Puedes ver el video de la explicación en https://www.youtube.com/watch?v=n98fnSEoRiM&t=265s
o visitar mi página en www.rociochavezml.com
SMM 2013 (Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Ap...CIMAT
Salvador Ruiz Correa (https://www.cimat.mx/~src/), Jean Bernard Hayet (https://www.cimat.mx/~jbhayet/) and Diego Jiménez Badillo (http://archaeology.asu.edu/tm/Pages/equipodiego.html).
Resumen:
La capacidad de reconocer objetos en tiempo real es de gran utilidad en aplicaciones en visión computacional. Por ejemplo en aplicaciones de Realidad
Aumentada, la cual estudia las técnicas que permiten integrar, en tiempo real, contenido virtual con el mundo real, a través de un
dispositivo, como una computadora portátil o un dispositivo móvil.
El presente trabajo propone una metodología para el reconocimiento de objetos, utilizando descriptores SIFT para representar a un objeto y un
esquema de vecino más cercano para clasificar aquellos puntos sobresalientes en una escena que correspondan a un objeto, para posteriormente estimar la ubicación del mismo.
Al conocer una estimación de la ubicación del objeto, podemos crear diferentes aplicaciones que utilicen la ubicación estimada para realizar alguna
acción. En particular desarrollamos un sistema de Realidad Aumentada como parte de nuestro trabajo de investigación. Este sistema funge de asistencia a visitantes de museos, particularmente el Museo del Templo Mayor de la Ciudad de México.
El sistema diseñado cuenta con una interfaz gráfica, la cual utiliza la ubicación del objeto para dibujar sobre su contorno un polígono complejo
para señalizar que el objeto ha sido reconocido. De esta forma la interacción del usuario con el sistema es natural y dinámica.
La interacción se da cuando el usuario selecciona al objeto, en ese momento se despliega información acerca del objeto a través de una
página web que contiene elementos multimedia, mapas satelitales, visión de calle y vídeos.
Como parte de nuestros resultados generamos diferentes vídeos donde se muestra el funcionamiento del sistema, estos se pueden consultar en la
siguiente dirección web (http://mariocanulku.awardspace.info/).
La minería de datos en el proceso de KDD donde se desarrollara los temas: Etapas de proceso de KDD,
Integración y recopilación, Selección, limpieza y transformación,
Minería de Datos, Evaluación e Interpretación, Difusión y uso; las cuales impartirán en cuatro horas semanales.los contenidos de la unidad 2.
ESTA PRESENTACIÓN SE PREPARÓ COMO PARTE DE UNA JORNADA DE SOCIALIZACIÓN DE LOS RESULTADOS DEL PROCESOS INVESTIGATIVO REALIZADO EN EL PROGRAMA DE INGENIERÍA DE SISTEMAS DE LA FUNDACIÓN UNIVERSITARIA KONRAD LORENZ
Seminario Almacenamiento de Datos Ambientales HoyCAESCG.org
Seminario "Almacenamiento de Datos Ambientales Hoy" impartido el 13/12/10 a los participantes del Proyecto Glocharid.
Ponentes: Isaac Francés y Balbino Fernández
Estructuras de datos avanzadas: Casos de uso realesSoftware Guru
La utilización de estructuras de datos adecuadas para cada problema hace que se simplifiquen en gran medida los tiempos de respuestas y la cantidad de cómputo realizada.
Por Nelson González
Más contenido relacionado
Similar a Caracterización geográfica de la población de la Ciudad de México
Clasificación de acciones sociales usando computer visionSoftware Guru
En esta charla presentaré un proyecto surgido de la observación del proceso realizado para la evaluación de proyectos de impacto social.
Presentado por Ludim Sanchez
MACHINE LEARNING (Aprendizaje Automático) es la ciencia que permite que las computadoras aprendan y actúen como lo hacen los humanos, mejorando su aprendizaje a lo largo del tiempo de una forma autónoma, alimentándolas con datos e información en forma de observaciones e interacciones con el mundo real.
Explicación del algoritmo del Clustering K-Means.
Incluye un ejemplo numérico con la explicación matemática
Puedes ver el video de la explicación en https://www.youtube.com/watch?v=n98fnSEoRiM&t=265s
o visitar mi página en www.rociochavezml.com
SMM 2013 (Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Ap...CIMAT
Salvador Ruiz Correa (https://www.cimat.mx/~src/), Jean Bernard Hayet (https://www.cimat.mx/~jbhayet/) and Diego Jiménez Badillo (http://archaeology.asu.edu/tm/Pages/equipodiego.html).
Resumen:
La capacidad de reconocer objetos en tiempo real es de gran utilidad en aplicaciones en visión computacional. Por ejemplo en aplicaciones de Realidad
Aumentada, la cual estudia las técnicas que permiten integrar, en tiempo real, contenido virtual con el mundo real, a través de un
dispositivo, como una computadora portátil o un dispositivo móvil.
El presente trabajo propone una metodología para el reconocimiento de objetos, utilizando descriptores SIFT para representar a un objeto y un
esquema de vecino más cercano para clasificar aquellos puntos sobresalientes en una escena que correspondan a un objeto, para posteriormente estimar la ubicación del mismo.
Al conocer una estimación de la ubicación del objeto, podemos crear diferentes aplicaciones que utilicen la ubicación estimada para realizar alguna
acción. En particular desarrollamos un sistema de Realidad Aumentada como parte de nuestro trabajo de investigación. Este sistema funge de asistencia a visitantes de museos, particularmente el Museo del Templo Mayor de la Ciudad de México.
El sistema diseñado cuenta con una interfaz gráfica, la cual utiliza la ubicación del objeto para dibujar sobre su contorno un polígono complejo
para señalizar que el objeto ha sido reconocido. De esta forma la interacción del usuario con el sistema es natural y dinámica.
La interacción se da cuando el usuario selecciona al objeto, en ese momento se despliega información acerca del objeto a través de una
página web que contiene elementos multimedia, mapas satelitales, visión de calle y vídeos.
Como parte de nuestros resultados generamos diferentes vídeos donde se muestra el funcionamiento del sistema, estos se pueden consultar en la
siguiente dirección web (http://mariocanulku.awardspace.info/).
La minería de datos en el proceso de KDD donde se desarrollara los temas: Etapas de proceso de KDD,
Integración y recopilación, Selección, limpieza y transformación,
Minería de Datos, Evaluación e Interpretación, Difusión y uso; las cuales impartirán en cuatro horas semanales.los contenidos de la unidad 2.
ESTA PRESENTACIÓN SE PREPARÓ COMO PARTE DE UNA JORNADA DE SOCIALIZACIÓN DE LOS RESULTADOS DEL PROCESOS INVESTIGATIVO REALIZADO EN EL PROGRAMA DE INGENIERÍA DE SISTEMAS DE LA FUNDACIÓN UNIVERSITARIA KONRAD LORENZ
Seminario Almacenamiento de Datos Ambientales HoyCAESCG.org
Seminario "Almacenamiento de Datos Ambientales Hoy" impartido el 13/12/10 a los participantes del Proyecto Glocharid.
Ponentes: Isaac Francés y Balbino Fernández
Estructuras de datos avanzadas: Casos de uso realesSoftware Guru
La utilización de estructuras de datos adecuadas para cada problema hace que se simplifiquen en gran medida los tiempos de respuestas y la cantidad de cómputo realizada.
Por Nelson González
Onboarding new members into an engineering team is not easy on anyone. In a short period of time, the new team member is required to be able to bring professional
Por Victoriya Kalmanovich
El secreto para ser un desarrollador SeniorSoftware Guru
En esta charla platicaremos sobre el “secreto” y el camino para llegar a ser un desarrollador Senior, experiencia, consejos y recomendaciones que en estos 8 años
Por René Sandoval
Apache Airflow es una plataforma en la que podemos crear flujos de datos de manera programática, planificarlos y monitorear de manera centralizada.
Por Yesi Díaz
How thick data can improve big data analysis for business:Software Guru
En esta presentación hablaré sobre cómo el Análisis de Datos Gruesos, específicamente el análisis antropológico y semiótico, puede ayudar a mejorar los resultados del Big Data
Por Martin Cuitzeo
CoDi® es la nueva forma de realizar pagos digitales desarrollada por el Banco de México. Por medio de CoDi puedes realizar cobros y pagos desde tu celular, utilizando una cuenta bancaria o de alguna institución financiera, sin comisiones.
Por Cristian Jaramillo
Gestionando la felicidad de los equipos con Management 3.0Software Guru
En las metodologías agiles hablamos de equipos colaborativos, autogestionados y felices. hablamos de lideres serviciales. El management 3.0 nos ayuda a cultivar el mindset correcto, aquel que servirá como el terreno fértil para que la agilidad florezca.
Por Andrea Vélez Cárdenas
Taller: Creación de Componentes Web re-usables con StencilJSSoftware Guru
Hoy por hoy las experiences de usuario pueden ser enriquecidas mediante el uso de Web Components, que son un estándar de la W3C soportado por la mayoría de los navegadores web modernos.
Por Alex Arriaga
Así publicamos las apps de Spotify sin stressSoftware Guru
En Spotify tenemos 1600+ ingenieros, trabajando en 280+ squads. Aún a esta escala, hemos logrado adoptar prácticas que nos han permitido acelerar la forma en que desarrollamos nuestro producto. Presentado por Erick Camacho en SG Virtual Conference 2020
Achieving Your Goals: 5 Tips to successfully achieve your goalsSoftware Guru
he measure of the executive, Peter F. Drucker reminds us, is the ability to "get the right things done." This involves having clarity on what are the right things as well as avoiding what is unproductive. Intelligence, creativity, and knowledge may all be wasted if not put to work on the things that matter.
Presentado por Cristina Nistor en SG Virtual Conference 2020
Acciones de comunidades tech en tiempos del Covid19Software Guru
Acciones de Comunidades Tech en tiempo del COVID-19 es una platica para informar acerca de las acciones que están realizando algunas comunidades de tecnología en México para luchar contra la propagación del COVID-19. Desde análisis de datos, visualizaciones, simulaciones de contagio, etc.
Presentado por Juana Martínez, Adriana Vallejo y Eduardo Ramírez en SG Virtual Conference 2020
De lo operativo a lo estratégico: un modelo de management de diseñoSoftware Guru
La charla presenta un modelo claro, generado por la ponente, para atender los niveles desde lo operativo a lo estratégico.
Presentado por Gabriela Salinas en SG Virtual Conference
Catalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador ValenciaAMADO SALVADOR
Descubre el catálogo general de la gama de productos de refrigeración del fabricante de electrodomésticos Miele, presentado por Amado Salvador distribuidor oficial Miele en Valencia. Como distribuidor oficial de electrodomésticos Miele, Amado Salvador ofrece una amplia selección de refrigeradores, congeladores y soluciones de refrigeración de alta calidad, resistencia y diseño superior de esta marca.
La gama de productos de Miele se caracteriza por su innovación tecnológica y eficiencia energética, garantizando que cada electrodoméstico no solo cumpla con las expectativas, sino que las supere. Los refrigeradores Miele están diseñados para ofrecer un rendimiento óptimo y una conservación perfecta de los alimentos, con características avanzadas como la tecnología de enfriamiento Dynamic Cooling, sistemas de almacenamiento flexible y acabados premium.
En este catálogo, encontrarás detalles sobre los distintos modelos de refrigeradores y congeladores Miele, incluyendo sus especificaciones técnicas, características destacadas y beneficios para el usuario. Amado Salvador, como distribuidor oficial de electrodomésticos Miele, garantiza que todos los productos cumplen con los más altos estándares de calidad y durabilidad.
Explora el catálogo completo y encuentra el refrigerador Miele perfecto para tu hogar con Amado Salvador, el distribuidor oficial de electrodomésticos Miele.
Catalogo Cajas Fuertes BTV Amado Salvador Distribuidor OficialAMADO SALVADOR
Explora el catálogo completo de cajas fuertes BTV, disponible a través de Amado Salvador, distribuidor oficial de BTV. Este catálogo presenta una amplia variedad de cajas fuertes, cada una diseñada con la más alta calidad para ofrecer la máxima seguridad y satisfacer las diversas necesidades de protección de nuestros clientes.
En Amado Salvador, como distribuidor oficial de BTV, ofrecemos productos que destacan por su innovación, durabilidad y robustez. Las cajas fuertes BTV son reconocidas por su eficiencia en la protección contra robos, incendios y otros riesgos, lo que las convierte en una opción ideal tanto para uso doméstico como comercial.
Amado Salvador, distribuidor oficial BTV, asegura que cada producto cumpla con los más estrictos estándares de calidad y seguridad. Al adquirir una caja fuerte a través de Amado Salvador, distribuidor oficial BTV, los clientes pueden tener la tranquilidad de que están obteniendo una solución confiable y duradera para la protección de sus pertenencias.
Este catálogo incluye detalles técnicos, características y opciones de personalización de cada modelo de caja fuerte BTV. Desde cajas fuertes empotrables hasta modelos de alta seguridad, Amado Salvador, como distribuidor oficial de BTV, tiene la solución perfecta para cualquier necesidad de seguridad. No pierdas la oportunidad de conocer todos los beneficios y características de las cajas fuertes BTV y protege lo que más valoras con la calidad y seguridad que solo BTV y Amado Salvador, distribuidor oficial BTV, pueden ofrecerte.
En este documento analizamos ciertos conceptos relacionados con la ficha 1 y 2. Y concluimos, dando el porque es importante desarrollar nuestras habilidades de pensamiento.
Sara Sofia Bedoya Montezuma.
9-1.
HPE presenta una competició destinada a estudiants, que busca fomentar habilitats tecnològiques i promoure la innovació en un entorn STEAM (Ciència, Tecnologia, Enginyeria, Arts i Matemàtiques). A través de diverses fases, els equips han de resoldre reptes mensuals basats en àrees com algorísmica, desenvolupament de programari, infraestructures tecnològiques, intel·ligència artificial i altres tecnologies. Els millors equips tenen l'oportunitat de desenvolupar un projecte més gran en una fase presencial final, on han de crear una solució concreta per a un conflicte real relacionat amb la sostenibilitat. Aquesta competició promou la inclusió, la sostenibilitat i l'accessibilitat tecnològica, alineant-se amb els Objectius de Desenvolupament Sostenible de l'ONU.
Caracterización geográfica de la población de la Ciudad de México
1. CARACTERIZACIÓN GEOGRÁFICA DE LA POBLACIÓN DECARACTERIZACIÓN GEOGRÁFICA DE LA POBLACIÓN DE
LA CIUDAD DE MÉXICOLA CIUDAD DE MÉXICO
Jacobo Gerardo González LeónJacobo Gerardo González León
https://sg.com.mx/dataday
#DataDayMx 1
2. "Mexico physical and human geography". DIVA-GIS. AutoCAD
3D
Área de oportunidad: caracterización de la relación entre la población y su
entorno geográfico, con base en el análisis de datos.
IntroducciónIntroducción
2
3. ¿Cómo explorar el contexto social, económico y demográfico desde un enfoque
científico e interdisciplinario con técnicas de aprendizaje automatizado?
"Zona oriente, con mayor presencia de captores".
El Universal. 06/02/2017
Planteamiento del problemaPlanteamiento del problema
Estrategia IA-MX 2018
3
4. Conjunto de datos conocido X
Función desconocida enf X
Aproximación def^ f
Esto es el aprendizaje f^
Objetivo: encontrar la función que generalice o describa af^ X
Knox S.: Machine Learning: a Concise Introduction. Wiley, 2018.
Aprendizaje AutomatizadoAprendizaje Automatizado
Neuralnet simple function approximation
4 . 1
6. Problema del aprendizajeProblema del aprendizaje
Abu-Mostafa Y., Magdon-Ismail M., Lin H.: Learning From Data. AMLBook, 2012.
Configuración básica del problema del aprendizaje
4 . 3
7. DataData
Par dominio-rango (X, f(X)) Dominio (X)
Aprendizaje Supervizado Aprendizaje No Supervizado
(x , y ) … (x , y ) ∈1 1 n n X × f(X)
Encontrar una función
que generalice (X) f^
(x ) … (x ) ∈1 n X
Encontrar una función
que describa (X) f^
4 . 4
9. ObjetivoObjetivo
Diseñar una metodología para el análisis de la percepción social y su
entorno, a partir del procesamiento de datos obtenido desde fuentes
estructuradas y no estructuradas, usando técnicas de Machine Learning
5
10. EnfoqueEnfoque
Formalizar el proceso de Ciencia de Datos para conjuntos de datos
mixtos
Análisis de la percepción social y su entorno con técnicas de
aprendizaje automatizado no supervisado
Predicción de fenómenos humanos, con técnicas de aprendizaje
automatizado supervsiado, a partir de su caracterización
6
21. ImputeImpute
Regression para numéricos Random Forest para categóricos
Stekhoven D., Bühlmann P.: MissForest—non-parametric missing value imputation for mixed-type data, Bioinformatics, 28(1), 112–118 (2012) 9 . 7
22. TransformarTransformar
Patki N..: The Synthetic Data Vault: Generative Modeling for Relational Databases, MIT (2016)
El método que convierte variables categóricos a numéricos
9 . 8
24. Tendencia delTendencia del clusteringclustering
Estadística deEstadística de HopkinsHopkins
Banerjee A., Dave R.: Validating clusters using the Hopkins statistic. 2004 IEEE International Conference on Fuzzy Systems, vol.1, pp. 149-153. Budapest,
Hungary (2004)
H =
x + y
i=1
∑
n
i
i=1
∑
n
i
y
i=1
∑
n
i
Objetivo: cálcular la probabilidad de que dichos datos procedan de una
distribución uniforme
x :i dist(p , p ) i j
y :i dist(q , q ) i j
10 . 1
25. Tendencia delTendencia del clusteringclustering
Estadística deEstadística de HopkinsHopkins
Hipótesis 1 no es uniformemente distribuido {0 < H < 0.5} : D
H=0.167
Hipótesis 2 es uniformemente distribuido {0.5 ≤ H ≤ 1} : D
10 . 2
26. Tendencia delTendencia del clusteringclustering
VATVAT: visual assessment of cluster tendency: visual assessment of cluster tendency
Bezdek J., Hathaway R.: VAT: a tool for visual assessment of (cluster) tendency. Proceedings of the 2002 International Joint Conference on Neural Networks, vol.3, vol.3, pp.
2225-2230. HI, USA, (2002)
Rojo: alta similaridad dist(x , y ) ≈i j 0
Azul: baja similaridad dist(x , y ) ≈i j 1
10 . 3
27. Medidas internas delMedidas internas del ClusteringClustering
Desgraupes B.: Clustering Indices. University Paris Ouest. Lab Modal’ X, (2017)
Index = cohesi noˊ
separaci noˊ
Método para determinar la mejor partición
11 . 1
28. Medidas internas delMedidas internas del ClusteringClustering
Índice Calinski-Harabasz: la razón entre la dispersión interior de los clusters y la
dispersión entre los clusters.
Índice Dunn: la razón entre la distancia más pequeña entre las observaciones de
diferentes clusters y la distancia inter-cluster más grande
11 . 2
29. ÍndiceÍndice DunnDunn
D = =dmax
dmin
D
1≤i≤j≤n
max k
d
k=k/ ′
min kk′
: la mayor distancia dentro del cluster d max
: distancia mínima entre puntos de diferentes clusters d min
: diámetro del cluster D k
: cluster a k
: cluster b k ′
11 . 3
30. D = WGSS/(N−k)
BGSS/(k−1)
: la dispersión entre clusters BGSS
: número de clusters k
: número de observaciones N
: la dispersión dentro de los clusters WGSS
ÍndiceÍndice Calinsky-HarabaszCalinsky-Harabasz
11 . 4
31. Algoritmos deAlgoritmos de ClusteringClustering
Partición: k-meansPartición: k-means
Hartigan J., Wong M.: Algorithm AS 136: A K-means clustering algorithm. Applied Statistics, 28(0), 100-108 (1979)
Índice Dunn
12 . 1
33. Algoritmos deAlgoritmos de ClusteringClustering
Densidad: DBSCANDensidad: DBSCAN
(Density-based spatial clustering of applications with noise)
Algorithm of DBSCAN
Kassambara A.: Practical Guide to Cluster Analysis in R. Unsupervised Machine Learning. STHDA (2017) 12 . 3
46. Catálogo Único de Claves de Áreas Geoestadísticas Estatales, Municipales y Localidades. http://www.inegi.org.mx/ último acceso 11/10/18
DiscusiónDiscusión
Datos Localidades Municipios
Catálogo de
Localidades
Nacional
304,221 2,463
ENH 5,640 1,422
15 . 1
47. Catálogo Único de Claves de Áreas Geoestadísticas Estatales, Municipales y Localidades. http://www.inegi.org.mx/ último acceso 11/10/18
DiscusiónDiscusión
15 . 2
48. ConclusionesConclusiones
Se generó una metodología para data sets mixtos basada en el estado
del arte del aprendizaje automatizado
Se están creando data sets con la caracterización de diversos aspectos
sociales, a partir del análisis con técnicas de clustering
Se están creando mapas con esta caracterización
15 . 3