SlideShare una empresa de Scribd logo
La Importancia Estratégica de
Considerar Mezclas de Distribuciones
Moyocoyani Molina Espíritu
alchemsp3@gmail.com
https://sg.com.mx/dataday
#DataDayMx
Conociendo al ponente…
¡Comenzamos!
Gaussiana
el caballo de
batalla desde
tiempos
inmemorables
Puede representar:
El peso promedio de una
población
Puntos por partido de un
equipo de baloncesto
Palabras tecleadas por
minuto
Sin embargo, muchas veces,
casi siempre, no existe una sola
población…
Imaginen que están a cargo de una campaña de
mailing
Investigación de horarios del target
Resultados muestran la existencia
de dos poblaciones
¿Qué hacer?
promedio
¿Considerar un valor
promedio?
Caso 1.
promedio
promedio
¿Considerar dos poblaciones
diferentes?
promedio
promedio
Considerar dos poblaciones
diferentes
Caso 11.
Modelos de mezcla de distribuciones
Actividad en
twitter a lo
largo del día
La población
de los
electrones
Ley de mortalidad
de Gompertz-
Makeham
¿Qué es una distribución
normal?
¿Qué es una
distribución normal?
𝑓 𝑥 𝜇, 𝜎 =
1
2𝜋𝜎2
𝑒
−
(𝑥−𝜇)2
2𝜎2
𝑓 𝑥 𝜇, 𝜎 =
1
2𝜋𝜎2
𝑒
−
(𝑥−𝜇)2
2𝜎2
𝑓 𝑥 𝜇, 𝜎 =
1
2𝜋𝜎2
𝑒
−
(𝑥−𝜇)2
2𝜎2
Parámetro de
localización
𝑓 𝑥 𝜇, 𝜎 =
1
2𝜋𝜎2
𝑒
−
(𝑥−𝜇)2
2𝜎2
Parámetro de
escalabilidad y
dispersión
¿Qué es una
distribución normal?
𝑓 𝑥 𝜇, 𝜎 =
1
2𝜋𝜎2
𝑒
−
(𝑥−𝜇)2
2𝜎2
𝜎 = 1
𝜎 = 2
𝜎 = 3
Parámetro de
escalabilidad y
dispersión
Recordemos que…
Muchas veces, casi siempre, no
existe una sola población…
Sin embargo…
¿Qué es una mezcla de
distribuciones?
𝑓1 𝑥 𝜇1, 𝜎1 =
1
2𝜋𝜎1
2
𝑒
−
(𝑥−𝜇1)2
2𝜎1
2
𝑓2 𝑥 𝜇2, 𝜎2 =
1
2𝜋𝜎2
2
𝑒
−
(𝑥−𝜇2)2
2𝜎2
2
𝐹 𝑥 𝜃 = 𝜆1 𝑓1 𝑥 𝜃1 + 𝜆2 𝑓2 𝑥 𝜃2
𝑓1 𝑥 𝜇1, 𝜎1 =
1
2𝜋𝜎1
2
𝑒
−
(𝑥−𝜇1)2
2𝜎1
2
𝑓2 𝑥 𝜇2, 𝜎2 =
1
2𝜋𝜎2
2
𝑒
−
(𝑥−𝜇2)2
2𝜎2
2
Gaussian Mixture Model
(GMM), es el caballo de
batalla para modelos de
mezcla de distribuciones
Ejemplos
Actividad en twitter
a lo largo del día
Distribución por hora del
día
#MachineLearning
Distribución por hora del
día
#VivaMéxico
Distribución por hora del
día
#Elecciones2018
How?
Extracción de
tweets vía API
twepy
from sklearn.mixture
import
GaussianMixture
Interactive dataviz con
Tableau
Archivo json Clasificación por
horarios
Insights y
dashboards
Herramientas
Outputs
La población de los
electrones
Un átomo como una población de
electrones
Zona rica en
electrones
Zona deficiente
en electrones Núcleo
Zona rica en
electrones
Zona deficiente
en electrones
Recuerdan una gaussiana?
Probabilidad de
encontrar
electrones aumenta
cerca del núcleo
Probabilidad de
encontrar
electrones
disminuye lejos del
núcleo
Un átomo como una población de
electrones
Orbital: Elemento de
volumen donde es
probable encontrar un
electrón
Entre más electrones contenga un
átomo, más compleja es la forma del
orbital
Densidad
electrónica
The Shape of the…
atoms
Una molécula es una
combinación de dos o más
átomos
¡Su complejidad
aumenta
descomunalmente!
Mezcla de distribuciones…
en moléculas
Orbital… Gaussiano
𝜉 𝑟 = 𝛾 𝑙, 𝛼 𝑟 𝑙
𝑒−𝛼𝑟2
Aproximación de un orbital
atómico
𝜙𝑖 𝑟 =
𝑗=1
𝑁
𝑐𝑗𝑖 𝜉𝑗
Orbital molecular es una
combinación de orbitales
atómicos… ¡cómo el GMM!
Orbital… Gaussiano
𝜉 𝑟 = 𝛾 𝑙, 𝛼 𝑟 𝑙
𝑒−𝛼𝑟2
Aproximación de un orbital
atómico
𝜙𝑖 𝑟 =
𝑗=1
𝑁
𝑐𝑗𝑖 𝜉𝑗
Orbital molecular es una
combinación de orbitales
atómicos… ¡cómo el GMM!
Visualizando…
𝜉1 𝑟 𝜉2 𝑟 𝜙(𝑟)
Por ejemplo…
O
H
H
Una molécula
de agua
(H2O)
Varios cálculos después…
Se obtiene función de
densidad de
probabilidades
electrónica
Tres “poblaciones”… dos
hidrógenos y un oxígeno
¿De que sirve esa
información?
Averiguar regiones que
pueden donar electronesSeguir el
flujo
electrónico
de una
molécula
Las moléculas nos enseñan que
pueden existir distribuciones de
poblaciones diferentes que pueden
correlacionarse y que la densidad
poblacional nos brinda información
sobre un sistema complejo
Ley de mortalidad
de Gompertz-
Makeham
Mortalidad en México – INEGI 2015
¿Cómo abordarla?
Distribución de Gompertz
𝑔 𝑥 𝜂, 𝛽 = 𝛽𝜂𝑒 𝜂
exp −𝜂𝑒 𝛽𝑥
¿Gompertz Mixture Model?
Proyecto
personal
𝐺 𝑥 𝜂𝑖, 𝛽𝑖 =
𝑖=1
𝑁
𝑔𝑖 𝑥 𝜂𝑖, 𝛽𝑖 +
𝑖=1
𝑁
𝑓𝑗 𝑥 𝜇 𝑗, 𝜎𝑗
How?
from scipy.stats
import gompertz
Interactive dataviz con
Tableau
Distribuciones
calculadas
Mejores
parámetros
Insights y
dashboards
Herramientas
Outputs
from scipy.stats
import norm
Optimization
Log likelihood
En desarrollo…
Real Calculada
G_x = gompertz.pdf(x,1,loc=0,scale=2) +
40*gompertz.pdf(x,.0001,loc=0,scale=10) +
.75*norm.pdf(x,loc=30,scale=6)
Conclusiones
Conclusiones
La mezcla de distribuciones no se limita a un solo campo
Puede extenderse a diferentes funciones de
distribución de probabilidades
Conocer a tu población te permitirá
mejorar la personalización de tu producto o
servicio (one-to-one or Human-to-Human)
つづく…
Datos de contacto: Moyocoyani Molina Espíritu (Data Scientist @ OCC Mundial)
alchemsp3@gmail.com @MoiYo Moyocoyani Molina-Espíritu

Más contenido relacionado

Más de Software Guru

Estructuras de datos avanzadas: Casos de uso reales
Estructuras de datos avanzadas: Casos de uso realesEstructuras de datos avanzadas: Casos de uso reales
Estructuras de datos avanzadas: Casos de uso reales
Software Guru
 
Building bias-aware environments
Building bias-aware environmentsBuilding bias-aware environments
Building bias-aware environments
Software Guru
 
El secreto para ser un desarrollador Senior
El secreto para ser un desarrollador SeniorEl secreto para ser un desarrollador Senior
El secreto para ser un desarrollador Senior
Software Guru
 
Cómo encontrar el trabajo remoto ideal
Cómo encontrar el trabajo remoto idealCómo encontrar el trabajo remoto ideal
Cómo encontrar el trabajo remoto ideal
Software Guru
 
Automatizando ideas con Apache Airflow
Automatizando ideas con Apache AirflowAutomatizando ideas con Apache Airflow
Automatizando ideas con Apache Airflow
Software Guru
 
How thick data can improve big data analysis for business:
How thick data can improve big data analysis for business:How thick data can improve big data analysis for business:
How thick data can improve big data analysis for business:
Software Guru
 
Introducción al machine learning
Introducción al machine learningIntroducción al machine learning
Introducción al machine learning
Software Guru
 
Democratizando el uso de CoDi
Democratizando el uso de CoDiDemocratizando el uso de CoDi
Democratizando el uso de CoDi
Software Guru
 
Gestionando la felicidad de los equipos con Management 3.0
Gestionando la felicidad de los equipos con Management 3.0Gestionando la felicidad de los equipos con Management 3.0
Gestionando la felicidad de los equipos con Management 3.0
Software Guru
 
Taller: Creación de Componentes Web re-usables con StencilJS
Taller: Creación de Componentes Web re-usables con StencilJSTaller: Creación de Componentes Web re-usables con StencilJS
Taller: Creación de Componentes Web re-usables con StencilJS
Software Guru
 
El camino del full stack developer (o como hacemos en SERTI para que no solo ...
El camino del full stack developer (o como hacemos en SERTI para que no solo ...El camino del full stack developer (o como hacemos en SERTI para que no solo ...
El camino del full stack developer (o como hacemos en SERTI para que no solo ...
Software Guru
 
¿Qué significa ser un programador en Bitso?
¿Qué significa ser un programador en Bitso?¿Qué significa ser un programador en Bitso?
¿Qué significa ser un programador en Bitso?
Software Guru
 
Colaboración efectiva entre desarrolladores del cliente y tu equipo.
Colaboración efectiva entre desarrolladores del cliente y tu equipo.Colaboración efectiva entre desarrolladores del cliente y tu equipo.
Colaboración efectiva entre desarrolladores del cliente y tu equipo.
Software Guru
 
Pruebas de integración con Docker en Azure DevOps
Pruebas de integración con Docker en Azure DevOpsPruebas de integración con Docker en Azure DevOps
Pruebas de integración con Docker en Azure DevOps
Software Guru
 
Elixir + Elm: Usando lenguajes funcionales en servicios productivos
Elixir + Elm: Usando lenguajes funcionales en servicios productivosElixir + Elm: Usando lenguajes funcionales en servicios productivos
Elixir + Elm: Usando lenguajes funcionales en servicios productivos
Software Guru
 
Así publicamos las apps de Spotify sin stress
Así publicamos las apps de Spotify sin stressAsí publicamos las apps de Spotify sin stress
Así publicamos las apps de Spotify sin stress
Software Guru
 
Achieving Your Goals: 5 Tips to successfully achieve your goals
Achieving Your Goals: 5 Tips to successfully achieve your goalsAchieving Your Goals: 5 Tips to successfully achieve your goals
Achieving Your Goals: 5 Tips to successfully achieve your goals
Software Guru
 
Acciones de comunidades tech en tiempos del Covid19
Acciones de comunidades tech en tiempos del Covid19Acciones de comunidades tech en tiempos del Covid19
Acciones de comunidades tech en tiempos del Covid19
Software Guru
 
De lo operativo a lo estratégico: un modelo de management de diseño
De lo operativo a lo estratégico: un modelo de management de diseñoDe lo operativo a lo estratégico: un modelo de management de diseño
De lo operativo a lo estratégico: un modelo de management de diseño
Software Guru
 
La importancia de crear User Personas y Escenarios
La importancia de crear User Personas y EscenariosLa importancia de crear User Personas y Escenarios
La importancia de crear User Personas y Escenarios
Software Guru
 

Más de Software Guru (20)

Estructuras de datos avanzadas: Casos de uso reales
Estructuras de datos avanzadas: Casos de uso realesEstructuras de datos avanzadas: Casos de uso reales
Estructuras de datos avanzadas: Casos de uso reales
 
Building bias-aware environments
Building bias-aware environmentsBuilding bias-aware environments
Building bias-aware environments
 
El secreto para ser un desarrollador Senior
El secreto para ser un desarrollador SeniorEl secreto para ser un desarrollador Senior
El secreto para ser un desarrollador Senior
 
Cómo encontrar el trabajo remoto ideal
Cómo encontrar el trabajo remoto idealCómo encontrar el trabajo remoto ideal
Cómo encontrar el trabajo remoto ideal
 
Automatizando ideas con Apache Airflow
Automatizando ideas con Apache AirflowAutomatizando ideas con Apache Airflow
Automatizando ideas con Apache Airflow
 
How thick data can improve big data analysis for business:
How thick data can improve big data analysis for business:How thick data can improve big data analysis for business:
How thick data can improve big data analysis for business:
 
Introducción al machine learning
Introducción al machine learningIntroducción al machine learning
Introducción al machine learning
 
Democratizando el uso de CoDi
Democratizando el uso de CoDiDemocratizando el uso de CoDi
Democratizando el uso de CoDi
 
Gestionando la felicidad de los equipos con Management 3.0
Gestionando la felicidad de los equipos con Management 3.0Gestionando la felicidad de los equipos con Management 3.0
Gestionando la felicidad de los equipos con Management 3.0
 
Taller: Creación de Componentes Web re-usables con StencilJS
Taller: Creación de Componentes Web re-usables con StencilJSTaller: Creación de Componentes Web re-usables con StencilJS
Taller: Creación de Componentes Web re-usables con StencilJS
 
El camino del full stack developer (o como hacemos en SERTI para que no solo ...
El camino del full stack developer (o como hacemos en SERTI para que no solo ...El camino del full stack developer (o como hacemos en SERTI para que no solo ...
El camino del full stack developer (o como hacemos en SERTI para que no solo ...
 
¿Qué significa ser un programador en Bitso?
¿Qué significa ser un programador en Bitso?¿Qué significa ser un programador en Bitso?
¿Qué significa ser un programador en Bitso?
 
Colaboración efectiva entre desarrolladores del cliente y tu equipo.
Colaboración efectiva entre desarrolladores del cliente y tu equipo.Colaboración efectiva entre desarrolladores del cliente y tu equipo.
Colaboración efectiva entre desarrolladores del cliente y tu equipo.
 
Pruebas de integración con Docker en Azure DevOps
Pruebas de integración con Docker en Azure DevOpsPruebas de integración con Docker en Azure DevOps
Pruebas de integración con Docker en Azure DevOps
 
Elixir + Elm: Usando lenguajes funcionales en servicios productivos
Elixir + Elm: Usando lenguajes funcionales en servicios productivosElixir + Elm: Usando lenguajes funcionales en servicios productivos
Elixir + Elm: Usando lenguajes funcionales en servicios productivos
 
Así publicamos las apps de Spotify sin stress
Así publicamos las apps de Spotify sin stressAsí publicamos las apps de Spotify sin stress
Así publicamos las apps de Spotify sin stress
 
Achieving Your Goals: 5 Tips to successfully achieve your goals
Achieving Your Goals: 5 Tips to successfully achieve your goalsAchieving Your Goals: 5 Tips to successfully achieve your goals
Achieving Your Goals: 5 Tips to successfully achieve your goals
 
Acciones de comunidades tech en tiempos del Covid19
Acciones de comunidades tech en tiempos del Covid19Acciones de comunidades tech en tiempos del Covid19
Acciones de comunidades tech en tiempos del Covid19
 
De lo operativo a lo estratégico: un modelo de management de diseño
De lo operativo a lo estratégico: un modelo de management de diseñoDe lo operativo a lo estratégico: un modelo de management de diseño
De lo operativo a lo estratégico: un modelo de management de diseño
 
La importancia de crear User Personas y Escenarios
La importancia de crear User Personas y EscenariosLa importancia de crear User Personas y Escenarios
La importancia de crear User Personas y Escenarios
 

Último

Todo sobre Minirobotica. Revista Saber Electronica
Todo sobre  Minirobotica. Revista Saber ElectronicaTodo sobre  Minirobotica. Revista Saber Electronica
Todo sobre Minirobotica. Revista Saber Electronica
Carlos Carlosnoemi
 
Conceptos Básicos de Programación Proyecto
Conceptos Básicos de Programación ProyectoConceptos Básicos de Programación Proyecto
Conceptos Básicos de Programación Proyecto
cofferub
 
Manual de Soporte y mantenimiento de equipo de cómputos
Manual de Soporte y mantenimiento de equipo de cómputosManual de Soporte y mantenimiento de equipo de cómputos
Manual de Soporte y mantenimiento de equipo de cómputos
cbtechchihuahua
 
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
CesarPazosQuispe
 
Informe DATA & IA 2024 Primera encuesta sobre el uso de IA en las empresas pe...
Informe DATA & IA 2024 Primera encuesta sobre el uso de IA en las empresas pe...Informe DATA & IA 2024 Primera encuesta sobre el uso de IA en las empresas pe...
Informe DATA & IA 2024 Primera encuesta sobre el uso de IA en las empresas pe...
alejandromanuelve
 
SISTESIS RETO4 Grupo4 co-creadores .ppsx
SISTESIS RETO4 Grupo4 co-creadores .ppsxSISTESIS RETO4 Grupo4 co-creadores .ppsx
SISTESIS RETO4 Grupo4 co-creadores .ppsx
tamarita881
 
computacion global 3.pdf pARA TERCER GRADO
computacion global 3.pdf pARA TERCER GRADOcomputacion global 3.pdf pARA TERCER GRADO
computacion global 3.pdf pARA TERCER GRADO
YaniEscobar2
 
absorcion de gases y practicas de laboratorios
absorcion de gases y practicas de laboratoriosabsorcion de gases y practicas de laboratorios
absorcion de gases y practicas de laboratorios
JuanAlvarez413513
 
Presentacion de Estado del Arte del The Clean
Presentacion de Estado del Arte del The CleanPresentacion de Estado del Arte del The Clean
Presentacion de Estado del Arte del The Clean
juanchogame18
 
Informació Projecte Iniciativa TIC HPE.pdf
Informació Projecte Iniciativa TIC HPE.pdfInformació Projecte Iniciativa TIC HPE.pdf
Informació Projecte Iniciativa TIC HPE.pdf
Festibity
 
actividad 2 tecnologia (3).pdf junto con mis compañeros
actividad 2 tecnologia (3).pdf junto con mis compañerosactividad 2 tecnologia (3).pdf junto con mis compañeros
actividad 2 tecnologia (3).pdf junto con mis compañeros
aljitagallego
 
INFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTAL
INFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTALINFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTAL
INFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTAL
CrystalRomero18
 
HERRAMIENTAS WEB--------------------.pptx
HERRAMIENTAS WEB--------------------.pptxHERRAMIENTAS WEB--------------------.pptx
HERRAMIENTAS WEB--------------------.pptx
maralache30
 
Conceptos básicos de programación 10-5.pdf
Conceptos básicos de programación 10-5.pdfConceptos básicos de programación 10-5.pdf
Conceptos básicos de programación 10-5.pdf
ValeriaAyala48
 
Catalogo General Electrodomesticos Teka Distribuidor Oficial Amado Salvador V...
Catalogo General Electrodomesticos Teka Distribuidor Oficial Amado Salvador V...Catalogo General Electrodomesticos Teka Distribuidor Oficial Amado Salvador V...
Catalogo General Electrodomesticos Teka Distribuidor Oficial Amado Salvador V...
AMADO SALVADOR
 
IA en entornos rurales aplicada a la viticultura
IA en entornos rurales aplicada a la viticulturaIA en entornos rurales aplicada a la viticultura
IA en entornos rurales aplicada a la viticultura
Miguel Rebollo
 
Catalogo Cajas Fuertes BTV Amado Salvador Distribuidor Oficial
Catalogo Cajas Fuertes BTV Amado Salvador Distribuidor OficialCatalogo Cajas Fuertes BTV Amado Salvador Distribuidor Oficial
Catalogo Cajas Fuertes BTV Amado Salvador Distribuidor Oficial
AMADO SALVADOR
 
TECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVA
TECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVATECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVA
TECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVA
LilibethEstupian
 
Informació Projecte Iniciativa TIC SOPRA STERIA.pdf
Informació Projecte Iniciativa TIC SOPRA STERIA.pdfInformació Projecte Iniciativa TIC SOPRA STERIA.pdf
Informació Projecte Iniciativa TIC SOPRA STERIA.pdf
Festibity
 
Catalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador Valencia
Catalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador ValenciaCatalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador Valencia
Catalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador Valencia
AMADO SALVADOR
 

Último (20)

Todo sobre Minirobotica. Revista Saber Electronica
Todo sobre  Minirobotica. Revista Saber ElectronicaTodo sobre  Minirobotica. Revista Saber Electronica
Todo sobre Minirobotica. Revista Saber Electronica
 
Conceptos Básicos de Programación Proyecto
Conceptos Básicos de Programación ProyectoConceptos Básicos de Programación Proyecto
Conceptos Básicos de Programación Proyecto
 
Manual de Soporte y mantenimiento de equipo de cómputos
Manual de Soporte y mantenimiento de equipo de cómputosManual de Soporte y mantenimiento de equipo de cómputos
Manual de Soporte y mantenimiento de equipo de cómputos
 
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
Semana 10_MATRIZ IPER_UPN_ADM_03.06.2024
 
Informe DATA & IA 2024 Primera encuesta sobre el uso de IA en las empresas pe...
Informe DATA & IA 2024 Primera encuesta sobre el uso de IA en las empresas pe...Informe DATA & IA 2024 Primera encuesta sobre el uso de IA en las empresas pe...
Informe DATA & IA 2024 Primera encuesta sobre el uso de IA en las empresas pe...
 
SISTESIS RETO4 Grupo4 co-creadores .ppsx
SISTESIS RETO4 Grupo4 co-creadores .ppsxSISTESIS RETO4 Grupo4 co-creadores .ppsx
SISTESIS RETO4 Grupo4 co-creadores .ppsx
 
computacion global 3.pdf pARA TERCER GRADO
computacion global 3.pdf pARA TERCER GRADOcomputacion global 3.pdf pARA TERCER GRADO
computacion global 3.pdf pARA TERCER GRADO
 
absorcion de gases y practicas de laboratorios
absorcion de gases y practicas de laboratoriosabsorcion de gases y practicas de laboratorios
absorcion de gases y practicas de laboratorios
 
Presentacion de Estado del Arte del The Clean
Presentacion de Estado del Arte del The CleanPresentacion de Estado del Arte del The Clean
Presentacion de Estado del Arte del The Clean
 
Informació Projecte Iniciativa TIC HPE.pdf
Informació Projecte Iniciativa TIC HPE.pdfInformació Projecte Iniciativa TIC HPE.pdf
Informació Projecte Iniciativa TIC HPE.pdf
 
actividad 2 tecnologia (3).pdf junto con mis compañeros
actividad 2 tecnologia (3).pdf junto con mis compañerosactividad 2 tecnologia (3).pdf junto con mis compañeros
actividad 2 tecnologia (3).pdf junto con mis compañeros
 
INFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTAL
INFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTALINFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTAL
INFORME DE LAS FICHAS.docx.pdf LICEO DEPARTAMENTAL
 
HERRAMIENTAS WEB--------------------.pptx
HERRAMIENTAS WEB--------------------.pptxHERRAMIENTAS WEB--------------------.pptx
HERRAMIENTAS WEB--------------------.pptx
 
Conceptos básicos de programación 10-5.pdf
Conceptos básicos de programación 10-5.pdfConceptos básicos de programación 10-5.pdf
Conceptos básicos de programación 10-5.pdf
 
Catalogo General Electrodomesticos Teka Distribuidor Oficial Amado Salvador V...
Catalogo General Electrodomesticos Teka Distribuidor Oficial Amado Salvador V...Catalogo General Electrodomesticos Teka Distribuidor Oficial Amado Salvador V...
Catalogo General Electrodomesticos Teka Distribuidor Oficial Amado Salvador V...
 
IA en entornos rurales aplicada a la viticultura
IA en entornos rurales aplicada a la viticulturaIA en entornos rurales aplicada a la viticultura
IA en entornos rurales aplicada a la viticultura
 
Catalogo Cajas Fuertes BTV Amado Salvador Distribuidor Oficial
Catalogo Cajas Fuertes BTV Amado Salvador Distribuidor OficialCatalogo Cajas Fuertes BTV Amado Salvador Distribuidor Oficial
Catalogo Cajas Fuertes BTV Amado Salvador Distribuidor Oficial
 
TECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVA
TECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVATECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVA
TECLADO ERGONÓMICO Y PANTALLAS TACTILES - GESTIÓN INTEGRAL EDUCATIVA
 
Informació Projecte Iniciativa TIC SOPRA STERIA.pdf
Informació Projecte Iniciativa TIC SOPRA STERIA.pdfInformació Projecte Iniciativa TIC SOPRA STERIA.pdf
Informació Projecte Iniciativa TIC SOPRA STERIA.pdf
 
Catalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador Valencia
Catalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador ValenciaCatalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador Valencia
Catalogo Refrigeracion Miele Distribuidor Oficial Amado Salvador Valencia
 

La importancia estratégica de considerar mezclas de distribuciones

  • 1. La Importancia Estratégica de Considerar Mezclas de Distribuciones Moyocoyani Molina Espíritu alchemsp3@gmail.com https://sg.com.mx/dataday #DataDayMx
  • 4. Gaussiana el caballo de batalla desde tiempos inmemorables Puede representar: El peso promedio de una población Puntos por partido de un equipo de baloncesto Palabras tecleadas por minuto
  • 5. Sin embargo, muchas veces, casi siempre, no existe una sola población…
  • 6. Imaginen que están a cargo de una campaña de mailing Investigación de horarios del target Resultados muestran la existencia de dos poblaciones ¿Qué hacer?
  • 9. Modelos de mezcla de distribuciones Actividad en twitter a lo largo del día La población de los electrones Ley de mortalidad de Gompertz- Makeham
  • 10. ¿Qué es una distribución normal?
  • 11. ¿Qué es una distribución normal? 𝑓 𝑥 𝜇, 𝜎 = 1 2𝜋𝜎2 𝑒 − (𝑥−𝜇)2 2𝜎2 𝑓 𝑥 𝜇, 𝜎 = 1 2𝜋𝜎2 𝑒 − (𝑥−𝜇)2 2𝜎2 𝑓 𝑥 𝜇, 𝜎 = 1 2𝜋𝜎2 𝑒 − (𝑥−𝜇)2 2𝜎2 Parámetro de localización 𝑓 𝑥 𝜇, 𝜎 = 1 2𝜋𝜎2 𝑒 − (𝑥−𝜇)2 2𝜎2 Parámetro de escalabilidad y dispersión
  • 12. ¿Qué es una distribución normal? 𝑓 𝑥 𝜇, 𝜎 = 1 2𝜋𝜎2 𝑒 − (𝑥−𝜇)2 2𝜎2 𝜎 = 1 𝜎 = 2 𝜎 = 3 Parámetro de escalabilidad y dispersión
  • 13. Recordemos que… Muchas veces, casi siempre, no existe una sola población… Sin embargo…
  • 14. ¿Qué es una mezcla de distribuciones?
  • 15. 𝑓1 𝑥 𝜇1, 𝜎1 = 1 2𝜋𝜎1 2 𝑒 − (𝑥−𝜇1)2 2𝜎1 2 𝑓2 𝑥 𝜇2, 𝜎2 = 1 2𝜋𝜎2 2 𝑒 − (𝑥−𝜇2)2 2𝜎2 2 𝐹 𝑥 𝜃 = 𝜆1 𝑓1 𝑥 𝜃1 + 𝜆2 𝑓2 𝑥 𝜃2
  • 16. 𝑓1 𝑥 𝜇1, 𝜎1 = 1 2𝜋𝜎1 2 𝑒 − (𝑥−𝜇1)2 2𝜎1 2 𝑓2 𝑥 𝜇2, 𝜎2 = 1 2𝜋𝜎2 2 𝑒 − (𝑥−𝜇2)2 2𝜎2 2 Gaussian Mixture Model (GMM), es el caballo de batalla para modelos de mezcla de distribuciones
  • 18. Actividad en twitter a lo largo del día
  • 19. Distribución por hora del día #MachineLearning
  • 20. Distribución por hora del día #VivaMéxico
  • 21. Distribución por hora del día #Elecciones2018
  • 22. How? Extracción de tweets vía API twepy from sklearn.mixture import GaussianMixture Interactive dataviz con Tableau Archivo json Clasificación por horarios Insights y dashboards Herramientas Outputs
  • 23. La población de los electrones
  • 24. Un átomo como una población de electrones Zona rica en electrones Zona deficiente en electrones Núcleo Zona rica en electrones Zona deficiente en electrones Recuerdan una gaussiana? Probabilidad de encontrar electrones aumenta cerca del núcleo Probabilidad de encontrar electrones disminuye lejos del núcleo
  • 25. Un átomo como una población de electrones Orbital: Elemento de volumen donde es probable encontrar un electrón
  • 26. Entre más electrones contenga un átomo, más compleja es la forma del orbital Densidad electrónica The Shape of the… atoms Una molécula es una combinación de dos o más átomos ¡Su complejidad aumenta descomunalmente!
  • 28. Orbital… Gaussiano 𝜉 𝑟 = 𝛾 𝑙, 𝛼 𝑟 𝑙 𝑒−𝛼𝑟2 Aproximación de un orbital atómico 𝜙𝑖 𝑟 = 𝑗=1 𝑁 𝑐𝑗𝑖 𝜉𝑗 Orbital molecular es una combinación de orbitales atómicos… ¡cómo el GMM!
  • 29. Orbital… Gaussiano 𝜉 𝑟 = 𝛾 𝑙, 𝛼 𝑟 𝑙 𝑒−𝛼𝑟2 Aproximación de un orbital atómico 𝜙𝑖 𝑟 = 𝑗=1 𝑁 𝑐𝑗𝑖 𝜉𝑗 Orbital molecular es una combinación de orbitales atómicos… ¡cómo el GMM! Visualizando… 𝜉1 𝑟 𝜉2 𝑟 𝜙(𝑟)
  • 30. Por ejemplo… O H H Una molécula de agua (H2O) Varios cálculos después…
  • 31. Se obtiene función de densidad de probabilidades electrónica Tres “poblaciones”… dos hidrógenos y un oxígeno ¿De que sirve esa información? Averiguar regiones que pueden donar electronesSeguir el flujo electrónico de una molécula
  • 32. Las moléculas nos enseñan que pueden existir distribuciones de poblaciones diferentes que pueden correlacionarse y que la densidad poblacional nos brinda información sobre un sistema complejo
  • 33. Ley de mortalidad de Gompertz- Makeham
  • 34. Mortalidad en México – INEGI 2015 ¿Cómo abordarla? Distribución de Gompertz 𝑔 𝑥 𝜂, 𝛽 = 𝛽𝜂𝑒 𝜂 exp −𝜂𝑒 𝛽𝑥
  • 35. ¿Gompertz Mixture Model? Proyecto personal 𝐺 𝑥 𝜂𝑖, 𝛽𝑖 = 𝑖=1 𝑁 𝑔𝑖 𝑥 𝜂𝑖, 𝛽𝑖 + 𝑖=1 𝑁 𝑓𝑗 𝑥 𝜇 𝑗, 𝜎𝑗
  • 36. How? from scipy.stats import gompertz Interactive dataviz con Tableau Distribuciones calculadas Mejores parámetros Insights y dashboards Herramientas Outputs from scipy.stats import norm Optimization Log likelihood
  • 37. En desarrollo… Real Calculada G_x = gompertz.pdf(x,1,loc=0,scale=2) + 40*gompertz.pdf(x,.0001,loc=0,scale=10) + .75*norm.pdf(x,loc=30,scale=6)
  • 39. Conclusiones La mezcla de distribuciones no se limita a un solo campo Puede extenderse a diferentes funciones de distribución de probabilidades Conocer a tu población te permitirá mejorar la personalización de tu producto o servicio (one-to-one or Human-to-Human)
  • 40. つづく… Datos de contacto: Moyocoyani Molina Espíritu (Data Scientist @ OCC Mundial) alchemsp3@gmail.com @MoiYo Moyocoyani Molina-Espíritu

Notas del editor

  1. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  2. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  3. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  4. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  5. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  6. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  7. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  8. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  9. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  10. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  11. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  12. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  13. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  14. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  15. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  16. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  17. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  18. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  19. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  20. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  21. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  22. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  23. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  24. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  25. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  26. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  27. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  28. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  29. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  30. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  31. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  32. Poner gaussianas con información difetrente de acuerdo a los ejemplos
  33. Poner gaussianas con información difetrente de acuerdo a los ejemplos