SlideShare una empresa de Scribd logo
1 de 37
Descargar para leer sin conexión
1
Historias de DS
desde la trinchera
Historias malas, buenas, y feas, mexicanas, y del mundo.
Copyright © @xuxoramos 2017
"All models are wrong, but
some are useful"
- George E.P. Box
2
Objetivo
Identificar
patrones
equivocándose
lo menor posible.
3Copyright © @xuxoramos 2017
Cómo lo logra?
Balanceando
componentes del
error
4Copyright © @xuxoramos 2017
X1 X2 Y
X1 X2 YX3
X1 X2 YX3 X4
X1 X2 YX3 X4 X5 X6
X1 X2 YX3 X4 X5 X6 X7 X8
¡Aquí es donde se concentran mates,
estadística, lógica y ética!
- Lógica para tener higiene argumentativa y hacer la pregunta correcta
- Estadística para evaluar la aportación de información de éstas
- Mates para modelar este conjunto y reflejar fielmente la realidad
- Ética para reconocer sesgos y tratarlos
11
...Y donde más se equivoca
la gente.
A veces a propósito...
12
13
Historias Buenas
"DS done right"
14Copyright © @xuxoramos 2017
15
Historias Malas
Google Img Classifier
16Copyright © @xuxoramos 2017
Microsoft's TweetBot Tay
17Copyright © @xuxoramos 2017
Google Flu Trends
18Copyright © @xuxoramos 2017
Solid Gold Bomb
19Copyright © @xuxoramos 2017
Score de reincidencia
20Copyright © @xuxoramos 2017
2008 Subprime Mortgage Crisis
21Copyright © @xuxoramos 2017
Cambridge Analytica
22Copyright © @xuxoramos 2017
Y México?
23Copyright © @xuxoramos 2017
- Telcel identifica con clustering un grupo de usrs que
consume $7,000 MXN de tiempo aire en prepago.
- Con aprendizaje supervisado crea un producto de crédito
para estos clientes.
- Le trae 4mdp anuales en facturación.
- Luego hacen georeferenciación de estos clientes.
- Todos están en Sinaloa y Tamaulipas.
- ¿Qué tipo de personas creen que eran?
Y México?
24Copyright © @xuxoramos 2017
- Durante el sismo del 19S, Codeando México atrae un
grupo de programadores que quieren entrenar una red
neuronal para detectar daño estrucural con fotos de TW.
- Todas las fotos están taggeadas con #RevisaMiGrieta,
pero son solo 600.
- Las redes neuronales necesitan decenas de miles de
fotos, de lo contrario arrojarán muchos falsos positivos y
falsos negativos.
- ¿Qué costo social pueden tener estas equivocaciones?
¿Cómo anda MX en análisis de
datos?
113K Ingenieros de Software al año.
350 Matemáticos, físicos y estadísticos.
No se conoce la diferencia entre Data Scientist (DS) y Data Engineer
(DE).
Tenemos miles de Data Engineers talentosos.
No tenemos casi Data Scientists.
Tenemos muchos DE queriendo ser DS sin las bases de mates o proba.
+
25Copyright © @xuxoramos 2017
¿Cómo anda MX en análisis de
datos?
En 1982 México le entró al modelo neoliberal con la economía de maquila.
La SEP instruyó al sistema educativo eliminar la filosofía y mates de las
ingenierías. Era más importante producir gente con capacidades
secundarias, repetibles y transferibles, que crear conocimiento.
La ingeniería en compu es la más afectada. La reducen a recetas de cocina.
Algunas universidades autónomas se salvan.
Fast forward a 2018: 11 generaciones de ingenieros que razonan con
falacias, y cuyas matemáticas más avanzadas llegan solo a cálculo.
+
26Copyright © @xuxoramos 2017
Con todo esto, ¿debemos
convertirnos en hub de
talento para DS?
27
¿Qué tenemos en contra?
La frontera norte se cierra a nuestros productos y servicios.
Poco petróleo, y a precio muy bajo.
Corrupción rampante.
Mercado interno débil.
Variables macroeconómicas malas.
La "mano de obra barata" no será relevante en la era de la
automatización.
28Copyright © @xuxoramos 2017
Debe México convertirse en un
hub de Ciencia de Datos?
Sí.
29Copyright © @xuxoramos 2017
Cómo pueden ayudar?
Entra a un programa académico completo.
Regresa a la escuela a aprender mates.
Usa la educación abierta en internet para hacer tu propia maestría.
Únete a grupos profesionales.
Únete a comunidades.
30Copyright © @xuxoramos 2017
Mates aplicadas @ ITAM, UNAM, IPN
Física @ UNAM
Economía @ ITAM, UNAM
MSc Ciencia de Datos @ ITAM
MSc Inteligencia Analítica @ UAnáhuac
MSc Ciencia de Datos @ CIMAT
Programas académicos en MX*
+
* Evaluación de 63 candidatos para posiciones de Ciencia de Datos en Bolsa
Mexicana de Valores, GBM, TERAN/TBWA, Klustera, Globant, OPI y ConCrédito.
31Copyright © @xuxoramos 2017
Intro to Mathematical Thinking: Stanford + Coursera
Intro to Logic: Stanford + Coursera
Business Analytics: Wharton + Coursera
Data Science Specialization: JHU + Coursera
Machine Learning: Stanford + Coursera
Executive Data Science: JHU + Coursera
"Hága su propia maestría"*
* Ver ratings de cursos en https://www.class-central.com/ 32Copyright © @xuxoramos 2017
The Data Pub (FB: /thedatapub, TW: @thedatapub)
+1800 miembros. Meetups cada último Jueves del mes.
Cursos de Stats & Machine Learning para Developers.
Job posting - porque las empresas están perdidas.
Badges - porque los endorsements de LinkedIn son "la hoguera de las
vanidades".
Hackathones: Walmart, Grupo Modelo.
Grupos Profesionales
33Copyright © @xuxoramos 2017
El Juramento del Científico de Datos
34
Discusiones pendientes:
¡Machine Learning Ethics!
35
36
Grax!
@xuxoramos
jesus@datank.ai
LinkedIn
Github
FB
37Copyright © @xuxoramos 2017

Más contenido relacionado

La actualidad más candente

작은 레벨 디자인 가이드 01
작은 레벨 디자인 가이드 01작은 레벨 디자인 가이드 01
작은 레벨 디자인 가이드 01용태 이
 
레벨 디자인의 구성
레벨 디자인의 구성레벨 디자인의 구성
레벨 디자인의 구성준태 김
 
게임제작개론 : #5 플레이어에 대한 이해
게임제작개론 : #5 플레이어에 대한 이해게임제작개론 : #5 플레이어에 대한 이해
게임제작개론 : #5 플레이어에 대한 이해Seungmo Koo
 
Game Design - Lecture 3
Game Design - Lecture 3Game Design - Lecture 3
Game Design - Lecture 3Andrea Resmini
 
Best Fiends Design and Monetization Audit
Best Fiends Design and Monetization AuditBest Fiends Design and Monetization Audit
Best Fiends Design and Monetization AuditTony Gowland
 
Game Design Merit Badge Presentation
Game Design Merit Badge Presentation Game Design Merit Badge Presentation
Game Design Merit Badge Presentation Robert Casto
 
LANZAMIENTO MARTILLO 2º A.
LANZAMIENTO MARTILLO 2º A.LANZAMIENTO MARTILLO 2º A.
LANZAMIENTO MARTILLO 2º A.ravenegas
 
국내인디게임개발자의현실
국내인디게임개발자의현실국내인디게임개발자의현실
국내인디게임개발자의현실Mingu Heo
 
Beyond Gamification: Architecting Engagement Through Game Design Thinking
Beyond Gamification: Architecting Engagement Through Game Design ThinkingBeyond Gamification: Architecting Engagement Through Game Design Thinking
Beyond Gamification: Architecting Engagement Through Game Design ThinkingDustin DiTommaso
 
Unite Seoul 2016 - 스매싱 더 배틀의 멀티플랫폼 개발
Unite Seoul 2016 - 스매싱 더 배틀의 멀티플랫폼 개발 Unite Seoul 2016 - 스매싱 더 배틀의 멀티플랫폼 개발
Unite Seoul 2016 - 스매싱 더 배틀의 멀티플랫폼 개발 Daehoon Han
 
Kongregate - Maximizing Player Retention and Monetization in Free-to-Play Gam...
Kongregate - Maximizing Player Retention and Monetization in Free-to-Play Gam...Kongregate - Maximizing Player Retention and Monetization in Free-to-Play Gam...
Kongregate - Maximizing Player Retention and Monetization in Free-to-Play Gam...David Piao Chiu
 
NDC 2012 이은석 - 게임회사 취업특강 (커리어세션)
NDC 2012 이은석 - 게임회사 취업특강 (커리어세션)NDC 2012 이은석 - 게임회사 취업특강 (커리어세션)
NDC 2012 이은석 - 게임회사 취업특강 (커리어세션)Eunseok Yi
 
【Unite Tokyo 2018】『崩壊3rd』開発者が語るアニメ風レンダリングの極意
【Unite Tokyo 2018】『崩壊3rd』開発者が語るアニメ風レンダリングの極意【Unite Tokyo 2018】『崩壊3rd』開発者が語るアニメ風レンダリングの極意
【Unite Tokyo 2018】『崩壊3rd』開発者が語るアニメ風レンダリングの極意UnityTechnologiesJapan002
 
게임제작개론 : #7 팀 역할과 게임 리소스에 대한 이해
게임제작개론 : #7 팀 역할과 게임 리소스에 대한 이해게임제작개론 : #7 팀 역할과 게임 리소스에 대한 이해
게임제작개론 : #7 팀 역할과 게임 리소스에 대한 이해Seungmo Koo
 
KGC 2013 - 5일만에 레벨 디자인하기
KGC 2013 - 5일만에 레벨 디자인하기KGC 2013 - 5일만에 레벨 디자인하기
KGC 2013 - 5일만에 레벨 디자인하기용태 이
 
게임업계에서 내가 하고 싶은 일 찾는 방법
게임업계에서 내가 하고 싶은 일 찾는 방법게임업계에서 내가 하고 싶은 일 찾는 방법
게임업계에서 내가 하고 싶은 일 찾는 방법Donghun Lee
 

La actualidad más candente (20)

작은 레벨 디자인 가이드 01
작은 레벨 디자인 가이드 01작은 레벨 디자인 가이드 01
작은 레벨 디자인 가이드 01
 
레벨 디자인의 구성
레벨 디자인의 구성레벨 디자인의 구성
레벨 디자인의 구성
 
게임제작개론 : #5 플레이어에 대한 이해
게임제작개론 : #5 플레이어에 대한 이해게임제작개론 : #5 플레이어에 대한 이해
게임제작개론 : #5 플레이어에 대한 이해
 
Game Design - Lecture 3
Game Design - Lecture 3Game Design - Lecture 3
Game Design - Lecture 3
 
Evolution of Playstation
Evolution of PlaystationEvolution of Playstation
Evolution of Playstation
 
Best Fiends Design and Monetization Audit
Best Fiends Design and Monetization AuditBest Fiends Design and Monetization Audit
Best Fiends Design and Monetization Audit
 
Game Design Merit Badge Presentation
Game Design Merit Badge Presentation Game Design Merit Badge Presentation
Game Design Merit Badge Presentation
 
LANZAMIENTO MARTILLO 2º A.
LANZAMIENTO MARTILLO 2º A.LANZAMIENTO MARTILLO 2º A.
LANZAMIENTO MARTILLO 2º A.
 
국내인디게임개발자의현실
국내인디게임개발자의현실국내인디게임개발자의현실
국내인디게임개발자의현실
 
Billiards
BilliardsBilliards
Billiards
 
Beyond Gamification: Architecting Engagement Through Game Design Thinking
Beyond Gamification: Architecting Engagement Through Game Design ThinkingBeyond Gamification: Architecting Engagement Through Game Design Thinking
Beyond Gamification: Architecting Engagement Through Game Design Thinking
 
Unite Seoul 2016 - 스매싱 더 배틀의 멀티플랫폼 개발
Unite Seoul 2016 - 스매싱 더 배틀의 멀티플랫폼 개발 Unite Seoul 2016 - 스매싱 더 배틀의 멀티플랫폼 개발
Unite Seoul 2016 - 스매싱 더 배틀의 멀티플랫폼 개발
 
Game Industry Company Presentation and Project Template - IDEA 2015
Game Industry Company Presentation and Project Template - IDEA 2015Game Industry Company Presentation and Project Template - IDEA 2015
Game Industry Company Presentation and Project Template - IDEA 2015
 
Kongregate - Maximizing Player Retention and Monetization in Free-to-Play Gam...
Kongregate - Maximizing Player Retention and Monetization in Free-to-Play Gam...Kongregate - Maximizing Player Retention and Monetization in Free-to-Play Gam...
Kongregate - Maximizing Player Retention and Monetization in Free-to-Play Gam...
 
NDC 2012 이은석 - 게임회사 취업특강 (커리어세션)
NDC 2012 이은석 - 게임회사 취업특강 (커리어세션)NDC 2012 이은석 - 게임회사 취업특강 (커리어세션)
NDC 2012 이은석 - 게임회사 취업특강 (커리어세션)
 
【Unite Tokyo 2018】『崩壊3rd』開発者が語るアニメ風レンダリングの極意
【Unite Tokyo 2018】『崩壊3rd』開発者が語るアニメ風レンダリングの極意【Unite Tokyo 2018】『崩壊3rd』開発者が語るアニメ風レンダリングの極意
【Unite Tokyo 2018】『崩壊3rd』開発者が語るアニメ風レンダリングの極意
 
Poker face
Poker facePoker face
Poker face
 
게임제작개론 : #7 팀 역할과 게임 리소스에 대한 이해
게임제작개론 : #7 팀 역할과 게임 리소스에 대한 이해게임제작개론 : #7 팀 역할과 게임 리소스에 대한 이해
게임제작개론 : #7 팀 역할과 게임 리소스에 대한 이해
 
KGC 2013 - 5일만에 레벨 디자인하기
KGC 2013 - 5일만에 레벨 디자인하기KGC 2013 - 5일만에 레벨 디자인하기
KGC 2013 - 5일만에 레벨 디자인하기
 
게임업계에서 내가 하고 싶은 일 찾는 방법
게임업계에서 내가 하고 싶은 일 찾는 방법게임업계에서 내가 하고 싶은 일 찾는 방법
게임업계에서 내가 하고 싶은 일 찾는 방법
 

Similar a Historias de Ciencia de Datos desde la Trinchera

Entrepreneurship with Data, Machine Learning and AI
Entrepreneurship with Data, Machine Learning and AIEntrepreneurship with Data, Machine Learning and AI
Entrepreneurship with Data, Machine Learning and AIJesus Ramos
 
Emprendiendo con Data Science, Machine Learning y AI
Emprendiendo con Data Science, Machine Learning y AIEmprendiendo con Data Science, Machine Learning y AI
Emprendiendo con Data Science, Machine Learning y AISoftware Guru
 
WTF with Big Data?
WTF with Big Data?WTF with Big Data?
WTF with Big Data?Jesus Ramos
 
Estadistica y Machine Learning para Todos
Estadistica y Machine Learning para TodosEstadistica y Machine Learning para Todos
Estadistica y Machine Learning para TodosJesus Ramos
 
Introducción a la Teoría de Juegos con aplicación a las Ciencias de la Comput...
Introducción a la Teoría de Juegos con aplicación a las Ciencias de la Comput...Introducción a la Teoría de Juegos con aplicación a las Ciencias de la Comput...
Introducción a la Teoría de Juegos con aplicación a las Ciencias de la Comput...Egdares Futch H.
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónErnesto Mislej
 
El futuro del trabajo En la Era de la Singularidad Tecnológica
El futuro del trabajo En la Era de la Singularidad TecnológicaEl futuro del trabajo En la Era de la Singularidad Tecnológica
El futuro del trabajo En la Era de la Singularidad TecnológicaRoberto Ponieman
 
Nuevas formas de comunicación en una escuela hiperconectada. Del Bigdata al ...
Nuevas formas de comunicación  en una escuela hiperconectada. Del Bigdata al ...Nuevas formas de comunicación  en una escuela hiperconectada. Del Bigdata al ...
Nuevas formas de comunicación en una escuela hiperconectada. Del Bigdata al ...Juan Miguel Muñoz
 
Inteligencia Artificial en las aulas de los institutos
Inteligencia Artificial en las aulas de los institutosInteligencia Artificial en las aulas de los institutos
Inteligencia Artificial en las aulas de los institutosmanaitam
 
Profesiones en matemáticas
Profesiones en matemáticas Profesiones en matemáticas
Profesiones en matemáticas Rosa E Padilla
 
Sesion 2 gerencia de ti cs u de m abril-2015
Sesion 2   gerencia de ti cs  u de m   abril-2015Sesion 2   gerencia de ti cs  u de m   abril-2015
Sesion 2 gerencia de ti cs u de m abril-2015Mauricio Arias
 
EMBD2018 | Small Data y Dark Data: reconstruyendo la información del futuro.
EMBD2018 | Small Data y Dark Data: reconstruyendo la información del futuro.EMBD2018 | Small Data y Dark Data: reconstruyendo la información del futuro.
EMBD2018 | Small Data y Dark Data: reconstruyendo la información del futuro.Laybor EMBdata Training & Consulting
 
De la Inteligencia Artificial a la sabiduría humana
De la Inteligencia Artificial a la sabiduría humanaDe la Inteligencia Artificial a la sabiduría humana
De la Inteligencia Artificial a la sabiduría humanaNeus Lorenzo
 
Big Data y el ERP en México
Big Data y el ERP en MéxicoBig Data y el ERP en México
Big Data y el ERP en MéxicoSoftware Guru
 
Solid Day - Machine learning para organizaciones
Solid Day - Machine learning para organizacionesSolid Day - Machine learning para organizaciones
Solid Day - Machine learning para organizacionesSoftware Guru
 
Charla CADE - IA: hacia un uso responsable
Charla CADE - IA: hacia un uso responsableCharla CADE - IA: hacia un uso responsable
Charla CADE - IA: hacia un uso responsableFernando Cormenzana
 
Nestor Marquez Transformación Digital, Conferencista, México,
Nestor Marquez Transformación Digital, Conferencista, México, Nestor Marquez Transformación Digital, Conferencista, México,
Nestor Marquez Transformación Digital, Conferencista, México, Future Experts
 
Antonio Bahamonde - IA y Ciencia de datos: contexto y perspectiva
Antonio Bahamonde - IA y Ciencia de datos: contexto y perspectivaAntonio Bahamonde - IA y Ciencia de datos: contexto y perspectiva
Antonio Bahamonde - IA y Ciencia de datos: contexto y perspectivaCOIICV
 

Similar a Historias de Ciencia de Datos desde la Trinchera (20)

Entrepreneurship with Data, Machine Learning and AI
Entrepreneurship with Data, Machine Learning and AIEntrepreneurship with Data, Machine Learning and AI
Entrepreneurship with Data, Machine Learning and AI
 
Emprendiendo con Data Science, Machine Learning y AI
Emprendiendo con Data Science, Machine Learning y AIEmprendiendo con Data Science, Machine Learning y AI
Emprendiendo con Data Science, Machine Learning y AI
 
WTF with Big Data?
WTF with Big Data?WTF with Big Data?
WTF with Big Data?
 
Estadistica y Machine Learning para Todos
Estadistica y Machine Learning para TodosEstadistica y Machine Learning para Todos
Estadistica y Machine Learning para Todos
 
Introducción a la Teoría de Juegos con aplicación a las Ciencias de la Comput...
Introducción a la Teoría de Juegos con aplicación a las Ciencias de la Comput...Introducción a la Teoría de Juegos con aplicación a las Ciencias de la Comput...
Introducción a la Teoría de Juegos con aplicación a las Ciencias de la Comput...
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - Introducción
 
El futuro del trabajo En la Era de la Singularidad Tecnológica
El futuro del trabajo En la Era de la Singularidad TecnológicaEl futuro del trabajo En la Era de la Singularidad Tecnológica
El futuro del trabajo En la Era de la Singularidad Tecnológica
 
Transformación Digital y Redes Sociales
Transformación Digital y Redes SocialesTransformación Digital y Redes Sociales
Transformación Digital y Redes Sociales
 
Nuevas formas de comunicación en una escuela hiperconectada. Del Bigdata al ...
Nuevas formas de comunicación  en una escuela hiperconectada. Del Bigdata al ...Nuevas formas de comunicación  en una escuela hiperconectada. Del Bigdata al ...
Nuevas formas de comunicación en una escuela hiperconectada. Del Bigdata al ...
 
Inteligencia Artificial en las aulas de los institutos
Inteligencia Artificial en las aulas de los institutosInteligencia Artificial en las aulas de los institutos
Inteligencia Artificial en las aulas de los institutos
 
Profesiones en matemáticas
Profesiones en matemáticas Profesiones en matemáticas
Profesiones en matemáticas
 
Sesion 2 gerencia de ti cs u de m abril-2015
Sesion 2   gerencia de ti cs  u de m   abril-2015Sesion 2   gerencia de ti cs  u de m   abril-2015
Sesion 2 gerencia de ti cs u de m abril-2015
 
EMBD2018 | Small Data y Dark Data: reconstruyendo la información del futuro.
EMBD2018 | Small Data y Dark Data: reconstruyendo la información del futuro.EMBD2018 | Small Data y Dark Data: reconstruyendo la información del futuro.
EMBD2018 | Small Data y Dark Data: reconstruyendo la información del futuro.
 
Retos y desafíos del Big Data
Retos y desafíos del Big Data Retos y desafíos del Big Data
Retos y desafíos del Big Data
 
De la Inteligencia Artificial a la sabiduría humana
De la Inteligencia Artificial a la sabiduría humanaDe la Inteligencia Artificial a la sabiduría humana
De la Inteligencia Artificial a la sabiduría humana
 
Big Data y el ERP en México
Big Data y el ERP en MéxicoBig Data y el ERP en México
Big Data y el ERP en México
 
Solid Day - Machine learning para organizaciones
Solid Day - Machine learning para organizacionesSolid Day - Machine learning para organizaciones
Solid Day - Machine learning para organizaciones
 
Charla CADE - IA: hacia un uso responsable
Charla CADE - IA: hacia un uso responsableCharla CADE - IA: hacia un uso responsable
Charla CADE - IA: hacia un uso responsable
 
Nestor Marquez Transformación Digital, Conferencista, México,
Nestor Marquez Transformación Digital, Conferencista, México, Nestor Marquez Transformación Digital, Conferencista, México,
Nestor Marquez Transformación Digital, Conferencista, México,
 
Antonio Bahamonde - IA y Ciencia de datos: contexto y perspectiva
Antonio Bahamonde - IA y Ciencia de datos: contexto y perspectivaAntonio Bahamonde - IA y Ciencia de datos: contexto y perspectiva
Antonio Bahamonde - IA y Ciencia de datos: contexto y perspectiva
 

Más de Jesus Ramos

Formando Equipos de Ciencia de Datos
Formando Equipos de Ciencia de DatosFormando Equipos de Ciencia de Datos
Formando Equipos de Ciencia de DatosJesus Ramos
 
Practical Machine Ethics @ SXSW2019
Practical Machine Ethics @ SXSW2019Practical Machine Ethics @ SXSW2019
Practical Machine Ethics @ SXSW2019Jesus Ramos
 
Inferencia Estadística para Periodistas
Inferencia Estadística para PeriodistasInferencia Estadística para Periodistas
Inferencia Estadística para PeriodistasJesus Ramos
 
Data Quality for Data Science Projects
Data Quality for Data Science ProjectsData Quality for Data Science Projects
Data Quality for Data Science ProjectsJesus Ramos
 
Algorithmic Transparency
Algorithmic TransparencyAlgorithmic Transparency
Algorithmic TransparencyJesus Ramos
 
Mexican Landscape of DS & AI
Mexican Landscape of DS & AIMexican Landscape of DS & AI
Mexican Landscape of DS & AIJesus Ramos
 
Machine Learning For Organizations
Machine Learning For OrganizationsMachine Learning For Organizations
Machine Learning For OrganizationsJesus Ramos
 
Wonderful Wacky Wide World of Data Analysis Applications
Wonderful Wacky Wide World of Data Analysis ApplicationsWonderful Wacky Wide World of Data Analysis Applications
Wonderful Wacky Wide World of Data Analysis ApplicationsJesus Ramos
 
Big Data, Big Flops: The gag reel of algorithms
Big Data, Big Flops: The gag reel of algorithmsBig Data, Big Flops: The gag reel of algorithms
Big Data, Big Flops: The gag reel of algorithmsJesus Ramos
 
Big Data, Big Disappointment (@TheDataPub)
Big Data, Big Disappointment (@TheDataPub)Big Data, Big Disappointment (@TheDataPub)
Big Data, Big Disappointment (@TheDataPub)Jesus Ramos
 
Big Data, Big Disappointment
Big Data, Big DisappointmentBig Data, Big Disappointment
Big Data, Big DisappointmentJesus Ramos
 

Más de Jesus Ramos (11)

Formando Equipos de Ciencia de Datos
Formando Equipos de Ciencia de DatosFormando Equipos de Ciencia de Datos
Formando Equipos de Ciencia de Datos
 
Practical Machine Ethics @ SXSW2019
Practical Machine Ethics @ SXSW2019Practical Machine Ethics @ SXSW2019
Practical Machine Ethics @ SXSW2019
 
Inferencia Estadística para Periodistas
Inferencia Estadística para PeriodistasInferencia Estadística para Periodistas
Inferencia Estadística para Periodistas
 
Data Quality for Data Science Projects
Data Quality for Data Science ProjectsData Quality for Data Science Projects
Data Quality for Data Science Projects
 
Algorithmic Transparency
Algorithmic TransparencyAlgorithmic Transparency
Algorithmic Transparency
 
Mexican Landscape of DS & AI
Mexican Landscape of DS & AIMexican Landscape of DS & AI
Mexican Landscape of DS & AI
 
Machine Learning For Organizations
Machine Learning For OrganizationsMachine Learning For Organizations
Machine Learning For Organizations
 
Wonderful Wacky Wide World of Data Analysis Applications
Wonderful Wacky Wide World of Data Analysis ApplicationsWonderful Wacky Wide World of Data Analysis Applications
Wonderful Wacky Wide World of Data Analysis Applications
 
Big Data, Big Flops: The gag reel of algorithms
Big Data, Big Flops: The gag reel of algorithmsBig Data, Big Flops: The gag reel of algorithms
Big Data, Big Flops: The gag reel of algorithms
 
Big Data, Big Disappointment (@TheDataPub)
Big Data, Big Disappointment (@TheDataPub)Big Data, Big Disappointment (@TheDataPub)
Big Data, Big Disappointment (@TheDataPub)
 
Big Data, Big Disappointment
Big Data, Big DisappointmentBig Data, Big Disappointment
Big Data, Big Disappointment
 

Último

Pobreza porcentual por etnia para el año (2024).pdf
Pobreza porcentual por etnia para el año (2024).pdfPobreza porcentual por etnia para el año (2024).pdf
Pobreza porcentual por etnia para el año (2024).pdfJC Díaz Herrera
 
Paisajismo Chino - Vegetacion y su historia
Paisajismo Chino - Vegetacion y su historiaPaisajismo Chino - Vegetacion y su historia
Paisajismo Chino - Vegetacion y su historiaAlexander VA
 
01 SIMULACRO 2024.pdf unijjajajajjaaaajj
01 SIMULACRO 2024.pdf unijjajajajjaaaajj01 SIMULACRO 2024.pdf unijjajajajjaaaajj
01 SIMULACRO 2024.pdf unijjajajajjaaaajjmatiasccoyllomarca
 
Seguridad y privacidad (1).pptx OdayYoah
Seguridad y privacidad (1).pptx OdayYoahSeguridad y privacidad (1).pptx OdayYoah
Seguridad y privacidad (1).pptx OdayYoahodalisnicoles
 
SISTEMA DE CONTROL INTERNO - GRSM - GRUPO 5.pptx
SISTEMA DE CONTROL INTERNO - GRSM - GRUPO 5.pptxSISTEMA DE CONTROL INTERNO - GRSM - GRUPO 5.pptx
SISTEMA DE CONTROL INTERNO - GRSM - GRUPO 5.pptxTAMINCHIPONCEANILDAD
 
METODOLOGIA DE INVESTIGACION DE MARIO BUNGE
METODOLOGIA DE INVESTIGACION DE MARIO BUNGEMETODOLOGIA DE INVESTIGACION DE MARIO BUNGE
METODOLOGIA DE INVESTIGACION DE MARIO BUNGEBrusRimasccaHuarancc
 
2287-Texto del artículo-1259innova9-1-10-20230909.pdf
2287-Texto del artículo-1259innova9-1-10-20230909.pdf2287-Texto del artículo-1259innova9-1-10-20230909.pdf
2287-Texto del artículo-1259innova9-1-10-20230909.pdfCamiloVasconez
 
Formas Farmacéuticas segun la FEUM..........
Formas Farmacéuticas segun la FEUM..........Formas Farmacéuticas segun la FEUM..........
Formas Farmacéuticas segun la FEUM..........amebgirl
 
Análisis estructural del restaurante submarino de Valencia oceanographic
Análisis estructural del restaurante submarino de Valencia oceanographicAnálisis estructural del restaurante submarino de Valencia oceanographic
Análisis estructural del restaurante submarino de Valencia oceanographicalejandrosagre14
 
¿Qué es el texto científico? Presentación para la clase de comunicación escri...
¿Qué es el texto científico? Presentación para la clase de comunicación escri...¿Qué es el texto científico? Presentación para la clase de comunicación escri...
¿Qué es el texto científico? Presentación para la clase de comunicación escri...Daniela Márquez Sena
 
Los países de AL con mayor población blanca europea (2024).pdf
Los países de AL con mayor población blanca europea (2024).pdfLos países de AL con mayor población blanca europea (2024).pdf
Los países de AL con mayor población blanca europea (2024).pdfJC Díaz Herrera
 
EJERCICIOS PARA MODELAR BASES DE DATOS.docx.docx
EJERCICIOS PARA MODELAR BASES DE DATOS.docx.docxEJERCICIOS PARA MODELAR BASES DE DATOS.docx.docx
EJERCICIOS PARA MODELAR BASES DE DATOS.docx.docxZafetDeLaOssa1
 
Países con mayores líneas de trenes de alta velocidad (2021).pdf
Países con  mayores líneas de trenes de alta velocidad  (2021).pdfPaíses con  mayores líneas de trenes de alta velocidad  (2021).pdf
Países con mayores líneas de trenes de alta velocidad (2021).pdfJC Díaz Herrera
 
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdkXNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdkJuanmanuelYapitamani
 
El siglo de Asia en pocos datos relevantes año (2024).pdf
El siglo de Asia en pocos datos relevantes año (2024).pdfEl siglo de Asia en pocos datos relevantes año (2024).pdf
El siglo de Asia en pocos datos relevantes año (2024).pdfJC Díaz Herrera
 
trabajo aplicativo conflictos sociales ong y ccss
trabajo aplicativo conflictos sociales ong y ccsstrabajo aplicativo conflictos sociales ong y ccss
trabajo aplicativo conflictos sociales ong y ccsslaurenteguevaraluise
 
GRUPO 3 ACTIVIDADES Integradoras Universidad cesar vallejo.pdf
GRUPO 3 ACTIVIDADES Integradoras Universidad cesar vallejo.pdfGRUPO 3 ACTIVIDADES Integradoras Universidad cesar vallejo.pdf
GRUPO 3 ACTIVIDADES Integradoras Universidad cesar vallejo.pdfelielarmandoeche2
 
Presentación Navegadores de Internet.pptx
Presentación Navegadores de Internet.pptxPresentación Navegadores de Internet.pptx
Presentación Navegadores de Internet.pptxUniversidad de Sonora
 
Estudio Índice de Igualdad 2024 de Ipsos
Estudio Índice de Igualdad 2024 de IpsosEstudio Índice de Igualdad 2024 de Ipsos
Estudio Índice de Igualdad 2024 de IpsosEmisor Digital
 
Proyecto JANNET trabajo de investigación
Proyecto JANNET trabajo de investigaciónProyecto JANNET trabajo de investigación
Proyecto JANNET trabajo de investigaciónEduCE2
 

Último (20)

Pobreza porcentual por etnia para el año (2024).pdf
Pobreza porcentual por etnia para el año (2024).pdfPobreza porcentual por etnia para el año (2024).pdf
Pobreza porcentual por etnia para el año (2024).pdf
 
Paisajismo Chino - Vegetacion y su historia
Paisajismo Chino - Vegetacion y su historiaPaisajismo Chino - Vegetacion y su historia
Paisajismo Chino - Vegetacion y su historia
 
01 SIMULACRO 2024.pdf unijjajajajjaaaajj
01 SIMULACRO 2024.pdf unijjajajajjaaaajj01 SIMULACRO 2024.pdf unijjajajajjaaaajj
01 SIMULACRO 2024.pdf unijjajajajjaaaajj
 
Seguridad y privacidad (1).pptx OdayYoah
Seguridad y privacidad (1).pptx OdayYoahSeguridad y privacidad (1).pptx OdayYoah
Seguridad y privacidad (1).pptx OdayYoah
 
SISTEMA DE CONTROL INTERNO - GRSM - GRUPO 5.pptx
SISTEMA DE CONTROL INTERNO - GRSM - GRUPO 5.pptxSISTEMA DE CONTROL INTERNO - GRSM - GRUPO 5.pptx
SISTEMA DE CONTROL INTERNO - GRSM - GRUPO 5.pptx
 
METODOLOGIA DE INVESTIGACION DE MARIO BUNGE
METODOLOGIA DE INVESTIGACION DE MARIO BUNGEMETODOLOGIA DE INVESTIGACION DE MARIO BUNGE
METODOLOGIA DE INVESTIGACION DE MARIO BUNGE
 
2287-Texto del artículo-1259innova9-1-10-20230909.pdf
2287-Texto del artículo-1259innova9-1-10-20230909.pdf2287-Texto del artículo-1259innova9-1-10-20230909.pdf
2287-Texto del artículo-1259innova9-1-10-20230909.pdf
 
Formas Farmacéuticas segun la FEUM..........
Formas Farmacéuticas segun la FEUM..........Formas Farmacéuticas segun la FEUM..........
Formas Farmacéuticas segun la FEUM..........
 
Análisis estructural del restaurante submarino de Valencia oceanographic
Análisis estructural del restaurante submarino de Valencia oceanographicAnálisis estructural del restaurante submarino de Valencia oceanographic
Análisis estructural del restaurante submarino de Valencia oceanographic
 
¿Qué es el texto científico? Presentación para la clase de comunicación escri...
¿Qué es el texto científico? Presentación para la clase de comunicación escri...¿Qué es el texto científico? Presentación para la clase de comunicación escri...
¿Qué es el texto científico? Presentación para la clase de comunicación escri...
 
Los países de AL con mayor población blanca europea (2024).pdf
Los países de AL con mayor población blanca europea (2024).pdfLos países de AL con mayor población blanca europea (2024).pdf
Los países de AL con mayor población blanca europea (2024).pdf
 
EJERCICIOS PARA MODELAR BASES DE DATOS.docx.docx
EJERCICIOS PARA MODELAR BASES DE DATOS.docx.docxEJERCICIOS PARA MODELAR BASES DE DATOS.docx.docx
EJERCICIOS PARA MODELAR BASES DE DATOS.docx.docx
 
Países con mayores líneas de trenes de alta velocidad (2021).pdf
Países con  mayores líneas de trenes de alta velocidad  (2021).pdfPaíses con  mayores líneas de trenes de alta velocidad  (2021).pdf
Países con mayores líneas de trenes de alta velocidad (2021).pdf
 
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdkXNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
 
El siglo de Asia en pocos datos relevantes año (2024).pdf
El siglo de Asia en pocos datos relevantes año (2024).pdfEl siglo de Asia en pocos datos relevantes año (2024).pdf
El siglo de Asia en pocos datos relevantes año (2024).pdf
 
trabajo aplicativo conflictos sociales ong y ccss
trabajo aplicativo conflictos sociales ong y ccsstrabajo aplicativo conflictos sociales ong y ccss
trabajo aplicativo conflictos sociales ong y ccss
 
GRUPO 3 ACTIVIDADES Integradoras Universidad cesar vallejo.pdf
GRUPO 3 ACTIVIDADES Integradoras Universidad cesar vallejo.pdfGRUPO 3 ACTIVIDADES Integradoras Universidad cesar vallejo.pdf
GRUPO 3 ACTIVIDADES Integradoras Universidad cesar vallejo.pdf
 
Presentación Navegadores de Internet.pptx
Presentación Navegadores de Internet.pptxPresentación Navegadores de Internet.pptx
Presentación Navegadores de Internet.pptx
 
Estudio Índice de Igualdad 2024 de Ipsos
Estudio Índice de Igualdad 2024 de IpsosEstudio Índice de Igualdad 2024 de Ipsos
Estudio Índice de Igualdad 2024 de Ipsos
 
Proyecto JANNET trabajo de investigación
Proyecto JANNET trabajo de investigaciónProyecto JANNET trabajo de investigación
Proyecto JANNET trabajo de investigación
 

Historias de Ciencia de Datos desde la Trinchera

  • 1. 1 Historias de DS desde la trinchera Historias malas, buenas, y feas, mexicanas, y del mundo. Copyright © @xuxoramos 2017
  • 2. "All models are wrong, but some are useful" - George E.P. Box 2
  • 4. Cómo lo logra? Balanceando componentes del error 4Copyright © @xuxoramos 2017
  • 8. X1 X2 YX3 X4 X5 X6
  • 9. X1 X2 YX3 X4 X5 X6 X7 X8
  • 10.
  • 11. ¡Aquí es donde se concentran mates, estadística, lógica y ética! - Lógica para tener higiene argumentativa y hacer la pregunta correcta - Estadística para evaluar la aportación de información de éstas - Mates para modelar este conjunto y reflejar fielmente la realidad - Ética para reconocer sesgos y tratarlos 11
  • 12. ...Y donde más se equivoca la gente. A veces a propósito... 12
  • 14. "DS done right" 14Copyright © @xuxoramos 2017
  • 16. Google Img Classifier 16Copyright © @xuxoramos 2017
  • 18. Google Flu Trends 18Copyright © @xuxoramos 2017
  • 19. Solid Gold Bomb 19Copyright © @xuxoramos 2017
  • 20. Score de reincidencia 20Copyright © @xuxoramos 2017
  • 21. 2008 Subprime Mortgage Crisis 21Copyright © @xuxoramos 2017
  • 23. Y México? 23Copyright © @xuxoramos 2017 - Telcel identifica con clustering un grupo de usrs que consume $7,000 MXN de tiempo aire en prepago. - Con aprendizaje supervisado crea un producto de crédito para estos clientes. - Le trae 4mdp anuales en facturación. - Luego hacen georeferenciación de estos clientes. - Todos están en Sinaloa y Tamaulipas. - ¿Qué tipo de personas creen que eran?
  • 24. Y México? 24Copyright © @xuxoramos 2017 - Durante el sismo del 19S, Codeando México atrae un grupo de programadores que quieren entrenar una red neuronal para detectar daño estrucural con fotos de TW. - Todas las fotos están taggeadas con #RevisaMiGrieta, pero son solo 600. - Las redes neuronales necesitan decenas de miles de fotos, de lo contrario arrojarán muchos falsos positivos y falsos negativos. - ¿Qué costo social pueden tener estas equivocaciones?
  • 25. ¿Cómo anda MX en análisis de datos? 113K Ingenieros de Software al año. 350 Matemáticos, físicos y estadísticos. No se conoce la diferencia entre Data Scientist (DS) y Data Engineer (DE). Tenemos miles de Data Engineers talentosos. No tenemos casi Data Scientists. Tenemos muchos DE queriendo ser DS sin las bases de mates o proba. + 25Copyright © @xuxoramos 2017
  • 26. ¿Cómo anda MX en análisis de datos? En 1982 México le entró al modelo neoliberal con la economía de maquila. La SEP instruyó al sistema educativo eliminar la filosofía y mates de las ingenierías. Era más importante producir gente con capacidades secundarias, repetibles y transferibles, que crear conocimiento. La ingeniería en compu es la más afectada. La reducen a recetas de cocina. Algunas universidades autónomas se salvan. Fast forward a 2018: 11 generaciones de ingenieros que razonan con falacias, y cuyas matemáticas más avanzadas llegan solo a cálculo. + 26Copyright © @xuxoramos 2017
  • 27. Con todo esto, ¿debemos convertirnos en hub de talento para DS? 27
  • 28. ¿Qué tenemos en contra? La frontera norte se cierra a nuestros productos y servicios. Poco petróleo, y a precio muy bajo. Corrupción rampante. Mercado interno débil. Variables macroeconómicas malas. La "mano de obra barata" no será relevante en la era de la automatización. 28Copyright © @xuxoramos 2017
  • 29. Debe México convertirse en un hub de Ciencia de Datos? Sí. 29Copyright © @xuxoramos 2017
  • 30. Cómo pueden ayudar? Entra a un programa académico completo. Regresa a la escuela a aprender mates. Usa la educación abierta en internet para hacer tu propia maestría. Únete a grupos profesionales. Únete a comunidades. 30Copyright © @xuxoramos 2017
  • 31. Mates aplicadas @ ITAM, UNAM, IPN Física @ UNAM Economía @ ITAM, UNAM MSc Ciencia de Datos @ ITAM MSc Inteligencia Analítica @ UAnáhuac MSc Ciencia de Datos @ CIMAT Programas académicos en MX* + * Evaluación de 63 candidatos para posiciones de Ciencia de Datos en Bolsa Mexicana de Valores, GBM, TERAN/TBWA, Klustera, Globant, OPI y ConCrédito. 31Copyright © @xuxoramos 2017
  • 32. Intro to Mathematical Thinking: Stanford + Coursera Intro to Logic: Stanford + Coursera Business Analytics: Wharton + Coursera Data Science Specialization: JHU + Coursera Machine Learning: Stanford + Coursera Executive Data Science: JHU + Coursera "Hága su propia maestría"* * Ver ratings de cursos en https://www.class-central.com/ 32Copyright © @xuxoramos 2017
  • 33. The Data Pub (FB: /thedatapub, TW: @thedatapub) +1800 miembros. Meetups cada último Jueves del mes. Cursos de Stats & Machine Learning para Developers. Job posting - porque las empresas están perdidas. Badges - porque los endorsements de LinkedIn son "la hoguera de las vanidades". Hackathones: Walmart, Grupo Modelo. Grupos Profesionales 33Copyright © @xuxoramos 2017
  • 34. El Juramento del Científico de Datos 34
  • 36. 36