En esta charla presentaré un proyecto surgido de la observación del proceso realizado para la evaluación de proyectos de impacto social.
Presentado por Ludim Sanchez
Inteligencia artificial,visión por ordenador,y datos multimodales - ACE Jap...Antonio Tejero de Pablos
La inteligencia artificial (AI) está a la orden del día, pero ¿qué es realmente? ¿Cómo es capaz una máquina de percibir el mundo real? Diseñadas inicialmente para reconocer patrones sencillos en imágenes, las redes neuronales artificiales han incrementado su complejidad hasta obtener en la actualidad una precisión equivalente a la del ser humano. Esto ha permitido su aplicación en una gran variedad de sectores, desde el médico hasta el automovilístico. Esta charla sirve de introducción a mi campo dentro de la AI, la visión por ordenador, y a mi tema de investigación actual, el aprendizaje de datos multimodales.
Etnografía Rápida y Realidad Aumentada: Diseño Conceptual Aplicaciones Móvile...Miguel Palau
Un caso práctico de investigación sobre Antropología para el Diseño, en conjunción con Interacción Humano Computador. Se considera el estudio de caso de diseño con carácter pluridisciplinario. La realización del proyecto, aplico elementos sobre la metodología etnográfica en tiempos cortos para su elaboración con el propósito de aplicar modelos teóricos por sobre lo empírico. Dentro de sus hallazgos relevantes se obtiene información específica sobre atributos y funcionalidades de un prototipo de estación de trabajo con Realidad Aumentada. Se combinan dos modelos interpretativos, Millgrams para entender la realidad en forma real, mixta y virtual junto con los estudios antropológicos social cultural de Samuel Hurtado, sobre Cultura del Trabajo en Venezuela.
Inteligencia artificial,visión por ordenador,y datos multimodales - ACE Jap...Antonio Tejero de Pablos
La inteligencia artificial (AI) está a la orden del día, pero ¿qué es realmente? ¿Cómo es capaz una máquina de percibir el mundo real? Diseñadas inicialmente para reconocer patrones sencillos en imágenes, las redes neuronales artificiales han incrementado su complejidad hasta obtener en la actualidad una precisión equivalente a la del ser humano. Esto ha permitido su aplicación en una gran variedad de sectores, desde el médico hasta el automovilístico. Esta charla sirve de introducción a mi campo dentro de la AI, la visión por ordenador, y a mi tema de investigación actual, el aprendizaje de datos multimodales.
Etnografía Rápida y Realidad Aumentada: Diseño Conceptual Aplicaciones Móvile...Miguel Palau
Un caso práctico de investigación sobre Antropología para el Diseño, en conjunción con Interacción Humano Computador. Se considera el estudio de caso de diseño con carácter pluridisciplinario. La realización del proyecto, aplico elementos sobre la metodología etnográfica en tiempos cortos para su elaboración con el propósito de aplicar modelos teóricos por sobre lo empírico. Dentro de sus hallazgos relevantes se obtiene información específica sobre atributos y funcionalidades de un prototipo de estación de trabajo con Realidad Aumentada. Se combinan dos modelos interpretativos, Millgrams para entender la realidad en forma real, mixta y virtual junto con los estudios antropológicos social cultural de Samuel Hurtado, sobre Cultura del Trabajo en Venezuela.
En la charla realizada por Néstor Campos de Metric Arts (https://metricarts.com/), nos presentaron su producto Video Analytics y cómo utilizan Algoritmos de Machine Learning, junto a procesos y modelamientos de Visual Computing para poder realizar seguimiento de objetos y personas a través de video.
Virtual: Predicción de usuarios persuasibles en TwitterAndrés Oliva
Se trata de un estudio del cambio de posición de individuos en Twitter, utilizando técnicas de procesamiento de lenguaje natural y algoritmos de aprendizaje automático.
Estructuras de datos avanzadas: Casos de uso realesSoftware Guru
La utilización de estructuras de datos adecuadas para cada problema hace que se simplifiquen en gran medida los tiempos de respuestas y la cantidad de cómputo realizada.
Por Nelson González
Más contenido relacionado
Similar a Clasificación de acciones sociales usando computer vision
En la charla realizada por Néstor Campos de Metric Arts (https://metricarts.com/), nos presentaron su producto Video Analytics y cómo utilizan Algoritmos de Machine Learning, junto a procesos y modelamientos de Visual Computing para poder realizar seguimiento de objetos y personas a través de video.
Virtual: Predicción de usuarios persuasibles en TwitterAndrés Oliva
Se trata de un estudio del cambio de posición de individuos en Twitter, utilizando técnicas de procesamiento de lenguaje natural y algoritmos de aprendizaje automático.
Estructuras de datos avanzadas: Casos de uso realesSoftware Guru
La utilización de estructuras de datos adecuadas para cada problema hace que se simplifiquen en gran medida los tiempos de respuestas y la cantidad de cómputo realizada.
Por Nelson González
Onboarding new members into an engineering team is not easy on anyone. In a short period of time, the new team member is required to be able to bring professional
Por Victoriya Kalmanovich
El secreto para ser un desarrollador SeniorSoftware Guru
En esta charla platicaremos sobre el “secreto” y el camino para llegar a ser un desarrollador Senior, experiencia, consejos y recomendaciones que en estos 8 años
Por René Sandoval
Apache Airflow es una plataforma en la que podemos crear flujos de datos de manera programática, planificarlos y monitorear de manera centralizada.
Por Yesi Díaz
How thick data can improve big data analysis for business:Software Guru
En esta presentación hablaré sobre cómo el Análisis de Datos Gruesos, específicamente el análisis antropológico y semiótico, puede ayudar a mejorar los resultados del Big Data
Por Martin Cuitzeo
CoDi® es la nueva forma de realizar pagos digitales desarrollada por el Banco de México. Por medio de CoDi puedes realizar cobros y pagos desde tu celular, utilizando una cuenta bancaria o de alguna institución financiera, sin comisiones.
Por Cristian Jaramillo
Gestionando la felicidad de los equipos con Management 3.0Software Guru
En las metodologías agiles hablamos de equipos colaborativos, autogestionados y felices. hablamos de lideres serviciales. El management 3.0 nos ayuda a cultivar el mindset correcto, aquel que servirá como el terreno fértil para que la agilidad florezca.
Por Andrea Vélez Cárdenas
Taller: Creación de Componentes Web re-usables con StencilJSSoftware Guru
Hoy por hoy las experiences de usuario pueden ser enriquecidas mediante el uso de Web Components, que son un estándar de la W3C soportado por la mayoría de los navegadores web modernos.
Por Alex Arriaga
Así publicamos las apps de Spotify sin stressSoftware Guru
En Spotify tenemos 1600+ ingenieros, trabajando en 280+ squads. Aún a esta escala, hemos logrado adoptar prácticas que nos han permitido acelerar la forma en que desarrollamos nuestro producto. Presentado por Erick Camacho en SG Virtual Conference 2020
Achieving Your Goals: 5 Tips to successfully achieve your goalsSoftware Guru
he measure of the executive, Peter F. Drucker reminds us, is the ability to "get the right things done." This involves having clarity on what are the right things as well as avoiding what is unproductive. Intelligence, creativity, and knowledge may all be wasted if not put to work on the things that matter.
Presentado por Cristina Nistor en SG Virtual Conference 2020
Acciones de comunidades tech en tiempos del Covid19Software Guru
Acciones de Comunidades Tech en tiempo del COVID-19 es una platica para informar acerca de las acciones que están realizando algunas comunidades de tecnología en México para luchar contra la propagación del COVID-19. Desde análisis de datos, visualizaciones, simulaciones de contagio, etc.
Presentado por Juana Martínez, Adriana Vallejo y Eduardo Ramírez en SG Virtual Conference 2020
De lo operativo a lo estratégico: un modelo de management de diseñoSoftware Guru
La charla presenta un modelo claro, generado por la ponente, para atender los niveles desde lo operativo a lo estratégico.
Presentado por Gabriela Salinas en SG Virtual Conference
En este documento analizamos ciertos conceptos relacionados con la ficha 1 y 2. Y concluimos, dando el porque es importante desarrollar nuestras habilidades de pensamiento.
Sara Sofia Bedoya Montezuma.
9-1.
Catalogo Cajas Fuertes BTV Amado Salvador Distribuidor OficialAMADO SALVADOR
Explora el catálogo completo de cajas fuertes BTV, disponible a través de Amado Salvador, distribuidor oficial de BTV. Este catálogo presenta una amplia variedad de cajas fuertes, cada una diseñada con la más alta calidad para ofrecer la máxima seguridad y satisfacer las diversas necesidades de protección de nuestros clientes.
En Amado Salvador, como distribuidor oficial de BTV, ofrecemos productos que destacan por su innovación, durabilidad y robustez. Las cajas fuertes BTV son reconocidas por su eficiencia en la protección contra robos, incendios y otros riesgos, lo que las convierte en una opción ideal tanto para uso doméstico como comercial.
Amado Salvador, distribuidor oficial BTV, asegura que cada producto cumpla con los más estrictos estándares de calidad y seguridad. Al adquirir una caja fuerte a través de Amado Salvador, distribuidor oficial BTV, los clientes pueden tener la tranquilidad de que están obteniendo una solución confiable y duradera para la protección de sus pertenencias.
Este catálogo incluye detalles técnicos, características y opciones de personalización de cada modelo de caja fuerte BTV. Desde cajas fuertes empotrables hasta modelos de alta seguridad, Amado Salvador, como distribuidor oficial de BTV, tiene la solución perfecta para cualquier necesidad de seguridad. No pierdas la oportunidad de conocer todos los beneficios y características de las cajas fuertes BTV y protege lo que más valoras con la calidad y seguridad que solo BTV y Amado Salvador, distribuidor oficial BTV, pueden ofrecerte.
HPE presenta una competició destinada a estudiants, que busca fomentar habilitats tecnològiques i promoure la innovació en un entorn STEAM (Ciència, Tecnologia, Enginyeria, Arts i Matemàtiques). A través de diverses fases, els equips han de resoldre reptes mensuals basats en àrees com algorísmica, desenvolupament de programari, infraestructures tecnològiques, intel·ligència artificial i altres tecnologies. Els millors equips tenen l'oportunitat de desenvolupar un projecte més gran en una fase presencial final, on han de crear una solució concreta per a un conflicte real relacionat amb la sostenibilitat. Aquesta competició promou la inclusió, la sostenibilitat i l'accessibilitat tecnològica, alineant-se amb els Objectius de Desenvolupament Sostenible de l'ONU.
KAWARU CONSULTING presenta el projecte amb l'objectiu de permetre als ciutadans realitzar tràmits administratius de manera telemàtica, des de qualsevol lloc i dispositiu, amb seguretat jurídica. Aquesta plataforma redueix els desplaçaments físics i el temps invertit en tràmits, ja que es pot fer tot en línia. A més, proporciona evidències de la correcta realització dels tràmits, garantint-ne la validesa davant d'un jutge si cal. Inicialment concebuda per al Ministeri de Justícia, la plataforma s'ha expandit per adaptar-se a diverses organitzacions i països, oferint una solució flexible i fàcil de desplegar.
4. Visión
Computacional
“La visión computacional es
un área que busca lograr que
las computadoras obtengan
una comprensión de las
imágenes o video, tal y como
lo hacemos los humanos.” [1]
Permitir que las máquinas
vean el mundo como los
humanos.
Introducción
4
Imagen por Claudio Schwarz licenciado bajo Creative Commons
5. Clasificación de imágenes
5
Campos de la Visión
Computacional
Estimación de posición
Imagen por Oliver Sjöström icenciado bajo Creative Commons
6. Clasificación de
Imágenes
“Campo de la visión
computacional que busca
catalogar una imagen por su
contenido visual”. [2]
En los últimos años ha ido
disminuyendo el rango de
error, en medida por los
algoritmos de Deep Learning,
principalmente las Redes
Neuronales Convolucionales.
Introducción
6
7. Clasificación de
Imágenes
“Campo de la visión
computacional que busca
catalogar una imagen por su
contenido visual”. [2]
En los últimos años ha ido
disminuyendo el rango de
error, en medida por los
algoritmos de Deep Learning,
principalmente las Redes
Neuronales Convolucionales.
Introducción
7
8. 8
Marco Teórico
Transformar dos funciones en
una tercera función.
f(x)
f(x,y)
f(y)
Imagen por Wikimedia Commons licenciado
bajo Creative Commons
¿Convolución?
9. 9
Marco Teórico
red neuronal convolucional
Transformar dos funciones en
una tercera función.
f(x)
f(x,y)
f(y)
¿Qué es una red neuronal?
10. 10
Marco Teórico
red neuronal convolucional
Transformar dos funciones en
una tercera función.
f(x)
f(x,y)
f(y)
Imagen por Wikimedia Commons licenciado
bajo Creative Commons
¿Cómo funciona una CNN?
11. ¿Qué es una red neuronal
convolucional (CNN)?Uno de los algoritmo de Aprendizaje Profundo (Deep Learning) que toma una entrada, asigna importancia a
varios aspectos dentro de una imagen y diferencia estos aspectos uno de otro.
Está formada por capas de convoluciones (es decir que va transformando las entradas).
Eficaz y eficiente para:
● Clasificación y detección de objetos
● Aplicar otras capas puede ayudar a procesar de mejor manera nuestras imágenes, como: pooling
12. ¿De qué se compone?
Tomada de: https://ccinetica.wordpress.com/2018/06/06/redes-convolutivas-en-inteligencia-artificial/
13.
14. 14
Marco Teórico
red neuronal convolucional
Transformar dos funciones en
una tercera función.
f(x)
f(x,y)
f(y)
Imagen por Wikimedia Commons licenciado
bajo Creative Commons
Aplicaciones
15. ¿Para qué es una red neuronal
convolucional?
● Reconocimiento de imágenes y vídeos
● Análisis y clasificación de imágenes
● Sistemas de recomendación
● Procesamiento Natural de Lenguaje
● Entre otros
16. Frase
16
Si quieres amar lo que haces, abandona
la mentalidad pasional
"¿qué puede ofrecerme el mundo?"
Adopta la mentalidad artesanal
"¿qué puedo ofrecer al mundo?"
—Cal Newport
Autor de Deep Work
17. Objetivo General
Probar la posibilidad de predecir con una CNN qué acción se está realizando en una imagen.
18. Aplicaciones
Pregunta original: ¿Cómo detectar si una acción es voluntaria?
Respuesta: Eso no se puede “así nomás’ no :(“
¿Cómo si se puede?
Pregunta 2: ¿Puedo detectar qué acciones
se están realizando en las imágenes?
Respuesta: Si, investiga más.
19. Implementar una solución
que ya existiera en el
mercado para solucionar el
problema.
Ayudar al equipo
operativo a concentrarse en
el área social.
¿Es posible para una
máquina con solo ver una
imagen reconocer si una
acción realizada por un
humano tiene un fin social?
Objetivos del
Estudio
19
Encontrar una solución
al problema Reducir tiemposProbar una hipótesis
AVISO:
Este proyecto continúa en fase de
investigación y pruebas.
20. Reconocer acciones humanas basadas en imágenes estáticas es posible
tomando como base bag-of-features y part-based-representations.
20
“El mejoramiento de las redes neuronales convolucionales mostró
un buen efecto en el reconocimiento de comportamiento humano
en terminales inteligentes.”
Revisión de
la Literatura
Teoría 1
Teoría 2
21. La detección de acciones ha
sido estudiada previamente,
principalmente en vídeos.
Investigación
21
CNN tiene poca información
en detección de acciones
basado en imágenes
Análisis
Metodología
Entre las CNN y el enfoque
“tradicional” de la visión
computacional.
Comparación
Las Redes Neuronales Convolucionales
(CNN por sus siglas en inglés) son muy
populares en este campo de estudio
Clasificación
de imágenes
23. Describe here your metrics 1
Describe here your metrics 2
Describe here your metrics 3
Describe here your metrics 4
Describe here your metrics 5
Test 1 Test 2 Test 3 Test 4
23
Table
24. Montando un
caballo
Venus has a beautiful
name, but it’s terribly hot
60%
Estadísticas
Mercury
1,369
Results last month
Jupiter
5,408
Results this month
24
Análisis de
Resultados
26. Analizar y sintetizar
un problema que
puede parecer
imposible de resolver.
Para obtener mejores
resultados: ajustar
modelo o usar más
datos de entrada.
Conclusions
26
2
1
29. 1. DANA H. BALLARD; CHRISTOPHER M. BROWN (1982). Computer Vision. Prentice Hall.
2. DAVID KAELI, DONG PING ZHANG (2015). Heterogeneous Computing with OpenCL 2.0
3. VINCENT DELAITRE, ET. AL. (2010) Recognizing human actions in still images:a study of bag-of-features
and part-based representations.
4. SHANSHAN GUAN, ET. AL. (2019) Research on Human Behavior Recognition based on Deep Neural
Network. Atlantis Press.
5. AUTHOR (YEAR). Title of the publication. Publisher.
Bibliografía
29
30. 1. DANA H. BALLARD; CHRISTOPHER M. BROWN (1982). Computer Vision. Prentice Hall.
2. DAVID KAELI, DONG PING ZHANG (2015). Heterogeneous Computing with OpenCL 2.0
3. VINCENT DELAITRE, ET. AL. (2010) Recognizing human actions in still images:a study of bag-of-features
and part-based representations.
4. SHANSHAN GUAN, ET. AL. (2019) Research on Human Behavior Recognition based on Deep Neural
Network. Atlantis Press.
5. AUTHOR (YEAR). Title of the publication. Publisher.
Bibliografía
30
1. https://elisa.dyndns-web.com/teaching/sys/neural/intro.pdf
2. https://ccinetica.wordpress.com/2018/06/06/redes-convolutivas-en-inteligencia-artificial/
3. https://www.doc.ic.ac.uk/~nd/surprise_96/journal/vol4/cs11/report.html#What%20is%20a
%20Neural%20Network
4. https://towardsdatascience.com/a-comprehensive-guide-to-convolutional-neural-networks-
the-eli5-way-3bd2b1164a53
5. https://www.youtube.com/watch?v=EAqb20_4Rdg
6. https://www.di.ens.fr/willow/research/stillactions/
7. https://www.youtube.com/watch?v=ns2L2T6wvAY
8. http://www.sysu-hcp.net/an-expressive-deep-model-for-human-action-parsing-from-a-
single-image/
9. https://github.com/puigalex/AMP-Tech/tree/master/CNN%20desde%20cero
10. https://machinelearningmastery.com/adam-optimization-algorithm-for-deep-learning/
11. https://github.com/michalfaber/keras_Realtime_Multi-
Person_Pose_Estimation/blob/master/demo.ipynb
12. https://colab.research.google.com/drive/1Z6r82FlQTBXTh3GZCPc9LeZClxFVhcl_#scrollT
o=PLw47QOSGzdd
13. https://docs.google.com/presentation/d/1mLXk1JWr6doRxMCsH9V4P3DpNMZ1n3peA0t
m1fFFS7w/edit#slide=id.g50d510a6d7_0_197
31. Créditos
◂ Template por Slidesgo
◂ Iconos por Flaticon
◂ Infográficos por Freepik
◂ Imágenes creadas por Freepik
◂ Foto de diapositiva de introducción del autor creada por Freepik
◂ Texto e imagen de diapositivas creadas por Freepik.com
Agradecimiento a las comunidades:
◂ Women in Data Science, Power and Engineering.
◂ AI6 Mty.
31
32. Recursos
32
◂ Road desert landscape Morocco
◂ Rear view woman walking boardwalk mountain
◂ Couple running sunny road
◂ High angle view tropical trees growing forest
◂ Hiker sitting rock
◂ High angle view winding road surrounded by green trees
◂ Woman with book looking bookshelves
◂ Elevated view road forest during sunny day
Fotos
◂ Infographic timeline concept with road
Vector