Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Data science como motor de la innovación

224 views

Published on

Charla que dicté en el desayuno de la Comunidad BI en Chile. Presento el rol del científico de datos (data scientist) en la empresa moderna.

Published in: Data & Analytics
  • DOWNLOAD FULL BOOKS, INTO AVAILABLE FORMAT ......................................................................................................................... ......................................................................................................................... 1.DOWNLOAD FULL. PDF EBOOK here { https://tinyurl.com/y3nhqquc } ......................................................................................................................... 1.DOWNLOAD FULL. EPUB Ebook here { https://tinyurl.com/y3nhqquc } ......................................................................................................................... 1.DOWNLOAD FULL. doc Ebook here { https://tinyurl.com/y3nhqquc } ......................................................................................................................... 1.DOWNLOAD FULL. PDF EBOOK here { https://tinyurl.com/y3nhqquc } ......................................................................................................................... 1.DOWNLOAD FULL. EPUB Ebook here { https://tinyurl.com/y3nhqquc } ......................................................................................................................... 1.DOWNLOAD FULL. doc Ebook here { https://tinyurl.com/y3nhqquc } ......................................................................................................................... ......................................................................................................................... ......................................................................................................................... .............. Browse by Genre Available eBooks ......................................................................................................................... Art, Biography, Business, Chick Lit, Children's, Christian, Classics, Comics, Contemporary, Cookbooks, Crime, Ebooks, Fantasy, Fiction, Graphic Novels, Historical Fiction, History, Horror, Humor And Comedy, Manga, Memoir, Music, Mystery, Non Fiction, Paranormal, Philosophy, Poetry, Psychology, Religion, Romance, Science, Science Fiction, Self Help, Suspense, Spirituality, Sports, Thriller, Travel, Young Adult,
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • Be the first to like this

Data science como motor de la innovación

  1. 1. Cómo  la  Ciencia  ha  impactado   mi  vida  y  cómo  yo  he   impactado  a  la  Ciencia
  2. 2. Una  ventana  al  Universo Norte  de  Chile Cielos  claros  y  transparentes
  3. 3. Carrera  como científico • Tesis de Doctorado en Astrofísica acerca de cómo evolucionanlas galaxias elítipticas. • Uso de grandes telescopios en Chile y colaboraciones con Francia, USA, Canada, etc. Very Large Teslecope (VLT)
  4. 4. Datos  en  Astronomía • Desde la obtención del dato crudo hasta la generación de resultados en forma de tablas y gráficos. • Testigo del impacto del Big data en Astronomía: SDSS (1998) llena discos duros de 8GB en 25 min. Time  span:  15  years Area:  14,555  deg2 #  sources:  469,053,874
  5. 5. Dato  procesadoDato  crudo Ciencia  guiada  por  los  datos • Jim Gray,  investigador  de  Microsoft,  hizo  notar   que  la  Ciencia  entró  al  cuarto  paradigma: Data-­‐driven Science Muñoz et al. 2015
  6. 6. Evolución del  procesamiento y análisis  de  datos
  7. 7. Evolución  procesamiento  de  datos • 1890:  Se  usa  la  máquina  tabuladora  de  Hollerith   para  procesar  los  datos  del  censo  de  EE.UU. • 1951:  Se  diseña  el  primer  computador   electrónico  con  fines  comerciales,  UNIVAC  I. Cómputo Manual Cómputo Automático Cómputo Automático Cómputo Electrónico
  8. 8. Costo  del  cómputo • Desde  la  invención  de  los  computadores   electrónicos,  tanto  el  precio  como  el  tamaño  han   disminuido  sostenidamente.
  9. 9. Tsunami  de  datos • Durante  las  últimas  décadas  la  sociedad  en  su   conjunto  se  ha  digitalizado. • Mayor  capacidad  de  cómputo  y  tecnología  más   asequible  han  permitido  un  crecimiento  explosivo   de  los  datos. Fuente: Oracle, 2012 Los datos crecen a una tasa anual del 40%. Se estima una producción de 45 ZB para el 2020. 10  ZB 45  ZB 1  ZB=1024  EB 1  EB=1024  PB
  10. 10. Comunidad  Open  Source • Una  mayor  variedad  y  cantidad  de  datos  trae   consigo  nuevos  desafíos. • Desarrollo  continuo  de  herramientas  y  métodos   para  analizar  los  datos. • Transición  de  software  empaquetado  y  comercial   a  uno  desarrollado  por  comunidad  open  source.
  11. 11. ¿Qué  es  la  Ciencia  de  datos? • Data Science es un campo interdisciplinario que se ocupa de los procesos y sistemas usados en la extracción de conocimiento a partir del análisis de datos. • Se dice interdisciplinario pues requiere conocimientos de los campos de la computación, matemáticas y estadística. Programación Estadística Data   Science
  12. 12. ¿Cambio  de  paradigma? • Los  datos  digitales  y  las  tecnologías  han  cambiado   la  manera  en  cómo  vivimos  y  cómo  entendemos   el  mundo. • Jim Gray,  investigador  de  Microsoft  y   pionero  en  bases  de  datos  introdujo   el  concepto  del  cuarto  paradigma. • Era  experimental,  teórica computacional  y  últimamente  la  Era   del  dato.
  13. 13. Carácter  interdisciplinario Diagrama de  Venn  para  Data  Science Drew  Conway  (2010) Habilidades Programación Exploración de datos Soluciones creativas Conocimientos Matemáticas Estadística Experticia Especialización Conocimiento  de  campo
  14. 14. ¿Qué  hace  un  Data  Scientist? • Profesional  que  posee  las  herramientas  y  los   conocimientos  necesarios  para: § Recolectar  y  filtrar  datos  de  diversas  fuentes § Explorar de  manera  efectiva  un  set  de  datos § Obtener  información  valiosa  oculta  en  los  datos § Construir  modelos  que  permitan  tomar  decisiones   informadas. Data Scientist: Persona que es mejor en estadística que cualquier ingeniero de software y que es mejor en ingeniería de software que cualquier estadístico.
  15. 15. Roles  en  la  Organización
  16. 16. Conocimientos  y  Habilidades • Formación  universitaria  en  las  áreas  de  Ingeniería   y  Ciencias  Naturales.  Idealmente  tienen  Magister   y  PhD. • Poseen  conocimientos  de  Matemáticas,   Estadística  y  Programación  computacional. • Se  caracterizan  por  su  curiosidad  intelectual,  son   capaces  de  diseñar  experimentos  y  comunicar  de   manera  efectiva  los  resultados.
  17. 17. Esquema  simple  Data  Science
  18. 18. Casos  Notables nyc-­‐taxi-­‐data uber-­‐tlc-­‐foil-­‐response Análisis de  uso  de  Taxis  y  Uber  en  NYC Open  Data+Open Source Fuente: FiveThirtyEight
  19. 19. Casos  Notables datausa Análisis de  datos  públicos  de  USA Open  Data+Open Source Fuente: The New York Times
  20. 20. Innovación  con  base científica  y  tecnológica
  21. 21. Visión computacional • Enseñar  a  las  máquinas a  ver  e  interpretar  tal   como  lo  hacemos  los  humanos. • Interdisciplinario:  Matemáticas,  Física,  AI
  22. 22. Industria  automotriz • ¿Por  qué  usar  Visión  Computacional? § 3.500  personas  mueren  todos  los  días en   accidentes  de  tránsito  en  el  mundo § Gastamos  cerca  de  1  hora  conduciendo Ingresos:  240  millones  USD  (2015) Mobileye,  2015
  23. 23. Seguridad  y  Transporte • Los  sistemas  de  vigilancia  cumplen  un  rol  clave  en   la  seguridad  y  mejora  de  experiencia  de  usuario   en  las  industrias  del  retail,  transporte  público  y   orden  público.
  24. 24. Metric Video  Analytics • Análisis  de  cámaras  de  seguridad  en  tiempo  real,   escalable  y  de  bajo  costo. • Integración  con  la  plataforma  Azure  de  Microsoft   y  capacidad  de  analítica  avanzada.
  25. 25. Informes  y  alertas • Conteo  y  seguimiento  de  personas • Alertas  de  actos  delictuales  y  evasión   • Datos  demográficos  de  clientes  y  usuarios
  26. 26. Smarcity:  Ciudad  interconectada
  27. 27. Gracias! Email:  rmunoz@uc.cl Github:  github.com/rpmunoz

×