Data Science
Upcoming SlideShare
Loading in...5
×
 

Like this? Share it with your network

Share

Data Science

on

  • 561 views

 

Statistics

Views

Total Views
561
Views on SlideShare
561
Embed Views
0

Actions

Likes
0
Downloads
13
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

CC Attribution-ShareAlike LicenseCC Attribution-ShareAlike License

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Data Science Presentation Transcript

  • 1. Data Science Svet Ivantchev, eFaberUniEE, 7 de marzo de 2012
  • 2. El sexy job del la década?“I keep saying the sexy job in the next ten years will be statisticians. People think Im joking, butwho wouldve guessed that computer engineers wouldve been the sexy job of the 1990s?” Hal Varian,The McKinsey Quarterly, January 2009
  • 3. http://www.dataists.com/2010/09/the-data-science-venn-diagram/
  • 4. http://www.mymodernmet.com/profiles/blogs/stephen-wildish-clever-venn-diagrams
  • 5. http://www.mymodernmet.com/profiles/blogs/stephen-wildish-clever-venn-diagrams
  • 6. Hablaremos de:• Presentación de datos• Aprendizaje automático• Estadística• Big Data
  • 7. Presentación de datosCuatro “sets” de datos con los mismas “medidas” Anscombe, F. (1973), Graphs in Statistical Analysis,The American Statistician, pp. 195-199.
  • 8. Los mismos promedios presentados gráficamente http://en.wikipedia.org/wiki/Anscombe%27s_quartet
  • 9. Ej: Epidemia de cólera en Londres• año 1854• 19 de agosto -- 29 de septiembre: 616 muertos• tardan 2.5 semanas en descubrir el motivo
  • 10. Comparativas sin sentido Radiación solar y la bolsa
  • 11. El contexto
  • 12. NYT y la deuda de los paíseshttp://www.nytimes.com/interactive/2011/10/23/sunday-review/an-overview-of-the-euro-crisis.html
  • 13. Estadística 101
  • 14. Aprendizaje automático (aka Machine Learning) Desarrollo de algoritmos y métodos que permiten a los ordenadores “evolucionar” en base de datos empíricos
  • 15. Temas y ejemplos• Clasificación• Recomendaciones• Clustering (con zip :-) ?)• Ejemplo y relación con Compresión• En la vida real I: datos vs algoritmos• En la vida real II: experiencia vs metodología
  • 16. Relacionado: búsqueda• Idea de TF-IDF, tf (t, d) * idf (t, D)• Idea de PageRank
  • 17. Peligro: Usar sin entender
  • 18. Otro ejemplo (mejor)
  • 19. Datos propios• Con un móvil Android• Del coche
  • 20. Con un Android
  • 21. OBD II
  • 22. GPS speed
  • 23. Engine RPM
  • 24. Acc pedal pos
  • 25. Fuel flow
  • 26. CO2
  • 27. Recapitulando• Visualización• Gestión de muchos datos• Métodos matemáticos y estadística