Data Science

489 views
427 views

Published on

Published in: Education
1 Comment
0 Likes
Statistics
Notes
  • SINAI PHOTOSATELLITE, WITH "HUMAN FACE" IN THE TOP Sinai Mountain, human face photo satellite’s image, and other similar one in holy places of the world. This so huge human bust, really should be excavated with a very futuristic technology (like some immense laser knife), because just in this sector there doesn’t exist geological explanation to justify such deep and vertical gorges. http://webspace.webring.com/people/or/ramonetriu/sinai.html
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • Be the first to like this

No Downloads
Views
Total views
489
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
15
Comments
1
Likes
0
Embeds 0
No embeds

No notes for slide

Data Science

  1. 1. Data Science Svet Ivantchev, eFaberUniEE, 7 de marzo de 2012
  2. 2. El sexy job del la década?“I keep saying the sexy job in the next ten years will be statisticians. People think Im joking, butwho wouldve guessed that computer engineers wouldve been the sexy job of the 1990s?” Hal Varian,The McKinsey Quarterly, January 2009
  3. 3. http://www.dataists.com/2010/09/the-data-science-venn-diagram/
  4. 4. http://www.mymodernmet.com/profiles/blogs/stephen-wildish-clever-venn-diagrams
  5. 5. http://www.mymodernmet.com/profiles/blogs/stephen-wildish-clever-venn-diagrams
  6. 6. Hablaremos de:• Presentación de datos• Aprendizaje automático• Estadística• Big Data
  7. 7. Presentación de datosCuatro “sets” de datos con los mismas “medidas” Anscombe, F. (1973), Graphs in Statistical Analysis,The American Statistician, pp. 195-199.
  8. 8. Los mismos promedios presentados gráficamente http://en.wikipedia.org/wiki/Anscombe%27s_quartet
  9. 9. Ej: Epidemia de cólera en Londres• año 1854• 19 de agosto -- 29 de septiembre: 616 muertos• tardan 2.5 semanas en descubrir el motivo
  10. 10. Comparativas sin sentido Radiación solar y la bolsa
  11. 11. El contexto
  12. 12. NYT y la deuda de los paíseshttp://www.nytimes.com/interactive/2011/10/23/sunday-review/an-overview-of-the-euro-crisis.html
  13. 13. Estadística 101
  14. 14. Aprendizaje automático (aka Machine Learning) Desarrollo de algoritmos y métodos que permiten a los ordenadores “evolucionar” en base de datos empíricos
  15. 15. Temas y ejemplos• Clasificación• Recomendaciones• Clustering (con zip :-) ?)• Ejemplo y relación con Compresión• En la vida real I: datos vs algoritmos• En la vida real II: experiencia vs metodología
  16. 16. Relacionado: búsqueda• Idea de TF-IDF, tf (t, d) * idf (t, D)• Idea de PageRank
  17. 17. Peligro: Usar sin entender
  18. 18. Otro ejemplo (mejor)
  19. 19. Datos propios• Con un móvil Android• Del coche
  20. 20. Con un Android
  21. 21. OBD II
  22. 22. GPS speed
  23. 23. Engine RPM
  24. 24. Acc pedal pos
  25. 25. Fuel flow
  26. 26. CO2
  27. 27. Recapitulando• Visualización• Gestión de muchos datos• Métodos matemáticos y estadística

×