Análise das Palestras do PythonBrasil [6]

2,350 views

Published on

My lecture at PythonBrasil about Data mining applied on the lectures of Python Brasil. Lighting talk - PythonBrasil - Curitiba -22/10/2010

Published in: Technology
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
2,350
On SlideShare
0
From Embeds
0
Number of Embeds
1,128
Actions
Shares
0
Downloads
6
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Análise das Palestras do PythonBrasil [6]

  1. 1. Marcel Caraciolo - @marcelcaraciolo Mineração de Palestras 1
  2. 2. Quem é Marcel ? Marcel Pinheiro Caraciolo - @marcelcaraciolo Mestrando em Ciência da Computação no CIN/UFPE na área de mineração de dados Diretor de Pesquisa e Desenvolvimento na Orygens Membro e Moderador da Celúla de Usuários Python de Pernambuco (PUG-PE) Minhas áreas de interesse: Computação móvel e Computação inteligente Meus blogs: http://www.mobideia.com (sobre Mobilidade desde 2006) http://aimotion.blogspot.com (sobre I.A. desde 2009) Jovem Aprendiz ainda nas artes pythonicas.... (desde 2007) Sergipano, porém Recifense. 2
  3. 3. Como comecei esta análise ? 20 hrs atrás no Hotel.... 3
  4. 4. Scraping do PythonBrasil Mini-Crawler para extrair as palestras aprovadas urllib2,BeautifulSoap, regex... 4
  5. 5. Dilema Esses dados são Públicos ?? Não ? Podemos negociar ein ... 5
  6. 6. Alguns dados interessantes 6
  7. 7. 48 Palestras aceitas 2160 minutos de Palestras 7
  8. 8. Ou seja =˜388.800 tweets postados 8
  9. 9. Ou assistir Todas temporadas Big Bang Theory Toda a Saga Star Wars 2x 9
  10. 10. Na nossa língua agora... Zerar Super Mario 216 x http://video.google.com/videoplay?docid=-8297067084319900351&q=mario# 10
  11. 11. Na nossa língua agora... Abrir o Eclipse 2 vezes! 11
  12. 12. Total de Pontos recebidos: 4812 12
  13. 13. Convertendo em votos Não dava para eleger Tiririca, mas Mas veja conseguimos um número perfeito! 4812 MB = Capacidade de um DVD! 13
  14. 14. Palestra Hackeada Dinf & C3SL infra estrutura - 999 vontos Apelão mesmo! 14
  15. 15. Distribuição das palestras Ainda precisamos distribuir melhor o nível das palestras! Avançado 2% Intermediario 56% Basico 42% Avançado Intermediario Basico 15
  16. 16. Distribuição das palestras 16
  17. 17. Temas mais frequentes Temas relacionados a desenvolvimento, dados, sistemas, linguagem, ferramentas, django A partir dos resumos 17
  18. 18. Temas mais frequentes Mas como ver a distribuição dos temas 18
  19. 19. Temas mais frequentes Mas ainda fica difícil de distinguir! 19
  20. 20. Distribuição das palestras Utilizado o algoritmo de clustering K-means Ferramenta de visualização em Python UbiGraph DEMO 20
  21. 21. Distribuição das palestras Ferramenta de visualização UbiGraph Inteligencia Artificial Hardware Web (Django e AppEngine) Empreendorismo Padrões e Práticas Ferramentas Testes Mineração de Dados http://ubietylab.net/ubigraph/ 21
  22. 22. RESUMO Excelente nível de palestras! Submetam seus trabalhos, vocês podem estar aqui também! Engaje, colabore e divulgue! 22
  23. 23. Marcel Caraciolo - @marcelcaraciolo Mineração de Palestras 23
  24. 24. Marcel Caraciolo - @marcelcaraciolo Mineração de Palestras 23

×