O documento descreve a trajetória profissional de Rodrigo Senra, engenheiro de computação e especialista em Python. Ele trabalhou em empresas de tecnologia, foi professor universitário e pesquisador, e atua na comunidade Python desde 2000.
13. Quem está aí ?
• Estudantes ?
• Profissionais ?
• Professores ?
14. Quem está aí ?
• Estudantes ?
• Profissionais ?
• Professores ?
• Palestrantes ?
15. Quem está aí ?
• Estudantes ?
• Profissionais ?
• Professores ?
• Palestrantes ?
• Pythonistas ?
16. Vamos falar do quê ?
• Cientista de Dados
• O Graal do desenvolvedor
• Escolhendo uma linguagem
• Contextualizando Python
• Vocabulário Ofidiglota
17. fONTE: IDC Digital Universe Study, patrocinado pela EMC, 2011
fonte: http://thehumanfaceofbigdata.com/
18. fONTE: IDC Digital Universe Study, patrocinado pela EMC, 2011
IN 2010 THE DIGITAL UNIVERSE WAS
1.2 ZETTABYTES
fonte: http://thehumanfaceofbigdata.com/
19. fONTE: IDC Digital Universe Study, patrocinado pela EMC, 2011
IN 2010 THE DIGITAL UNIVERSE WAS
1.2 ZETTABYTES
1,200,000,000,000,000,000,000
Zetta Exa Peta Tera Giga Mega Kilo Byte
fonte: http://thehumanfaceofbigdata.com/
20. fONTE: IDC Digital Universe Study, patrocinado pela EMC, 2011
2009
0.8 Zettabytes CRESCIMENTO
DA INFORMAÇÃO
2020
44
X
MAIOR
35.2 ZB
IN 2010 THE DIGITAL UNIVERSE WAS
1.2 ZETTABYTES
1,200,000,000,000,000,000,000
Zetta Exa Peta Tera Giga Mega Kilo Byte
fonte: http://thehumanfaceofbigdata.com/
21. fONTE: IDC Digital Universe Study, patrocinado pela EMC, 2011
2009
0.8 Zettabytes CRESCIMENTO
DA INFORMAÇÃO
2020
44
X
MAIOR
35.2 ZB
IN 2010 THE DIGITAL UNIVERSE WAS
1.2 ZETTABYTES
1,200,000,000,000,000,000,000
Zetta Exa Peta Tera Giga Mega Kilo Byte
fonte: http://thehumanfaceofbigdata.com/
25. Data Science is a newly emerging field dedicated to
analyzing and manipulating data to derive insights
and build data products.
https://beta.oreilly.com/ideas/what-is-data-science
It combines skill-sets ranging from
computer science, to mathematics, to art.
http://images.fineartamerica.com/images-medium-large-5/1-pi-transition-paths-martin-krzywinski.jpg
31. Estatísticas descritivas:
! Média vs. Mediana.
! Desvio Padrão
! Quartis, Min/Max.
! Correlação entre variavéis
1
X y
10. 8.0
8.0 6.9
13. 7.5
9.0 8.8
11.0 8.3
14. 9.9
6.0 7.2
4.0 4.2
12. 10.
7.0 4.8
5.0 5.6
2
x y
10. 9.1
8.0 8.1
13. 8.7
9.0 8.7
11. 9.2
14. 8.1
6.0 6.1
4.0 3.1
12. 9.1
7.0 7.2
5.0 4.7
3
x y
10. 7.4
8.0 6.7
13. 12.
9.0 7.1
11. 7.8
14. 8.8
6.0 6.0
4.0 5.3
12. 8.1
7.0 6.4
5.0 5.7
4
x y
8.00 6.58
8.00 5.76
8.00 7.71
8.00 8.84
8.00 8.47
8.00 7.04
8.00 5.25
19.0 12.5
8.00 5.56
8.00 7.91
8.00 6.89
Média de x: 9
Variância de x: 11
Média exata de y: 7.5 (2 d.p)
Variância de y: 4.13 (to 2 d.p)
Correlação entre x e y : 0.816
Regressão linear: Y = 3.00 + 0.500x
32. Estatísticas descritivas:
! Média vs. Mediana.
! Desvio Padrão
! Quartis, Min/Max.
! Correlação entre variavéis
1
X y
10. 8.0
8.0 6.9
13. 7.5
9.0 8.8
11.0 8.3
14. 9.9
6.0 7.2
4.0 4.2
12. 10.
7.0 4.8
5.0 5.6
2
x y
10. 9.1
8.0 8.1
13. 8.7
9.0 8.7
11. 9.2
14. 8.1
6.0 6.1
4.0 3.1
12. 9.1
7.0 7.2
5.0 4.7
3
x y
10. 7.4
8.0 6.7
13. 12.
9.0 7.1
11. 7.8
14. 8.8
6.0 6.0
4.0 5.3
12. 8.1
7.0 6.4
5.0 5.7
4
x y
8.00 6.58
8.00 5.76
8.00 7.71
8.00 8.84
8.00 8.47
8.00 7.04
8.00 5.25
19.0 12.5
8.00 5.56
8.00 7.91
8.00 6.89
Média de x: 9
Variância de x: 11
Média exata de y: 7.5 (2 d.p)
Variância de y: 4.13 (to 2 d.p)
Correlação entre x e y : 0.816
Regressão linear: Y = 3.00 + 0.500x
33. Estatísticas descritivas:
! Média vs. Mediana.
! Desvio Padrão
! Quartis, Min/Max.
! Correlação entre variavéis
1
X y
10. 8.0
8.0 6.9
13. 7.5
9.0 8.8
11.0 8.3
14. 9.9
6.0 7.2
4.0 4.2
12. 10.
7.0 4.8
5.0 5.6
2
x y
10. 9.1
8.0 8.1
13. 8.7
9.0 8.7
11. 9.2
14. 8.1
6.0 6.1
4.0 3.1
12. 9.1
7.0 7.2
5.0 4.7
3
x y
10. 7.4
8.0 6.7
13. 12.
9.0 7.1
11. 7.8
14. 8.8
6.0 6.0
4.0 5.3
12. 8.1
7.0 6.4
5.0 5.7
4
x y
8.00 6.58
8.00 5.76
8.00 7.71
8.00 8.84
8.00 8.47
8.00 7.04
8.00 5.25
19.0 12.5
8.00 5.56
8.00 7.91
8.00 6.89
Média de x: 9
Variância de x: 11
Média exata de y: 7.5 (2 d.p)
Variância de y: 4.13 (to 2 d.p)
Correlação entre x e y : 0.816
Regressão linear: Y = 3.00 + 0.500xTruth lies on statistics !
34.
35.
36.
37.
38.
39.
40.
41.
42. Big Data a cada passo da exploração de petróleo
43. Big Data a cada passo da exploração de petróleo
Navigation
Seismic: Pre-stack
Seismic: Post-stack
Log Curves
Culture Data
Geologic Model
Pressure Data
Velocity Data Interpretation
47. Fernando Perez, lead PI at BIDS and creator of IPython, demonstrates brain imaging analyses
performed using the IPython Notebook, an interactive web-based computational environment.
credit: Peg Skorpinski
56. A verdade dói...
# Edsger W.Dijkstra, 18 Junho 1975 http://www.cbi.umn.edu/inv/burros/ewd498.htm
57. A verdade dói...
# Edsger W.Dijkstra, 18 Junho 1975 http://www.cbi.umn.edu/inv/burros/ewd498.htm
FORTRAN --"the infantile
disorder"--, by now nearly
20 years old, is hopelessly
inadequate for whatever
computer application
you have in mind today:
it is now too clumsy, too
risky, and too expensive to
use
58. A verdade dói...
# Edsger W.Dijkstra, 18 Junho 1975 http://www.cbi.umn.edu/inv/burros/ewd498.htm
PL/1 --"the fatal
disease"-- belongs
more to the
problem set than to
the solution set
59. A verdade dói...
# Edsger W.Dijkstra, 18 Junho 1975 http://www.cbi.umn.edu/inv/burros/ewd498.htm
It is practically impossible
to teach good
programming to students
that have had a prior
exposure to BASIC: as
potential programmers
they are mentally
mutilated beyond hope of
regeneration
60. A verdade dói...
# Edsger W.Dijkstra, 18 Junho 1975 http://www.cbi.umn.edu/inv/burros/ewd498.htm
The use of COBOL
cripples the mind; its
teaching should,
therefore, be regarded as
a criminal offence
91. Bancos de Dados
from psycopg import *
o = connect(“ dbname=teste user=fulano” )
c = o.cursor()
c.execute(“ SELECT * FROM nome_da_tabela” )
row = c.fetchone()
print row
x = [ ('valor_1', 'fulano', 0), ('valor_2', 'beltrano', 5),
('valor_3', 'ciclano', 15)]
c.executemany(" " " INSERT INTO outra_tabela
VALUES (%s, %s, %s)""", x)
c.commit()
92. Networking
from twisted.internet.protocol import Protocol, Factory
from twisted.internet import reactor
from time import asctime
class TimeServer(Protocol):
def dataReceived(self, data):
self.transport.write(asctime())
def main():
f = Factory()
f.protocol = TimeServer
reactor.listenTCP(8000, f)
reactor.run()
main()
93. Web Services
from SOAPpy import SOAPProxy
from SOAPpy import Types
google = SOAPProxy( 'http://api.google.com/search/beta2',
'urn:GoogleSearch')
results = google.doGetCachedPage('Pd6ke...ArQoX' ,
'www.owls.org')
of = open('cached_page_response.html', 'w')
of.write(results)
of.close()
94. SciPy
import view
from Numeric import *
x = arange(-3, 6, .04)
y = arange(-12, 12, .08)
y = sin(y)*exp(-y*y/18.0)
z = x * y[:,NewAxis]
view.view(z)
96. Referências
! Fluent Python: Luciano Ramalho (O’Reilly)
! Python in a Nutshell: Alex Martelli (O'Reilly)
! Python Cookbook: Alex Martelli, David Ascher (O'Reilly)
! Learning Python for Interactive Computing and Data
Visualisation: Cyrille Rossant (Packt)
97. Conclusão
• Ágil, madura e moderna
• Fácil aprendizado
• Comunidade Ativa
• Fartura de documentação
• Divertida ;o)
98.
99.
100.
101.
102. Obrigado a todos
pela atenção.
Rodrigo Dias Arruda Senra
http://rodrigo.senra.nom.br
rodsenra@gmail.com
@rodsenra
As opiniões e conclusões expressas nesta apresentação são de exclusiva responsabilidade de Rodrigo Senra.
Não é necessário requisitar permissão do autor para o uso de partes ou do todo desta apresentação, desde que não sejam feitas
alterações no conteúdo reutilizado e que esta nota esteja presente na íntegra no material resultante.
Imagens e referências para outros trabalhos nesta apresentação permanecem propriedade daqueles que detêm seus direitos de
copyright. Agradecimento especial a Ana Oliveira e Diego Salomone que contribuíram com alguns slides de suas apresentações sobre
o mesmo tema.