@fmasanorihttp://www.slideshare.net/fmasanori
•   Conhecendo o palestrante•   Conhecendo os assistentes•   Business Intelligence•   Pentaho•   Big Data and NoSQL•   Per...
•   IME-USP e Mestrado ITA•   ed e lint Cobra Tecnologia•   Software Express•   Credicard Mastercard•   PriceWaterhouseCoo...
Conhecendo os assistentes•   Estudantes•   Docentes•   Java Dev•   Conhece Sang Shin (JavaPassion)•   Sun Tech Days, JavaO...
Business Intelligence
Business Intelligence
Business IntelligenceGartners 2012 CIO surveyshowed that analytics andBI is the No. 1 technology priority for CIOs in 2012
Analytics no mercado mundial, Gartner:• 2010: +13.4%• 2011: +16.4% == $12.2 billion• 2º em crescimento software marketAmér...
BI architecture  FONTE DE DADOS         PROCESSO DE ETL          DATA WAREHOUSE     APRESENTAÇÃO                          ...
Star Schema                     TEMPOCLIENTE                                    PRODUTO                     VENDAS        ...
Denormalization                  (Kimball, 2002)
DenormalizationAggregation performance                    (Kimball, 2002)
Operacional x Analytics                           Operacional                  AnalíticoPropósito             Executar um ...
Open Source == comunidade ativa
Pentaho == BI suite•   Reporting, OLAP, Pivot Tables, Dashboarding,    Data Mining•   Requisito: Java (JRE + JDK)•   JAVA_...
BI-Server•   Extrair biserver-ce para c:program    filespentaho (exemplo)•   Adionar o user com full control no properties...
Demo
Administration Console•   start-pac.bat•   http://massa-pc:8099/•   User == admin e Senha == password•   Não esquecer: sto...
Demo
Pentaho Data Integration•   ETL: Extract, Transform, Load•   Extrair pdi-ce no mesmo diretório pentaho•   spoon.bat•   Ini...
Demo
BigData and NoSQL• Dados crescem exponencialmente• Wallmart == 1M transactions/hour• Facebook == 40B photos
Escalabilidade vertical • Escalabilidade para leituras num banco  relacional: trabalhoso• Escalabilidade para escritas nu...
Escalabilidade vertical 
Escalabilidade horizontal 
Not Only SQL
• JSON oriented• Autosharding• Full featured indexes
Cassandra: • Linearly Scalable • Column based
Pentaho BigData
Demo http://wiki.pentaho.com/display/BAD/Write+Data+To+MongoDBhttp://wiki.pentaho.com/display/BAD/Read+Data+From+MongoDB
Bibliografia
Bibliografia
Perguntas? fmasanori@gmail.comfacebook.com/fmasanori twitter.com/fmasanori
Pentaho JUG Vale 2012
Pentaho JUG Vale 2012
Upcoming SlideShare
Loading in...5
×

Pentaho JUG Vale 2012

645

Published on

Pentaho is the best open source suite for Business Intelligence and Analytics

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
645
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
32
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Pentaho JUG Vale 2012

  1. 1. @fmasanorihttp://www.slideshare.net/fmasanori
  2. 2. • Conhecendo o palestrante• Conhecendo os assistentes• Business Intelligence• Pentaho• Big Data and NoSQL• Perguntas
  3. 3. • IME-USP e Mestrado ITA• ed e lint Cobra Tecnologia• Software Express• Credicard Mastercard• PriceWaterhouseCoopers• ITAU BankBoston• Docente FATEC (amo dar aulas)• Interesses: Python, NoSQL, Google Technology, Facebook
  4. 4. Conhecendo os assistentes• Estudantes• Docentes• Java Dev• Conhece Sang Shin (JavaPassion)• Sun Tech Days, JavaOne• Business Intelligence• Pentaho
  5. 5. Business Intelligence
  6. 6. Business Intelligence
  7. 7. Business IntelligenceGartners 2012 CIO surveyshowed that analytics andBI is the No. 1 technology priority for CIOs in 2012
  8. 8. Analytics no mercado mundial, Gartner:• 2010: +13.4%• 2011: +16.4% == $12.2 billion• 2º em crescimento software marketAmérica Latina:• 2010: +19.5%
  9. 9. BI architecture FONTE DE DADOS PROCESSO DE ETL DATA WAREHOUSE APRESENTAÇÃO CENTRAL DASHBOARDS OLAP WAREHOUSEArquivos ÁREA DE ESTÁGIO SGBDSGBD ETL DATA DSS SGBD MINING ETL ETL ERP DOCUMENTOS Arquivos CRM DATA MARTS (Luiz H. N. Lorena, 2011)
  10. 10. Star Schema TEMPOCLIENTE PRODUTO VENDAS PROMOÇÃO LOJA (Luiz H. N. Lorena, 2011)
  11. 11. Denormalization (Kimball, 2002)
  12. 12. DenormalizationAggregation performance (Kimball, 2002)
  13. 13. Operacional x Analytics Operacional AnalíticoPropósito Executar um processo Avaliar um processoEstilo interação Insert, update, delete, query Query (read-only)Escopo interação Transação individual AgregaçãoPadrão query Previsível e estável ImprevisívelFoco temporal Atual Histórico e atualOtimização Update concorrente Query (agregação)Projeto ER na 3FN Star Schema ou Cubo (Adamson, 2010)
  14. 14. Open Source == comunidade ativa
  15. 15. Pentaho == BI suite• Reporting, OLAP, Pivot Tables, Dashboarding, Data Mining• Requisito: Java (JRE + JDK)• JAVA_HOME, JRE_HOME, PATH E CLASSPATH• Download community.pentaho.com
  16. 16. BI-Server• Extrair biserver-ce para c:program filespentaho (exemplo)• Adionar o user com full control no properties security do diretorio• start-pentaho.bat ou start-pentaho.sh• http://localhost:8080/pentaho/Login• User == joe e Senha == password• Não esquecer: stop-pentaho.bat
  17. 17. Demo
  18. 18. Administration Console• start-pac.bat• http://massa-pc:8099/• User == admin e Senha == password• Não esquecer: stop-pac.bat
  19. 19. Demo
  20. 20. Pentaho Data Integration• ETL: Extract, Transform, Load• Extrair pdi-ce no mesmo diretório pentaho• spoon.bat• Inicialmente não usaremos o repositório• Ferramenta gráfica, mas os scripts são executados em lote quando em produção
  21. 21. Demo
  22. 22. BigData and NoSQL• Dados crescem exponencialmente• Wallmart == 1M transactions/hour• Facebook == 40B photos
  23. 23. Escalabilidade vertical • Escalabilidade para leituras num banco relacional: trabalhoso• Escalabilidade para escritas num banco relacional: MUITO, MUITO, trabalhoso (se conseguir ele deixou de ser relacional...)
  24. 24. Escalabilidade vertical 
  25. 25. Escalabilidade horizontal 
  26. 26. Not Only SQL
  27. 27. • JSON oriented• Autosharding• Full featured indexes
  28. 28. Cassandra: • Linearly Scalable • Column based
  29. 29. Pentaho BigData
  30. 30. Demo http://wiki.pentaho.com/display/BAD/Write+Data+To+MongoDBhttp://wiki.pentaho.com/display/BAD/Read+Data+From+MongoDB
  31. 31. Bibliografia
  32. 32. Bibliografia
  33. 33. Perguntas? fmasanori@gmail.comfacebook.com/fmasanori twitter.com/fmasanori
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×