SlideShare a Scribd company logo
1 of 32
Download to read offline
1
Data Webhouse CEB-INEP
Projeto de Iniciação Cientifica-UFMS/CPCX
Fernando Maia da Mota (Orientando)
Profa. MSc. Leila Lisiane Rossi (Orientadora)
Prof. Dr. Marcelo Augusto Santos Turine
(Coordenador Projeto Web-Pide)
Apresentação
• Fernando Maia da
Mota(fernandomaia.eti.br)
• Graduando em Sistemas de Informação
pela UFMS - Campus Coxim
• Atua no Laboratório de Suporte e
Desenvolvimento (LSD)
• Aluno de Iniciação Científica
• Analista de BI
2
Agenda
3
• Motivação
• Avaliações INEP
• Fontes de Informação
• Objetivo
• Data Webhouse CEB-INEP
• Dificuldades e Limitações
• Considerações Finais
• Referências
• Perguntas
MOTIVAÇÃO
Como tornar os dados dos Sistemas de
Avaliação do Brasil (INEP/MEC) ”mais
acessíveis e transparentes” aos gestores
educacionais, educadores/pesquisadores
e comunidade em geral a fim de melhorar
a qualidade da Educação Brasileira
4
Caderno: Qualidade da Educação - O
Estado de São Paulo (29 de Abril de
2007)
• Segundo pesquisa do Ibope em Julho/2006 (4.002
entrevistados) 29% não conhecem os exames de
avaliação do INEP/MEC
– “Os dados dos sistemas de avaliação são um instrumento
poderoso. Mas há professores que não sabem como ler e
ter acesso”.
– “Não sei como ‘fuçar’ os dados de maneira a incrementar
meu trabalho ou conhecer minha realidade”
– “Como comparar minha escola com outras bem
posicionadas para melhoria da educação. Não é nosso
costume e não tem ninguém na minha escola que nos
ajude”
– “Oportunidades para aprender com os dados”
5
Avaliações INEP
• Censo Escolar(CEB): levantamento de informações estatístico-
educacionais realizado anualmente;
• Censo Superior: coleta anualmente uma série de dados do
ensino superior no País tanto na modalidade presencial como a
distância;
• Avaliação dos Cursos de Graduação: é utilizado pelo MEC para
o reconhecimento ou renovação de reconhecimento dos
cursos de graduação;
• Avaliação Institucional: análise das informações prestados
pelas Instituições de Ensino Superior (IES) no Formulário
Eletrônico e a verificação, in loco, da realidade institucional,
dos seus cursos de graduação e de pós-graduação, da
pesquisa e da extensão;
6
Avaliações INEP
• Sistema Nacional de Avaliação da Educação Superior(SINAES):
Formado por três componentes principais: avaliação das
instituições, dos cursos e do desempenho dos estudantes.
• Exame Nacional do Ensino Médio (ENEM): exame de saída
facultativo aos que já concluíram e aos concluintes do ensino
médio;
• Exame Nacional Para Certificação de Competências
(ENCCEJA): Avaliação nacional para jovens e adultos que não
puderam concluir os estudos na idade própria;
• Sistema Nacional de Avaliação da Educação Básica (SAEB):
pesquisa por amostragem, do ensino fundamental e médio,
realizada a cada dois anos.
7
Fontes de Informação
• Relatórios em formato PDF (website do INEP ou de
pesquisas) [INEP,2010]
– Difícil cruzamento de dados
• Consultas personalizadas em várias ferramentas
diferentes
– Apenas dados do Censo Escolar e Censo da Educação
Superior
• Microdados em formato ASCII (disponível em CD-
Rom e download)
– Necessita de sistema de leitura e conhecimento técnico:
SAS ou SPSS, por exemplo
8
Esse quadro dificulta
substancialmente a
reutilização de tais
informações para a tomada de
decisão na gestão pública
Objetivo
Definir e Implementar uma plataforma aberta e
baseada em Software Livre na Internet intitulada
Web-PIDE (http://webpide.ledes.net) para
integrar, organizar e disponibilizar os dados
educacionais do INEP por meio de uma
linguagem simples e padronizada (alta
acessibilidade e usabilidade)
9
10
• Meta: INTEGRAR diversas ferramentas implantadas
no INEP por uma solução integrada e centralizada
... +
Projetos de Pesquisa
• O projeto Webpide é composto por vários
projetos sendo um deles a avaliação e os
testes com as ferramentas a serem usadas
para criação dos Data Webhouses que irão
compor a plataforma Web-PIDE.
Técnicas e Ferramentas para o Projeto de Data
Warehouse: Estudo de Caso para a Base de
Dados Educacional do Projeto Webpide
11
Técnicas e Ferramentas para o
Projeto de Data Warehouse
• 2007/2008- Estudo e Avaliação das
Ferramentas
– Pentaho é escolhida por ser a melhor solução
open-source entre todas as pesquisadas.
12
Técnicas e Ferramentas para o
Projeto de Data Warehouse
• 2008 / 2009 – Desenvolvimento Data
Webhouse SAEB
– Criação do primeiro DW do projeto para a
base do SAEB
• 2009/2010 - Desenvolvimento Data Webhouse
CEB-INEP
– BI-Server.
• Controle de Acesso
• Evolução Visual
• Usuário pode criar visões próprias e salva-
las no portal.
13
Estrutura base CEB
14
ETL- Etapa 1
15
• Carregar os dados em tabelas de um banco
de dados.
– SGBD PostgreSQL
• INEP.sql- Contém a estrutura das tabelas
– Criação da ferramenta DEAR para leitura dos
arquivos:
• SAS- Contém o inicio e fim de cada campo
dado(Alguns Arquivos corrompidos)
• Microdados- Arquivos TXT em formato
ASCII com dados brutos
Ferramenta DEAR: Data Extractor
ASCII to Relational
16
DEAR
17
Aplicação que faz a leitura dos arquivos SAS [JAVA,2010]
Informações da Base
• Cluster com mais de 10GB de dados
• Grande variação de dados ao longo dos
anos de pesquisa
18
19
Definição do Modelo Multidimensional
• Definiu-se a tabela que contém os
dados do censo escolar, por estar
presente em todos os anos da
pesquisa, sendo assim variante no
tempo, conceito primordial de um DW
• Mapeamento detalhado dos campos
desta tabela, para a construção de um
modelo com alto nível de granularidade
20
Cubo Estrela
Cubo Estrela CEB-INEP [JUDE,2010]
ETL- Etapa 2
Carga das Dimensões e Fato
•Carga das dimensões feito através de script SQL
•Carga Fato
– Look-up das dimensões através de store procedures
• GetGeografia(região do Brasil, UF, Município,
Zona Escolar), retorna o id do registro que
satisfaz a estas condições na tabela dimensão
Geografia
– A fato foi carregada utilizando script sql insert/select
[PostgreSQL,2010]
21
BI-Server Pentaho [PENTAHO,2010]
22
PSW- Mapeamento do Cubo em
XML
23
Data Webhouse CEB-INEP
24
Número de Instituições por
Região e Ano
25
Número de Professores em Sala de
Aula por Região e Ano
26
Número de Matriculas na Pré-escola
na cidade de Alvaraes-AM (MDX)
27
Número de Matriculas na Pré-escola
por Geografia(Ano de 1996)
28
Dificuldades e Limitações
• Compreender e analisar os dados e a
consistência dos mesmos: estruturas e
formatos (.sas, .pdf, .txt);
• Capacidade HD/Ferramenta Banco Dados
29
Considerações Finais
30
• Importância da Integração das Bases de Dados do
INEP (CEB-INEP);
• Disponibilização dos Dados Educacionais INEP na
Web permitindo consultas analiticas online (OLAP);
• Facilidade do INEP na tomada de decisão para a
adoção de Políticas Educacionais;
• Uso de tecnologias de código aberto para o
desenvolvimento de softwares do governo federal;
• Participação de pesquisadores de Universidades
públicas no projeto (UFMS / UFScar);
Referências
• INEP - Instituto Nacional de Estudos e Pesquisas Educacionais
Anísio Teixeira. - http://www.inep.gov.br
• TURINE M.A.S.et al. - Projeto de Pesquisa EDITAL no.
001/2006/INEP/CAPES Web-PIDE: Uma Plataforma aberta de
Integração e avaliação de Dados Educacionais, 2006
• PENTAHO, Pentaho Open Source Business Intelligence -
http://www.pentaho.com, 2010
• JUDE, Jude Design & Communications - //http://jude.change-
vision.com, 2010
• PostgreSQL - http://www.postgresql.org, 2010
• JAVA, Sun Microsystems - http://www.sun.com, 2010
• Caio Moreno de Souza - http://blog.professorcoruja.com
31
CONTATOS
Fernando Maia
mota.fernandomaia@gmail.com
www.fernandomaia.eti.br
Leila Lisiane Rossi
leilalrossi@gmail.com
Marcelo Augusto dos Santos Turine
mturine@gmail.com
32

More Related Content

Similar to Data Webhouse CEB/INEP

Fortalecimento da Rede BVS Brasil – Plano Ação 2021 - I reunião
Fortalecimento da Rede BVS Brasil – Plano Ação 2021 - I reuniãoFortalecimento da Rede BVS Brasil – Plano Ação 2021 - I reunião
Fortalecimento da Rede BVS Brasil – Plano Ação 2021 - I reuniãohttp://bvsalud.org/
 
Capítulo 11 - Como desenvolver sistemas de informação e gerenciar projetos
Capítulo 11 - Como desenvolver sistemas de informação e gerenciar projetosCapítulo 11 - Como desenvolver sistemas de informação e gerenciar projetos
Capítulo 11 - Como desenvolver sistemas de informação e gerenciar projetosEverton Souza
 
RECOMENDAÇÃO DE DOCUMENTOS PARA OS USUÁRIOS DO AVA MOODLE A PARTIR DAS HASHTA...
RECOMENDAÇÃO DE DOCUMENTOS PARA OS USUÁRIOS DO AVA MOODLE A PARTIR DAS HASHTA...RECOMENDAÇÃO DE DOCUMENTOS PARA OS USUÁRIOS DO AVA MOODLE A PARTIR DAS HASHTA...
RECOMENDAÇÃO DE DOCUMENTOS PARA OS USUÁRIOS DO AVA MOODLE A PARTIR DAS HASHTA...Adelton Ribeiro
 
Planode Aula
Planode AulaPlanode Aula
Planode Aulasofteam
 
IN1008 Aspectos de Qualidade na Modelagem de Dados Monica Rafael (1).ppt
IN1008 Aspectos de Qualidade na Modelagem de Dados Monica Rafael (1).pptIN1008 Aspectos de Qualidade na Modelagem de Dados Monica Rafael (1).ppt
IN1008 Aspectos de Qualidade na Modelagem de Dados Monica Rafael (1).pptRafael Rodrigues de Souza
 
Sistema de AutoAvalição Web para o Ceulji Ulbra
Sistema de AutoAvalição Web para o Ceulji UlbraSistema de AutoAvalição Web para o Ceulji Ulbra
Sistema de AutoAvalição Web para o Ceulji UlbraClayton Ferraz
 
II Forum de Cultura de Informatica - Sistemas de Informacao da FFC - UNESP
II Forum de Cultura de Informatica - Sistemas de Informacao da FFC - UNESPII Forum de Cultura de Informatica - Sistemas de Informacao da FFC - UNESP
II Forum de Cultura de Informatica - Sistemas de Informacao da FFC - UNESPJose Eduardo Santarem Segundo
 
Usabilidade de interface para busca e recuperação de informação na web
Usabilidade de interface para busca e recuperação de informação na webUsabilidade de interface para busca e recuperação de informação na web
Usabilidade de interface para busca e recuperação de informação na webRobson Santos
 
Plano de ensino - Princípios de Sistemas da Informação
Plano de ensino - Princípios de Sistemas da InformaçãoPlano de ensino - Princípios de Sistemas da Informação
Plano de ensino - Princípios de Sistemas da Informaçãoefjunior
 
PRINC DE SIST DE INFORMACAO
PRINC DE SIST DE INFORMACAOPRINC DE SIST DE INFORMACAO
PRINC DE SIST DE INFORMACAOpaulocsm
 
Repositórios de produção científica e seu potencial nos sistemas de avaliação
Repositórios de produção científica e seu potencial nos sistemas de avaliaçãoRepositórios de produção científica e seu potencial nos sistemas de avaliação
Repositórios de produção científica e seu potencial nos sistemas de avaliaçãoRoberto C. S. Pacheco
 
Engenharia de Requisitos em Software para E-learning
Engenharia de Requisitos em Software para E-learningEngenharia de Requisitos em Software para E-learning
Engenharia de Requisitos em Software para E-learningNathalia Sautchuk Patricio
 
IAS: Como o Instituto Ayrton Senna organizou a seleção de sua plataforma LMS
IAS: Como o Instituto Ayrton Senna organizou a seleção de sua plataforma LMSIAS: Como o Instituto Ayrton Senna organizou a seleção de sua plataforma LMS
IAS: Como o Instituto Ayrton Senna organizou a seleção de sua plataforma LMSD2L Barry
 
Curriculo lattes
Curriculo lattesCurriculo lattes
Curriculo lattesvfreitasx
 
Sistema da informacao
Sistema da informacaoSistema da informacao
Sistema da informacaopaulocsm
 

Similar to Data Webhouse CEB/INEP (20)

Fortalecimento da Rede BVS Brasil – Plano Ação 2021 - I reunião
Fortalecimento da Rede BVS Brasil – Plano Ação 2021 - I reuniãoFortalecimento da Rede BVS Brasil – Plano Ação 2021 - I reunião
Fortalecimento da Rede BVS Brasil – Plano Ação 2021 - I reunião
 
Esquemas de metadados utilizados por repositórios digitais científicos latino...
Esquemas de metadados utilizados por repositórios digitais científicos latino...Esquemas de metadados utilizados por repositórios digitais científicos latino...
Esquemas de metadados utilizados por repositórios digitais científicos latino...
 
Capítulo 11 - Como desenvolver sistemas de informação e gerenciar projetos
Capítulo 11 - Como desenvolver sistemas de informação e gerenciar projetosCapítulo 11 - Como desenvolver sistemas de informação e gerenciar projetos
Capítulo 11 - Como desenvolver sistemas de informação e gerenciar projetos
 
RECOMENDAÇÃO DE DOCUMENTOS PARA OS USUÁRIOS DO AVA MOODLE A PARTIR DAS HASHTA...
RECOMENDAÇÃO DE DOCUMENTOS PARA OS USUÁRIOS DO AVA MOODLE A PARTIR DAS HASHTA...RECOMENDAÇÃO DE DOCUMENTOS PARA OS USUÁRIOS DO AVA MOODLE A PARTIR DAS HASHTA...
RECOMENDAÇÃO DE DOCUMENTOS PARA OS USUÁRIOS DO AVA MOODLE A PARTIR DAS HASHTA...
 
Extrator Lattes CNPq (Versão SBSI)
Extrator Lattes CNPq (Versão SBSI)Extrator Lattes CNPq (Versão SBSI)
Extrator Lattes CNPq (Versão SBSI)
 
Planode Aula
Planode AulaPlanode Aula
Planode Aula
 
IN1008 Aspectos de Qualidade na Modelagem de Dados Monica Rafael (1).ppt
IN1008 Aspectos de Qualidade na Modelagem de Dados Monica Rafael (1).pptIN1008 Aspectos de Qualidade na Modelagem de Dados Monica Rafael (1).ppt
IN1008 Aspectos de Qualidade na Modelagem de Dados Monica Rafael (1).ppt
 
Sistema de AutoAvalição Web para o Ceulji Ulbra
Sistema de AutoAvalição Web para o Ceulji UlbraSistema de AutoAvalição Web para o Ceulji Ulbra
Sistema de AutoAvalição Web para o Ceulji Ulbra
 
II Forum de Cultura de Informatica - Sistemas de Informacao da FFC - UNESP
II Forum de Cultura de Informatica - Sistemas de Informacao da FFC - UNESPII Forum de Cultura de Informatica - Sistemas de Informacao da FFC - UNESP
II Forum de Cultura de Informatica - Sistemas de Informacao da FFC - UNESP
 
Usabilidade de interface para busca e recuperação de informação na web
Usabilidade de interface para busca e recuperação de informação na webUsabilidade de interface para busca e recuperação de informação na web
Usabilidade de interface para busca e recuperação de informação na web
 
Mota Werner TCC
Mota Werner TCCMota Werner TCC
Mota Werner TCC
 
Integração de dados
Integração de dadosIntegração de dados
Integração de dados
 
Plano de ensino - Princípios de Sistemas da Informação
Plano de ensino - Princípios de Sistemas da InformaçãoPlano de ensino - Princípios de Sistemas da Informação
Plano de ensino - Princípios de Sistemas da Informação
 
PRINC DE SIST DE INFORMACAO
PRINC DE SIST DE INFORMACAOPRINC DE SIST DE INFORMACAO
PRINC DE SIST DE INFORMACAO
 
Repositórios de produção científica e seu potencial nos sistemas de avaliação
Repositórios de produção científica e seu potencial nos sistemas de avaliaçãoRepositórios de produção científica e seu potencial nos sistemas de avaliação
Repositórios de produção científica e seu potencial nos sistemas de avaliação
 
Engenharia de Requisitos em Software para E-learning
Engenharia de Requisitos em Software para E-learningEngenharia de Requisitos em Software para E-learning
Engenharia de Requisitos em Software para E-learning
 
IAS: Como o Instituto Ayrton Senna organizou a seleção de sua plataforma LMS
IAS: Como o Instituto Ayrton Senna organizou a seleção de sua plataforma LMSIAS: Como o Instituto Ayrton Senna organizou a seleção de sua plataforma LMS
IAS: Como o Instituto Ayrton Senna organizou a seleção de sua plataforma LMS
 
Curriculo lattes
Curriculo lattesCurriculo lattes
Curriculo lattes
 
Curriculo lattes
Curriculo lattesCurriculo lattes
Curriculo lattes
 
Sistema da informacao
Sistema da informacaoSistema da informacao
Sistema da informacao
 

More from Fernando Maia da Mota

Inteligência nos negócios com ferramentas open source (Debian Day MS 2014)
Inteligência nos negócios com ferramentas open source (Debian Day MS 2014)Inteligência nos negócios com ferramentas open source (Debian Day MS 2014)
Inteligência nos negócios com ferramentas open source (Debian Day MS 2014)Fernando Maia da Mota
 
Analista de BI - O que as empresas esperam de você
Analista de BI - O que as empresas esperam de vocêAnalista de BI - O que as empresas esperam de você
Analista de BI - O que as empresas esperam de vocêFernando Maia da Mota
 
Uma Visão Geral dos Sistemas de Inteligência nos Negócios (BI)
Uma Visão Geral dos Sistemas de Inteligência nos Negócios (BI)Uma Visão Geral dos Sistemas de Inteligência nos Negócios (BI)
Uma Visão Geral dos Sistemas de Inteligência nos Negócios (BI)Fernando Maia da Mota
 
Uma Estratégia para Publicação dos Dados da Base do CEB/INEP-MEC no Padrão Li...
Uma Estratégia para Publicação dos Dados da Base do CEB/INEP-MEC no Padrão Li...Uma Estratégia para Publicação dos Dados da Base do CEB/INEP-MEC no Padrão Li...
Uma Estratégia para Publicação dos Dados da Base do CEB/INEP-MEC no Padrão Li...Fernando Maia da Mota
 
Uma Estratégia para Publicação dos Dados da Base do CEB-INEP/MEC no Padrão Li...
Uma Estratégia para Publicação dos Dados da Base do CEB-INEP/MEC no Padrão Li...Uma Estratégia para Publicação dos Dados da Base do CEB-INEP/MEC no Padrão Li...
Uma Estratégia para Publicação dos Dados da Base do CEB-INEP/MEC no Padrão Li...Fernando Maia da Mota
 
DWSI- DataWebhouse para Análise do Perfil Acadêmico do Curso de Sistemas de I...
DWSI- DataWebhouse para Análise do Perfil Acadêmico do Curso de Sistemas de I...DWSI- DataWebhouse para Análise do Perfil Acadêmico do Curso de Sistemas de I...
DWSI- DataWebhouse para Análise do Perfil Acadêmico do Curso de Sistemas de I...Fernando Maia da Mota
 

More from Fernando Maia da Mota (6)

Inteligência nos negócios com ferramentas open source (Debian Day MS 2014)
Inteligência nos negócios com ferramentas open source (Debian Day MS 2014)Inteligência nos negócios com ferramentas open source (Debian Day MS 2014)
Inteligência nos negócios com ferramentas open source (Debian Day MS 2014)
 
Analista de BI - O que as empresas esperam de você
Analista de BI - O que as empresas esperam de vocêAnalista de BI - O que as empresas esperam de você
Analista de BI - O que as empresas esperam de você
 
Uma Visão Geral dos Sistemas de Inteligência nos Negócios (BI)
Uma Visão Geral dos Sistemas de Inteligência nos Negócios (BI)Uma Visão Geral dos Sistemas de Inteligência nos Negócios (BI)
Uma Visão Geral dos Sistemas de Inteligência nos Negócios (BI)
 
Uma Estratégia para Publicação dos Dados da Base do CEB/INEP-MEC no Padrão Li...
Uma Estratégia para Publicação dos Dados da Base do CEB/INEP-MEC no Padrão Li...Uma Estratégia para Publicação dos Dados da Base do CEB/INEP-MEC no Padrão Li...
Uma Estratégia para Publicação dos Dados da Base do CEB/INEP-MEC no Padrão Li...
 
Uma Estratégia para Publicação dos Dados da Base do CEB-INEP/MEC no Padrão Li...
Uma Estratégia para Publicação dos Dados da Base do CEB-INEP/MEC no Padrão Li...Uma Estratégia para Publicação dos Dados da Base do CEB-INEP/MEC no Padrão Li...
Uma Estratégia para Publicação dos Dados da Base do CEB-INEP/MEC no Padrão Li...
 
DWSI- DataWebhouse para Análise do Perfil Acadêmico do Curso de Sistemas de I...
DWSI- DataWebhouse para Análise do Perfil Acadêmico do Curso de Sistemas de I...DWSI- DataWebhouse para Análise do Perfil Acadêmico do Curso de Sistemas de I...
DWSI- DataWebhouse para Análise do Perfil Acadêmico do Curso de Sistemas de I...
 

Data Webhouse CEB/INEP

  • 1. 1 Data Webhouse CEB-INEP Projeto de Iniciação Cientifica-UFMS/CPCX Fernando Maia da Mota (Orientando) Profa. MSc. Leila Lisiane Rossi (Orientadora) Prof. Dr. Marcelo Augusto Santos Turine (Coordenador Projeto Web-Pide)
  • 2. Apresentação • Fernando Maia da Mota(fernandomaia.eti.br) • Graduando em Sistemas de Informação pela UFMS - Campus Coxim • Atua no Laboratório de Suporte e Desenvolvimento (LSD) • Aluno de Iniciação Científica • Analista de BI 2
  • 3. Agenda 3 • Motivação • Avaliações INEP • Fontes de Informação • Objetivo • Data Webhouse CEB-INEP • Dificuldades e Limitações • Considerações Finais • Referências • Perguntas
  • 4. MOTIVAÇÃO Como tornar os dados dos Sistemas de Avaliação do Brasil (INEP/MEC) ”mais acessíveis e transparentes” aos gestores educacionais, educadores/pesquisadores e comunidade em geral a fim de melhorar a qualidade da Educação Brasileira 4
  • 5. Caderno: Qualidade da Educação - O Estado de São Paulo (29 de Abril de 2007) • Segundo pesquisa do Ibope em Julho/2006 (4.002 entrevistados) 29% não conhecem os exames de avaliação do INEP/MEC – “Os dados dos sistemas de avaliação são um instrumento poderoso. Mas há professores que não sabem como ler e ter acesso”. – “Não sei como ‘fuçar’ os dados de maneira a incrementar meu trabalho ou conhecer minha realidade” – “Como comparar minha escola com outras bem posicionadas para melhoria da educação. Não é nosso costume e não tem ninguém na minha escola que nos ajude” – “Oportunidades para aprender com os dados” 5
  • 6. Avaliações INEP • Censo Escolar(CEB): levantamento de informações estatístico- educacionais realizado anualmente; • Censo Superior: coleta anualmente uma série de dados do ensino superior no País tanto na modalidade presencial como a distância; • Avaliação dos Cursos de Graduação: é utilizado pelo MEC para o reconhecimento ou renovação de reconhecimento dos cursos de graduação; • Avaliação Institucional: análise das informações prestados pelas Instituições de Ensino Superior (IES) no Formulário Eletrônico e a verificação, in loco, da realidade institucional, dos seus cursos de graduação e de pós-graduação, da pesquisa e da extensão; 6
  • 7. Avaliações INEP • Sistema Nacional de Avaliação da Educação Superior(SINAES): Formado por três componentes principais: avaliação das instituições, dos cursos e do desempenho dos estudantes. • Exame Nacional do Ensino Médio (ENEM): exame de saída facultativo aos que já concluíram e aos concluintes do ensino médio; • Exame Nacional Para Certificação de Competências (ENCCEJA): Avaliação nacional para jovens e adultos que não puderam concluir os estudos na idade própria; • Sistema Nacional de Avaliação da Educação Básica (SAEB): pesquisa por amostragem, do ensino fundamental e médio, realizada a cada dois anos. 7
  • 8. Fontes de Informação • Relatórios em formato PDF (website do INEP ou de pesquisas) [INEP,2010] – Difícil cruzamento de dados • Consultas personalizadas em várias ferramentas diferentes – Apenas dados do Censo Escolar e Censo da Educação Superior • Microdados em formato ASCII (disponível em CD- Rom e download) – Necessita de sistema de leitura e conhecimento técnico: SAS ou SPSS, por exemplo 8 Esse quadro dificulta substancialmente a reutilização de tais informações para a tomada de decisão na gestão pública
  • 9. Objetivo Definir e Implementar uma plataforma aberta e baseada em Software Livre na Internet intitulada Web-PIDE (http://webpide.ledes.net) para integrar, organizar e disponibilizar os dados educacionais do INEP por meio de uma linguagem simples e padronizada (alta acessibilidade e usabilidade) 9
  • 10. 10 • Meta: INTEGRAR diversas ferramentas implantadas no INEP por uma solução integrada e centralizada ... +
  • 11. Projetos de Pesquisa • O projeto Webpide é composto por vários projetos sendo um deles a avaliação e os testes com as ferramentas a serem usadas para criação dos Data Webhouses que irão compor a plataforma Web-PIDE. Técnicas e Ferramentas para o Projeto de Data Warehouse: Estudo de Caso para a Base de Dados Educacional do Projeto Webpide 11
  • 12. Técnicas e Ferramentas para o Projeto de Data Warehouse • 2007/2008- Estudo e Avaliação das Ferramentas – Pentaho é escolhida por ser a melhor solução open-source entre todas as pesquisadas. 12
  • 13. Técnicas e Ferramentas para o Projeto de Data Warehouse • 2008 / 2009 – Desenvolvimento Data Webhouse SAEB – Criação do primeiro DW do projeto para a base do SAEB • 2009/2010 - Desenvolvimento Data Webhouse CEB-INEP – BI-Server. • Controle de Acesso • Evolução Visual • Usuário pode criar visões próprias e salva- las no portal. 13
  • 15. ETL- Etapa 1 15 • Carregar os dados em tabelas de um banco de dados. – SGBD PostgreSQL • INEP.sql- Contém a estrutura das tabelas – Criação da ferramenta DEAR para leitura dos arquivos: • SAS- Contém o inicio e fim de cada campo dado(Alguns Arquivos corrompidos) • Microdados- Arquivos TXT em formato ASCII com dados brutos
  • 16. Ferramenta DEAR: Data Extractor ASCII to Relational 16
  • 17. DEAR 17 Aplicação que faz a leitura dos arquivos SAS [JAVA,2010]
  • 18. Informações da Base • Cluster com mais de 10GB de dados • Grande variação de dados ao longo dos anos de pesquisa 18
  • 19. 19 Definição do Modelo Multidimensional • Definiu-se a tabela que contém os dados do censo escolar, por estar presente em todos os anos da pesquisa, sendo assim variante no tempo, conceito primordial de um DW • Mapeamento detalhado dos campos desta tabela, para a construção de um modelo com alto nível de granularidade
  • 20. 20 Cubo Estrela Cubo Estrela CEB-INEP [JUDE,2010]
  • 21. ETL- Etapa 2 Carga das Dimensões e Fato •Carga das dimensões feito através de script SQL •Carga Fato – Look-up das dimensões através de store procedures • GetGeografia(região do Brasil, UF, Município, Zona Escolar), retorna o id do registro que satisfaz a estas condições na tabela dimensão Geografia – A fato foi carregada utilizando script sql insert/select [PostgreSQL,2010] 21
  • 23. PSW- Mapeamento do Cubo em XML 23
  • 25. Número de Instituições por Região e Ano 25
  • 26. Número de Professores em Sala de Aula por Região e Ano 26
  • 27. Número de Matriculas na Pré-escola na cidade de Alvaraes-AM (MDX) 27
  • 28. Número de Matriculas na Pré-escola por Geografia(Ano de 1996) 28
  • 29. Dificuldades e Limitações • Compreender e analisar os dados e a consistência dos mesmos: estruturas e formatos (.sas, .pdf, .txt); • Capacidade HD/Ferramenta Banco Dados 29
  • 30. Considerações Finais 30 • Importância da Integração das Bases de Dados do INEP (CEB-INEP); • Disponibilização dos Dados Educacionais INEP na Web permitindo consultas analiticas online (OLAP); • Facilidade do INEP na tomada de decisão para a adoção de Políticas Educacionais; • Uso de tecnologias de código aberto para o desenvolvimento de softwares do governo federal; • Participação de pesquisadores de Universidades públicas no projeto (UFMS / UFScar);
  • 31. Referências • INEP - Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. - http://www.inep.gov.br • TURINE M.A.S.et al. - Projeto de Pesquisa EDITAL no. 001/2006/INEP/CAPES Web-PIDE: Uma Plataforma aberta de Integração e avaliação de Dados Educacionais, 2006 • PENTAHO, Pentaho Open Source Business Intelligence - http://www.pentaho.com, 2010 • JUDE, Jude Design & Communications - //http://jude.change- vision.com, 2010 • PostgreSQL - http://www.postgresql.org, 2010 • JAVA, Sun Microsystems - http://www.sun.com, 2010 • Caio Moreno de Souza - http://blog.professorcoruja.com 31
  • 32. CONTATOS Fernando Maia mota.fernandomaia@gmail.com www.fernandomaia.eti.br Leila Lisiane Rossi leilalrossi@gmail.com Marcelo Augusto dos Santos Turine mturine@gmail.com 32