• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Data Webhouse CEB/INEP
 

Data Webhouse CEB/INEP

on

  • 521 views

 

Statistics

Views

Total Views
521
Views on SlideShare
521
Embed Views
0

Actions

Likes
0
Downloads
3
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Data Webhouse CEB/INEP Data Webhouse CEB/INEP Presentation Transcript

    • 1Data Webhouse CEB-INEPProjeto de Iniciação Cientifica-UFMS/CPCXFernando Maia da Mota (Orientando)Profa. MSc. Leila Lisiane Rossi (Orientadora)Prof. Dr. Marcelo Augusto Santos Turine(Coordenador Projeto Web-Pide)
    • Apresentação• Fernando Maia daMota(fernandomaia.eti.br)• Graduando em Sistemas de Informaçãopela UFMS - Campus Coxim• Atua no Laboratório de Suporte eDesenvolvimento (LSD)• Aluno de Iniciação Científica• Analista de BI2
    • Agenda3• Motivação• Avaliações INEP• Fontes de Informação• Objetivo• Data Webhouse CEB-INEP• Dificuldades e Limitações• Considerações Finais• Referências• Perguntas
    • MOTIVAÇÃOComo tornar os dados dos Sistemas deAvaliação do Brasil (INEP/MEC) ”maisacessíveis e transparentes” aos gestoreseducacionais, educadores/pesquisadorese comunidade em geral a fim de melhorara qualidade da Educação Brasileira4
    • Caderno: Qualidade da Educação - OEstado de São Paulo (29 de Abril de2007)• Segundo pesquisa do Ibope em Julho/2006 (4.002entrevistados) 29% não conhecem os exames deavaliação do INEP/MEC– “Os dados dos sistemas de avaliação são um instrumentopoderoso. Mas há professores que não sabem como ler eter acesso”.– “Não sei como ‘fuçar’ os dados de maneira a incrementarmeu trabalho ou conhecer minha realidade”– “Como comparar minha escola com outras bemposicionadas para melhoria da educação. Não é nossocostume e não tem ninguém na minha escola que nosajude”– “Oportunidades para aprender com os dados”5
    • Avaliações INEP• Censo Escolar(CEB): levantamento de informações estatístico-educacionais realizado anualmente;• Censo Superior: coleta anualmente uma série de dados doensino superior no País tanto na modalidade presencial como adistância;• Avaliação dos Cursos de Graduação: é utilizado pelo MEC parao reconhecimento ou renovação de reconhecimento doscursos de graduação;• Avaliação Institucional: análise das informações prestadospelas Instituições de Ensino Superior (IES) no FormulárioEletrônico e a verificação, in loco, da realidade institucional,dos seus cursos de graduação e de pós-graduação, dapesquisa e da extensão;6
    • Avaliações INEP• Sistema Nacional de Avaliação da Educação Superior(SINAES):Formado por três componentes principais: avaliação dasinstituições, dos cursos e do desempenho dos estudantes.• Exame Nacional do Ensino Médio (ENEM): exame de saídafacultativo aos que já concluíram e aos concluintes do ensinomédio;• Exame Nacional Para Certificação de Competências(ENCCEJA): Avaliação nacional para jovens e adultos que nãopuderam concluir os estudos na idade própria;• Sistema Nacional de Avaliação da Educação Básica (SAEB):pesquisa por amostragem, do ensino fundamental e médio,realizada a cada dois anos.7
    • Fontes de Informação• Relatórios em formato PDF (website do INEP ou depesquisas) [INEP,2010]– Difícil cruzamento de dados• Consultas personalizadas em várias ferramentasdiferentes– Apenas dados do Censo Escolar e Censo da EducaçãoSuperior• Microdados em formato ASCII (disponível em CD-Rom e download)– Necessita de sistema de leitura e conhecimento técnico:SAS ou SPSS, por exemplo8Esse quadro dificultasubstancialmente areutilização de taisinformações para a tomada dedecisão na gestão pública
    • ObjetivoDefinir e Implementar uma plataforma aberta ebaseada em Software Livre na Internet intituladaWeb-PIDE (http://webpide.ledes.net) paraintegrar, organizar e disponibilizar os dadoseducacionais do INEP por meio de umalinguagem simples e padronizada (altaacessibilidade e usabilidade)9
    • 10• Meta: INTEGRAR diversas ferramentas implantadasno INEP por uma solução integrada e centralizada... +
    • Projetos de Pesquisa• O projeto Webpide é composto por váriosprojetos sendo um deles a avaliação e ostestes com as ferramentas a serem usadaspara criação dos Data Webhouses que irãocompor a plataforma Web-PIDE.Técnicas e Ferramentas para o Projeto de DataWarehouse: Estudo de Caso para a Base deDados Educacional do Projeto Webpide11
    • Técnicas e Ferramentas para oProjeto de Data Warehouse• 2007/2008- Estudo e Avaliação dasFerramentas– Pentaho é escolhida por ser a melhor soluçãoopen-source entre todas as pesquisadas.12
    • Técnicas e Ferramentas para oProjeto de Data Warehouse• 2008 / 2009 – Desenvolvimento DataWebhouse SAEB– Criação do primeiro DW do projeto para abase do SAEB• 2009/2010 - Desenvolvimento Data WebhouseCEB-INEP– BI-Server.• Controle de Acesso• Evolução Visual• Usuário pode criar visões próprias e salva-las no portal.13
    • Estrutura base CEB14
    • ETL- Etapa 115• Carregar os dados em tabelas de um bancode dados.– SGBD PostgreSQL• INEP.sql- Contém a estrutura das tabelas– Criação da ferramenta DEAR para leitura dosarquivos:• SAS- Contém o inicio e fim de cada campodado(Alguns Arquivos corrompidos)• Microdados- Arquivos TXT em formatoASCII com dados brutos
    • Ferramenta DEAR: Data ExtractorASCII to Relational16
    • DEAR17Aplicação que faz a leitura dos arquivos SAS [JAVA,2010]
    • Informações da Base• Cluster com mais de 10GB de dados• Grande variação de dados ao longo dosanos de pesquisa18
    • 19Definição do Modelo Multidimensional• Definiu-se a tabela que contém osdados do censo escolar, por estarpresente em todos os anos dapesquisa, sendo assim variante notempo, conceito primordial de um DW• Mapeamento detalhado dos camposdesta tabela, para a construção de ummodelo com alto nível de granularidade
    • 20Cubo EstrelaCubo Estrela CEB-INEP [JUDE,2010]
    • ETL- Etapa 2Carga das Dimensões e Fato•Carga das dimensões feito através de script SQL•Carga Fato– Look-up das dimensões através de store procedures• GetGeografia(região do Brasil, UF, Município,Zona Escolar), retorna o id do registro quesatisfaz a estas condições na tabela dimensãoGeografia– A fato foi carregada utilizando script sql insert/select[PostgreSQL,2010]21
    • BI-Server Pentaho [PENTAHO,2010]22
    • PSW- Mapeamento do Cubo emXML23
    • Data Webhouse CEB-INEP24
    • Número de Instituições porRegião e Ano25
    • Número de Professores em Sala deAula por Região e Ano26
    • Número de Matriculas na Pré-escolana cidade de Alvaraes-AM (MDX)27
    • Número de Matriculas na Pré-escolapor Geografia(Ano de 1996)28
    • Dificuldades e Limitações• Compreender e analisar os dados e aconsistência dos mesmos: estruturas eformatos (.sas, .pdf, .txt);• Capacidade HD/Ferramenta Banco Dados29
    • Considerações Finais30• Importância da Integração das Bases de Dados doINEP (CEB-INEP);• Disponibilização dos Dados Educacionais INEP naWeb permitindo consultas analiticas online (OLAP);• Facilidade do INEP na tomada de decisão para aadoção de Políticas Educacionais;• Uso de tecnologias de código aberto para odesenvolvimento de softwares do governo federal;• Participação de pesquisadores de Universidadespúblicas no projeto (UFMS / UFScar);
    • Referências• INEP - Instituto Nacional de Estudos e Pesquisas EducacionaisAnísio Teixeira. - http://www.inep.gov.br• TURINE M.A.S.et al. - Projeto de Pesquisa EDITAL no.001/2006/INEP/CAPES Web-PIDE: Uma Plataforma aberta deIntegração e avaliação de Dados Educacionais, 2006• PENTAHO, Pentaho Open Source Business Intelligence -http://www.pentaho.com, 2010• JUDE, Jude Design & Communications - //http://jude.change-vision.com, 2010• PostgreSQL - http://www.postgresql.org, 2010• JAVA, Sun Microsystems - http://www.sun.com, 2010• Caio Moreno de Souza - http://blog.professorcoruja.com31
    • CONTATOSFernando Maiamota.fernandomaia@gmail.comwww.fernandomaia.eti.brLeila Lisiane Rossileilalrossi@gmail.comMarcelo Augusto dos Santos Turinemturine@gmail.com32