Este documento descreve um estudo que usou mapas de Kohonen para identificar perfis de estudantes matriculados no Prosel 2014.1 da UEFS. Os dados de 15 variáveis socioeconômicas de 13510 estudantes foram usados para treinar o modelo, resultando em 10 clusters que refletem classes sociais segundo o IBGE. Os resultados mostram que estudantes com menor renda e escolaridade dos pais demoram mais para ingressar no ensino superior.
Identificação de perfis de estudantes no Prosel usando mapas de Kohonen
1. Identificação de grupos de estudantes
no Prosel usando Mapas de Kohonen
Romualdo André da Costa
@romualdoandre
2. Introdução
● Recordes no número de vagas no ensino
superior (INEP, 2009).
● Traçar políticas de acesso e permanência.
3. Introdução
● Clusterização com mapas de Kohonen (Kaski,
Nikkilä e Kohonen, 1998).
● Determinar perfis de estudante inscritos no
Prosel 2014.1 da UEFS.
Relações entre 16 animais gerados pelo SOM. Fonte: Kaski, Nikkilä e Kohonen (1998)
4. Metodologia
● Seleção dos dados
– Formulário Web
– 33 questões
– Perfil socioeconômico
– 15 escolhidas: renda, escolaridade e residência
5. Metodologia
● Treinamento
– Orange Canvas (Demšar, J., et al, 2004).
– Total de registros: 13510.
– 10% aleatórios para treinamento.
– 10 x 10, 15 x 15 e 20 x 20 neurônios.
– 10 x 10 mais visível.
– 1000 iterações, raio inicial 3 e final 1.
6. Metodologia
● Análise dos resultados
– Matriz U.
– Ponto de vista macro.
– Vetores de referência (codebook vectors).
– Renda e escolaridade do candidato e familiares.
7. Resultados e discussão: Renda Familiar
0: Até 1 salário mínimo
1: mais de um até três salários
mínimos;
2: de três até cinco salários
mínimos;
3: de cinco até dez salários
mínimos;
4: de dez até vinte salários
mínimos;
5: mais de vinte salários
mínimos.
8. Resultados e discussão: Escolaridade do pai
0: Não frequentou escolas;
1: Ensino Fundamental incompleto;
2: Ensino Fundamental completo;
3: Ensino Médio incompleto;
4: Ensino Médio completo;
5: Superior incompleto;
6: Superior completo;
7: Pós-graduado.
9. Resultados e discussão: Escolaridade da
0: Não frequentou escolas;
1: Ensino Fundamental incompleto;
2: Ensino Fundamental completo;
3: Ensino Médio incompleto;
4: Ensino Médio completo;
5: Superior incompleto;
6: Superior completo;
7: Pós-graduado.
mãe
10. Resultados e discussão: Estabelecimento
ensino médio
0: Todo em escola pública;
1: Todo em escola particular;
2: Metade em escola pública e
metade em escola particular;
3: Maior parte em escola
pública;
4: Maior parte em escola
particular.
11. Resultados e discussão: tempo de conclusão
do ensino médio
0: Estou concluindo
este ano;
1: 1 ano;
2: 2 anos;
3: 3 anos;
4: 4 anos;
5: 5 ou mais anos.
12. Conclusão
● O mapa reflete as classes sociais de acordo
com o IBGE.
● Candidatos com menor renda e de escola
pública demoram mais para ingressar no
ensino superior.
● Políticas de ingresso e permanência ainda são
necessárias.
● Hereditariedade da pobreza.
13. Referências
● Demšar, Janez, et al. Orange: From experimental machine learning to
interactive data mining. Springer Berlin Heidelberg, 2004.
● Resumos técnicos, Instituto Nacional de Estudos e Pesquisas
Educacionais Anísio Teixeira, [online] 2014,
http://portal.inep.gov.br/web/censo-da-educacao-superior/resumos-tecnicos
(Acessado: 9 de julho de 2014)
● S. Kaski, J. Nikkilä e T Kohonen. "Methods for interpreting a self-organized
map in data analysis." In Proc. 6th European Symposium on Artificial
Neural Networks (ESANN98). D-Facto, Brugfes. 1998.