# MAPREDUCE PARA O MÉTODO DE REGRESSÃO POR MÍNIMOS QUADRADOS PARCIAIS (MRPLS)

1. 1. MAPREDUCE PARA O MÉTODO DE REGRESSÃO POR MÍNIMOS QUADRADOS PARCIAIS (MRPLS) MACHINE LEARNING I LEANDRO ALVIM PROF. RUY MILIDIÚ 1
2. 2. MOTIVAÇÃO CONSTRUIR MODELOS MAIS ROBUSTOS UTILIZAÇÃO DO PLS PLS PLS TEMPO ( PLS/ TEMPO ( PLS/ TOTAL ) TOTAL ) PROBLEMA 100 100 75 75 DESEMPENHO 50 50 25 25 0 0 1 10 20 30 27k 54k 108k 216k N. FATORES N. EXEMPLOS 2
3. 3. MOTIVAÇÃO PROBLEMA T X Y PLS - DUAS FASES TREINO Q B (CUSTOSO) TESTE 3
4. 4. OBJETIVO MODELO PLS VOLUME ELEVADO DE DADOS FASE DE TREINAMENTO ALGORITMOS: PLS1 (USA NIPALS), PLS2 PARADIGMA MAPREDUCE 4
5. 5. OBJETIVO INVESTIGAR PLS MRPLS DESEMPENHO EFICIÊNCIA VOLUME DE DADOS MODELO 5
6. 6. MAPREDUCE DESENVOLVIDO PELA GOOGLE PARADIGMA DE PROGRAMAÇÃO (CLOUD COMPUTING) OBJETIVO SIMPLIFICAR A PROGRAMAÇÃO - GRANDES VOLUMES DE DADOS MASCARAR O PARADIGMA MESTRE/ESCRAVO 6
7. 7. MAPREDUCE PROBLEMA CONTAGEM DE PALAVRAS ENTRADA = [BANANA,MELÃO,MAÇÃ,MELÃO,MAÇÃ] SAÍDA DESEJADA = {BANANA: 1, MELÃO: 2, MAÇÃ: 2} 7
8. 8. MAPREDUCE MAP REDUCE (BANANA,1);(MELÃO, (BANANA,[1]); 1);(MAÇÃ,1);(MELÃO, (MELÃO,[1,1]); 1) [(MAÇÃ,[1])] SOMAR VALORES POR CHAVE 8
9. 9. MAPREDUCE 9
10. 10. MAPREDUCE 10
11. 11. HADOOP DESENVOLVIDO PELA APACHE INSPIRADO NO GFS/MAPREDUCE PLATAFORMA OBJETIVOS EXECUTAR APLICAÇÕES PARA GRANDES VOLUMES DE DADOS MÁQUINAS DE CUSTO BAIXO EFICIENTE (PARALELISMO LOCAL) CONFIÁVEL (HDFS) 11