SlideShare a Scribd company logo
The State-of-the-Art in Predictive Visual Analytics
Yafeng Lu, Rolando Garcia, Brett Hansen, Michael Gleicher, and Ross Maciejewski
Vinícius M. de Sousa1
1vinisousa04@gmail.com
Programa de Pós-Graduação em Ciência da Informação - UFSC
Florianópolis/SC
Sexta Feira, 5 de Abril de 2019
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 1 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Sumário
1 Introdução
Contextualização
Predictive Analytics
Predictive Visual Analytics (PVA)
2 PVA Pipeline
Objetivos
Exemplos por Etapa
3 Interações no PVA
Tipos de Interação
Exemplos por Tipo de Interação
4 Considerações Finais
Discussão e Direções de PVA
Q & A e Contato
Bibliografia
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 2 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Sumário
1 Introdução
Contextualização
Predictive Analytics
Predictive Visual Analytics (PVA)
2 PVA Pipeline
Objetivos
Exemplos por Etapa
3 Interações no PVA
Tipos de Interação
Exemplos por Tipo de Interação
4 Considerações Finais
Discussão e Direções de PVA
Q & A e Contato
Bibliografia
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 3 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Contextualização
Referência - [LGH+17]
FIGURE 1 – Fonte : https://onlinelibrary.wiley.com/doi/full/10.1111/cgf.13210
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 4 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Contextualização
Predictive Analytics
Prática de identificar padrões, utilizando dados, para predizer resultados e
tendências futuras;
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 5 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Contextualização
Predictive Analytics
Prática de identificar padrões, utilizando dados, para predizer resultados e
tendências futuras;
Avanços da computação resultaram em um cenário em que a capacidade de
analisar dados é inferior à capacidade de analisá-los;
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 5 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Contextualização
Predictive Analytics
Prática de identificar padrões, utilizando dados, para predizer resultados e
tendências futuras;
Avanços da computação resultaram em um cenário em que a capacidade de
analisar dados é inferior à capacidade de analisá-los;
Resultado? Modelos de alta acurácia com pouca interpretabilidade;
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 5 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Contextualização
Predictive Analytics
Prática de identificar padrões, utilizando dados, para predizer resultados e
tendências futuras;
Avanços da computação resultaram em um cenário em que a capacidade de
analisar dados é inferior à capacidade de analisá-los;
Resultado? Modelos de alta acurácia com pouca interpretabilidade;
Percebeu-se que tais modelos podem apresentar consequências não desejáveis,
como por exemplo...
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 5 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Contextualização
Google Flu Trends
FIGURE 2 – Fonte : [LKKV14]
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 6 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Contextualização
Predictive Visual Analytics
Neste contexto surgiu o Predictive Visual Analytics, para auxiliar na tarefa de interagir
com os modelos de predição.
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 7 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Predictive Analytics
Predictive Analytics - O que é
1 Predictive : Identificar padrões nos dados que auxiliam a predizer resultados e
tendências;
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 8 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Predictive Analytics
Predictive Analytics - O que é
1 Predictive : Identificar padrões nos dados que auxiliam a predizer resultados e
tendências;
2 Analytics
Descritiva : O que aconteceu e qual é o estado do sistema;
Prescritiva : Auxilia na tomada de decisão em relação ao sistema;
Preditiva : Modelar o futuro com base nos dados disponíveis.
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 8 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Predictive Analytics
Predictive Analytics - O que é
1 Predictive : Identificar padrões nos dados que auxiliam a predizer resultados e
tendências;
2 Analytics
Descritiva : O que aconteceu e qual é o estado do sistema;
Prescritiva : Auxilia na tomada de decisão em relação ao sistema;
Preditiva : Modelar o futuro com base nos dados disponíveis.
3 Técnicas
Regressão : Como alteração nos prediores afetam a variável alvo;
Classificação : Identificar categorias, com categorias conhecidas;
Clusterização : Identificar categorias, quando não há categorias conhecidas.
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 8 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Predictive Analytics
Etapas
Predictive Analytics são as seguintes etapas :
1 Peparação dos dados;
2 Seleção das variáveis;
3 Modelagem dos algoritmos e modelos;
4 Exploração de resultados e seleção de modelo;
5 Validação.
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 9 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Predictive Visual Analytics (PVA)
Predictive Visual Analytics (PVA) - Objetivo e Condições
Objetivo
Métodos e técnicas que ajudem em qualquer etapa de Predictive Analytics
Condições
Foco em predição (não exploração e exploração);
Suportar interação com usuário em pelo menos uma das etadas de Predictive
Analytics ;
Permitir que o analista aumente a acurária da predição ou seu conhecimento do
funcionamento do modelo.
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 10 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Predictive Visual Analytics (PVA)
Metodologia
6.144 papers de Journals de visualização
Palavras Chave
==========⇒
Titulo ou Abstract
580 papers
Leitura e
===========⇒
Flag de Relevancia
72 papers.
FIGURE 3 – Fonte : [LGH+
17]
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 11 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Predictive Visual Analytics (PVA)
Metodologia
Os 72 papers foram lidos e classificados de acordo com três aspectos
FIGURE 4 – Fonte : [LGH+
17]
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 12 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Sumário
1 Introdução
Contextualização
Predictive Analytics
Predictive Visual Analytics (PVA)
2 PVA Pipeline
Objetivos
Exemplos por Etapa
3 Interações no PVA
Tipos de Interação
Exemplos por Tipo de Interação
4 Considerações Finais
Discussão e Direções de PVA
Q & A e Contato
Bibliografia
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 13 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Objetivos
Objetivos de PA vs. Objetivos de PVA
FIGURE 5 – Fonte : [LGH+
17]
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 14 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Exemplos por Etapa
Pré-Processamento
Objetvo : Entender e preparar os dados.
FIGURE 6 – Fonte : https://vimeo.com/136535362
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 15 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Exemplos por Etapa
Engenharia de Variáveis
Objetivo : Geração de variáveis e seleção de variáveis.
FIGURE 7 – Retirado de [LGH+
17]
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 16 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Exemplos por Etapa
Modelagem
Objetivo :
Regressão : exploração de subsets,
modificação no dataset de treino,
ajuste de parâmetros dos modelos e
alteração entre variáveis alvo do
modelo;
Clusterização : manipulação,
exploração e avaliação de clusters;
Classificação : permitir que o usuário
classifique dados de treino e ajuda a
montar árvores de decisão para
estimar os modelos.
FIGURE 8 – Retirado de [LGH+
17]
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 17 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Exemplos por Etapa
Exploração e Seleção do Modelo
Objetivo : explorar os resultados e comparar modelos (quando há mais de um no
final).
FIGURE 9 – Fonte : Link do paper
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 18 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Exemplos por Etapa
Validação
Observações :
1 Etapa com menos opções;
2 Relacionadas a visualização de medidas tradicionais de qualidade (R2, ROC,
ACF).
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 19 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Sumário
1 Introdução
Contextualização
Predictive Analytics
Predictive Visual Analytics (PVA)
2 PVA Pipeline
Objetivos
Exemplos por Etapa
3 Interações no PVA
Tipos de Interação
Exemplos por Tipo de Interação
4 Considerações Finais
Discussão e Direções de PVA
Q & A e Contato
Bibliografia
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 20 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Tipos de Interação
Tipos de Interação
Os papers também foram classificados de acordo com o tipo de interação com o
usuário :
1 Selecionar;
2 Explorar;
3 Reconfigurar;
4 Codificar (encode);
5 Abstrair/Elaborar (Abstract/Elaborate);
6 Filtrar;
7 Connectar;
8 Pastor (Shepherd).
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 21 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Exemplos por Tipo de Interação
Selecionar (select)
Objetivo : Selecionar items/observações para que o usuário possa ver mais
facilmente.
FIGURE 10 – Fonte : https://onlinelibrary.wiley.com/doi/full/10.1111/cgf.12630
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 22 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Exemplos por Tipo de Interação
Explorar (Browse)
Objetivo : Descobrir novas observações.
FIGURE 11 – Retirado de [LGH+
17]
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 23 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Exemplos por Tipo de Interação
Reconfigurar (reconfigure)
Objetivo : Reorganização do espaço visual.
FIGURE 12 – Retirado de [LGH+
17]
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 24 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Exemplos por Tipo de Interação
Codificar (Encode)
Objetivo : alterar a representação dos dados (e.g. mudar o número de dimensões,
adicionar cores, etc.)
FIGURE 13 – Retirado de [LGH+
17]
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 25 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Exemplos por Tipo de Interação
Filtrar (Query)
Objetivo : Selecionar observações de acordo com condições especificadas pelo
usuário.
Observação : Assim como Explorar, essa etapa altera o subset dos dados
utilizados. Porém, aqui as condições que se quer filtrar é conhecida peo usuário.
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 26 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Exemplos por Tipo de Interação
Abstrair/Elaborar (Abstract/Elaborate)
Objetivo : Alterar a granularidade dos dados;
FIGURE 14 – Retirado de [LGH+
17]
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 27 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Exemplos por Tipo de Interação
Conectar (Connect)
Objetivo : Destacar relações entre observações e/ou destacar diferentes atributas de
uma observação seleionada pelo usuário.
FIGURE 15 – Fonte : https://nancao.org/pubs/cao_infovis11_paper.pdf
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 28 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Exemplos por Tipo de Interação
Pastor (Shepherd)
Objetivo : Permitir que o usuário guie o processo de modelagem.
FIGURE 16 – Retirado de [LGH+
17]
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 29 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Sumário
1 Introdução
Contextualização
Predictive Analytics
Predictive Visual Analytics (PVA)
2 PVA Pipeline
Objetivos
Exemplos por Etapa
3 Interações no PVA
Tipos de Interação
Exemplos por Tipo de Interação
4 Considerações Finais
Discussão e Direções de PVA
Q & A e Contato
Bibliografia
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 30 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Discussão e Direções de PVA
Discussão
FIGURE 17 – (a) Frequência de co-ocorrência dos aspectos na classificação dos autores. (b) Correlação estre os
aspectos classificados pelos autores. [LGH+
17]
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 31 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Discussão e Direções de PVA
Direções
1 Integrar conhecimento do usuário;
2 Escalar para quantidade de dados maiores e modelos mais complexos;
3 Melhor suporte para validação dos modelos;
4 Melhorar experiência do usuário.
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 32 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Q & A e Contato
Q & A e Contato
Link do Linkedin
E-mail : vinisousa04@gmail.com
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 33 / 34
Introdução PVA Pipeline Interações no PVA Considerações Finais
Bibliografia
Yafeng Lu, Rolando Garcia, Brett Hansen, Michael Gleicher, and Ross
Maciejewski, The state-of-the-art in predictive visual analytics, Computer
Graphics Forum, vol. 36, Wiley Online Library, 2017, pp. 539–562.
David Lazer, Ryan Kennedy, Gary King, and Alessandro Vespignani, The parable
of google flu : traps in big data analysis, Science 343 (2014), no. 6176,
1203–1205.
Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 34 / 34

More Related Content

Similar to Predictive Visual Analytics

Mapa de Evidências: conceito e metodologia
Mapa de Evidências: conceito e metodologiaMapa de Evidências: conceito e metodologia
Mapa de Evidências: conceito e metodologia
http://bvsalud.org/
 
Como o planejamento de software pode contribuir para qualidade de um software...
Como o planejamento de software pode contribuir para qualidade de um software...Como o planejamento de software pode contribuir para qualidade de um software...
Como o planejamento de software pode contribuir para qualidade de um software...
Sandra Pavan
 
Políticas de autoarquivamento em repositórios institucionais brasileiros: est...
Políticas de autoarquivamento em repositórios institucionais brasileiros: est...Políticas de autoarquivamento em repositórios institucionais brasileiros: est...
Políticas de autoarquivamento em repositórios institucionais brasileiros: est...
Projeto RCAAP
 
A Engenharia do Conhecimento e as novas possibilidades de descoberta e dissem...
A Engenharia do Conhecimento e as novas possibilidades de descoberta e dissem...A Engenharia do Conhecimento e as novas possibilidades de descoberta e dissem...
A Engenharia do Conhecimento e as novas possibilidades de descoberta e dissem...
Roberto C. S. Pacheco
 
Detecção preventiva de fracionamento de compras
Detecção preventiva de fracionamento de comprasDetecção preventiva de fracionamento de compras
Detecção preventiva de fracionamento de compras
Rommel Carvalho
 
Painel 03 01 - Rommel Carvalho - detecção preventiva de fracionamento de co...
Painel 03   01 - Rommel Carvalho - detecção preventiva de fracionamento de co...Painel 03   01 - Rommel Carvalho - detecção preventiva de fracionamento de co...
Painel 03 01 - Rommel Carvalho - detecção preventiva de fracionamento de co...
Tribunal de Contas da União - TCU (Oficial)
 
Análise de Redes de Colaboração Científica Como Ferramenta de Auxílio ao Gere...
Análise de Redes de Colaboração Científica Como Ferramenta de Auxílio ao Gere...Análise de Redes de Colaboração Científica Como Ferramenta de Auxílio ao Gere...
Análise de Redes de Colaboração Científica Como Ferramenta de Auxílio ao Gere...
Aurelio Costa
 
Compartilhamento de dados de pesquisa na FIOCRUZ: diagnóstico e percepção do ...
Compartilhamento de dados de pesquisa na FIOCRUZ: diagnóstico e percepção do ...Compartilhamento de dados de pesquisa na FIOCRUZ: diagnóstico e percepção do ...
Compartilhamento de dados de pesquisa na FIOCRUZ: diagnóstico e percepção do ...
http://bvsalud.org/
 
Monitoramento e Visualização da Informação
Monitoramento e Visualização da InformaçãoMonitoramento e Visualização da Informação
Monitoramento e Visualização da Informação
PaperCliQ Comunicação
 
Cenário brasileiro de Inclusão Digital
Cenário brasileiro de Inclusão DigitalCenário brasileiro de Inclusão Digital
Cenário brasileiro de Inclusão Digital
Leonardo Diogo Silva
 
Análise exploratória dos indicadores do snis - sistema nacional de informaçõe...
Análise exploratória dos indicadores do snis - sistema nacional de informaçõe...Análise exploratória dos indicadores do snis - sistema nacional de informaçõe...
Análise exploratória dos indicadores do snis - sistema nacional de informaçõe...
Marcos Camargo
 
Ulbra tcc sistema de informaçao getúlio de oliveira valentim
Ulbra tcc sistema de informaçao getúlio de oliveira valentimUlbra tcc sistema de informaçao getúlio de oliveira valentim
Ulbra tcc sistema de informaçao getúlio de oliveira valentim
Getulio Valentim
 
Jornadas UCCN|FCT - Sessao PTCRIS - Parte II
Jornadas UCCN|FCT - Sessao PTCRIS - Parte IIJornadas UCCN|FCT - Sessao PTCRIS - Parte II
Jornadas UCCN|FCT - Sessao PTCRIS - Parte II
PTCRIS FCT
 
Avaliação da credibilidade da informação WEB: competências e desafios no 3...
Avaliação  da  credibilidade  da  informação WEB: competências e desafios no 3...Avaliação  da  credibilidade  da  informação WEB: competências e desafios no 3...
Avaliação da credibilidade da informação WEB: competências e desafios no 3...
António Pires
 
Análise de Dados: Padrões no Consumo de Conteúdo
Análise de Dados: Padrões no Consumo de ConteúdoAnálise de Dados: Padrões no Consumo de Conteúdo
Análise de Dados: Padrões no Consumo de Conteúdo
Rafa Spoladore
 
Ponline 2007
Ponline 2007Ponline 2007
Ponline 2007
Evelini Andrade
 
Mota Werner TCC
Mota Werner TCCMota Werner TCC
Mota Werner TCC
Werner Johnson
 

Similar to Predictive Visual Analytics (20)

Mapa de Evidências: conceito e metodologia
Mapa de Evidências: conceito e metodologiaMapa de Evidências: conceito e metodologia
Mapa de Evidências: conceito e metodologia
 
Como o planejamento de software pode contribuir para qualidade de um software...
Como o planejamento de software pode contribuir para qualidade de um software...Como o planejamento de software pode contribuir para qualidade de um software...
Como o planejamento de software pode contribuir para qualidade de um software...
 
Políticas de autoarquivamento em repositórios institucionais brasileiros: est...
Políticas de autoarquivamento em repositórios institucionais brasileiros: est...Políticas de autoarquivamento em repositórios institucionais brasileiros: est...
Políticas de autoarquivamento em repositórios institucionais brasileiros: est...
 
Renato Murasaki
Renato MurasakiRenato Murasaki
Renato Murasaki
 
A Engenharia do Conhecimento e as novas possibilidades de descoberta e dissem...
A Engenharia do Conhecimento e as novas possibilidades de descoberta e dissem...A Engenharia do Conhecimento e as novas possibilidades de descoberta e dissem...
A Engenharia do Conhecimento e as novas possibilidades de descoberta e dissem...
 
Detecção preventiva de fracionamento de compras
Detecção preventiva de fracionamento de comprasDetecção preventiva de fracionamento de compras
Detecção preventiva de fracionamento de compras
 
Painel 03 01 - Rommel Carvalho - detecção preventiva de fracionamento de co...
Painel 03   01 - Rommel Carvalho - detecção preventiva de fracionamento de co...Painel 03   01 - Rommel Carvalho - detecção preventiva de fracionamento de co...
Painel 03 01 - Rommel Carvalho - detecção preventiva de fracionamento de co...
 
Análise de Redes de Colaboração Científica Como Ferramenta de Auxílio ao Gere...
Análise de Redes de Colaboração Científica Como Ferramenta de Auxílio ao Gere...Análise de Redes de Colaboração Científica Como Ferramenta de Auxílio ao Gere...
Análise de Redes de Colaboração Científica Como Ferramenta de Auxílio ao Gere...
 
Compartilhamento de dados de pesquisa na FIOCRUZ: diagnóstico e percepção do ...
Compartilhamento de dados de pesquisa na FIOCRUZ: diagnóstico e percepção do ...Compartilhamento de dados de pesquisa na FIOCRUZ: diagnóstico e percepção do ...
Compartilhamento de dados de pesquisa na FIOCRUZ: diagnóstico e percepção do ...
 
Monitoramento e Visualização da Informação
Monitoramento e Visualização da InformaçãoMonitoramento e Visualização da Informação
Monitoramento e Visualização da Informação
 
Cenário brasileiro de Inclusão Digital
Cenário brasileiro de Inclusão DigitalCenário brasileiro de Inclusão Digital
Cenário brasileiro de Inclusão Digital
 
Análise exploratória dos indicadores do snis - sistema nacional de informaçõe...
Análise exploratória dos indicadores do snis - sistema nacional de informaçõe...Análise exploratória dos indicadores do snis - sistema nacional de informaçõe...
Análise exploratória dos indicadores do snis - sistema nacional de informaçõe...
 
Ulbra tcc sistema de informaçao getúlio de oliveira valentim
Ulbra tcc sistema de informaçao getúlio de oliveira valentimUlbra tcc sistema de informaçao getúlio de oliveira valentim
Ulbra tcc sistema de informaçao getúlio de oliveira valentim
 
Jornadas UCCN|FCT - Sessao PTCRIS - Parte II
Jornadas UCCN|FCT - Sessao PTCRIS - Parte IIJornadas UCCN|FCT - Sessao PTCRIS - Parte II
Jornadas UCCN|FCT - Sessao PTCRIS - Parte II
 
Avaliação da credibilidade da informação WEB: competências e desafios no 3...
Avaliação  da  credibilidade  da  informação WEB: competências e desafios no 3...Avaliação  da  credibilidade  da  informação WEB: competências e desafios no 3...
Avaliação da credibilidade da informação WEB: competências e desafios no 3...
 
Análise de Dados: Padrões no Consumo de Conteúdo
Análise de Dados: Padrões no Consumo de ConteúdoAnálise de Dados: Padrões no Consumo de Conteúdo
Análise de Dados: Padrões no Consumo de Conteúdo
 
GET 2016 rev4.2
GET 2016 rev4.2GET 2016 rev4.2
GET 2016 rev4.2
 
Ponline 2007
Ponline 2007Ponline 2007
Ponline 2007
 
Relatório Ponline 2007
Relatório Ponline 2007Relatório Ponline 2007
Relatório Ponline 2007
 
Mota Werner TCC
Mota Werner TCCMota Werner TCC
Mota Werner TCC
 

Predictive Visual Analytics

  • 1. The State-of-the-Art in Predictive Visual Analytics Yafeng Lu, Rolando Garcia, Brett Hansen, Michael Gleicher, and Ross Maciejewski Vinícius M. de Sousa1 1vinisousa04@gmail.com Programa de Pós-Graduação em Ciência da Informação - UFSC Florianópolis/SC Sexta Feira, 5 de Abril de 2019 Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 1 / 34
  • 2. Introdução PVA Pipeline Interações no PVA Considerações Finais Sumário 1 Introdução Contextualização Predictive Analytics Predictive Visual Analytics (PVA) 2 PVA Pipeline Objetivos Exemplos por Etapa 3 Interações no PVA Tipos de Interação Exemplos por Tipo de Interação 4 Considerações Finais Discussão e Direções de PVA Q & A e Contato Bibliografia Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 2 / 34
  • 3. Introdução PVA Pipeline Interações no PVA Considerações Finais Sumário 1 Introdução Contextualização Predictive Analytics Predictive Visual Analytics (PVA) 2 PVA Pipeline Objetivos Exemplos por Etapa 3 Interações no PVA Tipos de Interação Exemplos por Tipo de Interação 4 Considerações Finais Discussão e Direções de PVA Q & A e Contato Bibliografia Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 3 / 34
  • 4. Introdução PVA Pipeline Interações no PVA Considerações Finais Contextualização Referência - [LGH+17] FIGURE 1 – Fonte : https://onlinelibrary.wiley.com/doi/full/10.1111/cgf.13210 Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 4 / 34
  • 5. Introdução PVA Pipeline Interações no PVA Considerações Finais Contextualização Predictive Analytics Prática de identificar padrões, utilizando dados, para predizer resultados e tendências futuras; Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 5 / 34
  • 6. Introdução PVA Pipeline Interações no PVA Considerações Finais Contextualização Predictive Analytics Prática de identificar padrões, utilizando dados, para predizer resultados e tendências futuras; Avanços da computação resultaram em um cenário em que a capacidade de analisar dados é inferior à capacidade de analisá-los; Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 5 / 34
  • 7. Introdução PVA Pipeline Interações no PVA Considerações Finais Contextualização Predictive Analytics Prática de identificar padrões, utilizando dados, para predizer resultados e tendências futuras; Avanços da computação resultaram em um cenário em que a capacidade de analisar dados é inferior à capacidade de analisá-los; Resultado? Modelos de alta acurácia com pouca interpretabilidade; Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 5 / 34
  • 8. Introdução PVA Pipeline Interações no PVA Considerações Finais Contextualização Predictive Analytics Prática de identificar padrões, utilizando dados, para predizer resultados e tendências futuras; Avanços da computação resultaram em um cenário em que a capacidade de analisar dados é inferior à capacidade de analisá-los; Resultado? Modelos de alta acurácia com pouca interpretabilidade; Percebeu-se que tais modelos podem apresentar consequências não desejáveis, como por exemplo... Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 5 / 34
  • 9. Introdução PVA Pipeline Interações no PVA Considerações Finais Contextualização Google Flu Trends FIGURE 2 – Fonte : [LKKV14] Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 6 / 34
  • 10. Introdução PVA Pipeline Interações no PVA Considerações Finais Contextualização Predictive Visual Analytics Neste contexto surgiu o Predictive Visual Analytics, para auxiliar na tarefa de interagir com os modelos de predição. Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 7 / 34
  • 11. Introdução PVA Pipeline Interações no PVA Considerações Finais Predictive Analytics Predictive Analytics - O que é 1 Predictive : Identificar padrões nos dados que auxiliam a predizer resultados e tendências; Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 8 / 34
  • 12. Introdução PVA Pipeline Interações no PVA Considerações Finais Predictive Analytics Predictive Analytics - O que é 1 Predictive : Identificar padrões nos dados que auxiliam a predizer resultados e tendências; 2 Analytics Descritiva : O que aconteceu e qual é o estado do sistema; Prescritiva : Auxilia na tomada de decisão em relação ao sistema; Preditiva : Modelar o futuro com base nos dados disponíveis. Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 8 / 34
  • 13. Introdução PVA Pipeline Interações no PVA Considerações Finais Predictive Analytics Predictive Analytics - O que é 1 Predictive : Identificar padrões nos dados que auxiliam a predizer resultados e tendências; 2 Analytics Descritiva : O que aconteceu e qual é o estado do sistema; Prescritiva : Auxilia na tomada de decisão em relação ao sistema; Preditiva : Modelar o futuro com base nos dados disponíveis. 3 Técnicas Regressão : Como alteração nos prediores afetam a variável alvo; Classificação : Identificar categorias, com categorias conhecidas; Clusterização : Identificar categorias, quando não há categorias conhecidas. Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 8 / 34
  • 14. Introdução PVA Pipeline Interações no PVA Considerações Finais Predictive Analytics Etapas Predictive Analytics são as seguintes etapas : 1 Peparação dos dados; 2 Seleção das variáveis; 3 Modelagem dos algoritmos e modelos; 4 Exploração de resultados e seleção de modelo; 5 Validação. Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 9 / 34
  • 15. Introdução PVA Pipeline Interações no PVA Considerações Finais Predictive Visual Analytics (PVA) Predictive Visual Analytics (PVA) - Objetivo e Condições Objetivo Métodos e técnicas que ajudem em qualquer etapa de Predictive Analytics Condições Foco em predição (não exploração e exploração); Suportar interação com usuário em pelo menos uma das etadas de Predictive Analytics ; Permitir que o analista aumente a acurária da predição ou seu conhecimento do funcionamento do modelo. Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 10 / 34
  • 16. Introdução PVA Pipeline Interações no PVA Considerações Finais Predictive Visual Analytics (PVA) Metodologia 6.144 papers de Journals de visualização Palavras Chave ==========⇒ Titulo ou Abstract 580 papers Leitura e ===========⇒ Flag de Relevancia 72 papers. FIGURE 3 – Fonte : [LGH+ 17] Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 11 / 34
  • 17. Introdução PVA Pipeline Interações no PVA Considerações Finais Predictive Visual Analytics (PVA) Metodologia Os 72 papers foram lidos e classificados de acordo com três aspectos FIGURE 4 – Fonte : [LGH+ 17] Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 12 / 34
  • 18. Introdução PVA Pipeline Interações no PVA Considerações Finais Sumário 1 Introdução Contextualização Predictive Analytics Predictive Visual Analytics (PVA) 2 PVA Pipeline Objetivos Exemplos por Etapa 3 Interações no PVA Tipos de Interação Exemplos por Tipo de Interação 4 Considerações Finais Discussão e Direções de PVA Q & A e Contato Bibliografia Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 13 / 34
  • 19. Introdução PVA Pipeline Interações no PVA Considerações Finais Objetivos Objetivos de PA vs. Objetivos de PVA FIGURE 5 – Fonte : [LGH+ 17] Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 14 / 34
  • 20. Introdução PVA Pipeline Interações no PVA Considerações Finais Exemplos por Etapa Pré-Processamento Objetvo : Entender e preparar os dados. FIGURE 6 – Fonte : https://vimeo.com/136535362 Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 15 / 34
  • 21. Introdução PVA Pipeline Interações no PVA Considerações Finais Exemplos por Etapa Engenharia de Variáveis Objetivo : Geração de variáveis e seleção de variáveis. FIGURE 7 – Retirado de [LGH+ 17] Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 16 / 34
  • 22. Introdução PVA Pipeline Interações no PVA Considerações Finais Exemplos por Etapa Modelagem Objetivo : Regressão : exploração de subsets, modificação no dataset de treino, ajuste de parâmetros dos modelos e alteração entre variáveis alvo do modelo; Clusterização : manipulação, exploração e avaliação de clusters; Classificação : permitir que o usuário classifique dados de treino e ajuda a montar árvores de decisão para estimar os modelos. FIGURE 8 – Retirado de [LGH+ 17] Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 17 / 34
  • 23. Introdução PVA Pipeline Interações no PVA Considerações Finais Exemplos por Etapa Exploração e Seleção do Modelo Objetivo : explorar os resultados e comparar modelos (quando há mais de um no final). FIGURE 9 – Fonte : Link do paper Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 18 / 34
  • 24. Introdução PVA Pipeline Interações no PVA Considerações Finais Exemplos por Etapa Validação Observações : 1 Etapa com menos opções; 2 Relacionadas a visualização de medidas tradicionais de qualidade (R2, ROC, ACF). Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 19 / 34
  • 25. Introdução PVA Pipeline Interações no PVA Considerações Finais Sumário 1 Introdução Contextualização Predictive Analytics Predictive Visual Analytics (PVA) 2 PVA Pipeline Objetivos Exemplos por Etapa 3 Interações no PVA Tipos de Interação Exemplos por Tipo de Interação 4 Considerações Finais Discussão e Direções de PVA Q & A e Contato Bibliografia Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 20 / 34
  • 26. Introdução PVA Pipeline Interações no PVA Considerações Finais Tipos de Interação Tipos de Interação Os papers também foram classificados de acordo com o tipo de interação com o usuário : 1 Selecionar; 2 Explorar; 3 Reconfigurar; 4 Codificar (encode); 5 Abstrair/Elaborar (Abstract/Elaborate); 6 Filtrar; 7 Connectar; 8 Pastor (Shepherd). Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 21 / 34
  • 27. Introdução PVA Pipeline Interações no PVA Considerações Finais Exemplos por Tipo de Interação Selecionar (select) Objetivo : Selecionar items/observações para que o usuário possa ver mais facilmente. FIGURE 10 – Fonte : https://onlinelibrary.wiley.com/doi/full/10.1111/cgf.12630 Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 22 / 34
  • 28. Introdução PVA Pipeline Interações no PVA Considerações Finais Exemplos por Tipo de Interação Explorar (Browse) Objetivo : Descobrir novas observações. FIGURE 11 – Retirado de [LGH+ 17] Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 23 / 34
  • 29. Introdução PVA Pipeline Interações no PVA Considerações Finais Exemplos por Tipo de Interação Reconfigurar (reconfigure) Objetivo : Reorganização do espaço visual. FIGURE 12 – Retirado de [LGH+ 17] Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 24 / 34
  • 30. Introdução PVA Pipeline Interações no PVA Considerações Finais Exemplos por Tipo de Interação Codificar (Encode) Objetivo : alterar a representação dos dados (e.g. mudar o número de dimensões, adicionar cores, etc.) FIGURE 13 – Retirado de [LGH+ 17] Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 25 / 34
  • 31. Introdução PVA Pipeline Interações no PVA Considerações Finais Exemplos por Tipo de Interação Filtrar (Query) Objetivo : Selecionar observações de acordo com condições especificadas pelo usuário. Observação : Assim como Explorar, essa etapa altera o subset dos dados utilizados. Porém, aqui as condições que se quer filtrar é conhecida peo usuário. Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 26 / 34
  • 32. Introdução PVA Pipeline Interações no PVA Considerações Finais Exemplos por Tipo de Interação Abstrair/Elaborar (Abstract/Elaborate) Objetivo : Alterar a granularidade dos dados; FIGURE 14 – Retirado de [LGH+ 17] Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 27 / 34
  • 33. Introdução PVA Pipeline Interações no PVA Considerações Finais Exemplos por Tipo de Interação Conectar (Connect) Objetivo : Destacar relações entre observações e/ou destacar diferentes atributas de uma observação seleionada pelo usuário. FIGURE 15 – Fonte : https://nancao.org/pubs/cao_infovis11_paper.pdf Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 28 / 34
  • 34. Introdução PVA Pipeline Interações no PVA Considerações Finais Exemplos por Tipo de Interação Pastor (Shepherd) Objetivo : Permitir que o usuário guie o processo de modelagem. FIGURE 16 – Retirado de [LGH+ 17] Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 29 / 34
  • 35. Introdução PVA Pipeline Interações no PVA Considerações Finais Sumário 1 Introdução Contextualização Predictive Analytics Predictive Visual Analytics (PVA) 2 PVA Pipeline Objetivos Exemplos por Etapa 3 Interações no PVA Tipos de Interação Exemplos por Tipo de Interação 4 Considerações Finais Discussão e Direções de PVA Q & A e Contato Bibliografia Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 30 / 34
  • 36. Introdução PVA Pipeline Interações no PVA Considerações Finais Discussão e Direções de PVA Discussão FIGURE 17 – (a) Frequência de co-ocorrência dos aspectos na classificação dos autores. (b) Correlação estre os aspectos classificados pelos autores. [LGH+ 17] Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 31 / 34
  • 37. Introdução PVA Pipeline Interações no PVA Considerações Finais Discussão e Direções de PVA Direções 1 Integrar conhecimento do usuário; 2 Escalar para quantidade de dados maiores e modelos mais complexos; 3 Melhor suporte para validação dos modelos; 4 Melhorar experiência do usuário. Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 32 / 34
  • 38. Introdução PVA Pipeline Interações no PVA Considerações Finais Q & A e Contato Q & A e Contato Link do Linkedin E-mail : vinisousa04@gmail.com Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 33 / 34
  • 39. Introdução PVA Pipeline Interações no PVA Considerações Finais Bibliografia Yafeng Lu, Rolando Garcia, Brett Hansen, Michael Gleicher, and Ross Maciejewski, The state-of-the-art in predictive visual analytics, Computer Graphics Forum, vol. 36, Wiley Online Library, 2017, pp. 539–562. David Lazer, Ryan Kennedy, Gary King, and Alessandro Vespignani, The parable of google flu : traps in big data analysis, Science 343 (2014), no. 6176, 1203–1205. Vinícius M. de Sousa (PGCIn/UFSC) Big Data e Web Semântica Sexta Feira, 5 de Abril de 2019 34 / 34