SlideShare a Scribd company logo
1 of 34
Download to read offline
Metodologia da Pesquisa Científica
Aula 07: Táticas para Projeto de Experimentos
Professor: Alexandre Duarte
Web: http://alexandre.ci.ufpb.br/ensino/mpc
Louis Pasteur e a geração espontânea
Louis Pasteur e a geração espontânea
Louis Pasteur e a geração espontânea
Louis Pasteur e a geração espontânea
Louis Pasteur e a geração espontânea
Tipos de Hipóteses
• Existencial: Uma entidade ou fenômeno existe
• Composicional: Uma entidade ou fenômeno é
composta por um número de componentes
• Correlacional: Existe uma associação
específica entre duas grandezas quantificáveis
• Causal: Um determinado comportamento
possui um mecanismo causador/explicador
Condições para inferência causal
• Correlação
• Direção
• Eliminação de
potencias
causas comuns
A B
A B
C
Eliminando causas comuns
• Controle: mantenha potencias causas comuns constantes
de forma que elas não possam afetar o resultado (Bacon,
1620)
• Randomização: Varia de forma aleatória os níveis de
potenciais causas comuns de forma que elas não possam
afetar sistematicamente o resultado (Fisher, 1925)
• Modelagem: Meça, modele e remova matematicamente o
os efeitos de potenciais causas comuns (Rubin 1974;
Spirtes, Glymour & Scheines 1993; Pearl 2000)
Exemplo: Avaliando um sistema de RI
• A Google conduziu recentemente um estudo laboratorial
para avaliar a satisfação de seus usuários com os resultados
das buscas
– Pesquisadores conceberam a hipótese de que documentos mais
longos tem a classificados de forma mais precisa do que
documentos mais curtos porque os seus tópicos podem ser
estimados com maior precisão
– Para testar o efeito causas eles dividiram aleatoriamente os
usuários em dois grupos (A e B). O grupo A recebeu resultados
de buscas sem qualquer alteração. O grupo B recebeu
resultados alterados sistematicamente para favorecer
documentos mais longos.
• O grupo B reportou uma taxa de satisfação significativamente mais
alta do que o grupo A
• O que podemos concluir deste experimento?
Modelos causais alternativos
Docs mais
longos
Melhor
classificação
Maior
satisfação
Modelos causais alternativos
Docs mais
longos
Melhor
classificação
Maior
satisfação
Os desafios do projeto experimental
• Encontrar dependências causais entre as variáveis que
caracterizam o algoritmo, tarefa e ambiente...
• Quando
– Múltiplas variáveis influenciam o comportamento
– Interações ocorrem entre os efeitos das variáveis
independentes
– Há confounding factors entre as variáveis dependentes e
independentes
– Existem variáveis ocultas
– As amostras de dados têm tamanho limitado
CONFOUNDING
Duas ou mais variáveis são ditas confounded
se elas variam juntas de uma forma que torna
impossível determinar qual variável é
responsável pelo efeito observado
Vantagens do projeto experimental em
Ciência da Computação
• Recuperação de estado: em vários cenários é possível
recriar estados arbitrários. Portanto, podemos reutilizar os
mesmo “subjects” e isso diminui a necessidade de projetos
aleatórios
• Grandes amostras: vários experimentos na área podem
criar amostras extremamente grandes. Portanto,
dependemos menos de análise estatística para amostras
reduzidas
• Exceções
– Experimentos com humanos/usuários (ex. Engenharia de
software)
– Experimentos in-place em infraestruturas específicas (ex.
monitoramento de redes)
Desafios do projeto experimental em
Ciência da Computação
• Espaços amostrais muito grandes: sendo a “ciência do
artificial” temos poucas limitações naturais sobre os
objetivos de estudo. Desta forma, geralmente temos mais
potenciais variáveis independentes e dependentes
• Sistemas extremamente complexos: muitas vezes não fica
claro como conjuntos de variáveis independentes devem
ser variadas e quais variáveis dependentes devem ser
medidas
• Expectativa de controle: observadores externos acreditam
que o controle sobre o comportamento torna inferências
causais mais simples do que elas realmente são.
Terminologia
• Unidades (ou Sujeitos/Subjects)
– Entidades sujeito dos experimentos
• Tratamentos
– A experiência propriamente dita
• Resultados
– O resultado das experiências
– Em computação são medidas do comportamento (ex.
Precisão e cobertura)
• Configuração
– A situação específica em que a experiência é realiza e os
resultados observados
– Em computação representa os aspectos ambientais
imutáveis
Terminologia: Unidades ou “Subjects”
• Tipicamente, uma pessoa, um ecossistema, um pedaço
de chão ou alguma outra entidade que recebe um
tratamento
• Em Computação: uma entidade observada em uma
amostra que interage com um algoritmo ou sistema em
avaliação para produzir um comportamento
– O usuário de uma ferramenta de engenharia de software
– Uma consulta submetida a um sistema de RI
– A rede na qual um protocolo de roteamento é aplicado
– Um conjunto de dados analisado por um algoritmo de
aprendizagem de máquina
Terminologia: Tratamento
• Tipicamente, uma situação, estresse ambiental, pesticida,
tipo de semente, ou alguma outra mudança aplicada a uma
unidade pelo experimentador
• Em Computação: uma ou mais variações de um algoritmo,
sistema ou ambiente aplicados a uma unidade
– Diferentes métricas de similaridade em um sistema de RI
– Diferentes protocolos de roteamento aplicados em uma rede
– Diferentes algoritmos de aprendizagem aplicados em um
conjunto de dados
• Tratamentos representam variáveis independentes (aquelas
cujo valor podemos manipular explicitamente)
Validade experimental
• Validade por conclusão estatística
– Existe alguma correlação entre o tratamento e o
resultado
• Validade interna
– A correlação observada reflete de fato um
relacionamento causal entre tratamento e resultado
• Validade externa
– As relações causais inferidas podem ser generalizadas
para outras unidades, tratamentos e resultados
Ameaças à validade estatística
• Baixo poder estatístico
– Amostra de tamanho insuficiente para identificar
associações estatísticas reais
– Medições não confiáveis
• Alta variância ou medição tendenciosa
• Implementação não-confiável do tratamento
– Variação não-intencional no funcionamento do tratamento
• Variação externa na configuração
– Alteração não-intencional no ambiente experimental
Ameaças à validade interna
• Seleção
– Seleção não aleatória das unidades pode introduzir causas
comuns
• História
– Alterações externas em confounding com o tratamento
• Maturação
– Alterações internas em confounding com o tratamento
• Regressão
– A escolha de casos extremos leva a alterações que aparentam
ser efeitos do tratamento mas são na verdade artefatos da
própria seleção
Ameaças à validade interna
• Atrito
– Perda ou descarte de sujeitos ao longo do
experimento
• Instrumentação
– Alteração não intencional no ambiente de
medição
Ameaças à validade interna: Seleção
• A distribuição das unidades que passarão pelo tratamento
pode representar um efeito confounding
• Exemplo:
– Avaliamos nossa ferramenta comparando o código escrito por
duas turmas do mesmo curso de engenharia de software
ministradas no mesmo semestre onde uma das turmas usou a
ferramenta e a outra não.
• Sintoma:
– Projetos experimentais onde os sujeitos recebem tratamentos
diferentes mas não são selecionados aleatoriamente
Ameaças à validade interna: História
• A história de execução do experimento pode
influenciar a variável dependente
• Exemplo:
– Comparamos a acurácia da recuperação solicitando
aos usuários que escrevessem suas próprias consultas
e as submetessem ao Google. Depois eles escreveram
consultas e submeteram ao nosso sistema.
• Sintoma:
– Fluxo de informação entre os tratamentos
Ameaças à validade interna:
Maturação
• O amadurecimento ao longo do experimento é um
fator de confounding
• Exemplo:
– Comparamos nossos resultados com os de Smith e Jones
(2003). Replicamos a avaliação deles utilizando uma massa
de dados atual coletada de um sistema real.
• Sintoma:
– Resultados comparando tratamentos aplicados em
momentos muito distantes no tempo
Ameaças à validade interna: Regressão
• Regressão em direção à média: tendência de casos com
valores extremos se moverem em direção à média em
rodadas subsequentes devido a variações meramente
aleatórias
• Exemplo:
– Selecionamos conjuntos de dados onde o algoritmo
existente se comportou de forma extremamente ruim e
então comparamos seu desempenho com o nosso
algoritmo
• Sintoma:
– Projetos experimentais que focam valores extremos
Ameaças à validade interna: Atrito
• Perda ou descarte de sujeitos durante a execução do
experimento
• Exemplos:
– Durante a avaliação dos sistemas nossa solução travou com
algumas entradas, que foram excluídas dos resultados finais.
– Alguns estudantes desistiram do curso onde nossa ferramenta
foi avaliada. Os resultados desses estudantes foram
desconsiderados na avaliação final.
• Sintoma:
– Grandes perdas de sujeitos ou perdas desbalanceadas entre os
diferentes grupos
Ameaças à validade interna:
Instrumentação
• A medição em si pode ser um fator de confounding.
• Exemplo:
– Sem o conhecimento os usuários, sua velocidade de
codificação na IDE padrão foi gravada durante um mês. No
meio deste período, sua velocidade também foi gravada
com uma outra IDE em um ambiente laboratorial
• Sintomas:
– Técnicas de medição divergentes
– Potencial para medições tendenciosas
– Fluxo de informação entre os tratamentos
Ameaças à validade externa
• Interação da relação causal com
– Unidades
– Variações do tratamento
– Resultados
– Configurações
• Mediação dependente do contexto
– Uma variável que media a relação causal pode não
estar presente em outros contextos
Ameaças à validade externa
• Exemplos
– Todos os experimentos de teste do nosso novo
protocolo e troca de mensagens foram realizados
utilizando redes construídas de acordo com o
algoritmo de Watts e Strogatz para redes de
mundo pequeno.
– Avaliamos nosso novo algoritmo de classificação
utilizando 15 conjuntos de dados escolhidos
aleatoriamente no repositório da UCI
PROJETOS FATORIAIS
São projetos experimentais onde duas ou
mais variáveis independentes são variadas
sistematicamente para cobrir todas as
possíveis combinações de valores.
Projetos fatoriais
Dicas para projetos fatoriais
• Use um número pequeno de níveis para cada variável
independente
• Use um número pequeno de repetições para cada ponto no
hipercubo fatorial
• Use projetos-piloto para identificar
– Efeitos principais: O comportamento de muitos sistemas
computacionais é dominado por algumas poucas variáveis
independentes (regra dos “95/5”) – Focar em determinar estas
primeiro.
– Intervalo de variação: Muitas variáveis independentes só
produzem efeitos interessantes em uma faixa especifica de
variação – focar em determinar tais faixas
– Interações: Exame a interação entre as duas ou três variáveis
independentes mais forte
• Itere

More Related Content

Similar to Projeto experimental sobre Louis Pasteur e geração espontânea

Estatística Aplicada à Administração - Aula 08: Tipos de Ensaios
Estatística Aplicada à Administração - Aula 08: Tipos de EnsaiosEstatística Aplicada à Administração - Aula 08: Tipos de Ensaios
Estatística Aplicada à Administração - Aula 08: Tipos de EnsaiosMarcus Araújo
 
Como ler e redigir relatos de pesquisa / A Receita da Replicação
Como ler e redigir relatos de pesquisa / A Receita da ReplicaçãoComo ler e redigir relatos de pesquisa / A Receita da Replicação
Como ler e redigir relatos de pesquisa / A Receita da ReplicaçãoCaio Maximino
 
Aprendizagem de máquina aplicada na neurociência
Aprendizagem de máquina aplicada na neurociênciaAprendizagem de máquina aplicada na neurociência
Aprendizagem de máquina aplicada na neurociênciaWalter Hugo Lopez Pinaya
 
A Receita da Replicação / Tamanho de efeito / Técnicas experimentais na pesqu...
A Receita da Replicação / Tamanho de efeito / Técnicas experimentais na pesqu...A Receita da Replicação / Tamanho de efeito / Técnicas experimentais na pesqu...
A Receita da Replicação / Tamanho de efeito / Técnicas experimentais na pesqu...Caio Maximino
 
Metodologia da Pesquisa Científica: Introdução
Metodologia da Pesquisa Científica:  IntroduçãoMetodologia da Pesquisa Científica:  Introdução
Metodologia da Pesquisa Científica: IntroduçãoAlexandre Duarte
 
Validação e Testes de software
Validação e Testes de softwareValidação e Testes de software
Validação e Testes de softwareRondinelli Mesquita
 
Pesquisa metodologia 2
Pesquisa metodologia 2Pesquisa metodologia 2
Pesquisa metodologia 2Moises Ribeiro
 
Tecnicas de Pesquisa em Psicologia 4
Tecnicas de Pesquisa em Psicologia 4Tecnicas de Pesquisa em Psicologia 4
Tecnicas de Pesquisa em Psicologia 4Alex Rilie
 
Análise Experimental do Comportamento (AEC) - aula 1.pdf
Análise Experimental do Comportamento (AEC) - aula 1.pdfAnálise Experimental do Comportamento (AEC) - aula 1.pdf
Análise Experimental do Comportamento (AEC) - aula 1.pdfFabianaHShimabukuro1
 
Verificação e Validação
Verificação e ValidaçãoVerificação e Validação
Verificação e ValidaçãoMarcelo Yamaguti
 
Palestra - Testes de Usabilidade
Palestra - Testes de UsabilidadePalestra - Testes de Usabilidade
Palestra - Testes de UsabilidadeLuiz Agner
 
GOTEST-Aula3-Automacao-Processo-Testes.pdf
GOTEST-Aula3-Automacao-Processo-Testes.pdfGOTEST-Aula3-Automacao-Processo-Testes.pdf
GOTEST-Aula3-Automacao-Processo-Testes.pdfRodolphoCesar2
 
Revisão sistemática - Parte 2
Revisão sistemática - Parte 2Revisão sistemática - Parte 2
Revisão sistemática - Parte 2bibmedufrgs
 

Similar to Projeto experimental sobre Louis Pasteur e geração espontânea (20)

Estatística Aplicada à Administração - Aula 08: Tipos de Ensaios
Estatística Aplicada à Administração - Aula 08: Tipos de EnsaiosEstatística Aplicada à Administração - Aula 08: Tipos de Ensaios
Estatística Aplicada à Administração - Aula 08: Tipos de Ensaios
 
Como ler e redigir relatos de pesquisa / A Receita da Replicação
Como ler e redigir relatos de pesquisa / A Receita da ReplicaçãoComo ler e redigir relatos de pesquisa / A Receita da Replicação
Como ler e redigir relatos de pesquisa / A Receita da Replicação
 
Devani
DevaniDevani
Devani
 
Aprendizagem de máquina aplicada na neurociência
Aprendizagem de máquina aplicada na neurociênciaAprendizagem de máquina aplicada na neurociência
Aprendizagem de máquina aplicada na neurociência
 
A Receita da Replicação / Tamanho de efeito / Técnicas experimentais na pesqu...
A Receita da Replicação / Tamanho de efeito / Técnicas experimentais na pesqu...A Receita da Replicação / Tamanho de efeito / Técnicas experimentais na pesqu...
A Receita da Replicação / Tamanho de efeito / Técnicas experimentais na pesqu...
 
Metodologia da Pesquisa Científica: Introdução
Metodologia da Pesquisa Científica:  IntroduçãoMetodologia da Pesquisa Científica:  Introdução
Metodologia da Pesquisa Científica: Introdução
 
Teste de software
Teste de softwareTeste de software
Teste de software
 
Aula-3-Introdução-parte-2.ppt
Aula-3-Introdução-parte-2.pptAula-3-Introdução-parte-2.ppt
Aula-3-Introdução-parte-2.ppt
 
O que é Teste de Software?
O que é Teste de Software?O que é Teste de Software?
O que é Teste de Software?
 
Validação e Testes de software
Validação e Testes de softwareValidação e Testes de software
Validação e Testes de software
 
Pesquisa metodologia 2
Pesquisa metodologia 2Pesquisa metodologia 2
Pesquisa metodologia 2
 
Tecnicas de Pesquisa em Psicologia 4
Tecnicas de Pesquisa em Psicologia 4Tecnicas de Pesquisa em Psicologia 4
Tecnicas de Pesquisa em Psicologia 4
 
Análise Experimental do Comportamento (AEC) - aula 1.pdf
Análise Experimental do Comportamento (AEC) - aula 1.pdfAnálise Experimental do Comportamento (AEC) - aula 1.pdf
Análise Experimental do Comportamento (AEC) - aula 1.pdf
 
MetQuantI_Aula1 (1).pptx
MetQuantI_Aula1 (1).pptxMetQuantI_Aula1 (1).pptx
MetQuantI_Aula1 (1).pptx
 
Verificação e Validação
Verificação e ValidaçãoVerificação e Validação
Verificação e Validação
 
Palestra - Testes de Usabilidade
Palestra - Testes de UsabilidadePalestra - Testes de Usabilidade
Palestra - Testes de Usabilidade
 
Seminario 05: Avaliação de Eficácia
Seminario 05: Avaliação de EficáciaSeminario 05: Avaliação de Eficácia
Seminario 05: Avaliação de Eficácia
 
GOTEST-Aula3-Automacao-Processo-Testes.pdf
GOTEST-Aula3-Automacao-Processo-Testes.pdfGOTEST-Aula3-Automacao-Processo-Testes.pdf
GOTEST-Aula3-Automacao-Processo-Testes.pdf
 
Revisão sistemática - Parte 2
Revisão sistemática - Parte 2Revisão sistemática - Parte 2
Revisão sistemática - Parte 2
 
Revisão Sistemática - Parte 2
Revisão Sistemática - Parte 2Revisão Sistemática - Parte 2
Revisão Sistemática - Parte 2
 

More from Alexandre Duarte

Fazer Ciência é Difícil!
Fazer Ciência é Difícil!Fazer Ciência é Difícil!
Fazer Ciência é Difícil!Alexandre Duarte
 
Escolhendo um Projeto de Pesquisa
Escolhendo um Projeto de PesquisaEscolhendo um Projeto de Pesquisa
Escolhendo um Projeto de PesquisaAlexandre Duarte
 
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazer
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazerGráficos: 10 dicas sobre o que fazer e sobre o que não fazer
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazerAlexandre Duarte
 
Panorama de Pesquisas em Análise de Dados na UFPB
Panorama de Pesquisas em Análise de Dados na UFPBPanorama de Pesquisas em Análise de Dados na UFPB
Panorama de Pesquisas em Análise de Dados na UFPBAlexandre Duarte
 
Sumarização Estatística 2D: Variáveis Nominais
Sumarização Estatística 2D: Variáveis NominaisSumarização Estatística 2D: Variáveis Nominais
Sumarização Estatística 2D: Variáveis NominaisAlexandre Duarte
 
Correlação e Classificação
Correlação e ClassificaçãoCorrelação e Classificação
Correlação e ClassificaçãoAlexandre Duarte
 
Sumarização Estatística 2D
Sumarização Estatística 2DSumarização Estatística 2D
Sumarização Estatística 2DAlexandre Duarte
 
Sumarização Estatística 1D
Sumarização Estatística 1DSumarização Estatística 1D
Sumarização Estatística 1DAlexandre Duarte
 
Preparação e Limpeza de Dados
Preparação e Limpeza de DadosPreparação e Limpeza de Dados
Preparação e Limpeza de DadosAlexandre Duarte
 
Introdução ao Projeto de Surveys
Introdução ao Projeto de SurveysIntrodução ao Projeto de Surveys
Introdução ao Projeto de SurveysAlexandre Duarte
 
Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Alexandre Duarte
 
Introdução à Analise de Dados - aula 3 - Agregação de Dados
Introdução à Analise de Dados - aula 3 - Agregação de DadosIntrodução à Analise de Dados - aula 3 - Agregação de Dados
Introdução à Analise de Dados - aula 3 - Agregação de DadosAlexandre Duarte
 
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados Alexandre Duarte
 
Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Análise de Redes Sociais: Introdução aos Grafos Aleatórios Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Análise de Redes Sociais: Introdução aos Grafos Aleatórios Alexandre Duarte
 
Análise de Redes Sociais: Introdução
Análise de Redes Sociais: IntroduçãoAnálise de Redes Sociais: Introdução
Análise de Redes Sociais: IntroduçãoAlexandre Duarte
 
Dicas para calouros na Universidade
Dicas para calouros na UniversidadeDicas para calouros na Universidade
Dicas para calouros na UniversidadeAlexandre Duarte
 
Gerência de Armazenamento: Sistemas de Entrada e Saída
Gerência de Armazenamento: Sistemas de Entrada e SaídaGerência de Armazenamento: Sistemas de Entrada e Saída
Gerência de Armazenamento: Sistemas de Entrada e SaídaAlexandre Duarte
 
Gerência de Armazenamento: Sistemas de Armazenamento em Massa
Gerência de Armazenamento: Sistemas de Armazenamento em MassaGerência de Armazenamento: Sistemas de Armazenamento em Massa
Gerência de Armazenamento: Sistemas de Armazenamento em MassaAlexandre Duarte
 

More from Alexandre Duarte (20)

Fazer Ciência é Difícil!
Fazer Ciência é Difícil!Fazer Ciência é Difícil!
Fazer Ciência é Difícil!
 
Escolhendo um Projeto de Pesquisa
Escolhendo um Projeto de PesquisaEscolhendo um Projeto de Pesquisa
Escolhendo um Projeto de Pesquisa
 
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazer
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazerGráficos: 10 dicas sobre o que fazer e sobre o que não fazer
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazer
 
Panorama de Pesquisas em Análise de Dados na UFPB
Panorama de Pesquisas em Análise de Dados na UFPBPanorama de Pesquisas em Análise de Dados na UFPB
Panorama de Pesquisas em Análise de Dados na UFPB
 
Agrupamento com K-Means
Agrupamento com K-MeansAgrupamento com K-Means
Agrupamento com K-Means
 
Sumarização Estatística 2D: Variáveis Nominais
Sumarização Estatística 2D: Variáveis NominaisSumarização Estatística 2D: Variáveis Nominais
Sumarização Estatística 2D: Variáveis Nominais
 
Correlação e Classificação
Correlação e ClassificaçãoCorrelação e Classificação
Correlação e Classificação
 
Sumarização Estatística 2D
Sumarização Estatística 2DSumarização Estatística 2D
Sumarização Estatística 2D
 
Sumarização Estatística 1D
Sumarização Estatística 1DSumarização Estatística 1D
Sumarização Estatística 1D
 
Transformação de Dados
Transformação de DadosTransformação de Dados
Transformação de Dados
 
Preparação e Limpeza de Dados
Preparação e Limpeza de DadosPreparação e Limpeza de Dados
Preparação e Limpeza de Dados
 
Introdução ao Projeto de Surveys
Introdução ao Projeto de SurveysIntrodução ao Projeto de Surveys
Introdução ao Projeto de Surveys
 
Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01
 
Introdução à Analise de Dados - aula 3 - Agregação de Dados
Introdução à Analise de Dados - aula 3 - Agregação de DadosIntrodução à Analise de Dados - aula 3 - Agregação de Dados
Introdução à Analise de Dados - aula 3 - Agregação de Dados
 
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
 
Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Análise de Redes Sociais: Introdução aos Grafos Aleatórios Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Análise de Redes Sociais: Introdução aos Grafos Aleatórios
 
Análise de Redes Sociais: Introdução
Análise de Redes Sociais: IntroduçãoAnálise de Redes Sociais: Introdução
Análise de Redes Sociais: Introdução
 
Dicas para calouros na Universidade
Dicas para calouros na UniversidadeDicas para calouros na Universidade
Dicas para calouros na Universidade
 
Gerência de Armazenamento: Sistemas de Entrada e Saída
Gerência de Armazenamento: Sistemas de Entrada e SaídaGerência de Armazenamento: Sistemas de Entrada e Saída
Gerência de Armazenamento: Sistemas de Entrada e Saída
 
Gerência de Armazenamento: Sistemas de Armazenamento em Massa
Gerência de Armazenamento: Sistemas de Armazenamento em MassaGerência de Armazenamento: Sistemas de Armazenamento em Massa
Gerência de Armazenamento: Sistemas de Armazenamento em Massa
 

Recently uploaded

v19n2s3a25.pdfgcbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
v19n2s3a25.pdfgcbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbv19n2s3a25.pdfgcbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
v19n2s3a25.pdfgcbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbyasminlarissa371
 
A Inteligência Artificial na Educação e a Inclusão Linguística
A Inteligência Artificial na Educação e a Inclusão LinguísticaA Inteligência Artificial na Educação e a Inclusão Linguística
A Inteligência Artificial na Educação e a Inclusão LinguísticaFernanda Ledesma
 
Sistema de Bibliotecas UCS - A descoberta da terra
Sistema de Bibliotecas UCS  - A descoberta da terraSistema de Bibliotecas UCS  - A descoberta da terra
Sistema de Bibliotecas UCS - A descoberta da terraBiblioteca UCS
 
Slides Lição 3, CPAD, O Céu - o Destino do Cristão, 2Tr24,.pptx
Slides Lição 3, CPAD, O Céu - o Destino do Cristão, 2Tr24,.pptxSlides Lição 3, CPAD, O Céu - o Destino do Cristão, 2Tr24,.pptx
Slides Lição 3, CPAD, O Céu - o Destino do Cristão, 2Tr24,.pptxLuizHenriquedeAlmeid6
 
Cultura e Sociedade - Texto de Apoio.pdf
Cultura e Sociedade - Texto de Apoio.pdfCultura e Sociedade - Texto de Apoio.pdf
Cultura e Sociedade - Texto de Apoio.pdfaulasgege
 
Orientações para a análise do poema Orfeu Rebelde.pptx
Orientações para a análise do poema Orfeu Rebelde.pptxOrientações para a análise do poema Orfeu Rebelde.pptx
Orientações para a análise do poema Orfeu Rebelde.pptxJMTCS
 
Bingo da potenciação e radiciação de números inteiros
Bingo da potenciação e radiciação de números inteirosBingo da potenciação e radiciação de números inteiros
Bingo da potenciação e radiciação de números inteirosAntnyoAllysson
 
HORA DO CONTO3_BECRE D. CARLOS I_2023_2024
HORA DO CONTO3_BECRE D. CARLOS I_2023_2024HORA DO CONTO3_BECRE D. CARLOS I_2023_2024
HORA DO CONTO3_BECRE D. CARLOS I_2023_2024Sandra Pratas
 
TREINAMENTO - BOAS PRATICAS DE HIGIENE NA COZINHA.ppt
TREINAMENTO - BOAS PRATICAS DE HIGIENE NA COZINHA.pptTREINAMENTO - BOAS PRATICAS DE HIGIENE NA COZINHA.ppt
TREINAMENTO - BOAS PRATICAS DE HIGIENE NA COZINHA.pptAlineSilvaPotuk
 
19 de abril - Dia dos povos indigenas brasileiros
19 de abril - Dia dos povos indigenas brasileiros19 de abril - Dia dos povos indigenas brasileiros
19 de abril - Dia dos povos indigenas brasileirosMary Alvarenga
 
Aula - 2º Ano - Cultura e Sociedade - Conceitos-chave
Aula - 2º Ano - Cultura e Sociedade - Conceitos-chaveAula - 2º Ano - Cultura e Sociedade - Conceitos-chave
Aula - 2º Ano - Cultura e Sociedade - Conceitos-chaveaulasgege
 
Linguagem verbal , não verbal e mista.pdf
Linguagem verbal , não verbal e mista.pdfLinguagem verbal , não verbal e mista.pdf
Linguagem verbal , não verbal e mista.pdfLaseVasconcelos1
 
DIGNITAS INFINITA - DIGNIDADE HUMANA -Declaração do Dicastério para a Doutrin...
DIGNITAS INFINITA - DIGNIDADE HUMANA -Declaração do Dicastério para a Doutrin...DIGNITAS INFINITA - DIGNIDADE HUMANA -Declaração do Dicastério para a Doutrin...
DIGNITAS INFINITA - DIGNIDADE HUMANA -Declaração do Dicastério para a Doutrin...Martin M Flynn
 
AULA-06---DIZIMA-PERIODICA_9fdc896dbd1d4cce85a9fbd2e670e62f.pptx
AULA-06---DIZIMA-PERIODICA_9fdc896dbd1d4cce85a9fbd2e670e62f.pptxAULA-06---DIZIMA-PERIODICA_9fdc896dbd1d4cce85a9fbd2e670e62f.pptx
AULA-06---DIZIMA-PERIODICA_9fdc896dbd1d4cce85a9fbd2e670e62f.pptxGislaineDuresCruz
 
Slides Lição 3, Betel, Ordenança para congregar e prestar culto racional, 2Tr...
Slides Lição 3, Betel, Ordenança para congregar e prestar culto racional, 2Tr...Slides Lição 3, Betel, Ordenança para congregar e prestar culto racional, 2Tr...
Slides Lição 3, Betel, Ordenança para congregar e prestar culto racional, 2Tr...LuizHenriquedeAlmeid6
 
Aula 1, 2 Bacterias Características e Morfologia.pptx
Aula 1, 2  Bacterias Características e Morfologia.pptxAula 1, 2  Bacterias Características e Morfologia.pptx
Aula 1, 2 Bacterias Características e Morfologia.pptxpamelacastro71
 
HORA DO CONTO4_BECRE D. CARLOS I_2023_2024
HORA DO CONTO4_BECRE D. CARLOS I_2023_2024HORA DO CONTO4_BECRE D. CARLOS I_2023_2024
HORA DO CONTO4_BECRE D. CARLOS I_2023_2024Sandra Pratas
 
Combinatória.pptxCombinatória.pptxCombinatória.pptxCombinatória.pptx
Combinatória.pptxCombinatória.pptxCombinatória.pptxCombinatória.pptxCombinatória.pptxCombinatória.pptxCombinatória.pptxCombinatória.pptx
Combinatória.pptxCombinatória.pptxCombinatória.pptxCombinatória.pptxalessandraoliveira324
 
6°ano Uso de pontuação e acentuação.pptx
6°ano Uso de pontuação e acentuação.pptx6°ano Uso de pontuação e acentuação.pptx
6°ano Uso de pontuação e acentuação.pptxErivaldoLima15
 

Recently uploaded (20)

v19n2s3a25.pdfgcbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
v19n2s3a25.pdfgcbbbbbbbbbbbbbbbbbbbbbbbbbbbbbbv19n2s3a25.pdfgcbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
v19n2s3a25.pdfgcbbbbbbbbbbbbbbbbbbbbbbbbbbbbbb
 
A Inteligência Artificial na Educação e a Inclusão Linguística
A Inteligência Artificial na Educação e a Inclusão LinguísticaA Inteligência Artificial na Educação e a Inclusão Linguística
A Inteligência Artificial na Educação e a Inclusão Linguística
 
Sistema de Bibliotecas UCS - A descoberta da terra
Sistema de Bibliotecas UCS  - A descoberta da terraSistema de Bibliotecas UCS  - A descoberta da terra
Sistema de Bibliotecas UCS - A descoberta da terra
 
Slides Lição 3, CPAD, O Céu - o Destino do Cristão, 2Tr24,.pptx
Slides Lição 3, CPAD, O Céu - o Destino do Cristão, 2Tr24,.pptxSlides Lição 3, CPAD, O Céu - o Destino do Cristão, 2Tr24,.pptx
Slides Lição 3, CPAD, O Céu - o Destino do Cristão, 2Tr24,.pptx
 
Cultura e Sociedade - Texto de Apoio.pdf
Cultura e Sociedade - Texto de Apoio.pdfCultura e Sociedade - Texto de Apoio.pdf
Cultura e Sociedade - Texto de Apoio.pdf
 
Orientações para a análise do poema Orfeu Rebelde.pptx
Orientações para a análise do poema Orfeu Rebelde.pptxOrientações para a análise do poema Orfeu Rebelde.pptx
Orientações para a análise do poema Orfeu Rebelde.pptx
 
Bingo da potenciação e radiciação de números inteiros
Bingo da potenciação e radiciação de números inteirosBingo da potenciação e radiciação de números inteiros
Bingo da potenciação e radiciação de números inteiros
 
HORA DO CONTO3_BECRE D. CARLOS I_2023_2024
HORA DO CONTO3_BECRE D. CARLOS I_2023_2024HORA DO CONTO3_BECRE D. CARLOS I_2023_2024
HORA DO CONTO3_BECRE D. CARLOS I_2023_2024
 
TREINAMENTO - BOAS PRATICAS DE HIGIENE NA COZINHA.ppt
TREINAMENTO - BOAS PRATICAS DE HIGIENE NA COZINHA.pptTREINAMENTO - BOAS PRATICAS DE HIGIENE NA COZINHA.ppt
TREINAMENTO - BOAS PRATICAS DE HIGIENE NA COZINHA.ppt
 
treinamento brigada incendio 2024 no.ppt
treinamento brigada incendio 2024 no.ppttreinamento brigada incendio 2024 no.ppt
treinamento brigada incendio 2024 no.ppt
 
19 de abril - Dia dos povos indigenas brasileiros
19 de abril - Dia dos povos indigenas brasileiros19 de abril - Dia dos povos indigenas brasileiros
19 de abril - Dia dos povos indigenas brasileiros
 
Aula - 2º Ano - Cultura e Sociedade - Conceitos-chave
Aula - 2º Ano - Cultura e Sociedade - Conceitos-chaveAula - 2º Ano - Cultura e Sociedade - Conceitos-chave
Aula - 2º Ano - Cultura e Sociedade - Conceitos-chave
 
Linguagem verbal , não verbal e mista.pdf
Linguagem verbal , não verbal e mista.pdfLinguagem verbal , não verbal e mista.pdf
Linguagem verbal , não verbal e mista.pdf
 
DIGNITAS INFINITA - DIGNIDADE HUMANA -Declaração do Dicastério para a Doutrin...
DIGNITAS INFINITA - DIGNIDADE HUMANA -Declaração do Dicastério para a Doutrin...DIGNITAS INFINITA - DIGNIDADE HUMANA -Declaração do Dicastério para a Doutrin...
DIGNITAS INFINITA - DIGNIDADE HUMANA -Declaração do Dicastério para a Doutrin...
 
AULA-06---DIZIMA-PERIODICA_9fdc896dbd1d4cce85a9fbd2e670e62f.pptx
AULA-06---DIZIMA-PERIODICA_9fdc896dbd1d4cce85a9fbd2e670e62f.pptxAULA-06---DIZIMA-PERIODICA_9fdc896dbd1d4cce85a9fbd2e670e62f.pptx
AULA-06---DIZIMA-PERIODICA_9fdc896dbd1d4cce85a9fbd2e670e62f.pptx
 
Slides Lição 3, Betel, Ordenança para congregar e prestar culto racional, 2Tr...
Slides Lição 3, Betel, Ordenança para congregar e prestar culto racional, 2Tr...Slides Lição 3, Betel, Ordenança para congregar e prestar culto racional, 2Tr...
Slides Lição 3, Betel, Ordenança para congregar e prestar culto racional, 2Tr...
 
Aula 1, 2 Bacterias Características e Morfologia.pptx
Aula 1, 2  Bacterias Características e Morfologia.pptxAula 1, 2  Bacterias Características e Morfologia.pptx
Aula 1, 2 Bacterias Características e Morfologia.pptx
 
HORA DO CONTO4_BECRE D. CARLOS I_2023_2024
HORA DO CONTO4_BECRE D. CARLOS I_2023_2024HORA DO CONTO4_BECRE D. CARLOS I_2023_2024
HORA DO CONTO4_BECRE D. CARLOS I_2023_2024
 
Combinatória.pptxCombinatória.pptxCombinatória.pptxCombinatória.pptx
Combinatória.pptxCombinatória.pptxCombinatória.pptxCombinatória.pptxCombinatória.pptxCombinatória.pptxCombinatória.pptxCombinatória.pptx
Combinatória.pptxCombinatória.pptxCombinatória.pptxCombinatória.pptx
 
6°ano Uso de pontuação e acentuação.pptx
6°ano Uso de pontuação e acentuação.pptx6°ano Uso de pontuação e acentuação.pptx
6°ano Uso de pontuação e acentuação.pptx
 

Projeto experimental sobre Louis Pasteur e geração espontânea

  • 1. Metodologia da Pesquisa Científica Aula 07: Táticas para Projeto de Experimentos Professor: Alexandre Duarte Web: http://alexandre.ci.ufpb.br/ensino/mpc
  • 2. Louis Pasteur e a geração espontânea
  • 3. Louis Pasteur e a geração espontânea
  • 4. Louis Pasteur e a geração espontânea
  • 5. Louis Pasteur e a geração espontânea
  • 6. Louis Pasteur e a geração espontânea
  • 7. Tipos de Hipóteses • Existencial: Uma entidade ou fenômeno existe • Composicional: Uma entidade ou fenômeno é composta por um número de componentes • Correlacional: Existe uma associação específica entre duas grandezas quantificáveis • Causal: Um determinado comportamento possui um mecanismo causador/explicador
  • 8. Condições para inferência causal • Correlação • Direção • Eliminação de potencias causas comuns A B A B C
  • 9. Eliminando causas comuns • Controle: mantenha potencias causas comuns constantes de forma que elas não possam afetar o resultado (Bacon, 1620) • Randomização: Varia de forma aleatória os níveis de potenciais causas comuns de forma que elas não possam afetar sistematicamente o resultado (Fisher, 1925) • Modelagem: Meça, modele e remova matematicamente o os efeitos de potenciais causas comuns (Rubin 1974; Spirtes, Glymour & Scheines 1993; Pearl 2000)
  • 10. Exemplo: Avaliando um sistema de RI • A Google conduziu recentemente um estudo laboratorial para avaliar a satisfação de seus usuários com os resultados das buscas – Pesquisadores conceberam a hipótese de que documentos mais longos tem a classificados de forma mais precisa do que documentos mais curtos porque os seus tópicos podem ser estimados com maior precisão – Para testar o efeito causas eles dividiram aleatoriamente os usuários em dois grupos (A e B). O grupo A recebeu resultados de buscas sem qualquer alteração. O grupo B recebeu resultados alterados sistematicamente para favorecer documentos mais longos. • O grupo B reportou uma taxa de satisfação significativamente mais alta do que o grupo A • O que podemos concluir deste experimento?
  • 11. Modelos causais alternativos Docs mais longos Melhor classificação Maior satisfação
  • 12. Modelos causais alternativos Docs mais longos Melhor classificação Maior satisfação
  • 13. Os desafios do projeto experimental • Encontrar dependências causais entre as variáveis que caracterizam o algoritmo, tarefa e ambiente... • Quando – Múltiplas variáveis influenciam o comportamento – Interações ocorrem entre os efeitos das variáveis independentes – Há confounding factors entre as variáveis dependentes e independentes – Existem variáveis ocultas – As amostras de dados têm tamanho limitado
  • 14. CONFOUNDING Duas ou mais variáveis são ditas confounded se elas variam juntas de uma forma que torna impossível determinar qual variável é responsável pelo efeito observado
  • 15. Vantagens do projeto experimental em Ciência da Computação • Recuperação de estado: em vários cenários é possível recriar estados arbitrários. Portanto, podemos reutilizar os mesmo “subjects” e isso diminui a necessidade de projetos aleatórios • Grandes amostras: vários experimentos na área podem criar amostras extremamente grandes. Portanto, dependemos menos de análise estatística para amostras reduzidas • Exceções – Experimentos com humanos/usuários (ex. Engenharia de software) – Experimentos in-place em infraestruturas específicas (ex. monitoramento de redes)
  • 16. Desafios do projeto experimental em Ciência da Computação • Espaços amostrais muito grandes: sendo a “ciência do artificial” temos poucas limitações naturais sobre os objetivos de estudo. Desta forma, geralmente temos mais potenciais variáveis independentes e dependentes • Sistemas extremamente complexos: muitas vezes não fica claro como conjuntos de variáveis independentes devem ser variadas e quais variáveis dependentes devem ser medidas • Expectativa de controle: observadores externos acreditam que o controle sobre o comportamento torna inferências causais mais simples do que elas realmente são.
  • 17. Terminologia • Unidades (ou Sujeitos/Subjects) – Entidades sujeito dos experimentos • Tratamentos – A experiência propriamente dita • Resultados – O resultado das experiências – Em computação são medidas do comportamento (ex. Precisão e cobertura) • Configuração – A situação específica em que a experiência é realiza e os resultados observados – Em computação representa os aspectos ambientais imutáveis
  • 18. Terminologia: Unidades ou “Subjects” • Tipicamente, uma pessoa, um ecossistema, um pedaço de chão ou alguma outra entidade que recebe um tratamento • Em Computação: uma entidade observada em uma amostra que interage com um algoritmo ou sistema em avaliação para produzir um comportamento – O usuário de uma ferramenta de engenharia de software – Uma consulta submetida a um sistema de RI – A rede na qual um protocolo de roteamento é aplicado – Um conjunto de dados analisado por um algoritmo de aprendizagem de máquina
  • 19. Terminologia: Tratamento • Tipicamente, uma situação, estresse ambiental, pesticida, tipo de semente, ou alguma outra mudança aplicada a uma unidade pelo experimentador • Em Computação: uma ou mais variações de um algoritmo, sistema ou ambiente aplicados a uma unidade – Diferentes métricas de similaridade em um sistema de RI – Diferentes protocolos de roteamento aplicados em uma rede – Diferentes algoritmos de aprendizagem aplicados em um conjunto de dados • Tratamentos representam variáveis independentes (aquelas cujo valor podemos manipular explicitamente)
  • 20. Validade experimental • Validade por conclusão estatística – Existe alguma correlação entre o tratamento e o resultado • Validade interna – A correlação observada reflete de fato um relacionamento causal entre tratamento e resultado • Validade externa – As relações causais inferidas podem ser generalizadas para outras unidades, tratamentos e resultados
  • 21. Ameaças à validade estatística • Baixo poder estatístico – Amostra de tamanho insuficiente para identificar associações estatísticas reais – Medições não confiáveis • Alta variância ou medição tendenciosa • Implementação não-confiável do tratamento – Variação não-intencional no funcionamento do tratamento • Variação externa na configuração – Alteração não-intencional no ambiente experimental
  • 22. Ameaças à validade interna • Seleção – Seleção não aleatória das unidades pode introduzir causas comuns • História – Alterações externas em confounding com o tratamento • Maturação – Alterações internas em confounding com o tratamento • Regressão – A escolha de casos extremos leva a alterações que aparentam ser efeitos do tratamento mas são na verdade artefatos da própria seleção
  • 23. Ameaças à validade interna • Atrito – Perda ou descarte de sujeitos ao longo do experimento • Instrumentação – Alteração não intencional no ambiente de medição
  • 24. Ameaças à validade interna: Seleção • A distribuição das unidades que passarão pelo tratamento pode representar um efeito confounding • Exemplo: – Avaliamos nossa ferramenta comparando o código escrito por duas turmas do mesmo curso de engenharia de software ministradas no mesmo semestre onde uma das turmas usou a ferramenta e a outra não. • Sintoma: – Projetos experimentais onde os sujeitos recebem tratamentos diferentes mas não são selecionados aleatoriamente
  • 25. Ameaças à validade interna: História • A história de execução do experimento pode influenciar a variável dependente • Exemplo: – Comparamos a acurácia da recuperação solicitando aos usuários que escrevessem suas próprias consultas e as submetessem ao Google. Depois eles escreveram consultas e submeteram ao nosso sistema. • Sintoma: – Fluxo de informação entre os tratamentos
  • 26. Ameaças à validade interna: Maturação • O amadurecimento ao longo do experimento é um fator de confounding • Exemplo: – Comparamos nossos resultados com os de Smith e Jones (2003). Replicamos a avaliação deles utilizando uma massa de dados atual coletada de um sistema real. • Sintoma: – Resultados comparando tratamentos aplicados em momentos muito distantes no tempo
  • 27. Ameaças à validade interna: Regressão • Regressão em direção à média: tendência de casos com valores extremos se moverem em direção à média em rodadas subsequentes devido a variações meramente aleatórias • Exemplo: – Selecionamos conjuntos de dados onde o algoritmo existente se comportou de forma extremamente ruim e então comparamos seu desempenho com o nosso algoritmo • Sintoma: – Projetos experimentais que focam valores extremos
  • 28. Ameaças à validade interna: Atrito • Perda ou descarte de sujeitos durante a execução do experimento • Exemplos: – Durante a avaliação dos sistemas nossa solução travou com algumas entradas, que foram excluídas dos resultados finais. – Alguns estudantes desistiram do curso onde nossa ferramenta foi avaliada. Os resultados desses estudantes foram desconsiderados na avaliação final. • Sintoma: – Grandes perdas de sujeitos ou perdas desbalanceadas entre os diferentes grupos
  • 29. Ameaças à validade interna: Instrumentação • A medição em si pode ser um fator de confounding. • Exemplo: – Sem o conhecimento os usuários, sua velocidade de codificação na IDE padrão foi gravada durante um mês. No meio deste período, sua velocidade também foi gravada com uma outra IDE em um ambiente laboratorial • Sintomas: – Técnicas de medição divergentes – Potencial para medições tendenciosas – Fluxo de informação entre os tratamentos
  • 30. Ameaças à validade externa • Interação da relação causal com – Unidades – Variações do tratamento – Resultados – Configurações • Mediação dependente do contexto – Uma variável que media a relação causal pode não estar presente em outros contextos
  • 31. Ameaças à validade externa • Exemplos – Todos os experimentos de teste do nosso novo protocolo e troca de mensagens foram realizados utilizando redes construídas de acordo com o algoritmo de Watts e Strogatz para redes de mundo pequeno. – Avaliamos nosso novo algoritmo de classificação utilizando 15 conjuntos de dados escolhidos aleatoriamente no repositório da UCI
  • 32. PROJETOS FATORIAIS São projetos experimentais onde duas ou mais variáveis independentes são variadas sistematicamente para cobrir todas as possíveis combinações de valores.
  • 34. Dicas para projetos fatoriais • Use um número pequeno de níveis para cada variável independente • Use um número pequeno de repetições para cada ponto no hipercubo fatorial • Use projetos-piloto para identificar – Efeitos principais: O comportamento de muitos sistemas computacionais é dominado por algumas poucas variáveis independentes (regra dos “95/5”) – Focar em determinar estas primeiro. – Intervalo de variação: Muitas variáveis independentes só produzem efeitos interessantes em uma faixa especifica de variação – focar em determinar tais faixas – Interações: Exame a interação entre as duas ou três variáveis independentes mais forte • Itere

Editor's Notes

  1. Detecção do problema Veja com ceticismo projetos onde a unidades recebem diferentes tratamentos mas não são selecionadas aleatoriamente