1. Especificação de Requisitos de
Usabilidade
Engenharia de Usabilidade
Prof.: Clarindo Isaías Pereira da Silva e Pádua
Synergia / Gestus
Especificação de Requisitos de Usabilidade Departamento de Ciência da Computação - UFMG
2
Referências Especificação de Requisitos de Usabilidade
Hix, D.; Hartson, H. R. Developing User Interfaces: ensuring Introdução
usability through product & process, John Wiley and Sons, 1993.
Tabela de ERU
Good, M. et al. User Derived Impact Analysis as a Tool for
Usability Engineering, Proceedings of CHI Conference on Human Atributos de Usabilidade
Factors in Computing Systems, New York: ACM, 241-246, 1986. Instrumento de medida
Gilb, T., Design by Objectives, Unpublished Manuscript, 1981.
Valor a ser medido
http://lap.umd.edu/QUIS (site QUIS).
Níveis de desempenho
Diretrizes
3 4
1
2. Introdução
Introdução Motivação
Define metas quantitativas de usabilidade que são A Especificação de Usabilidade indica quando o projeto de
usadas como referência para se avaliar a qualidade da
desenvolvimento está convergindo em direção a uma interface
interface do usuário.
com sucesso.
As especificações devem ser estabelecidas o mais cedo
Com o estabelecimento da Especificação de Usabilidade o mais
possível no processo de desenvolvimento.
cedo possível no processo de desenvolvimento, e monitorando-
As metas são níveis de desempenho em tarefas típicas
as a cada iteração, pode-se determinar quando a interface está, de
dos diversos papéis de usuários.
fato, indo em direção à melhorias.
5 6
Introdução > Motivação
Engenharia de Usabilidade é um processo através do qual as Tabela de ERU
características de usabilidade são especificadas, antecipadamente e
O conceito de especificação formal de atributos em formato
de forma quantitativa no processo de desenvolvimento, e medidas
de tabela foi desenvolvida por Gilb (1981).
durante todo o processo (Good et all. 1986).
A tabela ERU é uma das principais fontes para o planejamento
Sem especificações mensuráveis, é impossível determinar metas de
usabilidade e dizer se o produto final alcança essas metas. No fundo, das avaliações com os usuários.
“...se você não pode realizar medidas em uma atividade, você Deve ser utilizada tanto para avaliações formativas, aquelas
provavelmente não pode gerenciá-la.” realizadas durante o desenvolvimento do software, quanto
somativas, ou seja, avaliações de produtos já existentes.
7 8
2
3. Tabela de ERU
Exemplo de tabela ERU
Atributo de Usabilidade
Níveis de desempenho Atributo de usabilidade é uma característica
Identifica Requisito Atributo de Instrumento de Valor a ser
Ordem Ator
dor ou meta? usabilidade medida medido Pior Melhor
Atual
aceitável Possível
Alvo
geral de Usabilidade a ser usada como critério
1 RU01 R
Desempenh
Todos
“Acrescente o
compromisso...” -
Tempo de
execução na 15s 30 s 10s 20s
para avaliação da interface.
o inicial
benchmark 1 primeira tentativa
É essencial já que fornece parâmetros para se
“Apague o Número de erros
Desempenh
2 RU02 R Todos compromisso...” na primeira 0 erro 3 erros 0 erro 1 erro
o inicial
benchmark 2 tentativa medir a usabilidade de uma versão da interface.
Satisfação - Questionário: Média das
3 RU03 R
inicial
Secretaria
questões... avaliações
?? 7,0 8,5 9,5
Pode-se usar os cinco principais atributos
4 RU04 M
5 RU06 R
definidos por Nielsen e outros relevantes.
9 10
Atributo de usabilidade Atributo de usabilidade
Na escolha dos atributos deve-se considerar Para uma tarefa complexa, pode ser interessante
estabelecer diferentes atributos, por exemplo, aprendizado
os diversos perfis de atores e as tarefas
e desempenho a longo prazo.
analisadas.
Muitas vezes não é viável estabelecer metas para todas as
Pode ser interessante utilizar-se atributos
classes de usuários ou tarefas possíveis.
associados a papéis de usuários específicos.
Especula-se que aproximadamente 80% dos
Pode-se usar uma tabela específica para cada
usuários usam somente 20% das funcionalidades
papel de usuário focal, por exemplo.
de um sistema interativo.
11 12
3
4. Atributo de usabilidade Atributo de usabilidade
Sugestão de atributos
Sugestão de atributos
Retenção: capacidade do usuário reter na memória o que
Desempenho inicial : refere-se ao desempenho do
aprendeu em um período de tempo quando volta a utilizar a
usuário durante a primeira vez de uso do sistema.
interface.
Desempenho em prazo longo: refere-se ao Uso de características (features) avançadas: utilizado para
desempenho do usuário em uso mais regular do determinar a usabilidade de funções complexas da interface.
sistema durante um longo período. Primeira impressão: avaliação inicial do usuário.
Satisfação do usuário a longo prazo: avaliação do usuário após
Aprendizagem: rapidez e a facilidade com que o
a utilização do sistema por um período maior.
usuário aprende a lidar com o sistema.
13 14
Atributo de usabilidade > Sugestão de Especificação de Requisitos de
atributos Usabilidade
Prevenção de erros: capacidade do sistema de Instrumento de medida
evitar erros em sua utilização. Descreve o método utilizado para se
Acurácia: capacidade de oferecer resultados obter valores de um atributo particular
na precisão desejada pelo usuário. de usabilidade.
Confiabilidade Deve ser quantitativo, isto é, pode ser
Clareza medido numericamente.
15 16
4
5. Instrumento de medida Instrumento de medida
A medida pode ser objetiva ou subjetiva. Os termos objetivo e subjetivo
Objetiva - medidas quantitativas do desempenho
referem-se ao modo como são
observável do usuário durante a realização de
tarefas usando a interface.
obtidos os dados relacionados
Subjetiva - medidas quantitativas baseadas nas com os atributos de usabilidade.
opiniões do usuário sobre a interface.
17 18
Instrumento de medida Instrumento de medida
Medidas objetivas: quando os dados são coletados por
observação do desempenho do usuário em tarefas de
Benchmark
benchmark.
Medidas subjetivas: quando os dados são obtidos através
de questionários de preferências dos usuários.
Medidas objetivas e subjetivas são igualmente importantes
para a especificação e para a avaliação da usabilidade de
um desenho.
19 20
5
6. Instrumento de medida > Tarefa de
Instrumento de medida
benchmark
Ao definir tarefas de benchmark diga o que o usuário deve fazer mas não como
Tarefa de Benchmark deve fazer.
É uma tarefa usada como referência para as medições objetivas. Ao iniciar uma tarefa, uma pessoa tem a intenção ou necessidade de realizar uma
ação. Ao se definir uma tarefa de benchmark, deve-se ter o cuidado de colocar o
Uma tarefa de benchmark deve ser bem redigida para indicar
usuário nesta situação.
claramente o que se deseja e permitir comparações
O objetivo da avaliação é justamente avaliar como o usuário realiza a tarefa utilizando
Ex. “marque um compromisso com o Doutor Pacheco por 3 a interface que, no caso, é o instrumento para sua realização.
semanas ...” Ex.:use “adicione um compromisso de almoço com os diretores João e Gilberto todas
as quartas as 14:00hs por 3 meses” e não “vá no menu de compromisso, entre na tela
Tarefas de benchmark devem ser específicas para que o participante
de repetição de compromisso e ...”.
não desvie sua atenção para detalhes irrelevantes durante o teste.
A redação da tarefa deve permitir avaliar se o usuário consegue perceber como
As tarefas de benchmark devem ser descritas na linguagem do
realizar a tarefa, medir o tempo que ele gasta para isso e/ou a quantidade de
domínio da aplicação.
erros que ele comete.
21 22
Instrumento de medida > Tarefa de
Instrumento de medida
benchmark
Na escolha de tarefas de benchmark, é bom usar características
Questionário
(features) simples da interface ou grupos pequenos de
características, para que a causa dos problemas identificados Questionários podem ser usados para avaliar a
possam ser mais facilmente rastreadas no desenho. satisfação subjetiva do usuário com a interface.
Quando as tarefas são complexas, elas devem ser convertidas em sub-
Objetivos: além de utilização em testes de usabilidade, o
tarefas para a avaliação, porque as tarefas complexas são demoradas
questionário é um instrumento que pode ser utilizado para:
para se executar e dificultam a identificação de problemas
guiar o desenho ou melhorias de desenho da interface;
Por outro lado, pode ser necessário usar-se uma seqüência de tarefas,
identificar áreas potenciais para introdução de melhorias;
como no caso em que elas costumam ocorrer em seqüência.
Validar avaliações comparativas;
Ex:. tarefas de pesquisar e modificar um compromisso.
23 24
6
7. Instrumento de medida > Questionário Instrumento de medida
Existem métodos científicos para elaboração e validação de
QUIS (Questionnaire for User Interface
questionários.
Um questionário deve relacionar várias características de interface de
Satisfaction)
usuário, de uma forma organizada. O QUIS (University of Maryland) é um exemplo conhecido
Montar um questionário não é somente montar uma lista de
de questionário para avaliação de satisfação de usuários.
características, listá-las e colocá-las juntas.
De preferência, profissionais devem ser utilizados para sua produção. Pode ser obtida mediante licenciamento.
Um questionário deve endereçar problemas de confiabilidade e validação,
Muitas vezes, é interessante adaptar-se o QUIS a
criando uma medida confiável para determinados tipos de interfaces.
uma situação específica.
25 26
Instrumento de medida > QUIS Especificação de Requisitos de Usabilidade
O QUIS contém um questionário demográfico, Valor a ser medido
uma parte dedicada à medida de satisfação de Indica o tipo de medida para o qual os valores dos dados
são coletados durante os testes juntos aos participantes.
modo geral e uma parte dedicada à medida
Medidas mais comuns:
de onze fatores específicos de uma forma
tempo em que se completou uma tarefa;
organizada hierarquicamente. número ou percentagem de erros.
Fatores: aspectos de tela; terminologia e feedback do É necessário definir exatamente o que significa um erro.
sistema; aprendizado; características do sistema;
Por exemplo, se o usuário não usa um botão ou menu
documentação técnica; tutoriais on-line; multimídia;
esperado na realização de uma tarefa, ainda que ele seja
reconhecimento de voz; ambiente virtual; acesso à internet
desnecessário, deve ser contado como erro.
e instalação do software.
Isso porque será necessário uma correção
27 28
7
8. Valor a ser medido Valor a ser medido
Para um questionário, é tipicamente utilizada a média de Algumas outras medidas que podem ser usadas nas
tarefas de benchmark:
avaliações medidas.
Porcentagem de tarefas completadas em um tempo
O “valor a ser medido” de um atributo como “primeira determinado.
Proporção sucesso / fracasso.
impressão” na Tabela ERU pode ser obtido como uma
Tempo gasto em erros e recuperação.
média entre vários itens de um questionário.
Número de comandos/ações usados para realizar uma
Outro exemplo de “valor a ser medido” que pode ser tarefa.
Freqüência do uso do help e documentação.
interessante é a percepção do usuário do tempo decorrido.
Número de repetições ou falhas de comandos.
Ex.: uma instalação demorada mas na qual o usuário fica Número de comandos disponíveis não executados.
ocupado trocando disquetes pode ser percebida como rápida. Número de vezes em que o usuário expressou frustração
ou satisfação.
29 30
Especificação de Requisitos de Usabilidade Níveis de desempenho
Níveis de desempenho Fontes/critérios para estimativa de níveis
Um sistema existente ou versão anterior de um novo
Na tabela ERU, os níveis de desempenho
sistema sob desenvolvimento.
referem-se a metas quantitativas de Sistemas concorrentes, principalmente aqueles com uma
usabilidade em uma interface. grande fatia do mercado ou com uma interface de
usuário reconhecida pela qualidade.
O tempo atribuído a cada tarefa depende de
A realização de tarefas sem o uso de um sistema de
sua complexidade e uso.
computação (ex. manualmente, usando papel e caneta).
Por exemplo, em uma tarefa freqüente, a
duração admitida deve ser menor.
31 32
8
9. Níveis de desempenho > Fontes/critérios para
Níveis de desempenho
estimativa de níveis
O uso pelos desenvolvedores de seu próprio Diferentes papéis de usuários podem significar necessidade
protótipo para alguma versão da interface. de diferentes tarefas e diferentes níveis de desempenho nas
tarefas.
Feedback de mercado, baseado na aspiração dos
Pode-se inclusive usar diferentes tabelas de especificação de
usuários com sistemas similares. Usabilidade.
Alguma escala absoluta, quando há pouco com o Com a prática, desenvolvedores tornam-se bastante
habilidosos para estabelecer especificações de usabilidade
que se comparar.
confiáveis e estabelecer níveis razoáveis de valores para os
atributos.
33 34
Níveis de desempenho Níveis de desempenho > Nível atual
Nível atual Exemplo
O nível atual é o nível corrente do valor a ser medido para o atributo
Na tabela exemplo, foi atribuído o valor do nível atual de
de usabilidade na presente versão do sistema.
desempenho para “apague o compromisso ...” como 0 já
Este nível pode ser utilizado não só quando o sistema já está
que em uma agenda em papel não é esperado erro para esta
operacional, mas mesmo quando ele ainda está em
desenvolvimento ou se trata de um protótipo. tarefa.
A medição do nível atual ajuda a assegurar que os outros níveis O valor do nível atual para “satisfação inicial” foi
possam ser estimados.
considerado não aplicável já que não interessa avaliar-se
É útil saber como está o nível atual de desempenho em relação a
esse atributo para agenda em papel.
um ou mais sistemas concorrentes.
35 36
9
10. Níveis de desempenho > Nível atual > Exemplo Níveis de desempenho
Pior aceitável
Indica o pior nível de desempenho do usuário que seria ainda
Níveis de desempenho
Identifica Requisito Atributo de Instrumento de Valor a ser
Ordem
dor ou meta? usabilidade
Ator
medida medido Pior Melhor
aceitável para cada atributo de usabilidade; não o pior que
Atual Alvo
aceitável Possível
pode acontecer.
“Acrescente o Tempo de
1 RU01 R
Desempenh
Todos compromisso...” - execução na 15s 30 s 20s 10s O pior nível aceitável é o nível mínimo de performance que os
o inicial
benchmark 1 primeira tentativa
usuários podem alcançar e ainda considerar-se que a interface
Desempenh
“Apague o Número de erros
possui algum crédito em usabilidade.
2 RU02 R Todos compromisso...” na primeira 0 erro 3 erros 1 erro 0 erro
o inicial
benchmark 2 tentativa
Para todos os atributos avaliados, o nível “pior aceitável”, no
Satisfação - Questionário: Média das
3 RU03 R Secretaria ?? 7,0 9,5 8,5
inicial questões... avaliações mínimo, deve ser alcançado.
4 RU04 M
5 RU06 R
37 38
Níveis de desempenho > Pior nível aceitável Níveis de desempenho
Diretrizes para se determinar o nível “pior aceitável”
deve, quando possível, estar próximo do valor do nível atual do
Nível alvo
sistema
Indica o valor alvo que significa sucesso
dever ser mais alto na medida em que o nível atual não seja
satisfatório. inquestionável de usabilidade para a
Como o sistema atual pode ser muito diferente do sistema planejado,
como no caso temos agenda em papel x agenda eletrônica, pode interface, isto é, o nível “que você deseja”.
acontecer que nível atual seja muito rigoroso para ser o pior nível
aceitável.
O nível Alvo deve ser alcançado para todos os
Por exemplo, tarefas simples como “acrescentar compromisso” atributos avaliados.
podem ser feitas muito rapidamente em papel. Sendo assim, o
desempenho “alvo “ e o “pior aceitável” foram estimados como
aquém do nível “atual” (pior do que o nível “atual”)
39 40
10
11. Níveis de desempenho
Níveis de desempenho > Nível alvo planejado
Diretrizes para se determinar seu valor. Melhor possível
É usualmente mais alto que o nível atual para o Indica o limite superior realístico do estado de arte, o
sistema/versão existente, para representar melhoria. “nível de inspiração” de um atributo de usabilidade.
Comparar com sistemas concorrentes. Mostra o potencial de um atributo e serve como
Se o nível alvo planejado for alcançado durante teste referência para futuras versões do sistema.
com o usuário, podemos estar confiantes de boa Deve que ser viável, ainda que difícil, atingi-lo.
qualidade em termos de usabilidade.
41 42
Níveis de desempenho > Melhor nível possível Níveis de desempenho
O melhor nível possível é o melhor nível de Resultados observados
performance que você pode esperar para uma Os resultados observados nas avaliações são valores
reais obtidos observando-se os usuários durante a
situação ideal, o que nos leva à seguinte diretriz:
realização dos testes.
considerar onde é possível se chegar com os melhores
Pode ser registrado uma média de valores observados
usuários (mais bem treinados), nas melhores condições,
Os resultados observados permitem uma comparação
com o melhor desenho e com o melhor uso da
rápida entre os níveis especificados e o resultado real
tecnologia disponível.
dos testes com os usuários.
43 44
11
12. Diretrizes
Diretrizes O número de atributos a ser medido deve ser
Cada atributo de usabilidade deve ser mensurável na razoável na prática
prática Quando o desenvolvedor não tem muita experiência,
Por exemplo, é razoável fazer-se uma medição de não deve ser muito ambicioso.
desempenho do usuário por um longo tempo? Considerar os recursos/prazos disponíveis.
Os papéis-de-usuários aplicáveis devem ser Todos os membros do projeto devem concordar
especificados de forma clara com os atributos e valores na tabela ERU
Pode-se usar uma coluna de Atores na tabela ERU, Isso é importante para o comprometimento da equipe.
como mostrado, ou mesmo fazer-se tabelas separadas
para cada classe de usuários.
45 46
Diretrizes Diretrizes
Verificar se as metas para os vários níveis são razoáveis Verificar se os atributos utilizados
É comum o desenvolvedor iniciante ser muito leniente, o que não
refletem as prioridades de Usabilidade
é producente.
Nos teste de usabilidade, quando os resultados observados são A escolha de uma tarefa não
muito piores que os planejados há duas possibilidades: representativa pode representar
o processo está caminhando normalmente mas há sérios
investimento em uma função que não
problemas de usabilidade na interface que devem ser
resolvidos,. será muito utilizada - perda de dinheiro e
Os valores planejados são irrealísticos. tempo!
47 48
12
13. Exercício: especificação de usabilidade
Objetivo: ganhar experiência especificação de usabilidade.
Tempo: 30 minutos
Atividades: produza pelo menos 3 especificações de
usabilidade para seu trabalho prático. Procure ser preciso
ao descrever as tarefas.
Resultados: tabela ERU preenchida.
49
13