Confiabilidade
O que é Confiabilidade?
A Confiabilidade refere-se à consistência e estabilidade de uma pontuação de teste. Se você subir em uma balança e ela disser 70kg, depois descer e subir novamente e ela disser 85kg, a balança é não confiável. Pode ser um conceito válido (peso), mas a ferramenta está quebrada.
Em testes de QI, a confiabilidade é crucial. Se você fizer um teste de QI na segunda-feira e marcar 130, e depois fizer novamente na sexta-feira e marcar 100, o teste é inútil.
Métodos de Medição da Confiabilidade
Os psicometristas usam métodos estatísticos para garantir que os testes sejam estáveis:
- Confiabilidade Teste-Reteste: O padrão-ouro. Um grupo faz o teste, espera algumas semanas e faz novamente. A correlação entre as duas pontuações deve ser extremamente alta (acima de 0,90 para bons testes).
- Consistência Interna (Divisão ao Meio): Se você dividir o teste ao meio (por exemplo, perguntas ímpares versus perguntas pares), sua pontuação em ambas as metades deve ser aproximadamente a mesma. Isso prova que o teste está medindo um único traço consistente.
- Confiabilidade Entre Avaliadores: Se dois psicólogos diferentes pontuarem o seu teste, eles obtêm o mesmo resultado? Para testes de múltipla escolha, isso é fácil (100%). Para testes que envolvem definições verbais, a pontuação subjetiva pode baixar a confiabilidade.
O Erro Padrão de Medição (EPM)
Como nenhum teste é 100% confiável, os psicólogos usam um Intervalo de Confiança.
- Em vez de dizer “O seu QI é 120”, um relatório pode dizer “Estamos 95% confiantes de que o seu QI está entre 115 e 125.”
- Este intervalo leva em conta a ligeira falta de confiabilidade inerente a qualquer medição humana.
Para o WAIS-IV, o Erro Padrão de Medição (EPM) para o QI da Escala Completa é de aproximadamente 2,16 pontos. Isto significa:
- Se o seu QI verdadeiro é 120, há 68% de probabilidade de que qualquer administração única do teste produza uma pontuação entre 117,8 e 122,2.
- Há 95% de probabilidade de que a pontuação caia entre 115,8 e 124,2.
Por contraste, muitos testes de QI na internet têm EPMs de 10 a 15 pontos ou mais, o que significa que uma “pontuação” de 130 pode refletir qualquer coisa entre 115 e 145.
Coeficientes de Confiabilidade: Lendo os Números
A confiabilidade é expressa como um coeficiente de correlação que varia de 0,0 (completamente aleatório) a 1,0 (perfeitamente consistente). Compreender esses números ajuda a julgar se um teste merece confiança:
- 0,90 e acima: Excelente confiabilidade. Este é o padrão para decisões clínicas e legais de alto risco. O WAIS-IV atinge confiabilidades compostas de 0,97–0,98, tornando-o um dos instrumentos estatisticamente mais confiáveis em psicologia.
- 0,80–0,89: Boa confiabilidade. Aceitável para a maioria dos fins educacionais e de investigação, mas introduz uma margem de erro significativa para decisões individuais.
- 0,70–0,79: Adequado para investigação ao nível do grupo. Demasiado impreciso para decisões individuais importantes (admissões universitárias, diagnóstico clínico).
- Abaixo de 0,70: Fraca confiabilidade. O teste introduz mais erro do que insight. Muitos “testes de QI online” disponíveis gratuitamente caem nesta faixa ou abaixo.
Fontes de Erro
Mesmo os melhores testes não são perfeitos. A confiabilidade pode ser afetada por:
- Estado Interno: Privação de sono, ansiedade ou doença podem baixar temporariamente uma pontuação.
- Ambiente: Uma sala barulhenta ou um supervisor que distrai.
- Adivinhação: Formatos de múltipla escolha introduzem um pequeno elemento de sorte.
Por que as Pontuações de QI Podem Flutuar — e Quanto
Uma experiência comum é fazer um teste de QI e depois refazê-lo anos mais tarde com uma pontuação diferente. Compreender a confiabilidade explica por que isso acontece e o que significa.
A implicação prática: nenhuma pontuação de teste único deve ser tratada como um rótulo exato e permanente. É uma estimativa dentro de um intervalo. Os psicólogos são treinados para interpretar pontuações dentro dos seus intervalos de confiança em vez de como medições precisas.
O Problema do “Efeito de Prática” com o Teste-Reteste
Ao medir a confiabilidade teste-reteste, os investigadores devem levar em conta o efeito de prática — a tendência de as pontuações subirem simplesmente porque o testador foi exposto ao mesmo material antes. É por isso que os estudos de confiabilidade usam um atraso de pelo menos duas a quatro semanas entre administrações.
O efeito de prática também explica por que não se deve refazer um teste de QI logo após a primeira tentativa esperando obter uma pontuação “real”. A melhoria refletirá parcialmente a medição genuína — mas refletirá principalmente a familiaridade com o formato do teste. Por esta razão, muitas diretrizes clínicas especificam intervalos mínimos (6 a 12 meses para crianças) antes da readministração.
Alfa de Cronbach: O Padrão de Consistência Interna
A medida mais amplamente usada de consistência interna é o Alfa de Cronbach (α), que mede quão bem todos os itens de uma escala de teste “se unem” — ou seja, quão consistentemente medem o mesmo traço subjacente.
- O alfa varia de 0 a 1.
- Para subtestes de inteligência, alfas de 0,85–0,95 são típicos em testes bem construídos.
- Um alfa baixo num subteste (abaixo de 0,75) sugere que os itens estão a medir coisas diferentes — um sinal de aviso de que a pontuação do subteste não é confiável.
No WAIS-IV, o Índice de Compreensão Verbal atinge um alfa de aproximadamente 0,96, e o composto de QI na Escala Completa chega a 0,98 — entre os valores mais altos de consistência interna de qualquer instrumento psicológico amplamente utilizado.
Confiabilidade vs. Validade
É possível que um teste seja confiável, mas não válido.
- Exemplo: Se você medir a inteligência medindo a circunferência da cabeça com uma fita métrica, obterá o mesmo número exato todas as vezes (Alta Confiabilidade), mas isso não lhe diz nada sobre inteligência (Baixa Validade). Um relógio partido é perfeitamente confiável — mostra a hora exata duas vezes por dia — mas não é válido para dizer as horas.
Conclusão: A Fundação dos Testes Dignos de Confiança
A confiabilidade não é um conceito glamoroso, mas é a base sobre a qual toda medição psicológica significativa repousa. Sem ela, um teste não pode dizer nada útil sobre uma pessoa — independentemente de quão impressionante seja a teoria por trás dele. Antes de confiar em qualquer pontuação de QI, a primeira pergunta a fazer não é “O que significa?” mas “Com que confiabilidade foi medido?”