Fiabilidad Definición

¿Qué es la Fiabilidad?

La Fiabilidad se refiere a la consistencia y estabilidad de una puntuación de prueba. Si te subes a una báscula y dice 70 kg, luego te bajas y te subes de nuevo y dice 85 kg, la báscula es poco fiable. Puede ser un concepto válido (el peso), pero el instrumento está roto.

En las pruebas de CI, la fiabilidad es crucial. Si tomas una prueba de CI el lunes y obtienes 130, y luego la tomas de nuevo el viernes y obtienes 100, la prueba es inútil. No importa lo elegante que sea la teoría detrás de ella: si no puede medir de forma consistente, no puede medir nada en absoluto.

Métodos para Medir la Fiabilidad

Los psicométricos utilizan métodos estadísticos para garantizar que las pruebas sean estables:

Fiabilidad Test-Retest: El estándar de oro. Un grupo realiza la prueba, espera unas semanas y la vuelve a realizar. La correlación entre las dos puntuaciones debe ser extremadamente alta (superior a 0.90 para las buenas pruebas).
Consistencia Interna (Mitad-Mitad): Si se divide la prueba por la mitad (por ejemplo, preguntas impares frente a preguntas pares), tu puntuación en ambas mitades debe ser aproximadamente la misma. Esto demuestra que la prueba está midiendo un único rasgo consistente.
Fiabilidad Entre Evaluadores: Si dos psicólogos diferentes puntúan tu prueba, ¿obtienen el mismo resultado? Para las pruebas de opción múltiple, esto es sencillo (100%). Para las pruebas que implican definiciones verbales (“Define ‘integridad’”), la puntuación subjetiva puede reducir la fiabilidad.

Fuentes de Error

Incluso las mejores pruebas (como el WAIS-IV) no son perfectas. La fiabilidad puede verse afectada por el “Error de Medición”:

Estado Interno: La privación del sueño, la ansiedad o la enfermedad pueden reducir temporalmente una puntuación.
Ambiente: Una habitación ruidosa o un supervisor que distrae.
Adivinar: Los formatos de opción múltiple introducen un pequeño elemento de suerte.

El Error Estándar de Medida (EEM)

Dado que ninguna prueba es 100% fiable, los psicólogos utilizan un Intervalo de Confianza.

En lugar de decir “Tu CI es 120”, un informe podría decir “Tenemos un 95% de confianza en que tu CI se encuentra entre 115 y 125”.
Este rango tiene en cuenta la ligera falta de fiabilidad inherente a cualquier medición humana.

Para el WAIS-IV, el Error Estándar de Medida (EEM) para el CI de Escala Completa es aproximadamente 2.16 puntos. Esto significa:

Si tu CI verdadero es 120, hay un 68% de probabilidad de que cualquier administración de prueba produzca una puntuación entre 117.8 y 122.2.
Hay un 95% de probabilidad de que la puntuación caiga entre 115.8 y 124.2.

Este es un margen pequeño, que refleja la excelente fiabilidad del WAIS-IV. Por el contrario, muchas pruebas de CI en internet tienen EEM de 10-15 puntos o más, lo que significa que una “puntuación” de 130 podría reflejar cualquier cosa entre 115 y 145.

Fiabilidad vs. Validez

Es posible que una prueba sea fiable pero no válida.

Ejemplo: Un reloj roto es perfectamente fiable (muestra exactamente la misma hora dos veces al día), pero no es válido para decir la hora.
Ejemplo: Si mides la inteligencia midiendo la circunferencia de la cabeza con una cinta métrica, obtendrás el mismo número exacto cada vez (Alta Fiabilidad), pero no te dice nada sobre la inteligencia (Baja Validez).

Coeficientes de Fiabilidad: Interpretando los Números

La fiabilidad se expresa como un coeficiente de correlación que va de 0.0 (completamente aleatorio) a 1.0 (perfectamente consistente). Entender estos números ayuda a juzgar si una prueba merece confianza:

0.90 y superior: Fiabilidad excelente. Este es el estándar para decisiones clínicas y legales de alto riesgo. El WAIS-IV alcanza fiabilidades compuestas de 0.97-0.98, lo que lo convierte en uno de los instrumentos estadísticamente más fiables de la psicología.
0.80–0.89: Buena fiabilidad. Aceptable para la mayoría de los propósitos educativos y de investigación, pero introduce un margen de error significativo para decisiones individuales.
0.70–0.79: Adecuado para investigaciones a nivel de grupo. Demasiado impreciso para decisiones individuales importantes (admisiones universitarias, diagnóstico clínico).
Por debajo de 0.70: Fiabilidad deficiente. La prueba introduce más error que perspicacia. Muchas “pruebas de CI en línea” disponibles gratuitamente caen en este rango o por debajo.

El Problema del “Efecto de Práctica” con el Test-Retest

Al medir la fiabilidad test-retest, los investigadores deben tener en cuenta el efecto de práctica: la tendencia de las puntuaciones a aumentar simplemente porque el examinado ha sido expuesto previamente al mismo material. Por eso, los estudios de fiabilidad utilizan un retraso de al menos dos a cuatro semanas entre administraciones, a veces más.

El efecto de práctica también explica por qué no debes volver a hacer una prueba de CI poco después de tu primer intento esperando obtener una puntuación “real”. La mejora reflejará en parte una medición genuina, pero en gran parte reflejará familiaridad con el formato de la prueba. Por esta razón, muchas directrices clínicas especifican intervalos mínimos (6-12 meses para niños) antes de la re-administración.

El Alpha de Cronbach: El Estándar de Consistencia Interna

La medida de consistencia interna más utilizada es el Alpha de Cronbach (α), que mide qué tan bien todos los ítems de una escala de prueba “se mantienen juntos”: es decir, con qué consistencia miden el mismo rasgo subyacente.

El alfa oscila entre 0 y 1.
Para los subtests de inteligencia, los alfas de 0.85-0.95 son típicos en pruebas bien construidas.
Un alfa bajo en un subtest (por debajo de 0.75) sugiere que los ítems están midiendo cosas diferentes, una señal de advertencia de que la puntuación del subtest es poco fiable.

En el WAIS-IV, el Índice de Comprensión Verbal alcanza un alfa de aproximadamente 0.96, y el compuesto de CI de Escala Completa llega a 0.98, que se encuentran entre los valores de consistencia interna más altos de cualquier instrumento psicológico ampliamente utilizado.

Conclusión: El Fundamento de las Pruebas Confiables

La fiabilidad no es un concepto glamoroso, pero es la piedra angular sobre la que descansa toda medición psicológica significativa. Sin ella, una prueba no puede decirte nada útil sobre una persona, independientemente de lo impresionante que sea la teoría detrás de ella. Antes de confiar en cualquier puntuación de CI, la primera pregunta que debes hacer no es “¿Qué significa?” sino “¿Con qué fiabilidad fue medida?” Una puntuación de CI solo vale tanto como la consistencia del instrumento que la produjo.