La significación estadística

29 - 06 - 2023

Categorías: Artículos Científicos , Contenidos especializados

Etiquetas: investigación , divulgación

La significación estadística

INVESTIGACIÓN | GESTIÓN DEL CONOCIMIENTO

Autor: Víctor González Ayuso. Psicólogo investigador. Área de Gestión del Conocimiento, que presta sus servicios en el Creap a través de Grupo 5 Acción y Gestión Social S.A.U.

Introducción

Cuando revisamos un artículo científico o queremos conocer la validez de un programa o intervención terapéutica, solemos hablar de si es estadísticamente significativo, pero ¿sabemos qué quiere decir exactamente esta expresión?

Al evaluar un estudio, la idea fundamental es que los resultados obtenidos se deban a la intervención evaluada y no a efectos genuinos o extraños. Es decir, si evaluamos los efectos de una intervención para reducir los síntomas depresivos, el objetivo es que los resultados producidos se deban a la intervención y no a otros elementos.

Análisis estadístico

Para llevar a cabo el análisis estadístico, se sigue un proceso que incluye el cálculo de las diferencias entre las puntuaciones directas antes y después del programa para cada participante en estudio, seguido del uso de pruebas estadísticas para determinar si estas diferencias son estadísticamente significativas.

Aquí se detalla ese proceso:

1. Cálculo de las diferencias: Primero, se toman las puntuaciones directas de cada participante antes y después del programa de intervención. Luego, se calcula la diferencia entre estas dos puntuaciones para cada participante. Esto nos proporciona un conjunto de diferencias individuales que representan el cambio en el rendimiento de cada participante después de participar en el programa.

2. Pruebas estadísticas: Una vez que tenemos las diferencias individuales, utilizamos pruebas estadísticas para evaluar si estas diferencias son estadísticamente significativas. Hay varias pruebas que se pueden utilizar dependiendo de la naturaleza de los datos y del diseño del estudio.

Algunas pruebas comunes incluyen:

Prueba t de Student: Esta prueba se utiliza cuando se comparan las diferencias entre dos grupos (por ejemplo, un grupo de control y un grupo de intervención). La prueba t determina si las diferencias entre los grupos son estadísticamente significativas.
Análisis de varianza (ANOVA): Esta prueba se utiliza cuando se comparan las diferencias entre más de dos grupos. El ANOVA permite determinar si hay diferencias significativas en las puntuaciones antes y después del programa entre los diferentes grupos.
Prueba de Wilcoxon o prueba de rangos con signo: Estas pruebas se utilizan cuando los datos no cumplen con los supuestos de normalidad requeridos para la prueba t. Se basan en los rangos de las diferencias individuales y determinan si hay diferencias significativas entre las puntuaciones antes y después del programa.

Estas pruebas estadísticas generan un valor de p, que representa la probabilidad de obtener las diferencias observadas o más extremas si la verdadera diferencia entre las puntuaciones antes y después del programa fuera cero (es decir, si no hubiera un efecto real del programa).

A continuación, se sigue el siguiente proceso:

Se plantea una Hipótesis Nula (H0) que establece como punto de partida que no hay efectos, por lo tanto, la función del investigador será rechazar dicha hipótesis y demostrar que sí que los hay. Hablamos de Hipótesis porque desconocemos lo que sucede a nivel poblacional. Por lo tanto y utilizando el mismo ejemplo anterior, la H0 establece que la intervención para reducir los síntomas depresivos no produce mejorías, y las medias antes y después de la intervención son iguales.

Posteriormente, mediante la técnica adecuada de contraste de hipótesis se obtendrá p o el nivel crítico, es decir, la probabilidad de obtener los resultados observados si fuera cierta la Hipótesis Nula.

La p o nivel crítico se comparará con el valor de α o nivel de significación, cuyo valor estándar es de 0,05.

Al comparar ambos valores, se tiene que tomar una decisión:

Si p o nivel crítico es menor o igual a α Rechazaremos la H0.
Si p o nivel crítico es mayor a α Mantendremos la H0.

En otras palabras, si el valor de p, calculado previamente, es menor que el umbral predefinido de significación (generalmente 0,05), se considera que las diferencias son estadísticamente significativas y se rechaza la hipótesis nula de que no hay efecto del programa.

Utilizando de nuevo el ejemplo anterior de la intervención para reducir los síntomas depresivos:

Si las diferencias encontradas, entre la intervención y los datos pre-post, no son suficientemente grandes como para poder afirmar con certeza (con una probabilidad de error del 0,05), estamos diciendo que las diferencias que encontramos podrían ser simplemente el resultado del azar y no necesariamente se deben al efecto de la intervención. En este caso mantenemos la H0. Por lo tanto, los efectos de la intervención no son relevantes para la reducción de síntomas depresivos.
Si las diferencias encontradas, entre la intervención y los datos pre-post, son suficientemente grandes como para poder afirmar con certeza (con una probabilidad de error del 0,05), estamos diciendo que las diferencias que encontramos se deben al efecto de la intervención y no al azar. En este caso rechazaremos la H0. Por lo tanto, los efectos de la intervención serán relevantes para la reducción de síntomas depresivos.

Siempre existe la posibilidad de cometer un error a la hora de tomar la decisión de aceptar o rechazar la H0. Podemos hablar de dos errores:

Error Tipo I (α): también conocido como falso positivo, y es el error asumido por el investigador al rechazar la Hipótesis Nula. Es decir, se asumen un 5% de posibilidades de que los resultados obtenidos no sean adecuados, es improbable que la intervención no produzca los efectos evaluados, pero no es imposible.
Error Tipo II (β): o falso negativo, se produce cuando el investigador no puede rechazar la H0.

Conclusión

Por lo tanto, cuando volvamos a escuchar la expresión «la intervención es estadísticamente significativa», podemos tener un mayor conocimiento y saber que los efectos producidos en el pre y en el post son diferentes; así como al tomar una decisiones respecto a qué tipo de intervención utilizar, si nos basamos en el nivel de significación querrá decir que los resultados obtenidos han sido avalados en una muestra y demostrado el nivel de eficacia del tratamiento respecto a una enfermedad determinada.