Categorías
Calculadora Tamaño Muestral

Calculadora Muestral – Ensayo Aleatorizado

Calculadora Muestral: Ensayos Aleatorizados (diferencia ajustada ancova - precisión)

En esta entrada se recoge una breve guía práctica de recomendaciones para calcular el tamaño muestral mínimo necesario para un ensayo clínico aleatorizado, en función de la precisión deseada de una diferencia de medias ajustada para la medición basal.

En esta página se presenta una aplicación Shiny que he creado para calcular el tamaño muestral mínimo necesario para un ensayo clínico aleatorizado (ECA), en función de la precisión deseada de una diferencia de medias ajustada de un Análisis de la Covarianza (ANCOVA). El motivo de que se presente para este tipo de análisis es debido a los siguientes motivos:

  1. Las interacciones tiempo-por-grupo tienen una peor interpretación clínica para guiar los cálculos.
  2. La potencia para detectar una diferencia de medias es menor que para detectar una interacción tiempo-por-grupo.
  3. El ajuste de la medición basal mediante un ANCOVA mejora la precisión en la estimación de la diferencia entre-grupos.

La aplicación se basa en la función ‘ss.aipe.c.ancova’ del paquete de R ‘MBESS’ creado por Ken Kelley, que se basa en la amplitud deseada del intervalo de confianza con una potencia estadística deseada.

Material de Información


Paquete R ‘MBESS’: MBESS: The MBESS R Package version 4.9.2 from CRAN (rdrr.io)

Función ‘ss.aipe.c.ancova’: ss.aipe.c.ancova in MBESS: The MBESS R Package (rdrr.io)

Artículo: Lai & Kelley (2011). Accuracy in parameter estimation for ANCOVA and ANOVA contrasts: Sample size planning via narrow confidence intervals.


Guía resumen para el cálculo

La precisión de una diferencia de medias entre-grupos ajustada para la medición basal, mediante un análisis tipo ACOVA (o lo que es lo mismo, una regresión lineal), se ve incrementada en una magnitud de √1−𝜌2 en un ensayo aleatorizado, siendo 𝜌 la correlación entre la medición basal y la post-tratamiento.(Borm et al., 2007) Es por ello que el cálculo planteado se realiza en base a dicha diferencia de medias ajustadas, en lugar de a una diferencia de medias post-tratamiento sin ajustar.

El primer parámetro a tener en consideración es la desviación estándar de la variable resultado de interés. A menor desviación estándar, mayor precisión, de modo que debemos procurar no infraestimar este parámetro a la hora de realizar los cálculos, para no obtener una muestra más pequeña de lo necesario. La recomendación es revisar la literatura previa publicada con tratamientos, momentos de seguimiento y variables resultado similares para estimar un valor plausible. Los estudios con poca muestra tienden a infraestimar el valor de la desviación estándar. Existen dos propuestas para corregir dicha infraestimación, cuya implementación puede ser recomendable incluso aunque se extraigan los datos de desviación estándar de ensayos aleatorizados y no de estudios piloto.(Whitehead et al., 2015)

El segundo parámetro a especificar es la correlación (𝜌) entre la medición basal y la post-tratamiento. A mayor correlación, mayor precisión y por lo tanto menor muestra necesaria. Debemos procurar no sobre-estimar el valor de la correlación para evitar obtener muestras demasiado pequeñas. Según se incrementa la distancia temporal entre la medición basal y la post-tratamiento, el valor de dicha correlación tiende a disminuir. En el artículo de Walters et al. del año 2019 se ofrece una revisión detallada sobre los valores plausibles de correlación para variables resultado auto-reportadas por el paciente. Una recomendación conservadora y plausible es usar un valor de 𝜌 = 0.50, para seguimientos iguales o inferiores a 2 años, y de 𝜌 = 0.40 para seguimientos superiores a 2 años. No obstante, este valor puede ser contrastado y definido en base a literatura previa publicada con una metodología similar al ensayo clínico a realizar.

El tercer parámetro a especificar es el valor del MoE deseado, que sería la mitad de la amplitud del intervalo de confianza. Este valor es el más complejo de especificar, ya que es difícil saber cual es margen aceptable de precisión, pues esto depende de múltiples factores contextuales, pudiendo variar mucho de una población a otra, o según el tipo de tratamiento implementado. A mayor MoE menor muestra necesaria, ya que disminuimos la precisión que esperamos obtener, de forma que debemos procurar no sobre-estimar el valor de MoE deseado. No se pueden dar recomendaciones de un valor mínimo de MoE adecuado, pero si algunas recomendaciones de como no especificar dicho MoE. La pregunta que debemos hacernos para establecer el MoE sería: ¿Cambiarían las conclusiones que sacaría de mi estudio si el valor de la diferencia de medias observada variase en una magnitud de +/- el valor del MoE? Si la respuesta es no, entonces ese valor de MoE es aceptable. El MoE no debe ser establecido en función de la mínima diferencia detectable, debido a que a mayor error de medición, mayor valor de la mínima diferencia detectable y por tanto menos muestra necesaria, infraestimándose aun más el cálculo. Por otro lado, también debe tenerse cautela al usar directamente la de mínima diferencia clínicamente relevante, ya que también son valores orientados a diferencias individuales y no muestrales.

En relación al MoE, está el concepto de potencia asociada al MoE esperado, que tiene una interpretación al concepto clásico de potencia, salvo que en lugar de para una diferencia media, para una amplitud esperada del intervalo de confianza. Una recomendación conservadora es usar una potencia del 80%. Si se especifica un valor del 50% estaríamos ignorando el concepto de potencia, y el cálculo sería simplemente un cálculo de precisión sin potencia considerada, como el que ofrecen otros paquetes de R o programas como Epidat para algún estadístico.

Otro parámetro a especificar es el X% de confianza del intervalo de confianza, que por defecto está establecido en el 95%. Esta calculadora está basada para la diferencia entre dos grupos, si el ensayo aleatorizado tuviera más de dos grupos, el procedimiento sería seleccionar aquellos dos de mayor relevancia (o que más muestra necesitasen) para realizar el cálculo, y ampliar la muestra necesaria para el tercer grupo. Si se dispone de más de dos grupos y se desea realizar alguna corrección para tasas de error esperadas, la recomendación es utilizar la corrección de Bonferroni a la hora de especificar el X% de confianza del intervalo. Por ejemplo, si disponemos de tres grupos, el X% quedaría definido como 1-0.05/3 = 0.9833, en lugar del valor predefinido de 0.95.

Finalmente, el último parámetro a especificar es el porcentaje de pérdidas esperado, cuyo valor conservador está predefinido en 0.15, siendo plausibles y recomendables valores entre 0.10 y 0.20.

Con todos estos parámetros especificados, la calculadora devolvería el tamaño muestral mínimo necesario por grupo para realizar el ensayo aleatorizado.

¡IMPORTANTE!

Las aplicaciones Shiny funcionan mediante un sistema de suscripción, donde se «alquila» un periodo de tiempo mensual de utilización de las mismas. Por favor, una vez realizado el cálculo, asegúrate de cerrar la pestaña del explorador para no gastar un tiempo innecesario y que más personas puedan utilizar la aplicación si lo necesitan. ¡Muchas gracias!

Calculadora para Ensayos Aleatorizados

Parámetro a especificar Descripción
Desviación estándar (Grupo Experimental)
Desviación estándar post-tratamiento del grupo experimental.
Desviación estándar (Grupo Control)
Desviación estándar post-tratamiento del grupo control.
Correlación
Correlación entre la medición basal y la post-tratamiento.
MoE Esperado
Mitad de la amplitud del intervalo de confianza deseada.
Nivel del intervalo de confianza
Porcentaje del intervalo de confianza deseado. Por defecto = 0.95.
Potencia para el MoE esperado
Potencia deseada para obtener un MoE igual o inferior al esperado. Por defecto = 0.80.
Porcentaje esperado de pérdidas
Porcentaje esperado de pérdidas para corregir el cálculo de tamaño muestral. Por defecto = 0.15.

Asunciones: Normalidad En esta entrada se recoge una breve explicación de la tan aclamada asunción de normalidad, haciendo hincapié en a que …

Análisis de la "normalidad": Gráficos QQ y PP En esta entrada se recoge una explicación de los gráficos QQ y PP, útiles …

Interpretación de la relevancia clínica: El mal uso de la mínima diferencia clínicamente relevante (I) En esta entrada se proporciona una breve …

Calculadora Muestral: Ensayos Aleatorizados (diferencia ajustada ancova – precisión) En esta entrada se recoge una breve guía práctica de recomendaciones para calcular …