Manual de Usuario

ClinTrialSuite v3.0

Suite de Evaluación de Ensayos Clínicos

1. Introducción

ClinTrialSuite v3.0 es una herramienta educativa interactiva diseñada para la evaluación rápida de resultados publicados de ensayos clínicos. Permite:

Verificar la consistencia estadística entre los datos crudos y las métricas reportadas en una publicación (Módulo 1).
Explorar la robustez de las conclusiones bajo diferentes supuestos metodológicos (Módulo 2).
Consultar las fórmulas, limitaciones y referencias que sustentan los cálculos (Módulo 3).

¿Para quién es esta herramienta?

Perfil	Uso principal
Estudiantes de bioestadística	Aprender cómo se calculan OR, IC, p-valores, NNT
Revisores de artículos	Verificar rápidamente si los números reportados son coherentes
Profesionales de asuntos regulatorios	Screening inicial de consistencia antes de revisión profunda
Investigadores clínicos	Explorar sensibilidad de resultados a cambios de supuestos

⚠️ Aviso importante: Esta herramienta es exclusivamente educativa. No sustituye la revisión completa de datos clínicos individuales (IPD) para decisiones regulatorias ante FDA, EMA, ANVISA u otros organismos.

2. Requisitos del Sistema

Requisito	Detalle
Navegador	Chrome 90+, Firefox 88+, Safari 14+, Edge 90+
Conexión a internet	Necesaria para cargar librerías CDN (Tailwind CSS, Chart.js, Google Fonts)
Resolución mínima	360px de ancho (responsive, se adapta a móvil)
Instalación	No requiere. Abrir el archivo `index.html` directamente en el navegador

Librerías externas utilizadas (vía CDN)

Tailwind CSS v4 — Framework de estilos
Chart.js v4.4.7 — Gráficos interactivos
Google Fonts (Inter) — Tipografía

3. Interfaz General

Cabecera (Header)

Logo y nombre: ClinTrialSuite con versión actual
Etiqueta "Herramienta educativa": Recordatorio permanente del carácter no regulatorio
Botón "Manual de Usuario": Abre esta documentación en una nueva pestaña
Botón "Exportar CSV": Descarga todos los resultados calculados en formato CSV

Pestañas de navegación

Pestaña	Contenido
Módulo 1: Auditoría Estadística	Ingreso de datos y verificación de consistencia
Módulo 2: Sensibilidad Inferencial	Exploración de robustez bajo diferentes supuestos
Módulo 3: Metodología y Limitaciones	Documentación de fórmulas, limitaciones y referencias

Comportamiento inicial

La aplicación no ejecuta ningún análisis automáticamente al cargar
Se muestra únicamente el formulario de entrada de datos, limpio y sin resultados
Los resultados aparecen solo después de presionar los botones de ejecución

4. Módulo 1: Auditoría Estadística

Este módulo permite ingresar los datos de un ensayo clínico de dos brazos y comparar los valores reportados en la publicación con los valores calculados a partir de los datos crudos.

4.1 Selección del tipo de desenlace

Desenlace Binario (proporciones)

Apropiado cuando el resultado se mide como evento/no-evento: respuesta al tratamiento (sí/no), mortalidad (sí/no), evento adverso grave (sí/no).

Desenlace Continuo (medias)

Apropiado cuando el resultado es una medición numérica: presión arterial (mmHg), puntuación de dolor (escala 0–10), nivel de hemoglobina (g/dL).

Al cambiar el tipo de desenlace, los campos del formulario se actualizan automáticamente.

4.2 Ingreso de datos — Formulario

Para desenlace binario

Se presentan dos paneles:

Brazo Tratamiento (azul):

Campo	Descripción	Ejemplo
Nombre	Nombre identificador del brazo	"Tratamiento A"
n (tamaño)	Número total de participantes	50
Eventos	Número de participantes con el evento	30
Proporción	Se calcula automáticamente (solo lectura)	60.0%

Brazo Control (verde):

Campo	Descripción	Ejemplo
Nombre	Nombre identificador del brazo	"Control"
n (tamaño)	Número total de participantes	50
Eventos	Número de participantes con el evento	20
Proporción	Se calcula automáticamente (solo lectura)	40.0%

Para desenlace continuo

Campo	Brazo Tto	Brazo Control
n	50	50
Media	12.5	10.8
DE (SD)	4.2	3.9

Validación en tiempo real

Borde rojo: el valor ingresado es inválido (eventos > n, valores negativos)
Los mensajes de error aparecen debajo de los campos
El botón "Ejecutar Auditoría" se desactiva si hay errores de validación

4.3 Ingreso de datos — CSV

Alternativamente, puede pegar datos en formato CSV:

Haga clic en el botón "CSV / Texto" en la esquina superior derecha del formulario
Pegue sus datos en el área de texto
Haga clic en "Importar CSV"

Formato esperado

brazo,n,eventos,OR_reportado,IC_low,IC_high,p_valor
Tratamiento,50,30,1.5,1.1,1.9,0.045
Control,50,20,,,,

Headers aceptados

Español	Inglés
`n`	`sample_size`
`eventos`	`events`
`or_reportado`	`reported_or`
`ic_low`	`ci_low`
`ic_high`	`ci_high`
`p_valor`	`p_value`

4.4 Valores reportados en la publicación

Para desenlace binario

Campo	Descripción	Ejemplo
OR reportado	Odds Ratio reportado por los autores	1.5
IC 95% Inferior	Límite inferior del intervalo de confianza	1.1
IC 95% Superior	Límite superior del intervalo de confianza	1.9
p-valor reportado	p-valor reportado	0.045

Para desenlace continuo

Campo	Descripción	Ejemplo
Dif. medias reportada	Diferencia de medias entre brazos	1.7
IC 95% Inferior	Límite inferior del IC	0.1
IC 95% Superior	Límite superior del IC	3.3
p-valor reportado	p-valor reportado	0.038

4.5 Opciones de cálculo

Corrección de Yates

Casilla de verificación: "Aplicar corrección de continuidad de Yates"
Cuándo activarla: Cuando alguna celda de la tabla 2×2 tiene menos de 40 observaciones
Efecto: Produce p-valores más conservadores (más grandes)
Referencia: Se aplica tanto al χ² principal como al cálculo del índice de fragilidad

4.6 Ejecución y resultados

Botones disponibles

Botón	Función
Ejecutar Auditoría	Calcula todas las métricas y muestra resultados
Ejemplo Binario	Carga datos de ejemplo para desenlace binario
Ejemplo Continuo	Carga datos de ejemplo para desenlace continuo
Limpiar	Oculta todos los resultados y gráficos

Flujo de trabajo recomendado

Seleccione el tipo de desenlace
Ingrese los datos del ensayo (o cargue un ejemplo)
Ingrese los valores reportados en la publicación
(Opcional) Active la corrección de Yates si aplica
Haga clic en "Ejecutar Auditoría"
Revise las alertas, métricas, tabla de comparación y gráficos
(Opcional) Exporte los resultados a CSV

4.7 Métricas calculadas

Al ejecutar la auditoría, se muestran 6 tarjetas de métricas:

1. Odds Ratio Calculado / Diferencia de Medias

Fórmula binaria: OR = (a × d) / (b × c)
Fórmula continua: Dif = media₁ - media₂
También muestra el RR calculado (binario) o Cohen's d (continuo)

2. IC 95% Calculado

Método: Wald (aproximación normal en escala logarítmica)
Fórmula binaria: IC = exp(ln(OR) ± 1.96 × SE)
SE: SE = √(1/a + 1/b + 1/c + 1/d) (método de Woolf)
Corrección de Haldane (+0.5) si alguna celda = 0

3. p-valor Calculado

Método binario: Chi-cuadrado con 1 grado de libertad
χ² = N(ad-bc)² / [(a+b)(c+d)(a+c)(b+d)]
Color verde si p < 0.05, rojo si p ≥ 0.05

4. NNT (Número Necesario a Tratar)

Fórmula: NNT = 1 / |p₁ - p₂|
NNT positivo = beneficio | NNT negativo = daño (NNTH)

5. Potencia Post-Hoc

⚠️ ADVERTENCIA: Esta métrica es una transformación directa del p-valor observado (Hoenig & Heisey, 2001). Un p-valor significativo siempre producirá potencia > 50%. No aporta información independiente. Para planificación de estudios futuros, use la curva de potencia a priori del Módulo 2.

6. Índice de Fragilidad

Método: Iterativo — reclasifica eventos uno a uno hasta que p ≥ 0.05
Rojo (≤ 3): Resultado muy frágil
Ámbar (4–8): Resultado moderadamente frágil
Verde (> 8): Resultado relativamente robusto

4.8 Tabla de comparación

Columna	Descripción
Parámetro	Nombre de la métrica
Reportado	Valor según la publicación
Calculado	Valor recalculado por la herramienta
Diferencia	Diferencia absoluta o relativa
Tolerancia	Umbral de variabilidad aceptable
Estado	"Consistente" (verde) o "Inconsistente" (rojo)

Tolerancias aplicadas

Parámetro	Tolerancia	Justificación
OR	±15% relativo	Variabilidad entre métodos (Wald, exacto, perfil)
IC 95%	±0.3 absoluto	Diferencias entre métodos de cálculo del IC
p-valor (binario)	±0.5 en escala log₁₀	Sensibilidad a métodos diferentes
p-valor (continuo)	±0.02 absoluto	Diferencias t-test vs z-test

4.9 Gráficos generados

Gráfico 1: Efecto — Reportado vs Calculado

Barras agrupadas verticales con tres pares: medida de efecto, IC inferior, IC superior. Azul = reportado, Naranja = calculado.

Gráfico 2: Diagrama de Efecto con IC 95%

Barras horizontales separadas (no superpuestas) con líneas de error, marcadores de diamante y línea roja punteada de nulidad (OR=1 o Dif=0).

Gráfico 3: p-valores — Reportado vs Calculado

Barras verticales en escala propia con línea roja punteada en α = 0.05. Verde si significativo, rojo si no.

4.10 Alertas e interpretación

Tipo	Color	Significado
Error	Rojo	Inconsistencia grave
Advertencia	Ámbar	Posible inconsistencia o limitación
Éxito	Verde	Valor consistente
Información	Azul	Nota contextual

Detecciones automáticas

Discrepancia OR/RR: Detecta si el OR reportado coincide mejor con el RR calculado
Cambio de significancia: Si reportado y calculado caen en lados opuestos de α = 0.05
Muestras pequeñas: Advierte cuando celdas < 5
Fragilidad alta: Resultados que pierden significancia con ≤ 3 reclasificaciones
Corrección de Yates: Informa cuando se aplica

5. Módulo 2: Sensibilidad Inferencial

Permite explorar cómo cambia la conclusión del ensayo bajo diferentes supuestos metodológicos y tamaños de muestra.

5.1 Parámetros configurables

Sliders (controles deslizantes)

Parámetro	Rango	Default	Descripción
RR observado	0.5 – 3.0	1.50	Efecto del tratamiento
Riesgo basal	5% – 80%	0.20	Proporción eventos en control
Factor dilución ITT	50% – 100%	0.85	Reducción por no-adherencia

Selectores

Parámetro	Opciones	Default
Nivel α	0.01, 0.025, 0.05, 0.10	0.05
Tipo de análisis	ITT, PP	ITT
Framework	Superioridad, No-inferioridad	Superioridad

Comportamiento inteligente: Los sliders y selectores solo actualizan los gráficos si ya se ejecutó un análisis previo. Mover los controles antes de presionar "Generar Análisis" no dispara cálculos. Además, los sliders tienen debouncing de 120ms para evitar lag.

5.2 Mapa de Robustez (Heatmap)

Estructura

Filas: Tamaños de muestra (30, 50, 75, 100, 150, 200, 300, 500)
Columnas: Valores de δ (1.0 a 2.0)
Total: 88 combinaciones evaluadas

Código de colores

Color	Etiqueta	Significado
Verde	"Sig" / "NI"	Resultado favorable
Ámbar	"Bord"	Resultado borderline
Rojo	"NS" / "Falla"	Resultado no favorable

Tooltips interactivos

Pase el cursor sobre cualquier celda para ver detalles como n, δ, p-valor/IC, potencia, y estado.

5.3 Curva de Potencia

Tipo: Gráfico de línea con área sombreada
Eje X: Tamaño de muestra por brazo (20 a 500)
Eje Y: Potencia estadística (0% a 100%)
Línea roja punteada: Umbral del 80%

IMPORTANTE: Esta es potencia a priori — usa el efecto ESPECIFICADO por el usuario, NO el efecto observado. Es la potencia correcta para planificación de estudios.

5.4 Gráfico de Conclusión vs Tamaño Muestral

Framework: Superioridad

Muestra p-valor vs N. El punto donde la curva cruza α hacia abajo es el n mínimo para significancia.

Framework: No-Inferioridad

Muestra límite superior del IC 95% del RR (línea azul) vs margen δ (línea roja diagonal). La no-inferioridad se demuestra cuando la línea azul está por debajo de la roja.

5.5 Interpretación del Análisis

ALTA (>70%): Resultado robusto ante variaciones de supuestos
MODERADA (40–70%): Resultado sensible a algunos cambios
BAJA (<40%): Resultado frágil ante cambios de supuestos

6. Módulo 3: Metodología y Limitaciones

Documentación completa incluida directamente en la aplicación:

Fórmulas utilizadas: OR, SE, IC, χ², NNT, Fragilidad
Limitaciones conocidas: Solo 2 brazos, sin multiplicidad, IC Wald, etc.
Cuándo NO usar: Decisiones regulatorias, auditorías formales, meta-análisis
Referencias bibliográficas: Walsh, Hoenig, Agresti, Altman, Abramowitz
Changelog v2.0 → v3.0: Historial detallado de correcciones y mejoras

7. Exportación de Resultados

El botón "Exportar CSV" en la cabecera genera un archivo ClinTrialSuite_v3_resultados.csv que incluye:

Fecha y hora de generación
Tabla de comparación completa del Módulo 1
Métricas adicionales: NNT, Potencia, Fragilidad
Parámetros y resumen del Módulo 2 (si fue ejecutado)

Nota: El archivo usa codificación UTF-8 con BOM para compatibilidad con Excel en español. Los gráficos no se exportan (solo datos numéricos). Ningún dato sale de su computadora — todo el procesamiento es local.

8. Ejemplos de Uso Paso a Paso

Ejemplo 1: Auditoría de ensayo con desenlace binario

Escenario: Un artículo publica un ensayo de dos brazos comparando un nuevo fármaco vs placebo para prevención de eventos cardiovasculares.

Dato	Tratamiento	Control
n	50	50
Eventos	30	20
OR reportado: 1.5, IC [1.1–1.9], p = 0.045

Pasos: Seleccione "Desenlace Binario" → Ingrese los datos → Ingrese valores reportados → Ejecutar Auditoría. Atajo: clic en "Ejemplo Binario".

Ejemplo 2: Auditoría de ensayo con desenlace continuo

Escenario: Ensayo que compara un analgésico vs placebo, midiendo reducción del dolor en escala numérica.

Tratamiento: n=50, media=12.5, DE=4.2 | Control: n=50, media=10.8, DE=3.9 | Dif reportada: 1.7, IC [0.1–3.3], p=0.038.

Atajo: clic en "Ejemplo Continuo".

Ejemplo 3: Análisis de sensibilidad de superioridad

En Módulo 2: configure RR=1.50, Riesgo basal=0.20, α=0.05, Framework=Superioridad, ITT, Dilución=0.85. Observe heatmap, curva de potencia y gráfico p vs n. Atajo: clic en "Cargar Ejemplo".

Ejemplo 4: Análisis de no-inferioridad

En Módulo 2: cambie Framework a "No-inferioridad". Ajuste RR cerca de 1.0. Observe celdas verdes ("NI") y el gráfico IC superior vs δ.

9. Glosario de Términos

Término	Definición
α (alfa)	Probabilidad de error tipo I. Umbral para significancia. Convencionalmente 0.05.
ARD	Absolute Risk Difference. Diferencia absoluta de riesgos: p₁ - p₂.
χ² (Chi-cuadrado)	Test para asociación en tablas de contingencia. Aquí con 1 gl.
Cohen's d	Tamaño de efecto estandarizado. Pequeño (<0.2), medio (0.5), grande (>0.8).
Haldane	Corrección +0.5 a celdas con 0 para permitir cálculo del OR.
Yates	Corrección de continuidad para χ². Produce p-valores más conservadores.
DE / SD	Desviación Estándar.
δ (delta)	Margen de no-inferioridad.
IC 95%	Intervalo de Confianza al 95%.
Fragilidad	Mínimo de eventos reclasificados para perder significancia. ≤3 = frágil.
IPD	Individual Patient Data. Datos individuales de cada participante.
ITT	Intention-to-Treat. Incluye todos los aleatorizados.
NI	No-Inferioridad. Demostrar que no es peor por más que un margen δ.
NNT	Number Needed to Treat. Pacientes para prevenir un evento adicional.
NNTH	Number Needed to Harm. NNT negativo.
OR	Odds Ratio. Cociente de odds entre dos grupos.
PP	Per Protocol. Solo participantes que completaron el protocolo.
Potencia (1-β)	Probabilidad de detectar efecto real. Estándar ≥ 80%.
Potencia post-hoc	Función directa del p-valor. No aporta información independiente.
RR	Risk Ratio (Riesgo Relativo).
SE	Standard Error (Error Estándar).
Wald	Método de aproximación para IC basado en distribución normal asintótica.

10. Preguntas Frecuentes (FAQ)

¿Por qué el OR que calcula no coincide con el de mi artículo?

Posibles razones: (1) método diferente — la herramienta usa OR crudo, los artículos frecuentemente usan OR ajustado por covariables; (2) confusión OR/RR — error frecuente que la herramienta detecta automáticamente; (3) datos incompletos o exclusiones diferentes; (4) diferente definición del evento.

¿Cuándo debo activar la corrección de Yates?

Cuando alguna celda de la tabla 2×2 tenga menos de 5 observaciones. Con muestras muy pequeñas, es preferible usar el test exacto de Fisher (no disponible en esta herramienta).

¿La potencia post-hoc del Módulo 1 es útil?

No para tomar decisiones. Es una transformación directa del p-valor: si p < 0.05, la potencia será > 50%. Se incluye solo como indicador pedagógico con advertencia explícita.

¿Qué diferencia hay entre la potencia del Módulo 1 y la del Módulo 2?

	Módulo 1	Módulo 2
Tipo	Post-hoc	A priori
Basada en	Efecto observado	Efecto especificado
Útil para	Nada (es falacia)	Planificación futura

¿Puedo usar esto para meta-análisis?

No. Analiza un solo estudio. Meta-análisis requiere modelos de efectos fijos/aleatorios, I², Q de Cochran, funnel plots. Use RevMan, R/metafor o Stata.

¿Los datos se envían a algún servidor?

No. Todo es local en su navegador. Ningún dato sale de su computadora.

11. Limitaciones Conocidas

Limitaciones estadísticas

Limitación	Impacto	Alternativa
Solo 2 brazos	No soporta multi-brazo, factorial, crossover	SAS, R
Sin corrección por multiplicidad	No ajusta Bonferroni, Holm, FDR	Aplicar manualmente
IC Wald	Cobertura sub-óptima con n < 30	IC perfil verosimilitud
Aproximación normal	Inexacta para n muy pequeño	Fisher exacto
Sin time-to-event	No soporta HR, KM, sobrevida	R/survival
Sin bayesiano	Todo frecuentista	R/brms, Stan
Fragilidad unidireccional	Solo una dirección	Implementación bidireccional
Sin ajuste por covariables	OR/RR crudos	Regresión logística/lineal

Limitaciones técnicas

Limitación	Detalle
Requiere internet	Para CDN de Tailwind, Chart.js, Fonts
Sin persistencia	Datos se pierden al cerrar/recargar
Export limitado	Solo CSV, no PDF ni imágenes
Precisión numérica	JavaScript IEEE 754 double (15-16 dígitos)

12. Referencias Bibliográficas

Walsh M, et al. (2014). The statistical significance of randomized controlled trial results is frequently fragile: a case for a Fragility Index. Journal of Clinical Epidemiology, 67(6), 622-628.
Hoenig JM, Heisey DM (2001). The abuse of power: the pervasive fallacy of power calculations for data analysis. The American Statistician, 55(1), 19-24.
Agresti A (2002). Categorical Data Analysis. 2nd ed. Wiley.
Altman DG (1998). Confidence intervals for the number needed to treat. BMJ, 317(7168), 1309-1312.
Abramowitz M, Stegun IA (1964). Handbook of Mathematical Functions. NBS. [Algoritmo normalCDF]
Woolf B (1955). On estimating the relation between blood group and disease. Annals of Human Genetics, 19(4), 251-253.
ICH E9 (1998). Statistical Principles for Clinical Trials.
FDA Guidance (2016). Non-Inferiority Clinical Trials to Establish Effectiveness.

13. Aviso Legal y Regulatorio

ClinTrialSuite v3.0 es una herramienta de carácter exclusivamente educativo y exploratorio.

No debe utilizarse para:

Tomar decisiones regulatorias de aprobación, rechazo o modificación de medicamentos
Sustituir revisiones estadísticas formales con acceso a datos individuales (IPD)
Reemplazar software certificado y validado (SAS, R validado, Stata)
Emitir juicios definitivos sobre integridad de datos
Realizar auditorías regulatorias oficiales

Puede utilizarse para:

✅ Formación en bioestadística y lectura crítica
✅ Screening rápido de consistencia
✅ Exploración pedagógica de conceptos (fragilidad, potencia, NNT)
✅ Sensibilización sobre robustez de conclusiones
✅ Preparación de preguntas para comités de revisión

Todos los cálculos están basados en aproximaciones asintóticas (distribución normal). Para decisiones críticas, validar con software certificado y métodos exactos.

Manual actualizado para ClinTrialSuite v3.0 — Última revisión: 2025

← Volver a la Aplicación