Manual de Usuario
ClinTrialSuite v3.0
Suite de Evaluación de Ensayos Clínicos
1. Introducción
ClinTrialSuite v3.0 es una herramienta educativa interactiva diseñada para la evaluación rápida de resultados publicados de ensayos clínicos. Permite:
- Verificar la consistencia estadística entre los datos crudos y las métricas reportadas en una publicación (Módulo 1).
- Explorar la robustez de las conclusiones bajo diferentes supuestos metodológicos (Módulo 2).
- Consultar las fórmulas, limitaciones y referencias que sustentan los cálculos (Módulo 3).
¿Para quién es esta herramienta?
| Perfil | Uso principal |
|---|---|
| Estudiantes de bioestadística | Aprender cómo se calculan OR, IC, p-valores, NNT |
| Revisores de artículos | Verificar rápidamente si los números reportados son coherentes |
| Profesionales de asuntos regulatorios | Screening inicial de consistencia antes de revisión profunda |
| Investigadores clínicos | Explorar sensibilidad de resultados a cambios de supuestos |
⚠️ Aviso importante: Esta herramienta es exclusivamente educativa. No sustituye la revisión completa de datos clínicos individuales (IPD) para decisiones regulatorias ante FDA, EMA, ANVISA u otros organismos.
2. Requisitos del Sistema
| Requisito | Detalle |
|---|---|
| Navegador | Chrome 90+, Firefox 88+, Safari 14+, Edge 90+ |
| Conexión a internet | Necesaria para cargar librerías CDN (Tailwind CSS, Chart.js, Google Fonts) |
| Resolución mínima | 360px de ancho (responsive, se adapta a móvil) |
| Instalación | No requiere. Abrir el archivo index.html directamente en el navegador |
Librerías externas utilizadas (vía CDN)
- Tailwind CSS v4 — Framework de estilos
- Chart.js v4.4.7 — Gráficos interactivos
- Google Fonts (Inter) — Tipografía
3. Interfaz General
Cabecera (Header)
- Logo y nombre: ClinTrialSuite con versión actual
- Etiqueta "Herramienta educativa": Recordatorio permanente del carácter no regulatorio
- Botón "Manual de Usuario": Abre esta documentación en una nueva pestaña
- Botón "Exportar CSV": Descarga todos los resultados calculados en formato CSV
Pestañas de navegación
| Pestaña | Contenido |
|---|---|
| Módulo 1: Auditoría Estadística | Ingreso de datos y verificación de consistencia |
| Módulo 2: Sensibilidad Inferencial | Exploración de robustez bajo diferentes supuestos |
| Módulo 3: Metodología y Limitaciones | Documentación de fórmulas, limitaciones y referencias |
Comportamiento inicial
- La aplicación no ejecuta ningún análisis automáticamente al cargar
- Se muestra únicamente el formulario de entrada de datos, limpio y sin resultados
- Los resultados aparecen solo después de presionar los botones de ejecución
4. Módulo 1: Auditoría Estadística
Este módulo permite ingresar los datos de un ensayo clínico de dos brazos y comparar los valores reportados en la publicación con los valores calculados a partir de los datos crudos.
4.1 Selección del tipo de desenlace
Desenlace Binario (proporciones)
Apropiado cuando el resultado se mide como evento/no-evento: respuesta al tratamiento (sí/no), mortalidad (sí/no), evento adverso grave (sí/no).
Desenlace Continuo (medias)
Apropiado cuando el resultado es una medición numérica: presión arterial (mmHg), puntuación de dolor (escala 0–10), nivel de hemoglobina (g/dL).
Al cambiar el tipo de desenlace, los campos del formulario se actualizan automáticamente.
4.2 Ingreso de datos — Formulario
Para desenlace binario
Se presentan dos paneles:
Brazo Tratamiento (azul):
| Campo | Descripción | Ejemplo |
|---|---|---|
| Nombre | Nombre identificador del brazo | "Tratamiento A" |
| n (tamaño) | Número total de participantes | 50 |
| Eventos | Número de participantes con el evento | 30 |
| Proporción | Se calcula automáticamente (solo lectura) | 60.0% |
Brazo Control (verde):
| Campo | Descripción | Ejemplo |
|---|---|---|
| Nombre | Nombre identificador del brazo | "Control" |
| n (tamaño) | Número total de participantes | 50 |
| Eventos | Número de participantes con el evento | 20 |
| Proporción | Se calcula automáticamente (solo lectura) | 40.0% |
Para desenlace continuo
| Campo | Brazo Tto | Brazo Control |
|---|---|---|
| n | 50 | 50 |
| Media | 12.5 | 10.8 |
| DE (SD) | 4.2 | 3.9 |
Validación en tiempo real
- Borde rojo: el valor ingresado es inválido (eventos > n, valores negativos)
- Los mensajes de error aparecen debajo de los campos
- El botón "Ejecutar Auditoría" se desactiva si hay errores de validación
4.3 Ingreso de datos — CSV
Alternativamente, puede pegar datos en formato CSV:
- Haga clic en el botón "CSV / Texto" en la esquina superior derecha del formulario
- Pegue sus datos en el área de texto
- Haga clic en "Importar CSV"
Formato esperado
brazo,n,eventos,OR_reportado,IC_low,IC_high,p_valor
Tratamiento,50,30,1.5,1.1,1.9,0.045
Control,50,20,,,,
Headers aceptados
| Español | Inglés |
|---|---|
n | sample_size |
eventos | events |
or_reportado | reported_or |
ic_low | ci_low |
ic_high | ci_high |
p_valor | p_value |
4.4 Valores reportados en la publicación
Para desenlace binario
| Campo | Descripción | Ejemplo |
|---|---|---|
| OR reportado | Odds Ratio reportado por los autores | 1.5 |
| IC 95% Inferior | Límite inferior del intervalo de confianza | 1.1 |
| IC 95% Superior | Límite superior del intervalo de confianza | 1.9 |
| p-valor reportado | p-valor reportado | 0.045 |
Para desenlace continuo
| Campo | Descripción | Ejemplo |
|---|---|---|
| Dif. medias reportada | Diferencia de medias entre brazos | 1.7 |
| IC 95% Inferior | Límite inferior del IC | 0.1 |
| IC 95% Superior | Límite superior del IC | 3.3 |
| p-valor reportado | p-valor reportado | 0.038 |
4.5 Opciones de cálculo
Corrección de Yates
- Casilla de verificación: "Aplicar corrección de continuidad de Yates"
- Cuándo activarla: Cuando alguna celda de la tabla 2×2 tiene menos de 40 observaciones
- Efecto: Produce p-valores más conservadores (más grandes)
- Referencia: Se aplica tanto al χ² principal como al cálculo del índice de fragilidad
4.6 Ejecución y resultados
Botones disponibles
| Botón | Función |
|---|---|
| Ejecutar Auditoría | Calcula todas las métricas y muestra resultados |
| Ejemplo Binario | Carga datos de ejemplo para desenlace binario |
| Ejemplo Continuo | Carga datos de ejemplo para desenlace continuo |
| Limpiar | Oculta todos los resultados y gráficos |
Flujo de trabajo recomendado
- Seleccione el tipo de desenlace
- Ingrese los datos del ensayo (o cargue un ejemplo)
- Ingrese los valores reportados en la publicación
- (Opcional) Active la corrección de Yates si aplica
- Haga clic en "Ejecutar Auditoría"
- Revise las alertas, métricas, tabla de comparación y gráficos
- (Opcional) Exporte los resultados a CSV
4.7 Métricas calculadas
Al ejecutar la auditoría, se muestran 6 tarjetas de métricas:
1. Odds Ratio Calculado / Diferencia de Medias
- Fórmula binaria:
OR = (a × d) / (b × c) - Fórmula continua:
Dif = media₁ - media₂ - También muestra el RR calculado (binario) o Cohen's d (continuo)
2. IC 95% Calculado
- Método: Wald (aproximación normal en escala logarítmica)
- Fórmula binaria:
IC = exp(ln(OR) ± 1.96 × SE) - SE:
SE = √(1/a + 1/b + 1/c + 1/d)(método de Woolf) - Corrección de Haldane (+0.5) si alguna celda = 0
3. p-valor Calculado
- Método binario: Chi-cuadrado con 1 grado de libertad
χ² = N(ad-bc)² / [(a+b)(c+d)(a+c)(b+d)]- Color verde si p < 0.05, rojo si p ≥ 0.05
4. NNT (Número Necesario a Tratar)
- Fórmula:
NNT = 1 / |p₁ - p₂| - NNT positivo = beneficio | NNT negativo = daño (NNTH)
5. Potencia Post-Hoc
⚠️ ADVERTENCIA: Esta métrica es una transformación directa del p-valor observado (Hoenig & Heisey, 2001). Un p-valor significativo siempre producirá potencia > 50%. No aporta información independiente. Para planificación de estudios futuros, use la curva de potencia a priori del Módulo 2.
6. Índice de Fragilidad
- Método: Iterativo — reclasifica eventos uno a uno hasta que p ≥ 0.05
- Rojo (≤ 3): Resultado muy frágil
- Ámbar (4–8): Resultado moderadamente frágil
- Verde (> 8): Resultado relativamente robusto
4.8 Tabla de comparación
| Columna | Descripción |
|---|---|
| Parámetro | Nombre de la métrica |
| Reportado | Valor según la publicación |
| Calculado | Valor recalculado por la herramienta |
| Diferencia | Diferencia absoluta o relativa |
| Tolerancia | Umbral de variabilidad aceptable |
| Estado | "Consistente" (verde) o "Inconsistente" (rojo) |
Tolerancias aplicadas
| Parámetro | Tolerancia | Justificación |
|---|---|---|
| OR | ±15% relativo | Variabilidad entre métodos (Wald, exacto, perfil) |
| IC 95% | ±0.3 absoluto | Diferencias entre métodos de cálculo del IC |
| p-valor (binario) | ±0.5 en escala log₁₀ | Sensibilidad a métodos diferentes |
| p-valor (continuo) | ±0.02 absoluto | Diferencias t-test vs z-test |
4.9 Gráficos generados
Gráfico 1: Efecto — Reportado vs Calculado
Barras agrupadas verticales con tres pares: medida de efecto, IC inferior, IC superior. Azul = reportado, Naranja = calculado.
Gráfico 2: Diagrama de Efecto con IC 95%
Barras horizontales separadas (no superpuestas) con líneas de error, marcadores de diamante y línea roja punteada de nulidad (OR=1 o Dif=0).
Gráfico 3: p-valores — Reportado vs Calculado
Barras verticales en escala propia con línea roja punteada en α = 0.05. Verde si significativo, rojo si no.
4.10 Alertas e interpretación
| Tipo | Color | Significado |
|---|---|---|
| Error | Rojo | Inconsistencia grave |
| Advertencia | Ámbar | Posible inconsistencia o limitación |
| Éxito | Verde | Valor consistente |
| Información | Azul | Nota contextual |
Detecciones automáticas
- Discrepancia OR/RR: Detecta si el OR reportado coincide mejor con el RR calculado
- Cambio de significancia: Si reportado y calculado caen en lados opuestos de α = 0.05
- Muestras pequeñas: Advierte cuando celdas < 5
- Fragilidad alta: Resultados que pierden significancia con ≤ 3 reclasificaciones
- Corrección de Yates: Informa cuando se aplica
5. Módulo 2: Sensibilidad Inferencial
Permite explorar cómo cambia la conclusión del ensayo bajo diferentes supuestos metodológicos y tamaños de muestra.
5.1 Parámetros configurables
Sliders (controles deslizantes)
| Parámetro | Rango | Default | Descripción |
|---|---|---|---|
| RR observado | 0.5 – 3.0 | 1.50 | Efecto del tratamiento |
| Riesgo basal | 5% – 80% | 0.20 | Proporción eventos en control |
| Factor dilución ITT | 50% – 100% | 0.85 | Reducción por no-adherencia |
Selectores
| Parámetro | Opciones | Default |
|---|---|---|
| Nivel α | 0.01, 0.025, 0.05, 0.10 | 0.05 |
| Tipo de análisis | ITT, PP | ITT |
| Framework | Superioridad, No-inferioridad | Superioridad |
Comportamiento inteligente: Los sliders y selectores solo actualizan los gráficos si ya se ejecutó un análisis previo. Mover los controles antes de presionar "Generar Análisis" no dispara cálculos. Además, los sliders tienen debouncing de 120ms para evitar lag.
5.2 Mapa de Robustez (Heatmap)
Estructura
- Filas: Tamaños de muestra (30, 50, 75, 100, 150, 200, 300, 500)
- Columnas: Valores de δ (1.0 a 2.0)
- Total: 88 combinaciones evaluadas
Código de colores
| Color | Etiqueta | Significado |
|---|---|---|
| Verde | "Sig" / "NI" | Resultado favorable |
| Ámbar | "Bord" | Resultado borderline |
| Rojo | "NS" / "Falla" | Resultado no favorable |
Tooltips interactivos
Pase el cursor sobre cualquier celda para ver detalles como n, δ, p-valor/IC, potencia, y estado.
5.3 Curva de Potencia
- Tipo: Gráfico de línea con área sombreada
- Eje X: Tamaño de muestra por brazo (20 a 500)
- Eje Y: Potencia estadística (0% a 100%)
- Línea roja punteada: Umbral del 80%
IMPORTANTE: Esta es potencia a priori — usa el efecto ESPECIFICADO por el usuario, NO el efecto observado. Es la potencia correcta para planificación de estudios.
5.4 Gráfico de Conclusión vs Tamaño Muestral
Framework: Superioridad
Muestra p-valor vs N. El punto donde la curva cruza α hacia abajo es el n mínimo para significancia.
Framework: No-Inferioridad
Muestra límite superior del IC 95% del RR (línea azul) vs margen δ (línea roja diagonal). La no-inferioridad se demuestra cuando la línea azul está por debajo de la roja.
5.5 Interpretación del Análisis
- ALTA (>70%): Resultado robusto ante variaciones de supuestos
- MODERADA (40–70%): Resultado sensible a algunos cambios
- BAJA (<40%): Resultado frágil ante cambios de supuestos
6. Módulo 3: Metodología y Limitaciones
Documentación completa incluida directamente en la aplicación:
- Fórmulas utilizadas: OR, SE, IC, χ², NNT, Fragilidad
- Limitaciones conocidas: Solo 2 brazos, sin multiplicidad, IC Wald, etc.
- Cuándo NO usar: Decisiones regulatorias, auditorías formales, meta-análisis
- Referencias bibliográficas: Walsh, Hoenig, Agresti, Altman, Abramowitz
- Changelog v2.0 → v3.0: Historial detallado de correcciones y mejoras
7. Exportación de Resultados
El botón "Exportar CSV" en la cabecera genera un archivo ClinTrialSuite_v3_resultados.csv que incluye:
- Fecha y hora de generación
- Tabla de comparación completa del Módulo 1
- Métricas adicionales: NNT, Potencia, Fragilidad
- Parámetros y resumen del Módulo 2 (si fue ejecutado)
Nota: El archivo usa codificación UTF-8 con BOM para compatibilidad con Excel en español. Los gráficos no se exportan (solo datos numéricos). Ningún dato sale de su computadora — todo el procesamiento es local.
8. Ejemplos de Uso Paso a Paso
Ejemplo 1: Auditoría de ensayo con desenlace binario
Escenario: Un artículo publica un ensayo de dos brazos comparando un nuevo fármaco vs placebo para prevención de eventos cardiovasculares.
| Dato | Tratamiento | Control |
|---|---|---|
| n | 50 | 50 |
| Eventos | 30 | 20 |
| OR reportado: 1.5, IC [1.1–1.9], p = 0.045 | ||
Pasos: Seleccione "Desenlace Binario" → Ingrese los datos → Ingrese valores reportados → Ejecutar Auditoría. Atajo: clic en "Ejemplo Binario".
Ejemplo 2: Auditoría de ensayo con desenlace continuo
Escenario: Ensayo que compara un analgésico vs placebo, midiendo reducción del dolor en escala numérica.
Tratamiento: n=50, media=12.5, DE=4.2 | Control: n=50, media=10.8, DE=3.9 | Dif reportada: 1.7, IC [0.1–3.3], p=0.038.
Atajo: clic en "Ejemplo Continuo".
Ejemplo 3: Análisis de sensibilidad de superioridad
En Módulo 2: configure RR=1.50, Riesgo basal=0.20, α=0.05, Framework=Superioridad, ITT, Dilución=0.85. Observe heatmap, curva de potencia y gráfico p vs n. Atajo: clic en "Cargar Ejemplo".
Ejemplo 4: Análisis de no-inferioridad
En Módulo 2: cambie Framework a "No-inferioridad". Ajuste RR cerca de 1.0. Observe celdas verdes ("NI") y el gráfico IC superior vs δ.
9. Glosario de Términos
| Término | Definición |
|---|---|
| α (alfa) | Probabilidad de error tipo I. Umbral para significancia. Convencionalmente 0.05. |
| ARD | Absolute Risk Difference. Diferencia absoluta de riesgos: p₁ - p₂. |
| χ² (Chi-cuadrado) | Test para asociación en tablas de contingencia. Aquí con 1 gl. |
| Cohen's d | Tamaño de efecto estandarizado. Pequeño (<0.2), medio (0.5), grande (>0.8). |
| Haldane | Corrección +0.5 a celdas con 0 para permitir cálculo del OR. |
| Yates | Corrección de continuidad para χ². Produce p-valores más conservadores. |
| DE / SD | Desviación Estándar. |
| δ (delta) | Margen de no-inferioridad. |
| IC 95% | Intervalo de Confianza al 95%. |
| Fragilidad | Mínimo de eventos reclasificados para perder significancia. ≤3 = frágil. |
| IPD | Individual Patient Data. Datos individuales de cada participante. |
| ITT | Intention-to-Treat. Incluye todos los aleatorizados. |
| NI | No-Inferioridad. Demostrar que no es peor por más que un margen δ. |
| NNT | Number Needed to Treat. Pacientes para prevenir un evento adicional. |
| NNTH | Number Needed to Harm. NNT negativo. |
| OR | Odds Ratio. Cociente de odds entre dos grupos. |
| PP | Per Protocol. Solo participantes que completaron el protocolo. |
| Potencia (1-β) | Probabilidad de detectar efecto real. Estándar ≥ 80%. |
| Potencia post-hoc | Función directa del p-valor. No aporta información independiente. |
| RR | Risk Ratio (Riesgo Relativo). |
| SE | Standard Error (Error Estándar). |
| Wald | Método de aproximación para IC basado en distribución normal asintótica. |
10. Preguntas Frecuentes (FAQ)
¿Por qué el OR que calcula no coincide con el de mi artículo?
Posibles razones: (1) método diferente — la herramienta usa OR crudo, los artículos frecuentemente usan OR ajustado por covariables; (2) confusión OR/RR — error frecuente que la herramienta detecta automáticamente; (3) datos incompletos o exclusiones diferentes; (4) diferente definición del evento.
¿Cuándo debo activar la corrección de Yates?
Cuando alguna celda de la tabla 2×2 tenga menos de 5 observaciones. Con muestras muy pequeñas, es preferible usar el test exacto de Fisher (no disponible en esta herramienta).
¿La potencia post-hoc del Módulo 1 es útil?
No para tomar decisiones. Es una transformación directa del p-valor: si p < 0.05, la potencia será > 50%. Se incluye solo como indicador pedagógico con advertencia explícita.
¿Qué diferencia hay entre la potencia del Módulo 1 y la del Módulo 2?
| Módulo 1 | Módulo 2 | |
|---|---|---|
| Tipo | Post-hoc | A priori |
| Basada en | Efecto observado | Efecto especificado |
| Útil para | Nada (es falacia) | Planificación futura |
¿Puedo usar esto para meta-análisis?
No. Analiza un solo estudio. Meta-análisis requiere modelos de efectos fijos/aleatorios, I², Q de Cochran, funnel plots. Use RevMan, R/metafor o Stata.
¿Los datos se envían a algún servidor?
No. Todo es local en su navegador. Ningún dato sale de su computadora.
11. Limitaciones Conocidas
Limitaciones estadísticas
| Limitación | Impacto | Alternativa |
|---|---|---|
| Solo 2 brazos | No soporta multi-brazo, factorial, crossover | SAS, R |
| Sin corrección por multiplicidad | No ajusta Bonferroni, Holm, FDR | Aplicar manualmente |
| IC Wald | Cobertura sub-óptima con n < 30 | IC perfil verosimilitud |
| Aproximación normal | Inexacta para n muy pequeño | Fisher exacto |
| Sin time-to-event | No soporta HR, KM, sobrevida | R/survival |
| Sin bayesiano | Todo frecuentista | R/brms, Stan |
| Fragilidad unidireccional | Solo una dirección | Implementación bidireccional |
| Sin ajuste por covariables | OR/RR crudos | Regresión logística/lineal |
Limitaciones técnicas
| Limitación | Detalle |
|---|---|
| Requiere internet | Para CDN de Tailwind, Chart.js, Fonts |
| Sin persistencia | Datos se pierden al cerrar/recargar |
| Export limitado | Solo CSV, no PDF ni imágenes |
| Precisión numérica | JavaScript IEEE 754 double (15-16 dígitos) |
12. Referencias Bibliográficas
- Walsh M, et al. (2014). The statistical significance of randomized controlled trial results is frequently fragile: a case for a Fragility Index. Journal of Clinical Epidemiology, 67(6), 622-628.
- Hoenig JM, Heisey DM (2001). The abuse of power: the pervasive fallacy of power calculations for data analysis. The American Statistician, 55(1), 19-24.
- Agresti A (2002). Categorical Data Analysis. 2nd ed. Wiley.
- Altman DG (1998). Confidence intervals for the number needed to treat. BMJ, 317(7168), 1309-1312.
- Abramowitz M, Stegun IA (1964). Handbook of Mathematical Functions. NBS. [Algoritmo normalCDF]
- Woolf B (1955). On estimating the relation between blood group and disease. Annals of Human Genetics, 19(4), 251-253.
- ICH E9 (1998). Statistical Principles for Clinical Trials.
- FDA Guidance (2016). Non-Inferiority Clinical Trials to Establish Effectiveness.
13. Aviso Legal y Regulatorio
ClinTrialSuite v3.0 es una herramienta de carácter exclusivamente educativo y exploratorio.
No debe utilizarse para:
- Tomar decisiones regulatorias de aprobación, rechazo o modificación de medicamentos
- Sustituir revisiones estadísticas formales con acceso a datos individuales (IPD)
- Reemplazar software certificado y validado (SAS, R validado, Stata)
- Emitir juicios definitivos sobre integridad de datos
- Realizar auditorías regulatorias oficiales
Puede utilizarse para:
✅ Formación en bioestadística y lectura crítica
✅ Screening rápido de consistencia
✅ Exploración pedagógica de conceptos (fragilidad, potencia, NNT)
✅ Sensibilización sobre robustez de conclusiones
✅ Preparación de preguntas para comités de revisión
Todos los cálculos están basados en aproximaciones asintóticas (distribución normal). Para decisiones críticas, validar con software certificado y métodos exactos.
Manual actualizado para ClinTrialSuite v3.0 — Última revisión: 2025
← Volver a la Aplicación