Una organización internacional sin ánimo de lucro para fomentar el acceso y el uso adecuado de medicamentos entre la población hispano-parlante

Gestión de los Ensayos Clínicos, Metodología, Costos y Conflictos de Interés

Preservando la integridad de los Ensayos Clínicos

(Preserving the integrity of clinical trials)
Editorial
The Lancet Digital Health, 2025; 7 DOI: 10.1016/j.landig.2025.100970
https://www.thelancet.com/journals/landig/article/PIIS2589-7500(25)00152-9/fulltext?rss=yes (de libre acceso en inglés)
Traducido por Salud y Fármacos, publicado en Boletín Fármacos: Ensayos Clínicos 2026; 29(2)

Tags: SPIRIT-AI, CONSORT-AI, seguridad de intervenciones sanitarias, sesgos de estudios con IA, IA y ensayos clínicos

Un ensayo clínico aleatorizado (ECA) es un tipo de ensayo clínico que durante mucho tiempo se ha considerado el estándar de oro para establecer la eficacia y la seguridad de las intervenciones en salud. El diseño prospectivo de los ECA, combinado con la asignación aleatoria de pacientes a una intervención en la práctica clínica, minimiza el sesgo y permite establecer relaciones de causalidad. Sin embargo, está surgiendo una tendencia [1], particularmente en el creciente campo de la salud digital y la inteligencia artificial (IA): se aplica la etiqueta de ECA o ensayo clínico a estudios que, fundamentalmente, no cumplen con los criterios esenciales de la definicion.

The Lancet Digital Health, al igual que muchas otras revistas, ha observado una afluencia de manuscritos que describen análisis retrospectivos de datos o estudios basados en simulaciones, pero que utilizan la clasificación de Ensayos Clínicos Retrospectivos (RCT). Para justificar este cambio semántico, los autores citan cada vez más artículos de revistas de alto impacto, incluyendo aquellos que describen el uso de la IA para ecografías cardíacas y grandes modelos lingüísticos (large language models o LLM) para ayudar a los médicos a mejorar los diagnósticos y procesos de atención al paciente, [2-4]. Si bien los estudios que citan utilizan una metodología sólida, comparar diferentes simulaciones o algoritmos en condiciones controladas y aleatorizadas desdibuja una línea crucial definida por las guías establecidas para los ensayos clínicos.

El Comité Internacional de Editores de Revistas Médicas (International Committee of Medical Journal Editors o ICMJE), ofrece una definición clara y esencial: un ensayo clínico es un proyecto de investigación que asigna prospectivamente a personas o grupos de personas a una intervención para estudiar la relación entre una intervención relacionada con la salud y un resultado en la salud. Este énfasis en la asignación prospectiva de las personas a una intervención de salud es indispensable para que se considere un verdadero ensayo clínico. Un análisis retrospectivo de datos existentes, o un estudio que aleatoriza a los participantes en diferentes simulaciones de IA sin asignar prospectivamente al paciente a una intervención terapéutica real, es fundamentalmente diferente. El estudio puede ser importante e innovador, pero por definición, no es un ensayo clínico.

Nuevos métodos, como la emulación de ensayos, destacados en trabajos recientes sobre investigación pediátrica y fibrosis quística [5, 6], ofrecen un marco conceptual para utilizar datos observacionales de la práctica clínica para estimar efectos causales de una manera que imita un ensayo aleatorizado. Se reconoce la complejidad de hacer una inferencia causal a partir de datos retrospectivos, y se están realizando importantes avances metodológicos para superar las limitaciones de costo, éticas y de alcance de los ECA tradicionales. Asimismo, la emulación de ensayos clínicos sintéticos aporta herramientas para el modelado predictivo mediante datos sintéticos.

Para mejorar la presentación de informes de estudios observacionales que estiman efectos causales, se ha publicado una nueva guía denominada TARGET [7]. Esta guía se centra en emular explícitamente el un ensayo clínico deseado. Es importante destacar que estos métodos fortalecen los estudios observacionales; sin embargo, no los redefinen como ensayos clínicos aleatorizados (ECA).

Para los autores que quieren clasificar correctamente su trabajo, las guías especializadas son una brújula fundamental. La adherencia a los estándares de presentación de informes establecidos es una forma fundamental de verificar la integridad, que ayuda a los autores, revisores y editores a mantener la claridad del registro científico.

Las revistas deben fomentar la adherencia a SPIRIT-AI y CONSORT-AI [8, 9] y utilizar listas de verificación para distinguir rigurosamente los verdaderos ensayos prospectivos de IA, evitando la inflación semántica engañosa. Si un estudio no cumple con los requisitos del protocolo de SPIRIT-AI (que exigen la planificación detallada de una intervención prospectiva centrada en participantes humanos) no se trata de un ECA relacionado con la IA.

La clasificación errónea de los estudios supone un riesgo para la integridad del acerbo científico, ya que erosiona la jerarquía de la evidencia. Para los médicos, los responsables políticos y los pacientes, esta distinción es crucial para la toma de decisiones informadas. La confusión se agrava para el contenido secundario y terciario, como las revisiones sistemáticas y los metaanálisis, así como para las políticas y guías clínicas, que cada vez se ven más enriquecidas por la IA.

Estos sistemas dependen de que la categorización e indexación de la literatura primaria sean precisas. Si los artículos fundamentales se etiquetan incorrectamente, los resultados de las herramientas de búsqueda basadas en IA serán defectuosos, lo que podría dar lugar a que se emitan recomendaciones clínicas sesgadas e inexactas a gran escala.

Esta situación exige que los editores de revistas y los revisores, especialmente en especialidades como las de The Lancet Digital Health, sean inflexibles en exigir la adherencia a los estándares del ICMJE. Si bien la investigación impulsada por la IA avanza rápidamente, las reglas fundamentales de la evidencia clínica permanecen. La presión por exigir la adherencia estricta a las definiciones podría enfrentar resistencia; sin embargo, preservar la integridad de la evidencia debe ser prioritario. La referenciación incorrecta de los estudios no es solo un descuido semántico; es un acto que disminuye la confianza en el proceso científico y contamina la evidencia.

Referencia

  1. Kouzy R, Hong J, Bitterman D.One shot at trust: building credible evidence for medical artificial intelligence. The Lancet digital health 2025; 7 https://www.thelancet.com/journals/landig/article/PIIS2589-7500(25)00065-2/fulltext
  2. He B; Kwan AC; Cho JH et al. Blinded, randomized trial of sonographer versus AI cardiac function assessment. Nature 2023; 616(520-524) https://www.nature.com/articles/s41586-023-05947-3
  3. Goh E, Gallo R, Hom J, et al. Large Language Model Influence on Diagnostic Reasoning: A Randomized Clinical Trial. JAMA Netw Open. 2024;7(10):e2440969. doi:10.1001/jamanetworkopen.2024.40969. Disponible en: https://jamanetwork.com/journals/jamanetworkopen/fullarticle/2825395
  4. Goh E, Gallo RJ, Strong E, Weng Y, Kerman H, Freed JA, Cool JA, Kanjee Z, Lane KP, Parsons AS, Ahuja N, Horvitz E et al. GPT-4 assistance for improvement of physician performance on patient care tasks: a randomized controlled trial. Nat Med. 2025 Apr;31(4):1233-1238. doi: 10.1038/s41591-024-03456-y. Epub 2025 Feb 5. Erratum in: Nat Med. 2025 Apr;31(4):1370. doi: 10.1038/s41591-025-03586-x. https://pubmed.ncbi.nlm.nih.gov/39910272/
  5. Robinson C, Fan E, Grandi S et al. Target trial emulation in paediatric research: ¿how can causal effects be estimated from observational data? The Lancet Child & Adolescent Health, 2025; 9, 663-672. Disponible en: https://www.thelancet.com/journals/lanchi/article/PIIS2352-4642(25)00131-2/abstract
  6. Davies G, Keogh R. Trial emulation with observational data in cystic fibrosis. The Lancet Respiratory Medicine, 2023; 11, 859-861Disponible en: https://www.thelancet.com/journals/lanres/article/PIIS2213-2600(23)00328-4/abstract
  7. Cashin AG, Hansford HJ, Hernán MA, et al. Transparent Reporting of Observational Studies Emulating a Target Trial—The TARGET Statement. JAMA. 2025;334(12):1084–1093. doi:10.1001/jama.2025.13350 https://jamanetwork.com/journals/jama/fullarticle/2837724
  8. Cruz Rivera S, Liu X, Chan A et al. Guidelines for clinical trial protocols for interventions involving artificial intelligence: the SPIRIT-AI extension. The Lancet Digital Health, 2020; 2, e549-e560 https://www.thelancet.com/journals/landig/article/PIIS2589-7500(20)30219-3/fulltext
  9. Liu X, Cruz Rivera S, Moher D et al. Reporting guidelines for clinical trial reports for interventions involving artificial intelligence: the CONSORT-AI extension. The Lancet Digital Health, 2020; 2, e537-e548 https://www.thelancet.com/journals/landig/article/PIIS2589-7500(20)30218-1/fulltext
creado el 4 de Junio de 2026