Una organización internacional sin ánimo de lucro para fomentar el acceso y el uso adecuado de medicamentos entre la población hispano-parlante

Gestión de los Ensayos Clínicos, Metodología, Costos y Conflictos de Interés

Hay que asegurar que los ensayos clínicos escogen bien la atención habitual
Salud y Fármacos, 6 de abril de 2020

El American Journal of Bioethics publicó en enero un artículo de Ruth Macklin y Charles Natanson [1] que utiliza tres estudios de caso para demostrar que muchos ensayos clínicos de eficacia comparativa, cuyo objetivo es comparar dos o más tratamientos clínicos de uso habitual para resolver el mismo problema, con frecuencia incluyen tratamientos que no son habituales. A continuación, resumimos sus hallazgos y recomendaciones.

Nadie duda de que estos estudios de eficacia comparativa podrían contribuir a maximizar la calidad de la atención médica. En estos ensayos, al menos un brazo del estudio debe incluir lo que se considera atención o tratamiento habitual, es decir las pautas de tratamiento que habitualmente utilizan los médicos al abordar ese problema de salud. Estos protocolos, para que sean útiles, deben demostrar que lo que se va a estudiar es el tratamiento habitual (en inglés: usual care). Cuando el diseño es incorrecto, no solo se altera la calidad de la ciencia y se producen guías clínicas defectuosas que pueden dañar a futuros pacientes, sino que también puede aumentar el riesgo para los participantes. Además, tanto los comités de ética (CEIs) como los participantes podrían pensar que los riesgos del mal-llamado tratamiento habitual son mínimos y son conocidos.

Según los autores, identificar inadecuadamente lo que constituye “tratamiento habitual” puede ocasionar, entre otras cosas que: (1) se saquen conclusiones incorrectas; (2) no se supervise adecuadamente la seguridad de los pacientes; (3) el consentimiento informado sea inadecuado.

Los tres estudios de caso (los ensayos ARMA, TRICC, SUPPORT) que presentan Macklin y Natanson [1] demuestran que los ensayos que incluyen tratamientos habituales no siempre son seguros. Hay que tener en cuenta que los tres ensayos se relacionan con cuidados intensivos (donde los médicos ejercen cierto nivel de discreción y cambian algunos aspectos del tratamiento según la evolución del paciente), se realizaron en centros prestigiosos, con los mejores clínicos, algunos contaban con financiamiento de los Institutos Nacionales de Salud, y todos fueron aprobados por CEIs competentes.

Las razones por las que en estos ensayos se han incluido tratamientos no habituales, incluyen:

  1. Los investigadores se equivocaron al recabar o utilizar fuentes imprecisas o inadecuadas para establecer lo que se considera tratamiento habitual.
  2. Las poblaciones en estudio incluyeron a subpoblaciones que requieren otro tratamiento.
  3. Las dificultades para identificar lo que se consideraba tratamiento habitual.
  4. La rápida evolución de la práctica clínica y los cambios que ocurrieron antes de que se aprobara e implementara el estudio.
  5. Los investigadores se fiaron de las opiniones de expertos, en lugar de buscar fuentes objetivas y actualizadas de información.

Estudio ARMA (Acute respiratory distress syndrome network lower tidal volume trial). Los pacientes con síndrome de insuficiencia respiratoria requieren respiración asistida, pero si la presión en las vías aéreas alcanza niveles demasiado altos se pueden dañar las mucosas internas y los alveolos, empeorando su situación. Se aleatorizaron 861 pacientes con síndrome de insuficiencia respiratoria para recibir un volumen de aire constante (alto o bajo) y analizar su impacto en el daño pulmonar y la muerte. Los investigadores consideraron que el tratamiento habitual era el que utilizaba volúmenes altos, y por eso, tanto el protocolo como el consentimiento informado lo catalogaron como “tratamiento habitual”.

Sin embargo, los hospitales que participaron en el estudio solo utilizaban volúmenes altos en 10-15% de las ocasiones. De hecho, cuando se aleatorizaron los pacientes, se tuvo que aumentar el volumen de aire para el 80% de los pacientes en ese grupo. Según los autores, en la práctica habitual, los médicos no hubieran administrado volúmenes tan altos como los que se utilizaron en este ensayo sin tener una buena razón para hacerlo.

En este ensayo también se dio seguimiento a 2.587 pacientes que cumplían los criterios de inclusión, y estaban siendo tratados por los mismos médicos y en las mismas unidades de cuidados intensivos que los pacientes inscritos en el ensayo. En este caso, los médicos fueron ajustando el volumen de aire a las necesidades de los pacientes. El objetivo era comparar estos resultados con los resultados de los pacientes inscritos en el ensayo.

Al final del estudio, la mortalidad fue significativamente más alta entre las personas que recibieron los volúmenes de aire más altos (40% vs 31% en el ensayo clínico; y 31,7% entre los pacientes no inscritos en el ensayo). Es más, todos los subgrupos de pacientes que no cumplieron los criterios de inclusión también experimentaron niveles inferiores de mortalidad. Como el diseño del estudio no incluyó un brazo tratado con el tratamiento habitual que reciben los pacientes, el comité de monitoreo y seguridad (DSMB) no tuvo una medida objetiva para parar el ensayo cuando detectaron que los volúmenes más altos ocasionaban mayor mortalidad.

Tras publicarse los resultados, los investigadores iniciaron otro estudio con el mismo problema de diseño: sin brazo que recibiera el tratamiento habitual. Todo esto desató una gran discusión, y los investigadores de ARMA reconocieron que los volúmenes altos eran los que se consideraban habituales cuatro años antes de que se iniciara su estudio.

Estudio TRICC. Este estudio analizó dos estrategias para decidir cuando hay que hacer una transfusión sanguínea: la liberal y la restrictiva. La liberal utilizaba un umbral de hemoglobina más alto, por lo que se hacían más transfusiones. La idea era comprobar si ambos umbrales eran igual de seguros, ya que de ser así se podría recomendar el uso del umbral inferior y reducir el número total de transfusiones.

Antes de iniciar el ensayo, los investigadores encuestaron a 193 intensivistas para determinar la práctica habitual en los dos subgrupos de pacientes que se habían incluido en el ensayo. Solo el 3% dijeron que utilizarían el umbral bajo para pacientes con enfermedad cardiovascular, y solo el 12% que utilizarían el umbral alto en pacientes jóvenes sanos que estuvieran experimentando un evento agudo. Sin embargo, el diseño de ensayo clínico no incorporó estos resultados. Este ensayo clínico también carecía de un grupo control que recibiera el tratamiento individualizado que se utilizaba en los hospitales que participaban en el ensayo, o el que recomendaban las guías de tratamiento vigentes. Consecuentemente, ninguno de los dos brazos del estudio estaba aplicando el tratamiento habitual.

En este ensayo se aleatorizaron 838 pacientes, y se detectaron tasas de mortalidad más altas en el grupo que recibió transfusiones de forma más liberal, concluyendo que era mejor utilizar el acercamiento más restrictivo.

Sin embargo, este y otros ensayos subsecuentes sobre el mismo tema no permiten extraer recomendaciones generalizables. Hay que hacer análisis de subgrupos. En este caso, los pacientes con antecedentes cardiovasculares que se sometieron al plan más restrictivo de transfusiones tuvieron una mortalidad más elevada que el grupo que las recibió de forma más liberal. En cambio, entre los pacientes sin enfermedad cardiovascular, especialmente entre los más jóvenes, ocurrió lo opuesto. En realidad, el ensayo confirmó lo que los intensivistas que trabajaban en esos hospitales ya sabían; y los investigadores hubieran tenido que integrar esa información en el diseño del estudio.

Estudio SUPPORT (financiado por los National Institutes of Health NIH). A muchos niños prematuros hay que tratarlos con oxigenoterapia, pero si la cantidad de oxígeno es demasiado alta se puede producir ceguera, y si es demasiado baja hay un riesgo de que sufran daño neurológico y muerte. En este estudio se aleatorizaron 1.316 recién nacidos, prematuros, de bajo peso para determinar el nivel de saturación de oxígeno que se debería lograr.

En este caso, los investigadores utilizaron las recomendaciones de la Sociedad Americana de Pediatría para establecer los brazos de tratamiento; y para justificar su diseño utilizaron datos sobre lo que se estaba haciendo en Inglaterra 10 años antes. Al terminar el ensayo se constató que los niveles más altos de oxigenoterapia eran consistentes con la práctica habitual, sin embargo, los niveles más bajos se utilizaban muy raramente. En este caso, solo uno de los brazos del estudio utilizaba los parámetros de tratamiento habituales, aunque los investigadores no reconocieron que los niveles inferiores eran experimentales. En ese ensayo, la mortalidad fue más elevada entre los niños que recibieron las dosis más bajas de oxigenoterapia.

A partir de la controversia que generó este estudio, algunos críticos dijeron que la forma de consentimiento informado debería haber incluido el mayor riesgo de muerte con las dosis bajas de oxígeno, ya que era una de las medidas de impacto.

Los tres ensayos tienen problemas de diseño que se hubieran podido evitar. TRICC utilizó umbrales fijos de transfusión, pero en la práctica clínica estos umbrales dependen del problema de salud subyacente que sufre el paciente crítico. ARMA aumentó los volúmenes de aire y los mantuvo constantes cuando en la práctica habitual se van ajustando a la situación del paciente; y SUPPORT utilizó pautas obsoletas de tratamiento. Desafortunadamente, los errores cometidos en ARMA y TRICC se siguieron cometiendo en 4 y 16 ensayos posteriores, respectivamente.

Para evitar estos problemas de diseño, los investigadores deben definir adecuadamente las pautas de tratamiento habitual que están vigentes en el momento de hacer el estudio. Cuando no se hace, aumenta el riesgo para los participantes. Los autores hacen las siguientes recomendaciones:

  1. Los investigadores tienen que analizar los datos sobre las características de los pacientes y sus cuidadores para establecer lo que se considera práctica habitual en esa comunidad, clínica o centro hospitalario.
  2. La investigación debe empezar en los centros en donde se realizará el estudio. En esos centros se puede hacer revisión de historias, encuestas a los proveedores de salud, análisis de los controles que se han utilizado en ensayos clínicos recientes o de los estudios observacionales. Cuando se trate de estudios multicéntricos, especialmente los internacionales, lo que se considere práctica habitual puede ser distinto, y el diseño del estudio debe reconocer esta variabilidad.
  3. El protocolo debe explicar en detalle todos los pasos que han seguido los investigadores para definir lo que se considera práctica habitual. Los métodos que han utilizado para establecerlo (revisión de historias, revisión sistemática, estudios observacionales, encuestas de profesionales etc.). Si no se puede identificar una práctica habitual, deben justificar los tratamientos que han elegido para cada brazo del estudio y las medidas que han adoptado para proteger al paciente.
  4. Los financiadores deben exigir que los protocolos expliquen lo que se considera práctica habitual.
  5. Los CEIs y los comités científicos deben revisar la calidad de la información que se utiliza para justificar lo que se considera tratamiento habitual y verificar que la información esté completa.
  6. Los entes gubernamentales deben proveer guías para que los CEIs puedan aprobar los proyectos relacionados con el tratamiento habitual, incluyendo la necesidad de justificar la selección de tratamiento habitual en las intervenciones que estén evaluando.
  7. Los que hacen revisiones por pares y los editores de revistas deben evaluar si los tratamientos que se han comparado incluyen el tratamiento habitual.

Este artículo suscitó una serie de comentarios. Por ejemplo, Annas y Annas [2] dijeron que en el estudio SUPPORT, los mismos investigadores podrían haber tenido dificultades en reconocer que había un brazo experimental, y que esos niños tenían un mayor riesgo de muerte, pues se trataba de niños muy vulnerables. Un mecanismo de defensa de esos médicos, asumimos inconsciente, es pretender que se están comparando dos terapias habituales. Estos autores comparan lo que hubiera podido suceder entre estos neonatólogos a lo que ocurre entre los militares: dinámica de pensamiento grupal. En este caso, los que apoyaban el ensayo, incluyendo los 23 CEIs no ejercieron adecuadamente sus funciones de supervisión; y cuando saltó la controversia acusaron a los críticos de estar en contra del progreso. Además, Annas y Annas afirman que ni los investigadores ni los CEIs están muy preocupados por preservar la dignidad de los participantes. En este caso, al obtener el consentimiento informado, es indispensable reconocer la dignidad de los padres y del recién nacido. Obtener el consentimiento informado en el entorno de una unidad neonatal de cuidados intensivos no es fácil, y en esos casos puede ser necesario obtener un consentimiento informado antes del nacimiento y otro después. Es probable que los padres sean renuentes a inscribir a sus hijos en un ensayo clínico a sabiendas que uno de los brazos de la intervención conlleva un mayor riesgo de muerte.

Cowan [3], amplió el horizonte detallando otros ejemplos de estudios en salas de emergencias en donde no se identifica correctamente lo que se considera tratamiento habitual. Goldstein y Weijer [4] comentaron que los ensayos de tratamiento habitual siempre deben ser revisados por un CEI porque los participantes no se benefician del tratamiento individualizado que generalmente ofrecen sus médicos, tienen que recibir la intervención a la que han sido asignados, sin posibilidad de hacer modificaciones. Quizás el problema más importante con los estudios descritos es que no había equipoise [4], es decir, uno de los tratamientos era superior al otro. Los CEIs tienen que prestar atención a como los consentimientos informados describen el tratamiento habitual porque de lo contrario los participantes podrían subestimar los riesgos. Macklin y Natanson [5] estuvieron de acuerdo con las críticas, pero insistieron en que además de cumplir con ese criterio ético, los investigadores deben identificar lo que constituye tratamiento habitual porque al hacerlo podrían percatarse de que un tratamiento es superior al otro, no hay equipoise, y por lo tanto no debe hacerse.

Kane et al [6] comentaron la ambigüedad que rodea al concepto de “riesgo mínimo”. Muchos consideran que los estudios que aleatorizan pacientes a intervenciones que podrían recibir habitualmente en la práctica clínica son de riesgo mínimo, y consecuentemente se pueden someter al proceso de aprobación acelerada por el CEI y puede no ser necesario obtener el consentimiento informado. Según estos autores, asumir que la aleatorización para recibir tratamientos estándar no acarrea ningún riesgo responde a cuatro errores conceptuales:

  1. Cómo se elige la “clase de referencia”, es decir la serie de eventos que se seleccionan para determinar el riesgo. Por ejemplo, si la clase de referencia es la población, significa que antes de que se inicie el ensayo no hay ningún elemento que lleve a pensar que el grupo de pacientes que participara en el ensayo tendrá peores resultados que aquellos que no participen. Es decir, los daños que puedan sufrir los pacientes en un brazo del estudio se verán compensados por las mejores condiciones de vida de los pacientes en el otro brazo del estudio. El problema es que en la ética de la investigación la clase de referencia es el paciente individual. La pregunta que hay que hacer es si ese paciente individual saldrá perjudicado por participar en el ensayo.
  2. La naturaleza contrafactual del riesgo. Por definición, los riesgos asociados con una intervención se miden en relación con lo que sucedería si no se hiciera nada o se hiciera de otra forma. Por ejemplo, el riesgo para un individuo de participar en un ensayo clínico vs lo que sucedería si no participara en el ensayo. Es decir, hay que responder si la aleatorización puede perjudicar a los pacientes.
  3. La combinación de aleatoriedad con arbitrariedad. Los que dicen que no hay riesgo defienden que la aleatorización es consistente con la práctica clínica porque el tratamiento que recibe el paciente es cuestión de suerte. Sin embargo, la práctica clínica no es aleatoria, si el tratamiento dependiera de la suerte, en lugar de ensayos clínicos se podrían hacer estudios observacionales. Hay muchos factores contextuales que influyen en el tratamiento que recibe el paciente (religiosos, de prestigio, lugar geográfico, historia, entrenamiento, etc.).
  4. Como se relaciona el riesgo con equipoise. Para que un ensayo aleatorio sea ético, la comunidad científica no puede tener evidencia de que un tratamiento sea mejor que otro, y la incerteza tiene que ser suficiente para merecer la realización de un ensayo clínico.

Según Kane et al, en estos ensayos no se debe eludir el consentimiento informado, y estos deben decir que el paciente podría verse perjudicado por participar en el ensayo clínico en lugar de recibir la atención habitual.

Referencias

  1. Ruth Macklin, Charles Natanson. (2020) Misrepresenting “Usual Care” in Research: An Ethical and Scientific Error. The American Journal of Bioethics 20:1, pages 31-39.
  2. George J. Annas & Catherine L. Annas (2020) “Unusual Care”: Groupthink and Willful Blindness in the SUPPORT Study, The American Journal of Bioethics, 20:1, 44-46, DOI: 10.1080/15265161.2019.1687787
  3. Ethan Cowan, Kate Sahan & Mark Sheehan (2020) Misuse of “Usual Care” in Emergency Care Research: A Call for Adapting Rules Governing Exception from Informed Consent (EFIC) Studies, The American Journal of Bioethics, 20:1, 59-61, DOI: 10.1080/15265161.2019.1687782
  4. Cory E. Goldstein & Charles Weijer (2020) It Does Not Matter Whether Research Interventions Are Usual Care, The American Journal of Bioethics, 20:1, 47-48, DOI: 10.1080/15265161.2019.1687779
  5. Ruth Macklin & Charles Natanson (2020) Response to Open Peer Commentaries on “Misrepresenting ‘Usual Care’ in Research: An Ethical and Scientific Error”, The American Journal of Bioethics, 20:1, W12-W14, DOI: 10.1080/15265161.2019.1700680
  6. Patrick Bodilly Kane, Scott Y. H. Kim & Jonathan Kimmelman (2020) What Research Ethics (Often) Gets Wrong about Minimal Risk, The American Journal of Bioethics, 20:1, 42-44, DOI: 10.1080/15265161.2019.1687789
creado el 4 de Diciembre de 2020