Fevereiro de 2024

Inicio

Gestão dos Ensaios Clínicos, Metodologia, Custos e Conflitos de Interesse

Demonstrar a eficácia de um tratamento

Rev Prescrire 2023; 32 (249): 162-165
Traduzido por Salud y Fármacos, publicado em Boletim Fármacos: Ensaios Clínicos 2024; 2(1)

Tags: integridade da ciência, avaliar a eficácia de um tratamento, limitações dos estudos observacionais, dados da prática clínica

Ensaios clínicos comparativos, randomizados e duplo cego: a base de uma abordagem científica rigorosa

Qual é a melhor maneira de demonstrar a eficácia de um tratamento? Em outras palavras, como estabelecer uma relação causal entre o tratamento e a melhora clínica de valor suficiente para justificar o risco de sofrer os danos conhecidos – e ainda desconhecidos – de um medicamento?

Este artigo é baseado na revisão da literatura da Prescrire, especialmente no que se refere à avaliação de novos medicamentos e outros tratamentos.

Um ensaio clínico é um experimento científico no qual os participantes são submetidos a uma intervenção de saúde para testar uma hipótese predefinida sobre a relação causal entre a intervenção recebida e o estado de saúde dos participantes.

Avaliar a eficácia de um tratamento geralmente requer a comparação com o tratamento de referência; se não houver nenhum, ele deve ser comparado com um placebo ou com nenhum tratamento. Se uma comparação direta não for feita como parte do mesmo estudo, é impossível distinguir bem entre as observações relacionadas aos efeitos do tratamento e aquelas relacionadas a outros fatores que são diferentes entre os grupos.

Para poder garantir que as diferenças observadas em um ensaio clínico sejam devidas ao tratamento em estudo, os grupos que estão sendo comparados devem ser idênticos em todos os aspectos, exceto pelo tratamento que recebem. O método mais confiável para formar grupos de pessoas com características semelhantes é a randomização, na qual, por meio de um processo aleatório, semelhante ao de jogar uma moeda, cada participante é designado a um grupo.

Em um estudo clínico duplo-cego, nem os pacientes nem os profissionais de saúde sabem qual tratamento os participantes recebem: isso evita que o conhecimento do tratamento influencie seu comportamento ou suas decisões durante o estudo.

A evidência de que um tratamento tem um efeito positivo sobre um critério de valoração – end point – “indireto” – por exemplo, o valor em um teste de laboratório – geralmente não prova que ele é benéfico para os pacientes.

Os estudos clínicos duplo-cegos e randomizados são o método mais robusto de fornecer evidências da eficácia de um tratamento, especialmente quando outro estudo clínico confirma seus resultados. No entanto, ao tomar decisões de saúde, é importante estar ciente de suas principais limitações e também levar em conta os riscos conhecidos e desconhecidos e o que o paciente espera pessoalmente do tratamento.

Um tratamento é eficaz quando previne ou tem um efeito positivo sobre as manifestações ou o curso normal de uma doença, por exemplo, aliviando os sintomas, acelerando a recuperação, reduzindo a incidência de complicações ou recorrência, ou prolongando a sobrevivência.

Qual é a melhor maneira de demonstrar a eficácia de um tratamento? Em outras palavras, como estabelecer uma relação causal entre o tratamento e a melhora clínica de magnitude suficiente para justificar o risco de sofrer os danos conhecidos – ou os ainda desconhecidos – de um medicamento?

Este artigo é baseado na revisão da literatura da Prescrire, especialmente no que se refere à avaliação de novos medicamentos e outros tratamentos. No texto, é explicado o significado dos seguintes termos: ensaio clínico, comparativo, randomizado, duplo-cego e o critério clínico.

Experimentação em vez de simples observação
Na pesquisa clínica, há dois tipos diferentes de estudos: observacionais ou descritivos e intervencionistas ou experimentais.

Estudos observacionais: descrevem sem intervir. Em um estudo observacional, é observado um grupo de pessoas (uma “coorte”) que não está recebendo uma intervenção adicional, além do tratamento habitual, para mudar o curso de sua saúde. Esses estudos fornecem informações úteis para avaliar um tratamento, especialmente para formular hipóteses sobre seus efeitos e para estimar a frequência dos efeitos adversos [2]. Entretanto, eles não demonstram uma relação causal entre os efeitos observados e o tratamento recebido: eles não fornecem evidências sobre a eficácia de um tratamento.

Por exemplo, um estudo usando dados de 121.700 mulheres, coletados entre 1976 e 1994, sugeriu que a mortalidade era menor entre as que usavam terapia hormonal pós-menopausa do que entre as que não usavam. A diferença parecia ser mais acentuada em mulheres com fatores de risco para eventos cardiovasculares. Ela foi considerada estatisticamente significativa depois que alguns “ajustes” foram feitos, por exemplo, alguns cálculos para levar em conta algumas diferenças entre as que usaram e as que não usaram, que estavam relacionados principalmente ao peso corporal, ao status de fumante, à presença ou ausência de hipertensão e a outros fatores associados a um risco maior de morte prematura [4].

Cuidado com os fatores de confusão que não são levados em conta. Esse estudo observacional estabeleceu a existência de uma associação estatística – nessa coorte de mulheres – entre o uso de terapia hormonal pós-menopausa e a mortalidade [4]. Entretanto, essa associação estatística pode ser explicada de várias maneiras, além do uso desse tratamento. Por exemplo, é provável que as mulheres que optaram por usar a terapia hormonal pós-menopausa (que, naquela época, já era considerada benéfica há muito tempo) tenham prestado mais atenção à sua saúde do que as não usuárias e tenham se exercitado regularmente, seguido uma dieta mais saudável e provavelmente feito mais exames de saúde, etc. Esses fatores de “confusão”, se não fossem igualmente distribuídos entre os dois grupos de mulheres, poderiam ter contribuído para a menor mortalidade observada entre as usuárias de terapia hormonal na pós-menopausa. Fatores de confusão é uma das muitas causas de viés que devem ser levadas em conta ao analisar os resultados de tais estudos [3].

Outra possibilidade é que essa associação estatística seja simplesmente o resultado do acaso (a).

Mais adiante, no início dos anos 2000, um ensaio clínico maior, randomizado, comparativo, duplo-cego, chamado Women’s Health Initiative (WHI) refutou os resultados desse estudo: ele mostrou que a incidência de eventos cardiovasculares era maior em mulheres que usavam terapia hormonal na pós-menopausa [5].

Estabelecer um vínculo causal: ensaios clínicos. Um ensaio clínico é um estudo experimental no qual os efeitos de uma intervenção terapêutica são observados com o objetivo principal de avaliar e quantificar sua eficácia clínica [6].

Por tanto, um estudo clínico é um experimento científico realizado para confirmar a hipótese predefinida de que existe uma relação causal entre uma intervenção (por exemplo, a administração de um tratamento) e o estado de saúde do paciente enquanto recebe a intervenção ou depois dela. Se a intervenção for um tratamento, o experimento consiste, por exemplo, em administrar o tratamento do estudo a um grupo de pacientes e o tratamento padrão a outro grupo de pacientes inscritos no mesmo ensaio clínico. Se não houver um tratamento de referência, o tratamento em estudo é comparado a um placebo ou a nenhum tratamento [6].

Se a comparação for feita com um grupo de pacientes que foi formado de forma diferente, como pacientes inscritos em outro ensaio clínico, ela estará sujeita ao mesmo tipo de viés que um estudo observacional. Isso se aplica, por exemplo, à comparação entre grupos de pacientes que parecem ter características semelhantes, mas que foram monitorados em instituições diferentes ou com anos de diferença. Salvo algumas raras exceções, as comparações só são conclusivas se forem diretas e entre pacientes inscritos no mesmo ensaio clínico (b).

Comparação direta para melhor avaliação
Na década de 1950, cirurgiões em Parma e na Filadélfia propuseram tratar a angina de peito ligando as artérias mamárias internas, uma cirurgia realizada sob anestesia local. Mais da metade dos pacientes relatou uma melhora acentuada nos sintomas alguns dias ou semanas após o procedimento. Em 1959 e 1960, dois ensaios clínicos randomizados compararam a ligadura das artérias mamárias internas com a cirurgia simulada. A melhora clínica (em alguns casos dramática) foi tão comum no grupo da cirurgia simulada quanto no grupo da ligadura.

Com essa descoberta, concluiu-se que a ligadura das artérias mamárias internas não tinha eficácia inerente [7].

No começo de 2020, uma equipe de Marselha (França) relatou resultados clínicos positivos em pacientes com covid-19 que haviam sido tratados com hidroxicloroquina [8]. Nos meses seguintes, vários ensaios clínicos comparativos estabeleceram de forma consistente que a progressão da covid-19, independentemente de ser inicialmente leve ou grave, é a mesma para pacientes tratados com hidroxicloroquina e para aqueles tratados com placebo [9].

Esses exemplos ilustram o risco de concluir erroneamente que um tratamento é eficaz quando ele não foi diretamente comparado com o tratamento de referência, um placebo ou nenhum tratamento.

Em um estudo clínico comparativo, os pacientes geralmente são divididos em dois grupos e monitorados simultaneamente (c

0. Os participantes do grupo de “intervenção” recebem o tratamento do estudo. Os participantes do outro grupo, o grupo “controle”, recebem o tratamento comumente usado para tratar o problema ou, se não houver nenhum, um placebo ou nenhum tratamento (d) [6]. No final do estudo clínico, o estado de saúde dos participantes do grupo de intervenção é comparado ao do grupo de controle. No entanto, para obter evidências de alta qualidade, é melhor garantir que, no momento da inscrição, a saúde dos participantes nos dois grupos seja a mais semelhante possível e que, antes do início do ensaio clínico, eles tenham características semelhantes: esse é o objetivo da randomização.

Randomização para garantir que os grupos sejam idênticos, exceto pelo tratamento que recebem
Para garantir que as diferenças observadas entre os grupos de intervenção e controle em um ensaio clínico sejam devidas ao tratamento em estudo, é essencial que não haja outra explicação. Isso é obtido por meio da formação de grupos com as mesmas características antes do início do estudo [6].

A randomização significa que um processo aleatório, semelhante ao lançamento de uma moeda, é usado para designar cada participante do estudo clínico para o grupo que receberá o tratamento experimental ou para o grupo de controle. É o método mais simples e confiável para garantir que, exceto pelo tratamento que receberão, os participantes inscritos terão as mesmas características antes do início do ensaio clínico. Quanto mais participantes forem incluídos no estudo, maior será a probabilidade de a randomização produzir grupos com prognóstico semelhante [6].

A randomização também evita a possibilidade de que o tratamento atribuído a cada paciente seja influenciado, consciente ou inconscientemente, pela presença ou ausência de características que possam afetar o curso da doença, como idade, estado de saúde ou gravidade da condição que está sendo tratada.

Sendo assim, a randomização também é um pré-requisito para a significância estatística (e) [6]. A descrição das características do paciente no momento da atribuição do grupo serve para confirmar, com base em algumas características importantes e em fatores de confusão prováveis ou confirmados, que o acaso não gerou diferenças entre os grupos que poderiam alterar os resultados do estudo.

É essencial garantir que, durante todo o ensaio clínico, as intervenções que estão sendo comparadas sejam os únicos fatores que poderiam contribuir para as diferenças nos efeitos observados em cada grupo. Esse é o objetivo do duplo cegamento: após a randomização, ele evita fatores que possam afetar um grupo mais do que o outro [6].

Ocultamento com duplo cegamento para minimizar o viés e a subjetividade
O objetivo do duplo cegamento é evitar que ocorram diferenças entre os grupos (além do tratamento recebido) durante o estudo clínico, e também evitar o viés nos resultados. Duplo cegamento significa que nem os pacientes nem os profissionais de saúde sabem qual tratamento cada participante recebeu até que o estudo clínico e a análise de seus resultados sejam concluídos.

O tratamento recebido é ocultado dos pacientes para evitar que eles modifiquem seus comportamentos relacionados à saúde ou interpretem suas experiências com base em seus conhecimentos ou crenças sobre o tratamento em estudo. Por exemplo, sem cegamento os pacientes que sabem que não receberam o tratamento em avaliação para prevenir eventos cardiovasculares provavelmente estarão mais inclinados a se exercitar ou parar de fumar.

Os profissionais de saúde não sabem se o participante está recebendo o tratamento para evitar que essa informação influencie, consciente ou inconscientemente, suas decisões sobre o acompanhamento do paciente ou a introdução de outros tratamentos. Por exemplo, quando não há cegamento e o médico sabe se um paciente está ou não recebendo o tratamento experimental, essa informação poderia induzi-lo a usar mais ou menos tratamentos adicionais ou a monitorar o paciente com mais ou menos cuidado.

Por fim, o tratamento recebido é ocultado dos avaliadores para evitar que essa informação influencie sua avaliação. Por exemplo, se eles souberem que um paciente recebeu tratamento sob avaliação para prevenção cardiovascular, isso poderia levá-los a atribuir erroneamente a morte de um paciente a uma causa não cardiovascular.

Selecionar critérios que sejam importantes para os pacientes.
A evidência de eficácia em um estudo clínico randomizado, comparativo e duplo-cego não prova necessariamente que o tratamento é benéfico. Também é necessário garantir que a eficácia demonstrada corresponda a uma melhora real para os pacientes [1].

Critérios de avaliação substitutos: raramente são úteis para os pacientes. Às vezes, a eficácia potencial de um tratamento é avaliada com base em critérios não clínicos, que não constituem um benefício real para os pacientes. Quando se presume que um critério esteja associado à melhora clínica, ele é chamado de critério substituto. Os exemplos incluem concentrações de colesterol sérico, pressão arterial, níveis de hemoglobina glicosilada no sangue (HbA1c), extrassístole ventricular em um eletrocardiograma, densidade mineral óssea ou evidência radiográfica de fraturas vertebrais assintomáticas. Os critérios clínicos reais, como morte, desconforto respiratório, distúrbios visuais associados à retinopatia diabética, fraturas ósseas sintomáticas e desconforto ou incapacidade que os pacientes possam sentir em suas vidas diárias são mais úteis para medir a melhora ou a deterioração da saúde de um paciente [1].

Demonstrar que um tratamento tem um efeito positivo em um critério indireto não prova que essa melhora se aplica aos critérios clínicos que são importantes para os pacientes. Por exemplo, demonstrou-se que o clofibrato reduz o colesterol sérico, mas aumenta a mortalidade; demonstrou-se que a rosiglitazona reduz a HbA1c, mas aumenta o risco de insuficiência cardíaca; demonstrou-se que o flúor aumenta a densidade óssea, mas aumenta o risco de fraturas; e demonstrou-se que a flecainida reduz a taxa de extrassístole ventricular após infarto do miocárdio, mas aumenta o risco de morte súbita [10-14].

Às vezes, é razoável usar um critério substituto que se relaciona intimamente com o curso clínico de uma doença em vez de critérios clínicos. O uso da carga viral do HIV como um critério substituto ao avaliar a terapia antirretroviral é um exemplo disso [1].

Na prática: os estudos clínicos randomizados, comparativos e duplo-cegos continuam sendo a melhor ferramenta de avaliação, mas têm algumas limitações
Os estudos clínicos randomizados, comparativos e duplo-cegos são a ferramenta de avaliação mais robusta para demonstrar a eficácia potencial de um tratamento. Entretanto, a demonstração de um efeito em um critério clinicamente relevante em um ensaio clínico randomizado, comparativo e duplo-cego não é suficiente para demonstrar a eficácia real em pacientes. Também é necessário que não existam falhas no desenho do estudo clínico, na sua execução ou na sua interpretação, para que seus resultados não sejam tendenciosos. E, como em qualquer ciência baseada em experimentação, é importante garantir que os resultados possam ser reproduzidos, ou seja, confirmar os resultados em pelo menos um outro ensaio clínico realizado por outra equipe.

Mesmo sem falhas metodológicas, um ensaio clínico comparativo, randomizado e duplo-cego tem escopo limitado: quanto mais diferentes forem as características dos pacientes e dos participantes de um ensaio clínico, menor será a probabilidade de esses resultados serem traduzidos para a prática clínica.

“Os médicos costumam se gabar de que podem curar todos os seus pacientes com algum tratamento que usam (…) Poderíamos estar sujeitos todos os dias aos maiores enganos sobre o benefício de um tratamento se não tivéssemos a possibilidade de acesso a um experimento comparativo. Gostaria de lembrar apenas um exemplo recente sobre o tratamento da pneumonia. O experimento comparativo mostrou, de fato, que o tratamento da pneumonia com sangria, que se pensava ser o mais eficaz, é uma mera ilusão terapêutica”. Claude Bernard (trecho da tradução para o inglês de Henry Copley Greene do livro Introduction à l’Étude de la Médecine Expérimentale [Introdução ao Estudo da Medicina Experimental”, 1865]).

A significância estatística de uma associação ou correlação entre duas variáveis não significa necessariamente que haja uma relação causal. O site http://www.tylervigen.com fornece muitos exemplos de correlações estatisticamente significativas em que uma relação causal parece altamente improvável.

Nos raros casos em que uma doença piora sistematicamente em curto prazo se não for tratada, a evidência não comparativa de uma associação entre o tratamento e a melhora clínica é suficiente para estabelecer uma relação causal entre os dois. Assim, em 1922, foi demonstrado que a insulina era um tratamento eficaz para o diabetes tipo 1, uma doença que anteriormente resultava em morte rápida em quase todos os casos (ref. 15).

Outro tipo de estudo, chamado de estudo clínico cruzado, compara vários tratamentos sucessivos nos mesmos pacientes. Sob certas condições, esses ensaios clínicos podem ser tão conclusivos quanto os ensaios de grupos paralelos (ref. 6).

Quando alguns Pesquisadores, profissionais de saúde ou pacientes estão convencidos de que um tratamento experimental será mais eficaz do que outros tratamentos disponíveis, eles às vezes acham que não seria ético realizar um ensaio clínico comparativo. Entretanto, até que a superioridade de um tratamento experimental tenha sido estabelecida de forma conclusiva e justifique o risco de os pacientes sofrerem seus efeitos adversos conhecidos e ainda desconhecidos, é considerado ético realizar um estudo clínico comparativo, desde que o comparador escolhido seja o tratamento padrão ouro para aquele problema. A comparação com um placebo ou sem tratamento só é considerada eticamente aceitável quando não há um tratamento de referência bem estabelecido (ref.16).

Os testes estatísticos são baseados na suposição de que os grupos comparados foram formados por atribuição aleatória. Eles quantificam a probabilidade de que o acaso, por si só, tenha produzido uma diferença entre os grupos tão grande quanto (ou até maior que) o efeito observado, sob a “hipótese nula” de que os tratamentos comparados têm os mesmos efeitos (ref.6).

Referências selecionadas da revisão bibliográfica da Prescrire

Prescrire Editorial Staff “Evaluation of treatment benefits: clinical endpoints relevant to patients” Prescrire Int 2008; 17 (98): 260.
Prescrire Editorial Staff “Evaluation of treatment risks: taking clinical data, pharmacology and patient characteristics into account” Prescrire Int 2010; 19 (105): 44-45.
Prescrire Rédaction “Facteurs de confusion: sources de biais majeurs” Rev Prescrire 2009; 29 (310): 618-620.
Grodstein F et al. “Postmenopausal hormone therapy and mortality” N Engl J Med 1997; 336 (25): 1769-1775.
Prescrire Rédaction “Hormonothérapie substitutive de la ménopause. Sans intérêt clinique à long terme” Rev Prescrire 2018; 38 (417): 536.
“The randomized controlled trial”. In: Daly LE et al. “Interpretation and Uses of Medical Statistics” 4th ed., Blackwell Scientific Publications, Oxford, 1991: 214-239.
Miller FG “The enduring legacy of sham-controlled trials of internal mammary artery ligation” Prog Cardiovasc Dis 2012; 55 (3): 246-250.
Prescrire Editorial Staff “Hydroxychloroquine: the situation is critical” Prescrire Int 2020; 29 (219): 227.
Prescrire Editorial Staff “Hydroxychloroquine in covid-19: no proven efficacy, including in less severe forms of the disease” 24 July 2020.
Prescrire Rédaction “Quelle place pour les fibrates en prévention cardiovasculaire?” Rev Prescrire 2001; 21 (219): 555-556.
Prescrire Rédaction “Rosiglitazone: la triste saga continue” Rev Prescrire 2010; 30 (324): 742.
Riggs BL et al. “Effect of fluoride treatment on the fracture rate in postmenopausal women with osteoporosis” N Engl J Med 1990; 322 (12): 802-809.
Prescrire Rédaction “Le risque de mort par antiarythmique. Les résultats préliminaires d’une étude importante” Rev Prescrire 1989; 9 (87): 295-296.
Prescrire Editorial Staff “Flecainide: fatalities and cardiac arrests?” Prescrire Int 2022; 31 (234): 46-47.
Banting FG et al. “Pancreatic extracts in the treatment of diabetes mellitus” Can Med Assoc J 1922; 12 (3): 141-146.
Prescrire Rédaction “Évaluer le progrès thérapeutique: avec méthode, au service des patients” Rev Prescrire 2015; 35 (382): 565-569.

creado el 24 de Enero de 2024