Capítulo 39 Ensaios experimentais
39.1 Ensaio clínico aleatorizado
39.1.1 Quais são as características de ensaios clínicos aleatorizados?
A característica essencial de um ensaio clínico aleatorizado é a comparação entre grupos.291
Quanto à unidade de alocação:292
Individual
Agrupado
Quanto ao número de braços:292
Único*
Múltiplos
Quanto ao número de centros:292
Único
Múltiplos
Quanto ao cegamento:292
Aberto*
Simples-cego
Duplo-cego
Tripo-cego
Quádruplo-cego
Quanto à alocação:292
Sem sorteio
Estratificada (centro apenas)
Estratificada
Minimizada
Estratificada e minimizada
39.2 Modelos de análise de comparação
39.2.1 Que modelos podem ser utilizados para comparações?
As abordagens compreendem a comparação da variável de desfecho medida entre os momentos antes e depois ou da sua mudança (pré - pós) entre os momentos.293
Se a média da variável é igual entre grupos no início do acompanhamento, ambas abordagens estimam o mesmo efeito. Caso contrário, o efeito será influenciado pela correlação entre as medidas antes e depois. A análise da mudança não controla para desbalanços no início do estudo.293
A abordagem mais recomendada é a análise de covariância (ANCOVA) - equação (39.1) - pois ajusta os valores pós-intervenção (\(Y_{ij}\)) aos valores pré-intervenção (\(X_{ij}\)) para cada participante (\(i\)) de cada grupo {\(Z_{ij}\)}, e portanto não é afetada pelas diferenças entre grupos no início do estudo.10,293
\[\begin{equation} \tag{39.1} Y_{ij} = \beta_0 + \beta_1 X_{ij} + \beta_2 Z_j + \epsilon_{ij} \end{equation}\]
A ANCOVA modelando seja a mudança (pré - pós: \(\Delta = X_{ij} - Y_{ij}\)) quando o desfecho no pós-tratamento parece ser o método mais efetivo considerando-se o viés de estimação dos parâmetros, a precisão das estimativas, a cobertura nominal (isto é, intervalo de confiança) e o poder do teste.294
Quando a ANCOVA - equação (39.2) - é utilizada com a mudança (pré - pós) com variável de desfecho (\(Y_{ij}\)), o coeficiente de regressão \(\beta_1\) é diminuído em 1 unidade.10,295
\[\begin{equation} \tag{39.2} (X_{ij} - Y_{ij}) = \beta_0 + \beta_1 Z_j + \epsilon_{ij} \end{equation}\]
Análise de variância (ANOVA) e modelos lineares mistos (MLM) são outras opções de métodos, embora apresentem maior variância, menor poder, e cobertura nominal comparados à ANCOVA.294
.296
.297
39.3 Comparação na linha de base
39.3.1 O que são dados na linha de base?
Dados sociodemográficos, clínicos e funcionais são coletados na linha de base sobre cada participante no momento da aleatorização.298
Os dados de linha de base são usados para caracterizar os pacientes incluídos no estudo e para mostrar que os grupos de tratamento estão bem equilibrados.298
Dados da linha de base podem ser utilizados para a aleatorização de modo a equilíbrar ou estratificar os grupos considerando alguns fatores-chave.298
Dados da linha de base podem ser utilizados como ajuste de covariável para análise do resultado por grupo de tratamento.298
39.3.2 O que é comparação entre grupos na linha de base em ensaios clínicos aleatorizados?
A comparação se refere ao teste de hipótese nula de não haver diferença (‘balanço’ ou ‘equilíbrio’) entre grupos de tratamento nas (co)variáveis na linha de base, geralmente apresentadas apenas de modo descritivo na ‘Tabela 1’.299
A interpretação isolada do P-valor da comparação entre grupos na linha de base não permite identificar as razões para eventuais diferenças.299
39.3.3 Para quê comparar grupos na linha de base em ensaios clínicos aleatorizados?
Os P-valores estão relacionados à aleatorização dos participantes em grupos.300
Em ensaios clínicos aleatorizados, a comparação de (co)variáveis na linha de base é usada para avaliar se aleatorização foi ‘bem sucedida’.300
39.3.4 Quais são as razões para diferenças entre grupos de tratamento nas (co)variáveis na linha de base?
39.3.5 Quais cenários permitem a comparação entre grupos na linha de base em ensaios clínicos aleatorizados?
Em ensaios clínicos aleatorizados agregados, os P-valores possuem interpretação diferente de estudos aleatorizados individualmente.300
Em ensaios clínicos com agrupamento, nos quais o recrutamento ocorreu após a aleatorização, os P-valores já não estão inteiramente relacionados ao processo de aleatorização, mas sim ao método de recrutamento, o que pode resultar na comparação de amostras não aleatórias.300
39.3.6 Por que não se deve comparar grupos na linha de base em ensaios clínicos aleatorizados?
A interpretação errônea dos P-valores na comparação entre grupos, na linha de base, de um ensaio clínico aleatorizado constitui a ‘falácia da Tabela 1’.169
Quando a aleatorização é bem-sucedida, a hipótese nula de diferença entre grupos na linha de base é verdadeira.301
Testes de significância estatística na linha de base avaliam a probabilidade de que as diferenças observadas possam ter ocorrido por acaso; no entanto, já sabemos - pelo delineamento do experimento - que quaisquer diferenças são causadas pelo acaso.302
39.3.7 Quais estratégias podem ser adotadas para substituir a comparação entre grupos na linha de base em ensaios clínicos aleatorizados?
Na fase de projeto: identifique as variáveis prognósticas do desfecho de acordo com a literatura.301
Na fase de análise: inclua as variáveis prognósticas nos modelos para ajuste.301
39.4 Comparação intragrupos
39.4.1 Por que não se deve comparar intragrupos (pré - pós) em ensaios clínicos aleatorizados?
- Testar por mudanças a partir da linha de base separadamente em cada grupos aleatorizados não permite concluir sobre diferenças entre grupos; não se pode fazer inferências a partir da comparação de P-valores.291
39.5 Comparação entre grupos
39.5.1 O que é comparação entre grupos em ensaios clínicos aleatorizados?
- A comparação se refere ao teste de hipótese nula de não haver diferença (‘alteração’ ou ‘mudança’) pós-tratamento entre grupos de tratamento.291
39.5.2 O que pode ser comparado entre grupos?
- Valores pós-tratamento; mudança entre linha de base e pós-tratamento; mudança percentual da linha de base.303
39.5.3 Qual é a comparação entre grupos mais adequada em ensaios clínicos aleatorizados?
Análise de covariância (ANCOVA) que analisa o pós-tratamento com a linha de base como covariável é a opção que possui maior poder estatístico.303
Mudança entre linha de base e pós-tratamento tem poder adequado apenas quando a correlação entre linha de base e pós-tratamento é alta.303
Mudança percentual da linha de base é a opção menos eficiente em termos de poder estatístico.303
39.6 Comparação de subgrupos
39.6.1 O que é comparação de subgrupos em ensaios clínicos aleatorizados?
- Análises de subgrupos podem ser realizadas para avaliar se as diferenças no resultado do tratamento (ou a falta delas) dependem de algumas características na linha de base dos pacientes.298
39.6.2 Como realizar a comparação de subgrupos em ensaios clínicos aleatorizados?
- Testes estatísticos de interação (que avaliam se um efeito de tratamento difere entre subgrupos) devem ser usados, e não apenas a inspeção dos P-valores do subgrupo. Somente se o teste de interação estatística apoiar um efeito de subgrupo as conclusões poderão ser influenciadas.298,304
39.6.3 Como interpretar a comparação de subgrupos em ensaios clínicos aleatorizados?
Análises de subgrupos devem ser consideradas de natureza exploratória e raramente elas afetam as conclusões obtidas a partir do estudo.298,304
A credibilidade das análises de subgrupos é melhor se restrita ao desfecho primário e a alguns subgrupos predefinidos e baseadas em hipóteses biologicamente plausíveis.298
Deve-se verificar se o estudo possui poder estatístico suficiente para detectar tamanhos de efeitos realistas em subgrupos e interpretar com cautela uma diferença de tratamento em um subgrupo quando a comparação global do tratamento não é significativa.298
39.7 Efeito de interação
39.7.1 Por que analisar o efeito de interação?
Em ensaios clínicos aleatorizados, o principal problema de pesquisa é se há uma diferença pré - pós maior em um grupo do que em outro(s).291
A comparação de subgrupos por meio de testes de significância de hipótese nula separados é enganosa por não testar (comparar) diretamente os tamanhos dos efeitos dos tratamentos.305
.202
39.7.2 Quando usar o termo de interação?
Análise de efeito de interação pode ser usada para testar se o efeito de um tratamento varia entre dois ou mais subgrupos de indivíduos, ou seja, se um efeito é modificado pelo(s) outros(s) efeito(s).203
A interação entre duas (ou mais) variáveis pode ser utilizada para comparar efeitos do tratamento em subgrupos de ensaios clínicos.306
O poder estatístico para detectar efeitos de interação é limitado.306
39.8 Ajuste de covariáveis
39.8.1 Quais variáveis devem ser utilizadas no ajuste de covariáveis?
- A escolha das características de linha de base pelas quais uma análise é ajustada deve ser determinada pelo conhecimento prévio de uma possível influência no resultado, em vez da evidência de desequilíbrio entre os grupos de tratamento no estudo.301
39.8.2 Quais os benefícios do ajuste de covariáveis?
Ajustar por covariáveis ajuda a estimar os efeitos do tratamento para o indivíduo, assim como aumenta a eficiência dos testes para hipótese nula e a validade externa do estudo.307
Incluir a variável de desfecho medida na linha de base como covariável - independentemente de a análise ser realizada com a medida pós-tratamento da mesma variável ou a diferença para a linha de base - pode aumentar o poder estatístico do estudo.308
Incluir outras variáveis medidas na linha de base, com potencial para serem desbalanceadas entre grupos após a aleatorização, diminui a chance de afetar as estimativas de efeito dos tratamentos.308
39.8.3 Quais os riscos do ajuste de covariáveis?
Incluir covariáveis que não são prognósticas do desfecho pode reduzir o poder estatístico do estudo.308
Incluir covariáveis com dados perdidos pode reduzir o tamanho amostral e consequentemente o poder estatístico do estudo (análise de casos completos) ou levar a desvios do plano de análise por exclusão de covariáveis prognósticas.308
39.9 Imputação de dados perdidos
39.9.1 Como lidar com os dados perdidos em desfechos?
Em dados longitudinais com um pequeno número de ‘ondas’ (medidas repetidas) e poucas variáveis, para análise com modelos de regressão univariados, a imputação paramétrica via especificação condicional completa - também conhecido como imputação multivariada por equações encadeadas (multivariate imputation by chained equations, MICE) - é eficiente do ponto de vista computacional e possui acurácia e precisão para estimação de parâmetros.83,309
Para dados perdidos em desfechos dicotômicos, o desempenho dos métodos de imputação multivariada por equações encadeadas (multivariate imputation by chained equations, MICE)90 e por correspondência média preditiva (predictive mean matching, PMM)91,92 é similar.89
39.9.2 Como lidar com os dados perdidos em covariáveis?
- Imputação de dados perdidos de uma covariável pela média dos dados do respectivo grupo permite estimativas não enviesadas dos efeitos do tratamento, preserva o erro tipo I e aumenta o poder estatístico comparado à análise de dados completos.308
Os pacotes mice90 e miceadds93 fornecem funções mice e mi.anova para imputação multivariada por equações encadeadas, respectivamente, para imputação de dados.
39.10 Diretrizes para redação
39.10.1 Quais são as diretrizes para redação de ensaios experimentais?
Visite a rede Enhancing the QUAlity and Transparency Of health Research EQUATOR Network para encontrar diretrizes específicas para cada tipo de ensaio experimental.
CONSORT 2010 Statement: updated guidelines for reporting parallel group randomised trials:310 https://www.equator-network.org/reporting-guidelines/consort/
O pacote consort311 fornece a função consort_plot para elaboração do fluxograma de ensaios experimentais no formato padrão.