evidências clínicas

Desenhos de estudo

Cada desenho de estudo responde a um tipo de pergunta. Conhecer os principais — e saber quando cada um se aplica — é o que separa leitura crítica de leitura passiva. ECR não é sempre o melhor desenho; coorte não é sempre inferior; relato de caso tem função específica que não cabe a nenhum dos outros.

Esta página descreve os desenhos mais frequentes na literatura clínica.

Visão geral

Desenho Direção temporal Pergunta que responde melhor
Relato de caso / série de casos Descritivo "Existe?" — observação que gera hipótese
Estudo transversal Ponto único no tempo "Quanto?" — prevalência
Estudo caso-controle Retrospectivo "Por que aconteceu?" — etiologia, especialmente para doenças raras
Estudo de coorte Prospectivo (geralmente) "O que vai acontecer?" — prognóstico, incidência, fatores de risco
Ensaio clínico randomizado (ECR) Prospectivo, intervencional "Funciona?" — eficácia/efetividade de intervenção
Revisão sistemática / meta-análise Síntese "O que a literatura como um todo mostra?"

A direção temporal importa: estudos retrospectivos olham para trás; prospectivos para frente; transversais capturam um momento. O tipo de pergunta determina o desenho apropriado.

Relato de caso e série de casos

O que é: descrição detalhada de um paciente único (relato de caso) ou de um pequeno conjunto de pacientes (série de casos). Sem grupo de comparação, sem cálculo de risco.

Quando é útil:

  • Identificar condição nova ou rara
  • Documentar apresentação atípica
  • Gerar hipóteses para estudos futuros
  • Ensinar — casos didáticos preservam complexidade clínica que números agregados perdem

Limitações:

  • Sem comparador, não estabelece causalidade
  • Susceptível a viés de seleção (publicam-se os casos interessantes)
  • Não permite cálculo de incidência ou prevalência

Posição na pirâmide: base. Mas vale notar que descobertas históricas importantes começaram em relatos de caso — incluindo SIDA, talidomida e doença de Lyme.

Estudo transversal

O que é: investigação que coleta informações sobre exposição e desfecho simultaneamente, num ponto único no tempo.

Quando é útil:

  • Estimar prevalência de condições
  • Identificar associações que merecem investigação posterior
  • Pesquisas de saúde pública, censos sanitários

Limitações:

  • Não estabelece direção causal (a exposição precedeu o desfecho?)
  • Sujeito a viés de duração-prevalência (condições crônicas com longa duração ficam super-representadas)

Exemplo: pesquisa nacional de saúde mede simultaneamente, em 30.000 adultos, presença de hipertensão, IMC, atividade física e renda. Estima a prevalência e identifica associações.

→ Mais sobre prevalência em medidas de frequência.

Estudo caso-controle

O que é: seleciona-se um grupo com a doença (casos) e outro sem a doença (controles); investiga-se retrospectivamente se houve diferença de exposição.

Quando é útil:

  • Doenças raras — se a doença é rara, esperar uma coorte teria seguimento longo demais
  • Investigação inicial de fatores de risco
  • Estudos de surto

Vantagens:

  • Eficiente para doenças raras
  • Tempo de execução curto
  • Custo relativamente baixo

Limitações:

  • Susceptível a viés de recordação (casos lembram melhor da exposição que controles)
  • Difícil escolher controles realmente comparáveis
  • Não calcula risco absoluto nem incidência — só odds ratio
  • Ordem temporal nem sempre clara

Exemplo clássico: Doll e Hill (1950) compararam pacientes com câncer de pulmão (casos) com pacientes hospitalizados sem câncer (controles), descobrindo associação forte com tabagismo. Estudo seminal — mas a confirmação definitiva veio depois com coortes.

Estudo de coorte

O que é: acompanha-se um grupo de pessoas (a "coorte") ao longo do tempo, registrando exposições e desfechos. Pode ser prospectivo (acompanhamento começa no presente, segue para o futuro) ou retrospectivo (usa registros já existentes para reconstruir o passado).

Quando é útil:

  • Prognóstico — qual a evolução natural de uma condição?
  • Incidência — qual a taxa de novos casos?
  • Fatores de risco quando a exposição é comum
  • Quando ECR não é factível (exposições nocivas, contextos não-randomizáveis)

Vantagens:

  • Calcula incidência e risco absoluto
  • Direção temporal clara (exposição precede desfecho)
  • Permite múltiplos desfechos para mesma exposição
  • Menos sujeito a viés de recordação que caso-controle

Limitações:

  • Tempo de seguimento longo (anos a décadas)
  • Custo alto
  • Perdas de seguimento podem distorcer resultados (viés de perda)
  • Confundimento residual mesmo com bom controle estatístico

Exemplos clássicos: Framingham Heart Study (acompanha residentes de Framingham, Massachusetts, desde 1948) gerou a maior parte do que sabemos hoje sobre fatores de risco cardiovascular.

Ensaio clínico randomizado (ECR)

O que é: participantes são alocados aleatoriamente para receber a intervenção ou um comparador. Acompanhamento prospectivo. A randomização é o que distingue ECR de coorte intervencional — ela distribui fatores de confundimento (conhecidos e desconhecidos) igualmente entre os grupos.

Quando é útil:

  • Avaliar eficácia ou efetividade de uma intervenção
  • Quando a alocação aleatória é eticamente possível
  • Quando o tamanho do efeito esperado é detectável com amostra factível

Vantagens:

  • Único desenho que controla confundimento desconhecido (via randomização)
  • Direção causal clara
  • Estimativas de efeito mais confiáveis que observacionais

Limitações:

  • Pode ser inviável (eticamente, logisticamente)
  • Custo alto
  • Validade externa frequentemente limitada (populações selecionadas, contextos especiais)
  • Não captura efeitos raros ou tardios em prazo razoável

Detalhes que importam para qualidade:

  • Ocultação da alocação — quem recruta o paciente não sabe para qual grupo ele será alocado, evitando manipulação consciente ou inconsciente
  • Cegamento — pacientes, profissionais e avaliadores não sabem quem recebeu a intervenção
  • Análise por intenção de tratar — todos os randomizados são analisados no grupo original, mesmo se não completaram

→ Avaliação formal de qualidade de ECR: RoB 2.0.

Variações do ECR

  • Ensaio cruzado (crossover) — cada participante recebe ambas as intervenções em períodos consecutivos. Útil para condições crônicas estáveis.
  • Ensaio fatorial — testa duas intervenções simultaneamente, em arranjo 2×2.
  • Cluster-randomizado — randomiza grupos (escolas, hospitais, comunidades) em vez de indivíduos. Útil quando intervenções afetam o coletivo.
  • Ensaio pragmático — desenhado para refletir a prática real, com critérios de inclusão amplos e desfechos clinicamente relevantes.
  • Ensaio explanatório — desenhado para máximo controle, em condições ideais. Resposta à pergunta "pode funcionar?", não "funciona na prática?".
  • Ensaio de não-inferioridade — testa se nova intervenção não é pior que a padrão por margem clinicamente irrelevante.
  • Ensaio adaptativo — modificações pré-especificadas no decorrer do estudo (ex.: análise interina que pode parar o estudo cedo).

Revisão sistemática e meta-análise

O que é: revisão sistemática sintetiza estudos primários sobre uma pergunta específica, com método explícito de busca, seleção e avaliação. Meta-análise é a combinação estatística dos resultados (quando apropriada).

Quando é útil:

  • Síntese de evidência sobre tema com múltiplos estudos primários
  • Quando estudos individuais têm conclusões aparentemente conflitantes
  • Suporte a diretrizes clínicas

Vantagens:

  • Aumenta poder estatístico ao combinar amostras
  • Examina consistência entre estudos
  • Reduz viés de seleção (se a busca for completa)
  • Pode detectar viés de publicação (com funnel plot e testes formais)

Limitações:

  • Qualidade da síntese depende da qualidade dos estudos primários
  • Heterogeneidade clínica entre estudos pode tornar combinação inadequada
  • Sujeita a viés de publicação se literatura cinzenta não for buscada

→ Avaliação formal de qualidade: AMSTAR-2.

Estudo de teste diagnóstico

O que é: desenho específico para avaliar a acurácia de um teste. Aplica-se o teste em um grupo de pessoas e compara-se com um padrão-ouro (gold standard) — o teste de referência.

Quando é útil:

  • Validar novo teste diagnóstico
  • Comparar acurácia entre testes
  • Estudar performance em diferentes prevalências

Métricas produzidas:

  • Sensibilidade — proporção de doentes que o teste identifica
  • Especificidade — proporção de não-doentes que o teste exclui
  • Valor preditivo positivo (VPP) — probabilidade de doença dado teste positivo (depende da prevalência)
  • Valor preditivo negativo (VPN) — probabilidade de não-doença dado teste negativo
  • Razão de verossimilhança positiva e negativa (RV+ e RV−) — quanto o teste muda a probabilidade pré-teste

→ Calcule esses valores em calculadora de testes diagnósticos.

Avaliação formal: ferramenta QUADAS-2 é o padrão para avaliar risco de viés em estudos diagnósticos.

Como escolher o desenho ao ler um artigo

Ao receber um artigo para avaliar criticamente, três passos rápidos:

  1. Identifique o desenho — geralmente declarado nos métodos, mas vale verificar (ECRs precisam de randomização documentada; coortes precisam de seguimento; etc.)
  2. Avalie se o desenho é apropriado para a pergunta — pergunta de prognóstico em ECR? Suspeito. Pergunta de eficácia em série de casos? Insuficiente.
  3. Aplique a ferramenta apropriada — RoB para ECR, AMSTAR-2 para revisão sistemática, QUADAS-2 para teste diagnóstico, escala apropriada para coorte ou caso-controle (Newcastle-Ottawa, por exemplo).

Erros comuns

  • Confundir desenho com qualidade. ECR ruim pode ser pior que coorte excelente.
  • Descartar caso-controle por princípio. Para doenças raras, é o melhor que existe.
  • Achar que retrospectivo = ruim. Coorte retrospectiva bem feita pode ser excelente.
  • Confundir cegamento com mascaramento da randomização. São coisas diferentes — randomização oculta antes da alocação; cegamento mantido durante o estudo.
  • Aplicar ECR a perguntas inadequadas. Pergunta sobre prognóstico, etiologia ambiental ou experiência subjetiva pede outros desenhos.
  • Tratar série de casos como evidência fraca por princípio. Para condições novas ou raras, gera hipóteses que viram pesquisa formal depois.

Conceitos relacionados

Referências

  1. Grimes DA, Schulz KF. An overview of clinical research: the lay of the land. Lancet 2002;359(9300):57–61.
  2. Rothman KJ, Greenland S, Lash TL. Modern Epidemiology. 4ª ed. Philadelphia: Lippincott Williams & Wilkins; 2021.
  3. Higgins JPT, Thomas J, Chandler J, et al, eds. Cochrane Handbook for Systematic Reviews of Interventions version 6.4. Cochrane; 2023. Disponível em: training.cochrane.org/handbook.
  4. Whiting PF, Rutjes AW, Westwood ME, et al. QUADAS-2: a revised tool for the quality assessment of diagnostic accuracy studies. Ann Intern Med 2011;155(8):529–36.
  5. Sterne JA, Hernán MA, Reeves BC, et al. ROBINS-I: a tool for assessing risk of bias in non-randomised studies of interventions. BMJ 2016;355:i4919.