evidências clínicas

Ferramentas de avaliação crítica

Avaliar criticamente um estudo é, em essência, fazer perguntas certas em ordem certa. Décadas de prática produziram ferramentas que estruturam essas perguntas — checklists, escalas, rubricas — para que ninguém precise reinventar o caminho. Quatro delas dominam a prática contemporânea e estão em uso em diretrizes, revisões sistemáticas e formação de profissionais de saúde no mundo inteiro.

Esta página é uma comparação rápida. Use-a para escolher a ferramenta certa antes de mergulhar em qualquer uma. Cada ferramenta tem página dedicada, com exemplo de aplicação e onde encontrá-la em português.

Comparação rápida

Ferramenta Para que serve Quem mantém Quando usar
CASP Checklists para avaliar diferentes desenhos de estudo CASP UK Avaliação geral, especialmente em ensino
RoB 2.0 Risco de viés em ensaios clínicos randomizados Cochrane Quando você lê ou produz revisão sistemática de ECRs
AMSTAR-2 Qualidade metodológica de revisões sistemáticas AMSTAR Group Antes de confiar numa revisão sistemática
GRADE Qualidade da evidência e força da recomendação GRADE Working Group Em diretrizes, para entender o quão forte é uma recomendação

Qual ferramenta usar para o quê

A escolha depende do que você tem em mãos:

  • Tenho um ensaio clínico individual → CASP (visão geral) ou RoB 2.0 (mais técnico)
  • Tenho uma revisão sistemática → AMSTAR-2 (qualidade da revisão) + checagem do GRADE da evidência (qualidade dos achados)
  • Tenho uma diretriz clínica → leitura crítica via GRADE (qualidade + força)
  • Tenho um estudo de coorte ou caso-controle → CASP (tem checklist específico para cada)
  • Tenho um estudo qualitativo → CASP qualitativa
  • Tenho um estudo de teste diagnóstico → CASP teste diagnóstico, ou QUADAS-2 para versão mais técnica

Princípios comuns às quatro

Apesar das diferenças, as quatro ferramentas convergem em alguns princípios:

1. Foco em domínios, não em pontuações. As versões modernas (RoB 2.0, AMSTAR-2, GRADE) abandonaram pontuações somatórias por avaliação domínio a domínio. A razão: um estudo com risco baixo de viés em quatro domínios e alto em um domínio crítico não é "moderado" — é alto risco.

2. Distinção entre qualidade da evidência e qualidade do estudo. Não é a mesma coisa. Um estudo individual pode ser metodologicamente impecável mas, sozinho, não constituir evidência forte para uma recomendação. GRADE deixa essa distinção explícita.

3. Transparência em vez de oráculo. As ferramentas servem para você expor seu raciocínio, não para entregar um veredito automatizado. Dois avaliadores treinados podem chegar a julgamentos ligeiramente diferentes para o mesmo estudo — e isso é normal, contanto que cada um justifique seu juízo.

4. Adaptação ao contexto. Nenhuma ferramenta substitui o julgamento clínico sobre aplicabilidade. Validade interna é universal; aplicabilidade é local.

Quando usar mais de uma

Em muitos casos, as ferramentas se complementam:

  • Lendo uma revisão Cochrane sobre o tratamento de uma doença: AMSTAR-2 para a qualidade da revisão; depois examinar o GRADE da evidência conforme apresentado pelos próprios autores.
  • Lendo um artigo isolado de ECR: CASP para visão geral; RoB 2.0 para análise técnica do risco de viés.
  • Avaliando uma diretriz internacional: examinar o GRADE de cada recomendação; rastrear até as revisões sistemáticas que sustentam as recomendações e aplicar AMSTAR-2 a elas.

A combinação aumenta a confiança no julgamento e expõe lacunas que uma ferramenta isolada esconderia.

Onde estudar

Os textos canônicos de aprofundamento estão nas referências de cada página dedicada.

Conceitos relacionados