evidências clínicas

RoB 2.0 — risco de viés em ensaios clínicos randomizados

RoB 2.0 — Risk of Bias 2.0 — é a ferramenta atual da Cochrane Collaboration para avaliar risco de viés em ensaios clínicos randomizados (ECR). Substituiu, em 2019, a versão original de 2008. É a ferramenta mais técnica e mais usada em revisões sistemáticas formais; é também o padrão exigido por revistas que aceitam revisões sistemáticas.

Sua diferença para o CASP é o nível de profundidade: enquanto o CASP-RCT pergunta de forma genérica se o ensaio foi bem feito, o RoB 2.0 examina cinco domínios específicos de viés com perguntas-sinalizadoras detalhadas, levando a um julgamento estruturado domínio a domínio.

Quando usar

Use RoB 2.0 quando estiver:

  • Lendo ou produzindo uma revisão sistemática ou meta-análise de ECRs
  • Avaliando criticamente um ECR individual de alto impacto, especialmente para tomada de decisão importante
  • Ensinando MBE em nível avançado, depois que CASP foi assimilado
  • Justificando metodologicamente por que confia ou desconfia dos achados de um ensaio

Para ECR único em uso clínico cotidiano, CASP costuma bastar. RoB é a ferramenta para análise mais formal.

De onde veio

A primeira versão (RoB 1.0) foi publicada em 2008 pela Cochrane, com sete domínios e baseada em julgamento "alto/baixo/incerto". Após uma década de uso, dois problemas emergiram: alta variabilidade entre avaliadores, e domínios redundantes ou mal delimitados.

A versão 2.0, publicada em 20191, reformulou o instrumento em torno de cinco domínios bem delimitados, com perguntas-sinalizadoras específicas e algoritmo claro para chegar ao julgamento. O resultado: maior reprodutibilidade entre avaliadores e maior alinhamento com a literatura metodológica contemporânea.

Como funciona — cinco domínios

Cada domínio é avaliado com perguntas-sinalizadoras (sim, provavelmente sim, provavelmente não, não, sem informação) e termina em julgamento: baixo risco, algumas preocupações, alto risco. Os cinco domínios:

Domínio 1 — viés decorrente do processo de randomização

Pergunta central: a sequência de alocação foi gerada aleatoriamente e foi devidamente ocultada até o momento da designação?

Pontos de atenção:

  • Métodos centralizados de alocação (telefone, sistema online) reduzem o risco
  • Listas em envelopes selados em sequência são aceitáveis se cumpridos rigorosamente
  • Alternar pacientes ou usar data de nascimento como critério não é randomização

Domínio 2 — viés por desvios da intervenção pretendida

Houve cegamento de pacientes e profissionais? Quando inviável, houve outras medidas para reduzir o efeito do conhecimento do tratamento?

Pontos de atenção:

  • Cegamento perfeito é raro fora de ensaios farmacológicos
  • O importante é que o conhecimento do tratamento não tenha contaminado o desfecho
  • Análise por intenção de tratar é parte da resposta a este domínio

Domínio 3 — viés por dados ausentes do desfecho

Os dados estão disponíveis para quase todos os participantes? Quando há perdas, são pequenas e equilibradas entre grupos?

Pontos de atenção:

  • Perdas > 20% costumam levantar preocupação
  • Perdas balanceadas (mesma proporção nos dois grupos) são menos preocupantes que perdas desbalanceadas
  • Análises de sensibilidade explicando como as perdas afetam o resultado são valiosas

Domínio 4 — viés na medição do desfecho

O desfecho foi medido de forma apropriada e padronizada? Avaliadores eram cegados? O desfecho é objetivo (mortalidade) ou subjetivo (qualidade de vida)?

Pontos de atenção:

  • Desfechos objetivos (mortalidade, troponina) sofrem menos com falta de cegamento de avaliadores
  • Desfechos subjetivos (dor relatada, qualidade de vida) sofrem mais
  • Avaliadores cegos para alocação são a norma de referência

Domínio 5 — viés na seleção do resultado relatado

Os resultados relatados refletem o protocolo registrado, ou foram selecionados após análise para favorecer o achado?

Pontos de atenção:

  • Comparar com o protocolo registrado em ClinicalTrials.gov ou similar
  • Desfechos primários e secundários pré-especificados deveriam ser todos relatados
  • "Migração de desfechos" (mudar o que era primário pelo que ficou bonito na análise) é viés clássico

O semáforo

O resultado final é frequentemente apresentado como semáforo colorido — uma figura compacta mostrando, para cada estudo, cada domínio e o julgamento global:

  • Verde — baixo risco de viés
  • Amarelo — algumas preocupações
  • Vermelho — alto risco de viés

Em revisões sistemáticas, esse semáforo é apresentado para todos os ensaios incluídos numa figura única — visualmente, é fácil ver quais ensaios são confiáveis e quais não.

O julgamento global segue regra simples: se algum domínio é alto risco, o estudo é alto risco no global. Se nenhum é alto mas algum tem algumas preocupações, o global é "algumas preocupações". Só se todos são baixo risco, o global é baixo risco. É uma regra rigorosa — e é assim que deve ser.

Exemplo aplicado

Tomemos o DAPA-HF, ensaio publicado no NEJM em 2019, que comparou dapagliflozina vs. placebo em pacientes com insuficiência cardíaca com fração de ejeção reduzida2.

Domínio Julgamento Justificativa
1. Randomização Baixo risco. Baixo Alocação central por sistema interativo, com ocultação adequada
2. Desvios da intervenção Baixo risco. Baixo Cegamento duplo (paciente + profissional); análise ITT
3. Dados ausentes Baixo risco. Baixo < 5% de dados ausentes; balanceados entre grupos
4. Medição do desfecho Baixo risco. Baixo Desfecho composto verificado por comitê adjudicador cego
5. Seleção de resultados Baixo risco. Baixo Protocolo registrado; resultados primários e secundários alinhados
Global Baixo risco. Baixo

Resultado: o DAPA-HF tem baixo risco de viés em todos os domínios. Os achados (redução significativa de hospitalização e morte cardiovascular com dapagliflozina) são metodologicamente robustos. Combinado com magnitude grande do efeito (HR 0,74; IC95% 0,65–0,85) e replicação em ensaios subsequentes (EMPEROR-Reduced), constitui evidência de alta qualidade — daí a inclusão da classe nas diretrizes contemporâneas com força forte.

Limitações conhecidas

  1. Aplica-se apenas a ECRs. Para coortes e caso-controle, use a versão ROBINS-I (Risk of Bias In Non-randomized Studies of Interventions), também da Cochrane.
  2. Exige tempo. Avaliação completa de um ensaio com RoB 2.0, feita rigorosamente, leva 30 a 60 minutos. Para revisões com 30 ensaios, é trabalho considerável.
  3. Subjetividade residual. Apesar da estrutura, alguns julgamentos exigem interpretação. A recomendação Cochrane é que dois avaliadores trabalhem independentemente e resolvam discordâncias por consenso.
  4. Não avalia magnitude do efeito nem aplicabilidade. RoB cobre apenas validade interna. Importância clínica e validade externa exigem outras ferramentas (medidas de efeito, GRADE, julgamento clínico).

Onde encontrar

  • Página oficial: methods.cochrane.org/bias
  • Manual operacional (PDF): disponível na mesma página
  • Excel template: Cochrane disponibiliza planilha para auxiliar avaliação
  • robvis — ferramenta gratuita para gerar visualizações em semáforo: mcguinlu.shinyapps.io/robvis

Conceitos relacionados

Referências

  1. Sterne JAC, Savović J, Page MJ, et al. RoB 2: a revised tool for assessing risk of bias in randomised trials. BMJ 2019;366:l4898. Disponível em: bmj.com/content/366/bmj.l4898.
  2. McMurray JJV, Solomon SD, Inzucchi SE, et al. Dapagliflozin in Patients with Heart Failure and Reduced Ejection Fraction. N Engl J Med 2019;381(21):1995–2008.
  3. Higgins JPT, Thomas J, Chandler J, et al, eds. Cochrane Handbook for Systematic Reviews of Interventions version 6.4. Cochrane; 2023. Disponível em: training.cochrane.org/handbook.
  4. Sterne JA, Hernán MA, Reeves BC, et al. ROBINS-I: a tool for assessing risk of bias in non-randomised studies of interventions. BMJ 2016;355:i4919.