RoB 2.0 — risco de viés em ensaios clínicos randomizados
RoB 2.0 — Risk of Bias 2.0 — é a ferramenta atual da Cochrane Collaboration para avaliar risco de viés em ensaios clínicos randomizados (ECR). Substituiu, em 2019, a versão original de 2008. É a ferramenta mais técnica e mais usada em revisões sistemáticas formais; é também o padrão exigido por revistas que aceitam revisões sistemáticas.
Sua diferença para o CASP é o nível de profundidade: enquanto o CASP-RCT pergunta de forma genérica se o ensaio foi bem feito, o RoB 2.0 examina cinco domínios específicos de viés com perguntas-sinalizadoras detalhadas, levando a um julgamento estruturado domínio a domínio.
Quando usar
Use RoB 2.0 quando estiver:
- Lendo ou produzindo uma revisão sistemática ou meta-análise de ECRs
- Avaliando criticamente um ECR individual de alto impacto, especialmente para tomada de decisão importante
- Ensinando MBE em nível avançado, depois que CASP foi assimilado
- Justificando metodologicamente por que confia ou desconfia dos achados de um ensaio
Para ECR único em uso clínico cotidiano, CASP costuma bastar. RoB é a ferramenta para análise mais formal.
De onde veio
A primeira versão (RoB 1.0) foi publicada em 2008 pela Cochrane, com sete domínios e baseada em julgamento "alto/baixo/incerto". Após uma década de uso, dois problemas emergiram: alta variabilidade entre avaliadores, e domínios redundantes ou mal delimitados.
A versão 2.0, publicada em 20191, reformulou o instrumento em torno de cinco domínios bem delimitados, com perguntas-sinalizadoras específicas e algoritmo claro para chegar ao julgamento. O resultado: maior reprodutibilidade entre avaliadores e maior alinhamento com a literatura metodológica contemporânea.
Como funciona — cinco domínios
Cada domínio é avaliado com perguntas-sinalizadoras (sim, provavelmente sim, provavelmente não, não, sem informação) e termina em julgamento: baixo risco, algumas preocupações, alto risco. Os cinco domínios:
Domínio 1 — viés decorrente do processo de randomização
Pergunta central: a sequência de alocação foi gerada aleatoriamente e foi devidamente ocultada até o momento da designação?
Pontos de atenção:
- Métodos centralizados de alocação (telefone, sistema online) reduzem o risco
- Listas em envelopes selados em sequência são aceitáveis se cumpridos rigorosamente
- Alternar pacientes ou usar data de nascimento como critério não é randomização
Domínio 2 — viés por desvios da intervenção pretendida
Houve cegamento de pacientes e profissionais? Quando inviável, houve outras medidas para reduzir o efeito do conhecimento do tratamento?
Pontos de atenção:
- Cegamento perfeito é raro fora de ensaios farmacológicos
- O importante é que o conhecimento do tratamento não tenha contaminado o desfecho
- Análise por intenção de tratar é parte da resposta a este domínio
Domínio 3 — viés por dados ausentes do desfecho
Os dados estão disponíveis para quase todos os participantes? Quando há perdas, são pequenas e equilibradas entre grupos?
Pontos de atenção:
- Perdas > 20% costumam levantar preocupação
- Perdas balanceadas (mesma proporção nos dois grupos) são menos preocupantes que perdas desbalanceadas
- Análises de sensibilidade explicando como as perdas afetam o resultado são valiosas
Domínio 4 — viés na medição do desfecho
O desfecho foi medido de forma apropriada e padronizada? Avaliadores eram cegados? O desfecho é objetivo (mortalidade) ou subjetivo (qualidade de vida)?
Pontos de atenção:
- Desfechos objetivos (mortalidade, troponina) sofrem menos com falta de cegamento de avaliadores
- Desfechos subjetivos (dor relatada, qualidade de vida) sofrem mais
- Avaliadores cegos para alocação são a norma de referência
Domínio 5 — viés na seleção do resultado relatado
Os resultados relatados refletem o protocolo registrado, ou foram selecionados após análise para favorecer o achado?
Pontos de atenção:
- Comparar com o protocolo registrado em ClinicalTrials.gov ou similar
- Desfechos primários e secundários pré-especificados deveriam ser todos relatados
- "Migração de desfechos" (mudar o que era primário pelo que ficou bonito na análise) é viés clássico
O semáforo
O resultado final é frequentemente apresentado como semáforo colorido — uma figura compacta mostrando, para cada estudo, cada domínio e o julgamento global:
- Verde — baixo risco de viés
- Amarelo — algumas preocupações
- Vermelho — alto risco de viés
Em revisões sistemáticas, esse semáforo é apresentado para todos os ensaios incluídos numa figura única — visualmente, é fácil ver quais ensaios são confiáveis e quais não.
O julgamento global segue regra simples: se algum domínio é alto risco, o estudo é alto risco no global. Se nenhum é alto mas algum tem algumas preocupações, o global é "algumas preocupações". Só se todos são baixo risco, o global é baixo risco. É uma regra rigorosa — e é assim que deve ser.
Exemplo aplicado
Tomemos o DAPA-HF, ensaio publicado no NEJM em 2019, que comparou dapagliflozina vs. placebo em pacientes com insuficiência cardíaca com fração de ejeção reduzida2.
| Domínio | Julgamento | Justificativa |
|---|---|---|
| 1. Randomização | Baixo risco. Baixo | Alocação central por sistema interativo, com ocultação adequada |
| 2. Desvios da intervenção | Baixo risco. Baixo | Cegamento duplo (paciente + profissional); análise ITT |
| 3. Dados ausentes | Baixo risco. Baixo | < 5% de dados ausentes; balanceados entre grupos |
| 4. Medição do desfecho | Baixo risco. Baixo | Desfecho composto verificado por comitê adjudicador cego |
| 5. Seleção de resultados | Baixo risco. Baixo | Protocolo registrado; resultados primários e secundários alinhados |
| Global | Baixo risco. Baixo |
Resultado: o DAPA-HF tem baixo risco de viés em todos os domínios. Os achados (redução significativa de hospitalização e morte cardiovascular com dapagliflozina) são metodologicamente robustos. Combinado com magnitude grande do efeito (HR 0,74; IC95% 0,65–0,85) e replicação em ensaios subsequentes (EMPEROR-Reduced), constitui evidência de alta qualidade — daí a inclusão da classe nas diretrizes contemporâneas com força forte.
Limitações conhecidas
- Aplica-se apenas a ECRs. Para coortes e caso-controle, use a versão ROBINS-I (Risk of Bias In Non-randomized Studies of Interventions), também da Cochrane.
- Exige tempo. Avaliação completa de um ensaio com RoB 2.0, feita rigorosamente, leva 30 a 60 minutos. Para revisões com 30 ensaios, é trabalho considerável.
- Subjetividade residual. Apesar da estrutura, alguns julgamentos exigem interpretação. A recomendação Cochrane é que dois avaliadores trabalhem independentemente e resolvam discordâncias por consenso.
- Não avalia magnitude do efeito nem aplicabilidade. RoB cobre apenas validade interna. Importância clínica e validade externa exigem outras ferramentas (medidas de efeito, GRADE, julgamento clínico).
Onde encontrar
- Página oficial: methods.cochrane.org/bias
- Manual operacional (PDF): disponível na mesma página
- Excel template: Cochrane disponibiliza planilha para auxiliar avaliação
- robvis — ferramenta gratuita para gerar visualizações em semáforo: mcguinlu.shinyapps.io/robvis
Conceitos relacionados
- Appraise (Avaliar) — onde RoB se encaixa no ciclo dos 5As
- Outras ferramentas de avaliação crítica — visão geral comparativa
- CASP — alternativa mais simples para ECRs em uso pedagógico
- AMSTAR-2 — para revisões sistemáticas (não para ECRs individuais)
- Vieses e fontes de erro — fundamentação conceitual dos cinco domínios
Referências
- Sterne JAC, Savović J, Page MJ, et al. RoB 2: a revised tool for assessing risk of bias in randomised trials. BMJ 2019;366:l4898. Disponível em: bmj.com/content/366/bmj.l4898. ↩
- McMurray JJV, Solomon SD, Inzucchi SE, et al. Dapagliflozin in Patients with Heart Failure and Reduced Ejection Fraction. N Engl J Med 2019;381(21):1995–2008. ↩
- Higgins JPT, Thomas J, Chandler J, et al, eds. Cochrane Handbook for Systematic Reviews of Interventions version 6.4. Cochrane; 2023. Disponível em: training.cochrane.org/handbook.
- Sterne JA, Hernán MA, Reeves BC, et al. ROBINS-I: a tool for assessing risk of bias in non-randomised studies of interventions. BMJ 2016;355:i4919.