evidências clínicas

GRADE — qualidade da evidência e força da recomendação

GRADE — Grading of Recommendations Assessment, Development and Evaluation — é o sistema mais usado no mundo para classificar a qualidade da evidência e graduar a força da recomendação em diretrizes clínicas. É adotado pela Organização Mundial da Saúde, pela Cochrane Collaboration, pelo NICE britânico, pelo USPSTF americano, pela Canadian Task Force, e por dezenas de sociedades médicas.

Sua contribuição mais importante é conceitual: separar duas coisas que muita gente confundequão confiáveis são os estudos (qualidade da evidência) e o quanto devemos agir com base neles (força da recomendação). São coisas diferentes, e perceber isso transforma a maneira como se lê uma diretriz.

Quando usar

Use GRADE quando estiver:

  • Lendo uma diretriz clínica e quiser entender por que uma recomendação é "forte" e outra "condicional"
  • Lendo o resumo de uma revisão sistemática Cochrane (que reporta avaliação GRADE)
  • Tomando uma decisão clínica em que diferentes fontes parecem dizer coisas diferentes
  • Defendendo (ou questionando) uma conduta junto a colegas ou gestores

GRADE não é ferramenta para avaliar um único artigo — é ferramenta para avaliar um corpo de evidência sobre uma pergunta. Para um artigo isolado, use CASP ou RoB.

De onde veio

O GRADE Working Group formou-se em 2000, reunindo metodologistas de várias instituições insatisfeitos com a multiplicidade de sistemas de classificação de evidência então em uso. Cada sociedade tinha o seu próprio (níveis A/B/C, I/II/III, etc.), com critérios incompatíveis e sem distinção clara entre qualidade e força.

A primeira publicação canônica foi em 2004, no BMJ1. Em 2008, uma série no BMJ consolidou o sistema2. Hoje, o handbook completo está mantido online e é referência operacional do método3.

Como funciona — duas dimensões

GRADE organiza o trabalho em duas dimensões separadas, cada uma com sua escala.

Dimensão 1: qualidade da evidência

Quão confiantes podemos estar em que o efeito estimado pelos estudos reflete o efeito verdadeiro? Quatro níveis:

Nível O que significa
Alta ⊕⊕⊕⊕ Confiança muito alta. Estudos futuros provavelmente não mudarão a estimativa.
Moderada ⊕⊕⊕⊖ Confiança razoável. Estudos futuros podem mudar a estimativa.
Baixa ⊕⊕⊖⊖ Confiança limitada. Estudos futuros provavelmente mudarão a estimativa.
Muito baixa ⊕⊖⊖⊖ Confiança muito limitada. A estimativa é incerta.

ECRs começam em alta; estudos observacionais começam em baixa. Mas o nível inicial pode subir ou descer:

Cinco fatores que rebaixam a evidência:

  1. Risco de viés nos estudos incluídos
  2. Inconsistência entre estudos (heterogeneidade não explicada)
  3. Evidência indireta (a população, intervenção ou desfecho dos estudos difere da pergunta de interesse)
  4. Imprecisão (intervalos de confiança amplos, poucos eventos)
  5. Viés de publicação (suspeita de que estudos negativos não foram publicados)

Três fatores que elevam evidência observacional:

  1. Magnitude grande do efeito (RR > 2 ou < 0,5)
  2. Gradiente dose-resposta plausível
  3. Confundidores residuais que iriam atenuar (existência de confundidores que, se controlados, tornariam o efeito ainda maior)

Dimensão 2: força da recomendação

Dado o que sabemos, devemos ou não fazer isso? Apenas dois níveis:

Força O que significa
Forte A maior parte dos pacientes deve receber a conduta. Pouco espaço para variação.
Condicional (ou fraca) A conduta deve ser considerada, mas com discussão caso a caso. Espaço amplo para preferência do paciente.

Quatro fatores determinam a força da recomendação:

  1. Qualidade da evidência (a dimensão acima)
  2. Balanço entre benefícios e danos
  3. Valores e preferências dos pacientes
  4. Custos e uso de recursos

A combinação que muitos não percebem

A grande virada conceitual do GRADE é que qualidade alta nem sempre vira recomendação forte, e qualidade baixa às vezes vira recomendação forte. Quatro combinações possíveis:

Qualidade Força Exemplo
Alta Forte Antibiótico para meningite bacteriana confirmada
Alta Condicional Aspirina em prevenção primária no idoso (benefício pequeno, dano comparável)
Baixa Forte Paraquedas em queda livre (sem ECR, mas o risco de não recomendar é evidente)
Baixa Condicional Maioria das condutas em situações pouco estudadas

Quando você vê uma recomendação de qualidade alta com força condicional — caso da aspirina em prevenção primária —, isso significa: "a evidência é robusta, mas o benefício é tão pequeno que cada paciente deve decidir conforme seus valores". É uma informação preciosa. Sem GRADE, ela ficaria escondida em "evidência nível A" sem mais explicação.

Tabela Summary of Findings

Diretrizes baseadas em GRADE apresentam os achados numa tabela Summary of Findings (SoF), com colunas padronizadas:

  • Desfecho (mortalidade, eventos cardiovasculares, etc.)
  • Risco assumido com a conduta padrão
  • Risco assumido com a intervenção
  • Diferença absoluta (com IC 95%)
  • Diferença relativa (RR ou OR)
  • Número de participantes / estudos
  • Qualidade da evidência (GRADE)
  • Comentários

A tabela é a forma mais densa e clara de apresentar evidência para decisão clínica. Aprender a lê-la rapidamente é uma das habilidades mais úteis da MBE moderna.

Exemplo aplicado

Considere um trecho da diretriz da Organização Mundial da Saúde sobre tratamento da malária não complicada por Plasmodium falciparum4. A recomendação central é o uso de terapia combinada baseada em artemisinina (ACT) como tratamento de primeira linha.

Olhando a tabela SoF da diretriz:

  • Desfecho: falha terapêutica em 28 dias
  • Risco com cloroquina: muito alto (em regiões com resistência)
  • Risco com ACT: muito baixo (~2–5%, dependendo da combinação)
  • Diferença absoluta: redução muito grande
  • Qualidade da evidência: ⊕⊕⊕⊕ alta — múltiplos ECRs de boa qualidade, alta consistência, magnitude grande do efeito
  • Força da recomendação: forte — qualidade alta + balanço fortemente favorável + custos comparáveis em programas de saúde pública

Resultado: profissionais e gestores podem implementar a recomendação com alto grau de confiança. Quase não há espaço para variação clínica.

Compare com uma recomendação condicional sobre o uso de aspirina em prevenção primária no idoso: qualidade alta, mas benefício e dano absolutos comparáveis — daí a força só condicional, com discussão individualizada.

Limitações conhecidas

  1. GRADE não é automático. Os fatores que rebaixam ou elevam evidência exigem julgamento. Dois grupos GRADE podem chegar a níveis ligeiramente diferentes para o mesmo corpo de evidência.
  2. A passagem da qualidade para a força envolve valores. O passo "balanço benefícios-danos" depende de pesos atribuídos aos desfechos, e esses pesos refletem prioridades. Diretrizes diferentes podem chegar a forças diferentes para a mesma evidência por isso.
  3. Tabelas SoF dependem de boa apresentação. Algumas diretrizes apresentam GRADE de forma confusa ou incompleta. Saber procurar pela tabela SoF é um diferencial.

Onde encontrar

  • GRADE Working Group: gradeworkinggroup.org
  • Handbook completo (online): gdt.gradepro.org/app/handbook
  • GRADEpro — software gratuito para criar tabelas SoF: gradepro.org
  • Capítulos didáticos do GRADE foram publicados em série no BMJ (2008) e no J Clin Epidemiol (a partir de 2011) — todos com texto completo livre

Conceitos relacionados

Referências

  1. Atkins D, Best D, Briss PA, et al. (GRADE Working Group). Grading quality of evidence and strength of recommendations. BMJ 2004;328(7454):1490. Disponível em: bmj.com/content/328/7454/1490.
  2. Guyatt GH, Oxman AD, Vist GE, et al. GRADE: an emerging consensus on rating quality of evidence and strength of recommendations. BMJ 2008;336(7650):924–6.
  3. Schünemann H, Brożek J, Guyatt G, Oxman A, eds. GRADE Handbook for Grading Quality of Evidence and Strength of Recommendations. The GRADE Working Group; 2013. Disponível em: gdt.gradepro.org/app/handbook.
  4. World Health Organization. Guidelines for the Treatment of Malaria. 3rd ed. Geneva: WHO; 2015 (atualizações posteriores). Disponível em: who.int.