Pirâmide de evidências — hierarquia dos desenhos de estudo

A pirâmide de evidências é uma representação visual que hierarquiza desenhos de estudo pela força da evidência que produzem. Na base, opiniões e relatos de caso. No topo, revisões sistemáticas e meta-análises. É uma das imagens mais difundidas da MBE — e também uma das mais simplificadoras.

Conhecer a pirâmide é ponto de partida. Conhecer suas limitações é ponto de partida da prática crítica madura.

A pirâmide clássica

A versão tradicional, ensinada em escolas médicas no mundo inteiro, organiza desenhos em seis níveis:

Nível	Desenho	O que produz
6	Revisões sistemáticas e meta-análises	Síntese crítica de múltiplos estudos primários
5	Ensaios clínicos randomizados (ECRs)	Comparação direta entre intervenção e controle, com aleatorização
4	Estudos de coorte	Acompanhamento prospectivo de exposição a desfecho
3	Estudos caso-controle	Comparação retrospectiva de casos com controles
2	Estudos transversais e séries de casos	Observação em ponto único no tempo
1	Opinião de especialistas, relatos de caso	Experiência individual sem estrutura comparativa

A lógica: quanto mais alto na pirâmide, melhor o controle de viés, e maior a confiança no efeito estimado. Revisões sistemáticas combinam múltiplos estudos; ECRs minimizam confundimento por aleatorização; observacionais são vulneráveis a confundimento residual; opinião não tem comparador estruturado.

Essa hierarquia é útil para uma decisão rápida ao olhar um artigo: "esse estudo é de que tipo?" já antecipa o quão confiável tende a ser a evidência.

Por que a pirâmide é útil

Três funções práticas:

1. Atalho cognitivo na busca. Diante de muitas opções na lista de resultados do PubMed, a pirâmide ajuda a priorizar leitura — começar pelas revisões sistemáticas e meta-análises antes de descer para estudos primários.

2. Critério rápido de confiabilidade. Estudo isolado sobre tema controverso? Provavelmente uma revisão sistemática já existe. Sintetizou múltiplos estudos.

3. Linguagem comum. Falar em "evidência nível 1B" ou "topo da pirâmide" comunica entre profissionais que conhecem o vocabulário.

Por que a pirâmide engana

Cinco limitações sérias:

1. Nem todo ECR é melhor que toda coorte

Um ECR pequeno, mal cegado, com perdas grandes, pode ter menos validade que uma coorte prospectiva grande, bem desenhada. A qualidade individual do estudo importa mais que o desenho nominal.

A pirâmide assume que cada nível é homogêneo internamente — não é. Há ECRs ruins e coortes excelentes. Por isso ferramentas como RoB 2.0, AMSTAR-2 e GRADE avaliam cada estudo específico, não apenas seu desenho.

2. Revisões sistemáticas não são automaticamente confiáveis

Uma meta-análise ruim, baseada em estudos primários frágeis, pode dar a falsa impressão de robustez por "ser revisão sistemática". GRADE e AMSTAR-2 existem justamente para avaliar a qualidade da síntese — não a posição na pirâmide.

3. Para algumas perguntas, ECR é impossível ou inadequado

Pergunta sobre prognóstico de doença rara? Coorte é o desenho apropriado. Pergunta sobre exposição ambiental? ECR não é factível. Pergunta sobre acurácia diagnóstica? Estudo de teste diagnóstico, não ECR.

A pirâmide implica que ECR é sempre superior. Não é. O melhor desenho depende da pergunta.

4. Estudos qualitativos não cabem na hierarquia

Pesquisa sobre experiência de adoecimento, barreiras à adesão, percepção de risco — perguntas qualitativas — produzem evidência valiosa que não encaixa na pirâmide. Tratar "qualitativo" como base da pirâmide é desconhecer sua função distinta.

5. A pirâmide ignora o contexto

ECR conduzido em centros terciários da Europa pode ter resultados que não se aplicam à atenção primária em Cabinda. Validade externa não é capturada pela pirâmide — exige julgamento clínico (parte do quarto A: Apply).

A pirâmide nova de Murad (2016)

Reconhecendo essas limitações, Mohammad Murad e colaboradores propuseram em 2016 uma pirâmide atualizada¹. Três modificações principais:

1. Linhas onduladas em vez de horizontais. Mostra que a fronteira entre níveis é fluida — um ECR mal feito pode "descer" para o nível das observacionais; uma coorte excepcionalmente bem feita pode "subir" para o nível dos ECRs.

2. Revisões sistemáticas removidas do topo. Em vez disso, são representadas como uma lente através da qual se examinam os outros níveis. Uma revisão é tão boa quanto os estudos que sintetiza — e tão má quanto sua metodologia permite.

3. Reconhecimento explícito da heterogeneidade interna. Cada nível inclui estudos de qualidade muito variável.

A pirâmide nova é mais honesta. Mas é também mais difícil de ensinar e de usar como atalho. A clássica continua útil para iniciantes; a nova, para quem já entende as armadilhas.

Onde cada desenho se encaixa

Para diferentes tipos de pergunta, o desenho ótimo varia:

Pergunta	Desenho ideal
Tratamento funciona?	ECR ou revisão sistemática de ECRs
Prognóstico de uma doença?	Coorte prospectiva (com seguimento longo)
Causa de uma doença?	Caso-controle (para doenças raras) ou coorte (para exposições raras)
Acurácia de um teste diagnóstico?	Estudo de teste diagnóstico com padrão-ouro
Frequência de uma condição?	Estudo transversal
Experiência de pacientes?	Estudos qualitativos (não cabem na pirâmide)
Recomendação clínica formal?	Diretriz baseada em revisão sistemática + GRADE

→ Aprofunde-se em desenhos de estudo.

Como usar a pirâmide na prática

Recomendações pragmáticas:

1. Use como atalho de priorização, não como critério único. Ao localizar resultados, comece pelo nível mais alto disponível — mas avalie cada estudo com ferramentas formais antes de confiar nele.

2. Não despreze observacionais. Para muitas perguntas, são o melhor que existe. Boas coortes informam decisão clínica em áreas onde ECR não é factível.

3. Cuidado com revisões sistemáticas frágeis. Aplique AMSTAR-2 antes de confiar.

4. Combine pirâmide com estratégia 6S de Haynes. A 6S organiza fontes; a pirâmide organiza desenhos. As duas se complementam.

5. Lembre que o topo da pirâmide ainda exige aplicação ao paciente. Mesmo a melhor revisão sistemática não substitui o julgamento clínico no Apply.

Erros comuns

Tratar a pirâmide como hierarquia rígida. "É ECR, então é confiável" — ignora qualidade do estudo individual.
Despreciar caso-controle ou transversal por princípio. Para muitas perguntas, são apropriados e não há melhor.
Confundir "topo da pirâmide" com "verdade". Topo é melhor controle de viés, não certeza absoluta.
Aplicar pirâmide a perguntas qualitativas. Não cabe — perguntas qualitativas precisam de outros critérios de qualidade.
Ignorar a aplicabilidade. Validade externa não está na pirâmide; é trabalho do julgamento clínico no Apply.

Conceitos relacionados

Desenhos de estudo — cada nível da pirâmide em detalhe
Acquire (Buscar) — onde a pirâmide guia priorização de leitura
Vieses — controle de viés é o que justifica a hierarquia
GRADE — avaliação que vai além da pirâmide
RoB 2.0 — qualidade dentro do nível "ECR"
AMSTAR-2 — qualidade dentro do nível "revisão sistemática"

Referências

Murad MH, Asi N, Alsawas M, Alahdab F. New evidence pyramid. BMJ Evid Based Med 2016;21(4):125–7. Disponível em: ebm.bmj.com/content/21/4/125. ↩
Guyatt G, Rennie D, Meade MO, Cook DJ. Users' Guides to the Medical Literature: A Manual for Evidence-Based Clinical Practice. 3ª ed. New York: McGraw-Hill; 2014.
DiCenso A, Bayley L, Haynes RB. Accessing pre-appraised evidence: fine-tuning the 5S model into a 6S model. Evid Based Nurs 2009;12(4):99–101.
Greenhalgh T. How to Read a Paper: The Basics of Evidence-Based Medicine and Healthcare. 6ª ed. Hoboken: Wiley-Blackwell; 2019.

Aparência

Tamanho do texto

Estilo da fonte