evidências clínicas

Testes diagnósticos

Todo teste diagnóstico tem propriedades mensuráveis que determinam sua utilidade clínica: sensibilidade, especificidade, valores preditivos, razões de verossimilhança. Conhecer essas propriedades — e saber como usá-las — é diferença entre interpretar resultados corretamente e tomar decisões baseadas em impressão.

Esta página explica cada propriedade, como calcular e quando usar.

A tabela 2×2 que sustenta tudo

Toda análise de teste diagnóstico parte da comparação entre o teste em avaliação e um padrão-ouro (gold standard) — o teste de referência considerado correto.

Tem a doença Não tem a doença Total
Teste positivo a (verdadeiro positivo) b (falso positivo) a + b
Teste negativo c (falso negativo) d (verdadeiro negativo) c + d
Total a + c b + d a + b + c + d

A partir dessa tabela, calculam-se as propriedades. Vamos usar um exemplo concreto: 1.000 pacientes testados, 100 com a doença (10% de prevalência), 900 sem.

Tem a doença Não tem a doença Total
Teste positivo 87 35 122
Teste negativo 13 865 878
Total 100 900 1.000

Sensibilidade

Definição: proporção de doentes que o teste identifica corretamente. "Entre os doentes, quantos o teste pega?"

Sensibilidade = a / (a + c)

No exemplo: 87/100 = 87%. O teste detecta 87% dos doentes; 13% escapam (falsos negativos).

Interpretação: teste altamente sensível tem poucos falsos negativos. Resultado negativo, então, descarta a doença com maior segurança. Regra mnemônica: SnNoutSensitive test, when Negative, rules Out.

Quando priorizar sensibilidade: rastreamento, triagem, doenças graves cujo atraso de diagnóstico custa caro. Você prefere falsos alarmes a casos perdidos.

Especificidade

Definição: proporção de não-doentes que o teste classifica corretamente como negativos. "Entre os saudáveis, quantos o teste deixa em paz?"

Especificidade = d / (b + d)

No exemplo: 865/900 = 96%. O teste classifica corretamente 96% dos saudáveis; 4% recebem falso positivo.

Interpretação: teste altamente específico tem poucos falsos positivos. Resultado positivo, então, confirma a doença com maior segurança. Regra mnemônica: SpPinSpecific test, when Positive, rules In.

Quando priorizar especificidade: confirmação diagnóstica, antes de tratamento agressivo, em doenças cujo tratamento tem efeitos adversos sérios. Você prefere perder alguns casos a tratar quem não precisa.

O equilíbrio sensibilidade–especificidade

Não há almoço grátis. Em quase todo teste, aumentar sensibilidade reduz especificidade e vice-versa. O ponto de corte é o que controla esse equilíbrio.

Considere um teste laboratorial com escala contínua (ex.: troponina). Em ponto de corte baixo: muitos positivos detectados → sensibilidade alta, especificidade baixa (vários saudáveis falso-positivos). Em ponto de corte alto: poucos positivos → sensibilidade baixa, especificidade alta.

A escolha do ponto de corte depende do contexto clínico — não há valor universal. Por isso, leitura crítica de estudo diagnóstico precisa explicitar o ponto de corte usado e justificar.

Valor preditivo positivo (VPP)

Definição: probabilidade de realmente ter a doença dado que o teste foi positivo. "Resultado positivo — que chance tenho de fato ter isso?"

VPP = a / (a + b)

No exemplo: 87/122 = 71%.

Interpretação: entre os 122 testes positivos, 87 são verdadeiros (tem a doença) e 35 são falsos. Confiança no resultado positivo é de 71%.

Valor preditivo negativo (VPN)

Definição: probabilidade de realmente não ter a doença dado que o teste foi negativo. "Resultado negativo — que chance tenho de estar livre disso?"

VPN = d / (c + d)

No exemplo: 865/878 = 98,5%.

Interpretação: entre os 878 negativos, 865 são verdadeiros e apenas 13 são falsos. Resultado negativo é altamente confiável.

A propriedade que muda tudo: VPP e VPN dependem da prevalência

Sensibilidade e especificidade são propriedades fixas do teste, independentes do contexto. VPP e VPN, não. Eles variam conforme a prevalência da doença na população testada.

Por quê? Imagine o mesmo teste (sensibilidade 87%, especificidade 96%) aplicado em duas populações diferentes:

Cenário A — prevalência alta (10%, do exemplo acima)

  • 100 doentes, 900 sem doença em 1.000 pessoas
  • VPP = 87/122 = 71%
  • VPN = 865/878 = 98,5%

Cenário B — prevalência muito baixa (0,1%)

  • 1 doente, 999 sem doença em 1.000 pessoas
  • Verdadeiros positivos: 0,87 (≈ 1)
  • Falsos positivos: 999 × 4% = 40
  • Total positivos: ≈ 41
  • VPP = 1/41 ≈ 2,4%

O mesmo teste, com características idênticas, tem VPP de 71% num contexto e 2,4% noutro. A diferença é só a prevalência.

Contexto VPP VPN
Prevalência alta Sobe (positivo é confiável) Desce (negativo perde valor)
Prevalência baixa Cai (muitos positivos são falsos) Sobe (negativo é muito confiável)

Implicação clínica fundamental: o mesmo teste positivo significa coisas diferentes em pacientes diferentes. Pessoa de baixo risco com teste positivo tem alta probabilidade de falso positivo. Pessoa de alto risco com teste negativo tem maior risco de falso negativo.

→ Veja calculadora de testes diagnósticos para experimentar com diferentes prevalências.

Razões de verossimilhança (RV+ e RV−)

Definição: medidas que combinam sensibilidade e especificidade em um único número, indicando quanto o resultado do teste muda a probabilidade de doença. Independem da prevalência — são propriedades do teste.

Razão de verossimilhança positiva (RV+)

"Quantas vezes mais provável é o diagnóstico, dado que o teste foi positivo?"

RV+ = Sensibilidade / (1 − Especificidade)

No exemplo: RV+ = 0,87 / (1 − 0,96) = 0,87 / 0,04 = 21,75.

Resultado positivo torna a doença ~22 vezes mais provável.

Razão de verossimilhança negativa (RV−)

"Quantas vezes menos provável é o diagnóstico, dado que o teste foi negativo?"

RV− = (1 − Sensibilidade) / Especificidade

No exemplo: RV− = (1 − 0,87) / 0,96 = 0,13 / 0,96 = 0,135.

Resultado negativo torna a doença ~7 vezes menos provável (1/0,135 ≈ 7,4).

Como interpretar RV

Valor de RV+ Mudança na probabilidade
> 10 Aumento substancial — confirmação forte
5 a 10 Aumento moderado
2 a 5 Aumento pequeno
1 a 2 Aumento mínimo, raramente útil
1 Sem mudança — teste inútil
Valor de RV− Mudança na probabilidade
< 0,1 Redução substancial — descarte forte
0,1 a 0,2 Redução moderada
0,2 a 0,5 Redução pequena
0,5 a 1 Redução mínima, raramente útil
1 Sem mudança — teste inútil

Por que RV é melhor que VPP/VPN para conversa clínica

VPP e VPN dão a probabilidade pós-teste direta, mas dependem da prevalência. RV permite calcular probabilidade pós-teste a partir de qualquer probabilidade pré-teste — funciona em qualquer contexto.

Probabilidade pós-teste = Probabilidade pré-teste × RV (em odds, com correção)

Na prática, usa-se nomograma de Fagan ou calculadora.

→ A calculadora de testes diagnósticos faz esse cálculo automaticamente.

Resumo das propriedades

Propriedade Pergunta que responde Fórmula Exemplo
Sensibilidade Entre os doentes, quantos detecta? a / (a+c) 0,87
Especificidade Entre os saudáveis, quantos identifica? d / (b+d) 0,96
VPP Resultado positivo — chance real de doença? a / (a+b) 0,71
VPN Resultado negativo — chance real de saúde? d / (c+d) 0,985
RV+ Quanto positivo aumenta a probabilidade? Sens / (1−Esp) 21,75
RV− Quanto negativo diminui a probabilidade? (1−Sens) / Esp 0,135

Aplicação prática — quando escolher cada métrica

Depende do que você quer fazer:

Decisão clínica Métrica chave
Escolher teste para rastreamento Sensibilidade alta
Escolher teste para confirmação Especificidade alta
Interpretar resultado em paciente individual VPP/VPN no contexto, ou RV
Comparar acurácia de testes Curva ROC, AUC
Comunicar resultado ao paciente Probabilidade pós-teste em linguagem natural

Erros comuns

  • Confundir sensibilidade com VPP. Sensibilidade é probabilidade de teste positivo dado que tem a doença. VPP é o inverso: probabilidade de doença dado teste positivo.
  • Esquecer da prevalência. Aplicar VPP de um estudo (com prevalência X) a um paciente de contexto Y (prevalência diferente) é erro frequente.
  • Tratar teste como certeza. Mesmo teste com sensibilidade 99% tem 1% de falsos negativos. Tratar resultado como verdade absoluta ignora isso.
  • Não considerar probabilidade pré-teste. Resultado de teste muda a probabilidade — não a determina sozinho. Pessoa de baixo risco com teste positivo pode ter probabilidade pós-teste ainda baixa.
  • Usar RV+ e RV− isoladamente. O valor está em combinar com a probabilidade pré-teste para gerar probabilidade pós-teste.
  • Usar mesmo teste para rastrear e confirmar. Estratégia melhor: teste sensível para rastrear (poucos falsos negativos), teste específico para confirmar positivos (poucos falsos positivos no diagnóstico final).

Em situações reais — doação de sangue

Em bancos de sangue, doadores fazem testes muito sensíveis primeiro — a prioridade é não deixar nenhuma bolsa contaminada passar. Resultados positivos vão para teste confirmatório mais específico. Por que não fazer logo o teste específico? Porque o específico geralmente perde sensibilidade — alguns positivos verdadeiros escapariam.

Esta sequência — sensível primeiro, específico depois — é princípio geral em rastreamento e investigação inicial: detectar amplo, confirmar com precisão.

Conceitos relacionados

Referências

  1. Pewsner D, Battaglia M, Minder C, Marx A, Bucher HC, Egger M. Ruling a diagnosis in or out with "SpPIn" and "SnNOut": a note of caution. BMJ 2004;329(7459):209–13.
  2. Akobeng AK. Understanding diagnostic tests 1: sensitivity, specificity and predictive values. Acta Paediatr 2007;96(3):338–41.
  3. Akobeng AK. Understanding diagnostic tests 2: likelihood ratios, pre- and post-test probabilities. Acta Paediatr 2007;96(4):487–91.
  4. Whiting PF, Rutjes AW, Westwood ME, et al. QUADAS-2: a revised tool for the quality assessment of diagnostic accuracy studies. Ann Intern Med 2011;155(8):529–36.
  5. Sackett DL, Haynes RB, Guyatt GH, Tugwell P. Clinical Epidemiology: A Basic Science for Clinical Medicine. 2ª ed. Boston: Little, Brown; 1991.
  6. Fagan TJ. Nomogram for Bayes theorem. N Engl J Med 1975;293(5):257.