Testes diagnósticos
Todo teste diagnóstico tem propriedades mensuráveis que determinam sua utilidade clínica: sensibilidade, especificidade, valores preditivos, razões de verossimilhança. Conhecer essas propriedades — e saber como usá-las — é diferença entre interpretar resultados corretamente e tomar decisões baseadas em impressão.
Esta página explica cada propriedade, como calcular e quando usar.
A tabela 2×2 que sustenta tudo
Toda análise de teste diagnóstico parte da comparação entre o teste em avaliação e um padrão-ouro (gold standard) — o teste de referência considerado correto.
| Tem a doença | Não tem a doença | Total | |
|---|---|---|---|
| Teste positivo | a (verdadeiro positivo) | b (falso positivo) | a + b |
| Teste negativo | c (falso negativo) | d (verdadeiro negativo) | c + d |
| Total | a + c | b + d | a + b + c + d |
A partir dessa tabela, calculam-se as propriedades. Vamos usar um exemplo concreto: 1.000 pacientes testados, 100 com a doença (10% de prevalência), 900 sem.
| Tem a doença | Não tem a doença | Total | |
|---|---|---|---|
| Teste positivo | 87 | 35 | 122 |
| Teste negativo | 13 | 865 | 878 |
| Total | 100 | 900 | 1.000 |
Sensibilidade
Definição: proporção de doentes que o teste identifica corretamente. "Entre os doentes, quantos o teste pega?"
Sensibilidade = a / (a + c) No exemplo: 87/100 = 87%. O teste detecta 87% dos doentes; 13% escapam (falsos negativos).
Interpretação: teste altamente sensível tem poucos falsos negativos. Resultado negativo, então, descarta a doença com maior segurança. Regra mnemônica: SnNout — Sensitive test, when Negative, rules Out.
Quando priorizar sensibilidade: rastreamento, triagem, doenças graves cujo atraso de diagnóstico custa caro. Você prefere falsos alarmes a casos perdidos.
Especificidade
Definição: proporção de não-doentes que o teste classifica corretamente como negativos. "Entre os saudáveis, quantos o teste deixa em paz?"
Especificidade = d / (b + d) No exemplo: 865/900 = 96%. O teste classifica corretamente 96% dos saudáveis; 4% recebem falso positivo.
Interpretação: teste altamente específico tem poucos falsos positivos. Resultado positivo, então, confirma a doença com maior segurança. Regra mnemônica: SpPin — Specific test, when Positive, rules In.
Quando priorizar especificidade: confirmação diagnóstica, antes de tratamento agressivo, em doenças cujo tratamento tem efeitos adversos sérios. Você prefere perder alguns casos a tratar quem não precisa.
O equilíbrio sensibilidade–especificidade
Não há almoço grátis. Em quase todo teste, aumentar sensibilidade reduz especificidade e vice-versa. O ponto de corte é o que controla esse equilíbrio.
Considere um teste laboratorial com escala contínua (ex.: troponina). Em ponto de corte baixo: muitos positivos detectados → sensibilidade alta, especificidade baixa (vários saudáveis falso-positivos). Em ponto de corte alto: poucos positivos → sensibilidade baixa, especificidade alta.
A escolha do ponto de corte depende do contexto clínico — não há valor universal. Por isso, leitura crítica de estudo diagnóstico precisa explicitar o ponto de corte usado e justificar.
Valor preditivo positivo (VPP)
Definição: probabilidade de realmente ter a doença dado que o teste foi positivo. "Resultado positivo — que chance tenho de fato ter isso?"
VPP = a / (a + b) No exemplo: 87/122 = 71%.
Interpretação: entre os 122 testes positivos, 87 são verdadeiros (tem a doença) e 35 são falsos. Confiança no resultado positivo é de 71%.
Valor preditivo negativo (VPN)
Definição: probabilidade de realmente não ter a doença dado que o teste foi negativo. "Resultado negativo — que chance tenho de estar livre disso?"
VPN = d / (c + d) No exemplo: 865/878 = 98,5%.
Interpretação: entre os 878 negativos, 865 são verdadeiros e apenas 13 são falsos. Resultado negativo é altamente confiável.
A propriedade que muda tudo: VPP e VPN dependem da prevalência
Sensibilidade e especificidade são propriedades fixas do teste, independentes do contexto. VPP e VPN, não. Eles variam conforme a prevalência da doença na população testada.
Por quê? Imagine o mesmo teste (sensibilidade 87%, especificidade 96%) aplicado em duas populações diferentes:
Cenário A — prevalência alta (10%, do exemplo acima)
- 100 doentes, 900 sem doença em 1.000 pessoas
- VPP = 87/122 = 71%
- VPN = 865/878 = 98,5%
Cenário B — prevalência muito baixa (0,1%)
- 1 doente, 999 sem doença em 1.000 pessoas
- Verdadeiros positivos: 0,87 (≈ 1)
- Falsos positivos: 999 × 4% = 40
- Total positivos: ≈ 41
- VPP = 1/41 ≈ 2,4%
O mesmo teste, com características idênticas, tem VPP de 71% num contexto e 2,4% noutro. A diferença é só a prevalência.
| Contexto | VPP | VPN |
|---|---|---|
| Prevalência alta | Sobe (positivo é confiável) | Desce (negativo perde valor) |
| Prevalência baixa | Cai (muitos positivos são falsos) | Sobe (negativo é muito confiável) |
Implicação clínica fundamental: o mesmo teste positivo significa coisas diferentes em pacientes diferentes. Pessoa de baixo risco com teste positivo tem alta probabilidade de falso positivo. Pessoa de alto risco com teste negativo tem maior risco de falso negativo.
→ Veja calculadora de testes diagnósticos para experimentar com diferentes prevalências.
Razões de verossimilhança (RV+ e RV−)
Definição: medidas que combinam sensibilidade e especificidade em um único número, indicando quanto o resultado do teste muda a probabilidade de doença. Independem da prevalência — são propriedades do teste.
Razão de verossimilhança positiva (RV+)
"Quantas vezes mais provável é o diagnóstico, dado que o teste foi positivo?"
RV+ = Sensibilidade / (1 − Especificidade) No exemplo: RV+ = 0,87 / (1 − 0,96) = 0,87 / 0,04 = 21,75.
Resultado positivo torna a doença ~22 vezes mais provável.
Razão de verossimilhança negativa (RV−)
"Quantas vezes menos provável é o diagnóstico, dado que o teste foi negativo?"
RV− = (1 − Sensibilidade) / Especificidade No exemplo: RV− = (1 − 0,87) / 0,96 = 0,13 / 0,96 = 0,135.
Resultado negativo torna a doença ~7 vezes menos provável (1/0,135 ≈ 7,4).
Como interpretar RV
| Valor de RV+ | Mudança na probabilidade |
|---|---|
| > 10 | Aumento substancial — confirmação forte |
| 5 a 10 | Aumento moderado |
| 2 a 5 | Aumento pequeno |
| 1 a 2 | Aumento mínimo, raramente útil |
| 1 | Sem mudança — teste inútil |
| Valor de RV− | Mudança na probabilidade |
|---|---|
| < 0,1 | Redução substancial — descarte forte |
| 0,1 a 0,2 | Redução moderada |
| 0,2 a 0,5 | Redução pequena |
| 0,5 a 1 | Redução mínima, raramente útil |
| 1 | Sem mudança — teste inútil |
Por que RV é melhor que VPP/VPN para conversa clínica
VPP e VPN dão a probabilidade pós-teste direta, mas dependem da prevalência. RV permite calcular probabilidade pós-teste a partir de qualquer probabilidade pré-teste — funciona em qualquer contexto.
Probabilidade pós-teste = Probabilidade pré-teste × RV (em odds, com correção)
Na prática, usa-se nomograma de Fagan ou calculadora.
→ A calculadora de testes diagnósticos faz esse cálculo automaticamente.
Resumo das propriedades
| Propriedade | Pergunta que responde | Fórmula | Exemplo |
|---|---|---|---|
| Sensibilidade | Entre os doentes, quantos detecta? | a / (a+c) | 0,87 |
| Especificidade | Entre os saudáveis, quantos identifica? | d / (b+d) | 0,96 |
| VPP | Resultado positivo — chance real de doença? | a / (a+b) | 0,71 |
| VPN | Resultado negativo — chance real de saúde? | d / (c+d) | 0,985 |
| RV+ | Quanto positivo aumenta a probabilidade? | Sens / (1−Esp) | 21,75 |
| RV− | Quanto negativo diminui a probabilidade? | (1−Sens) / Esp | 0,135 |
Aplicação prática — quando escolher cada métrica
Depende do que você quer fazer:
| Decisão clínica | Métrica chave |
|---|---|
| Escolher teste para rastreamento | Sensibilidade alta |
| Escolher teste para confirmação | Especificidade alta |
| Interpretar resultado em paciente individual | VPP/VPN no contexto, ou RV |
| Comparar acurácia de testes | Curva ROC, AUC |
| Comunicar resultado ao paciente | Probabilidade pós-teste em linguagem natural |
Erros comuns
- Confundir sensibilidade com VPP. Sensibilidade é probabilidade de teste positivo dado que tem a doença. VPP é o inverso: probabilidade de doença dado teste positivo.
- Esquecer da prevalência. Aplicar VPP de um estudo (com prevalência X) a um paciente de contexto Y (prevalência diferente) é erro frequente.
- Tratar teste como certeza. Mesmo teste com sensibilidade 99% tem 1% de falsos negativos. Tratar resultado como verdade absoluta ignora isso.
- Não considerar probabilidade pré-teste. Resultado de teste muda a probabilidade — não a determina sozinho. Pessoa de baixo risco com teste positivo pode ter probabilidade pós-teste ainda baixa.
- Usar RV+ e RV− isoladamente. O valor está em combinar com a probabilidade pré-teste para gerar probabilidade pós-teste.
- Usar mesmo teste para rastrear e confirmar. Estratégia melhor: teste sensível para rastrear (poucos falsos negativos), teste específico para confirmar positivos (poucos falsos positivos no diagnóstico final).
Em situações reais — doação de sangue
Em bancos de sangue, doadores fazem testes muito sensíveis primeiro — a prioridade é não deixar nenhuma bolsa contaminada passar. Resultados positivos vão para teste confirmatório mais específico. Por que não fazer logo o teste específico? Porque o específico geralmente perde sensibilidade — alguns positivos verdadeiros escapariam.
Esta sequência — sensível primeiro, específico depois — é princípio geral em rastreamento e investigação inicial: detectar amplo, confirmar com precisão.
Conceitos relacionados
- Calculadora de testes diagnósticos — para experimentar com diferentes prevalências e cenários
- Rastreamento — onde sensibilidade alta é prioritária
- Medidas de frequência — prevalência, base do cálculo de VPP/VPN
- Desenhos de estudo — desenho específico para teste diagnóstico (estudos de acurácia)
- Apply (Aplicar) — onde a interpretação encontra o paciente real
Referências
- Pewsner D, Battaglia M, Minder C, Marx A, Bucher HC, Egger M. Ruling a diagnosis in or out with "SpPIn" and "SnNOut": a note of caution. BMJ 2004;329(7459):209–13.
- Akobeng AK. Understanding diagnostic tests 1: sensitivity, specificity and predictive values. Acta Paediatr 2007;96(3):338–41.
- Akobeng AK. Understanding diagnostic tests 2: likelihood ratios, pre- and post-test probabilities. Acta Paediatr 2007;96(4):487–91.
- Whiting PF, Rutjes AW, Westwood ME, et al. QUADAS-2: a revised tool for the quality assessment of diagnostic accuracy studies. Ann Intern Med 2011;155(8):529–36.
- Sackett DL, Haynes RB, Guyatt GH, Tugwell P. Clinical Epidemiology: A Basic Science for Clinical Medicine. 2ª ed. Boston: Little, Brown; 1991.
- Fagan TJ. Nomogram for Bayes theorem. N Engl J Med 1975;293(5):257.