A parábola do gato de Schrödinger e a ilusão do significado estatístico em ensaios clínicos
Milton Packer, MD
Tradução: Claudio L Barbosa, MD, MSc
Mestre e pesquisador do Núcleo Transdiciplinaridade para o Estudo do Caos e Complexidade (NUTECC) da Faculdade de Medicina de São José do Rio Preto-SP (FAMERP)
No entanto, em um nível subatômico, a utilidade da física newtoniana se perde; é substituída pela física quântica, na qual o estado futuro de um sistema é definido de maneira probabilística e não determinística. A quantificação da incerteza permite que a física quântica resolva questões que a física clássica não pode resolver.
De muitas maneiras, a evolução do conhecimento sobre a evidência clínica é paralela a evolução do pensamento na física. Quando o tamanho do efeito de um medicamento ou dispositivo é robusto, estudos descritivos geralmente são suficientes para estabelecer a eficácia dessa intervenção. Se a taxa de mortalidade da pneumonia pneumocócica for uniformemente de 90% e cair para 10% com o advento da penicilina, não há necessidade de um estudo controlado randomizado. A resposta ao imatinibe na leucemia foi tão dramática que a Food and Drug Administration aprovou o medicamento com base em um estudo não controlado com uma amostra<50 pacientes. Se o curso clínico de um evento grave for altamente previsível, um benefício substancial após uma intervenção representa uma evidência convincente de eficácia.
No entanto, assim como a física clássica perde a sua aplicabilidade quando se passa para efeitos muito pequenos, a utilidade de estudos descritivos evapora quando os médicos mudam de drogas com 90% de benefício para agentes que reduzem o risco em apenas 10% a 20%.
Os medicamentos cardiovasculares geralmente exercem efeitos terapêuticos pequenos e são estudados em um ambiente em que os resultados não podem ser previstos com precisão. Para enfrentar esse desafio, os investigadores devem migrar da nitidez dos estudos descritivos clássicos para uma estrutura probabilística (isto é, em ensaios clínicos randomizados e controlados). Se outros fatores além do tratamento puderem influenciar as taxas de incidência que rivalizam com o tamanho do efeito esperado de uma intervenção, o investigador necessitará de um grupo controle, randomizado e cego, acompanhamento completo, bem como número significativo de eventos.
Usando essas ferramentas e padrões, os pesquisadores conseguem discernir tamanhos de efeitos pequenos, mas, mesmo assim, podem fazê-lo somente dentro de uma estrutura probabilística e não determinística. É por isso que calculamos valores P e intervalos de confiança em ensaios clínicos, mas não em estudos descritivos. Assim como os cientistas mudaram da física clássica para a física quântica, passamos de estudos descritivos para ensaios clínicos randomizados quando nosso tamanho do efeito mudou de macroscópico para microscópico.
Métodos estatísticos são aplicados em ensaios clínicos para permitir quantificar a incerteza; eles não foram desenvolvidos como uma ferramenta de decisão. O uso de um valor P de 0,05 como limiar para declarar significância estatística ganhou apoio, não porque houvesse algo especial sobre uma taxa de erro falso positivo de 5%, mas porque exigimos algum limiar para a tomada de decisão, mesmo quando a certeza era impossível.
Para ilustrar nosso dilema, precisamos recordar do famoso experimento mental proposto por Erwin Schödinger em 1935. Um gato é fechado em uma câmara que contém uma substância radioativa que pode ou não decair na próxima hora. Se a substância se decompõe, desencadeia um martelo que despedaça um recipiente com ácido hidrociânico, matando o gato; mas se a substância não se deteriorar, a partícula permanece intacta e o gato vive. A probabilidade de decadência dentro da próxima hora é de 50 a 50 e, durante esse período, a condição do gato pode ser melhor representada por uma sobreposição de estados, que inclui estar vivo e morto ao mesmo tempo.
Como a incerteza inerente a um sistema quântico e a obtenção de uma indeterminação macroscópica podem ser resolvidas? Teoricamente, a qualquer momento, um observador poderia abrir a câmara e examinar o gato. No entanto, isso não aborda a incerteza inerente ao destino do gato. Como a sobrevivência do gato é probabilística, sua existência é melhor representada pela superimposição de estados possíveis, que não dependem de um ser humano olhar dentro da caixa.
Como a incerteza inerente a um sistema quântico e a obtenção de uma indeterminação macroscópica podem ser resolvidas? Teoricamente, a qualquer momento, um observador poderia abrir a câmara e examinar o gato. No entanto, isso não aborda a incerteza inerente ao destino do gato. Como a sobrevivência do gato é probabilística, sua existência é melhor representada pela superimposição de estados possíveis, que não dependem de um ser humano olhar dentro da caixa.
O mesmo pensamento se aplica a análise de ensaios clínicos. Quando o efeito de um novo medicamento é avaliado, os pesquisadores relatam uma estimativa do tamanho do efeito que é apresentada em termos probabilísticos (isto é, em intervalos de confiança). Os pesquisadores não fornecem certeza; em vez disso, fazem o possível para descrever o nível de incerteza. A evidência é aplicável apenas se os pesquisadores decidirem, a priori, o grau de incerteza que desejam tolerar.
No entanto, quaisquer níveis de tolerância pré-especificados são arbitrários e produzem conclusões que podem ou não ser confiáveis. A taxa de erro falso-positivo de 5% não é muito rigorosa; se um estudo produz um valor P <0,05, a probabilidade de um segundo estudo também ter um valor P <0,05 é de apenas 30%. Além disso, muitos artigos relatam efeitos favoráveis nos pontos finais exploratórios ou post hoc com base no valor nominal de P que (por causa da multiplicidade de comparações) não carregam verdadeiramente uma taxa de erro falso-positivo de 5%.
É mais importante notar que um resultado estatisticamente significativo que tenha intervalos de confiança extremamente amplos provavelmente não será replicado em um estudo maior subsequente, mesmo que o valor de P para o endpoint primário seja consideravelmente <0,05.
É mais importante notar que um resultado estatisticamente significativo que tenha intervalos de confiança extremamente amplos provavelmente não será replicado em um estudo maior subsequente, mesmo que o valor de P para o endpoint primário seja consideravelmente <0,05.
Os métodos estatísticos foram desenvolvidos e aplicados a ensaios clínicos apenas para quantificar a incerteza, não para tomar decisões diante da incerteza. A incerteza persiste, mesmo que um observador opte por tomar uma decisão.Idealmente, os pesquisadores devem se sentir à vontade com a quantificação da incerteza, sem a necessidade de criar um limiar arbitrário para sua interpretação.
Os físicos podem perguntar: quando um sistema quântico deixa de existir como uma superposição de estados e se torna um ou outro (isto é, quando a física newtoniana clássica se aplica)? Na realidade, não há um horizonte claro; os físicos nunca podem ter certeza, mas o conforto com a incerteza é o ponto principal da mecânica quântica.
Portanto, da próxima vez que você ouvir os investigadores relatarem resultados conclusivos com base em um valor de P maior ou menor que um limite pré-especificado, talvez seja hora de lembrar os conselhos recentemente publicados por 800 estatísticos que imploraram aos investigadores clínicos que abandonassem os valores de P para tomada de decisão. Na verdade, a estimativa pontual e seus intervalos de confiança descrevem adequadamente os resultados de um julgamento; qualquer declaração de significado estatístico satisfaz apenas nossa preferência de viver em um universo clássico com estados de existência nitidamente definidos.
No entanto, a declaração de uma decisão não resolve a incerteza. Se insistimos em um universo binário dirigido por regras arbitrárias, mas esquecemos a precariedade dos dados subjacentes, seguimos um caminho intelectual que não é nem científico nem esclarecedor.
Curiosamente, os gatos podem experimentar a mesma doença; mas reconhecidamente para eles, é uma questão de vida ou morte, e eles só se lembram de estar vivos.
Circulation 2019;140:799–800.
Nenhum comentário:
Postar um comentário