Iniciação à Pesquisa Científica em Saúde /REPOSITÓRIO DE EXERCÍCIOS RESOLVIDOS/ Exercício 35: Resfriados
Questão 35 - Resfriados
[editar | editar código-fonte]Sabe-se que os resfriados comuns são geralmente causados por rinovírus, sendo mais de 200 tipos diferentes. No entanto, acredita-se que remédios alternativos possam ter algum efeito na redução dos sintomas. Em um teste de eficácia, alguns sujeitos portadores de resfriado comum foram aleatoriamente tratados com extrato de gengibre e outros com placebo. Nem o paciente sabia qual intervenção estava recebendo e nem o médico pesquisador em qual grupo estava alocando o voluntário. O desfecho de interesse foi ausência dos sintomas de resfriado apos 48 horas da intervenção. Analise a saída computacional para um teste estatístico realizado a partir dos dados desse estudo, apresentada a seguir:
Crosstabulation
Melhora em 48h | Sem melhora em 48h | |
---|---|---|
Gengibre | 57 | 105 |
Placebo | 32 | 89 |
Chi-square Value DF p <
-----------------------------------------------------------------
Pearson 2,454 1 0,1173
Likelihood Ratio 2,478 1 0,1154
Yate's Correction 2,065 1 0,1507
Risk Measures Value SE 95%LL 95%UL
-------------------------------------------------------------------------
Odds Ratio 1,510 0,264 0,900 2,532
Relative Risk 1,183 0,103 0,966 1,449
(Software: STATCALC)
Responda as questões seguintes, apresentando como você obteve elementos para as respostas:''''
a) Elabore a hipótese nula para o teste qui-quadrado. Neste caso, alguma correção será necessária?
b) Analisando os resultados dos testes estatísticos é possível afirmar que extrato de gengibre está associado à melhora os sintomas do resfriado em 48 horas?
c) Interprete as medidas de risco apresentadas e o intervalo de confiança de 95%. Comente, em relação ao delineamento deste estudo científico, as medidas de efeito calculadas, justificando qual delas é adequada para este contexto.
d) Baseado no delineamento deste estudo científico e nos conceitos da Medicina Baseada em Evidências, qual seria o nível de evidência e grau de recomendação para os achados do estudo?
Sugestão de leitura:
Resposta da questão:
[editar | editar código-fonte]a) A hipótese nula (H0) seria: a probabilidade de se apresentar ausência de sintomas de resfriado 48 horas após a ingestão de extrato de gengibre é igual à probabilidade disso acontecer caso seja ingerido placebo. Ou em outras palavras: a ingestão de extrato de gengibre não se associa com influencia o desaparecimento dos sintomas nas 48 horas seguintes. Ingestão de gengibre e resolução dos sintomas em 48 horas são, portanto, eventos independentes.
Vale lembrar que a hipótese nula deve afirmar o contrário daquilo que se está tentando demonstrar com o estudo (ela é a negativa da hipótese alternativa – H1). Desse modo, a partir do cálculo da probabilidade dessa hipótese nula ser real (“valor de p” da H0, ou nível descritivo), pode-se inferir se há significância estatística dos dados obtidos no estudo no sentido de sugerir veracidade da hipótese alternativa.
Assim, a não ser que a probabilidade da hipótese nula ser real seja muito baixa (p<α, sendo α o nível de significância, ou o erro máximo tolerado no estudo) não se pode dizer que os dados corroboram a ideia que se pretendia demonstrar. Isso, porque há sempre a chance dos dados obtidos serem apenas coincidência, isto é, o acaso da situação, não podendo, nesse caso, serem utilizados para uma conclusão geral. É essa probabilidade do acaso que é averiguada a partir da hipótese nula. O α corresponde, pois, ao ponto de corte ou “valor crítico”: um p maior do que α aceita a H0; um menor rejeita-a.
Existe, todavia, uma possibilidade do chamado erro do tipo I (quando a comparação entre p e α rejeita uma hipótese nula que é, na verdade, real), porém essa probabilidade é tão reduzida quão menor for o α escolhido para o estudo (geralmente, nos valores de 10%, 5% ou 1%). Buscando-se que o grau de erro tolerado seja o mínimo possível, aumenta-se a significância estatística do estudo.
Além disso, no teste qui-quadrado de Pearson (descrito a seguir) existe outra possibilidade de erro, dado que seus cálculos implicam uma amostra “grande”. Dessa forma, quando a amostra é menor do que 40, ou quando alguma das frequências observadas (valor de cada uma das caselas) é menor do que 5, sugere-se a chamada correção de Yates (descrita a seguir), uma alteração no cálculo de Pearson que visa reduzir a probabilidade de erro. Ademais, no caso de amostras muito pequenas (menores do que 20, ou entre 20 e 40 com pelo menos uma das frequências observadas com valor menor do que 5), existe o Teste exato de Fisher. No estudo em questão, entretanto, o teste de Pearson já seria o ideal.
b) Estatisticamente falando, não se pode dizer que o consumo de extrato de gengibre está associado à resolução dos sintomas de resfriado em 48 horas, visto que o nível descritivo (valor de p) para o teste qui quadrado foi maior do que o nível de significância, de modo que a probabilidade dos resultados obtidos decorrerem do acaso é demasiadamente alta para se tirar conclusões associativas.
Cabe relembrar que o teste qui-quadrado avalia a força de associação entre duas variáveis categóricas, a partir de cálculos envolvendo a distância entre os resultados esperados (no caso de uma variável não influenciar em nada a probabilidade da outra) e os resultados observados na execução do estudo. Para esse cálculo, utiliza-se a tabela de contingência 2x2, com os fatores preditores (na questão, ingestão de extrato de gengibre, e ingestão de placebo) nas linhas e os desfechos (no caso, resolução dos sintomas em 48 horas e não resolução deles no mesmo tempo) nas colunas. A frequência esperada para cada casela (cada quadrante de encontro com um preditor e um desfecho) é calculada pela divisão do produto entre a soma dos valores observados da linha e a soma dos valores observados da coluna pelo total de observações. No exemplo da questão teríamos, na casela superior esquerda (ingeriu gengibre e melhorou em 48h): Frequência esperada (E)=(57+105)*(57+32)/(57+105+32+89). Já a frequência observada (O) é o valor que já consta na tabela; no caso, a da primeira casela é de 57. O cálculo do qui quadrado é: , isto é, a soma dos quadrados das diferenças relativizadas entre as frequências esperadas e as observadas para cada casela (ou seja, para cada combinação preditor-desfecho possível).
Quanto maior o resultado do teste qui-quadrado (x²), menor a chance de não haver qualquer tipo de associação. Outra forma de avaliar a verossimilhança dos resultados é pelo cálculo do nível descritivo da hipótese nula, que no caso é: não há associação entre as variáveis; ou: uma variável independe da outra. Comparando-se o valor obtido e o ponto de corte (α, ou nível de significância) escolhido para o estudo, mede-se a significância do estudo diante da probabilidade do acaso. Como esse nível descritivo foi muito alto no teste do estudo em questão (p > 0,1, enquanto que o nível de significância geralmente é de no máximo 0,1), os resultados não têm significância estatística.
A correção de Yates, citada na questão anterior, corresponde a:
c) A leitura do Risco Relativo (Relative Risk) é de que o risco de se ter melhora dos sintomas de resfriado em 48 horas após a ingestão de gengibre é 18,3% maior do que o risco de haver essa melhora após 48 horas da ingestão de placebo.
A Leitura da Razão de Chances (Odds Ratio) é de que a chance de se ter melhora dos sintomas de resfriado em 48 horas após a ingestão de extrato de gengibre é 51% maior do que chance de não haver melhora nesse tempo tendo ingerido o gengibre
A leitura do Intervalo de confiança é a de que o valores das razões acima obtidos para a amostra não necessariamente valem para a população como um todo, mas caso o estudo fosse feito 100 vezes, em 95 delas (no caso do intervalo de confiança de 95%) o valor para a população estaria dentro de um intervalo, que, no caso da questão é de: -3,4% a 44,9% para o risco relativo; e de: -10% a 153,2% para a chance. Como esses intervalos passam pelo 0%, para a população, diz-se que não se pode concluir que há risco ou chance aumentados de melhora com o uso do gengibre, uma vez que o intervalo passa tanto pela área de risco ou chance negativos quanto pela de risco ou chance positivos.
O risco relativo é calculado pela probabilidade do desfecho principal (no caso, melhora dos sintomas) acontecer quando o fator preditor principal (no caso, ingestão de gengibre) está o presente (frequência do desfecho principal na condição do preditor principal divida pela frequência total do preditor principal), dividida pela probabilidade do desfecho principal quando o fator preditor principal está ausente (ingestão de placebo, em vez de gengibre), que seria a frequência do desfecho principal na ausência do preditor principal dividida pela frequência total da ausência do preditor principal. Se o resultado é <1, o preditor principal é protetor para o desfecho principal; se é =1, ele não interfere; e se é >1, ele aumenta o risco do desfecho principal. Essa razão é utilizada para estudos dinâmicos, quando se pretende avaliar a incidência de novos eventos, que ainda não tinham acontecido ao início do estudo. No estudo em questão, o fator preditor (gengibre ou placebo) foi implementado logo no início, mas o desfecho (melhora dos sintomas ou não) só pode ser observada em um segundo momento de observação. Isso caracteriza o delineamento do estudo como longitudinal (por depender de mais de uma observação) experimental (pelo preditor ter sido por uma intervenção dos pesquisadores) duplo-cego randomizado (pela distribuição entre quem tomaria gengibre ou placebo ter sido aleatória sem que o doente soubesse o que estava tomando ou o pesquisador soubesse o que estava entregando para cada doente), também conhecido como Ensaio Clínico cego-randomizado. Nesse tipo de estudo, o risco relativo é a medida de efeito ideal.
Já a Razão de Chances pode ser usada tanto para estudos em que preditor e desfecho estejam presentes desde o primeiro momento quanto para aqueles em que o desfecho acontece num segundo momento. No entanto, costuma-se reservar essa medida de efeito para o primeiro caso, ou seja, para estudos transversais (de uma só observação e, portanto, de caráter mais estático) que buscam avaliar a prevalência de certo evento na população estudada. A chance é calculada pela frequência do desfecho principal dividida pela frequência do desfecho alternativo. Então são calculadas as chances na condição do predito principal e na do alternativo e divididas uma pela outra para se obter a razão.
d) A Medicina Baseada em Evidências, ou o termo mais amplo, Saúde Baseada em Evidências, são uma abordagem que se utilizam da Epidemiologia Clínica, da Estatística, da Metodologia Científica, e da Informática para desenvolver a pesquisa e o conhecimento, e para orientar a atuação em Saúde, no intuito de gerar e fornecer a melhor informação disponível para a tomada de decisão nos assuntos concernentes a essa área. Sua prática busca integrar a experiência clínica às melhores evidências científicas disponíveis, considerando a segurança nas intervenções e a ética na totalidade das ações. Essa linha de abordagem da saúde prevê o Grading of Recommendations Assessment, Development and Evaluation (GRADE), ou Graduação das Recomendações, do Desenvolvimento e da Avaliação, como forma de estabelecer a qualidade da evidência e a força de recomendação de cada tipo de estudo.
Segundo esse sistema, a força de recomendação se descreve conforme a clareza de efeitos benéficos ou maléficos de uma conduta. Quando as vantagens de uma conduta claramente superam as desvantagens, é forte a recomendação de segui-la; e quando as desvantagens claramente se sobrepõem, é forte a recomendação de evitar a conduta. Por outro lado, quando a relação entre prós e contras ainda é incerta, diz-se que a força de recomendação da conduta é fraca. A recomendação forte é designada como “1” e a fraca como “2” no Sistema GRADE. Já em relação à qualidade da evidência, a classificação vai de alta até muito baixa, sendo: alta (A), quando a evidência é fruto de ensaios clínicos randomizados bem conduzidos e sem inconsistências, ou ainda – idealmente -, de revisões sistemáticas de vários ensaios assim; moderada (B), quando os resultados derivam de ensaios clínicos randomizados que apresentaram inconsistências ainda não resolvidas; baixa (C), quando os resultados foram gerados em estudos observacionais longitudinais e caso-controle, estudos esses fortemente susceptíveis a vieses de análise; muito baixa (D), quando os resultados são provenientes de relatos de casos ou opiniões de profissionais. A interpretação dessa classificação gira em torno do impacto que novos estudos podem ter sobre a evidência em questão, de modo que aquelas de qualidade alta dificilmente serão anuladas com a realização de mais pesquisas, enquanto que as de qualidade muito baixa muito provavelmente serão anuladas ou completamente modificadas por novos estudos realizados.
No estudo em questão, em se tratando de um ensaio clínico randomizado ainda com inconsistências e com as medidas de efeito estatisticamente sem significância, a classificação pelo GRADE seria: qualidade moderada e fraca força de recomendação (2B).
Indexadores do tema deste exercício
[editar | editar código-fonte]Comparação entre grupos amostrais em saúde
Medidas de efeito: Risco relativo e Razão de chances
Planejamento de estudos científicos em saúde
A medicina baseada em evidências (MBE)
Níveis de evidência científica (MBE)
Graus de recomendação da evidência científica (MBE)
Bibliografia utilizada
[editar | editar código-fonte]BONITA, R; BEAGLEHOLE, R; KJELLSTRÖM, T. Epidemiologia básica. - 2.ed. - São Paulo, Santos. 2010
PAES, A. Itens essenciais em bioestatística. Arq. Bras. Cardiol. volume 71, (nº 4), 1998
YATES, F . Contingency table involving small numbers and the χ2 test. Journal of the Royal Statistical Society, 1934. p. 217–235.
BRASIL. Ministério da Saúde. Diretrizes metodológicas: Sistema GRADE – Manual de graduação da qualidade da evidência e força de recomendação para tomada de decisão em saúde. Brasília: Ministério da Saúde, 2014.