Saltar para o conteúdo

Iniciação à Pesquisa Científica em Saúde /REPOSITÓRIO DE EXERCÍCIOS RESOLVIDOS/ Exercício 33: Lazer e estado nutricional II

Origem: Wikilivros, livros abertos por um mundo aberto.

Questão 33: Lazer e estado nutricional II

[editar | editar código-fonte]

A obesidade é considerada um importante problema de saúde pública, atingindo também crianças e adolescentes. Está entre os fatores de risco para as doenças crônicas degenerativas na vida adulta e sua prevalência aumenta em todo mundo. Preocupados com esta questão, um grupo de profissionais de saúde deseja verificar a relação entre o tempo utilizado para para lazer ao ar livre pelas crianças e o seu estado nutricional, através do IMC.

Base de dados - Tempo de lazer ao ar livre e estado nutricional entre crianças do pré-escolar (5 anos de idade) das escolas da àrea de abrangência da UBS São Carlos

Tempo de lazer ao ar livre (horas semanais) Índice de Massa Corporal (kg/m2)
12 13,5
11 14,5
8 14,8
9 12,7
8 13,9
7 16,1
10 13
3 16,8
0 17,6
9 15,4
2 19
3 15,8
4 15,1
10 15,7
6 16,2
13 17,1

(Dados ficticios)

Responda as questões:

a) Construa um gráfico utilizando simultaneamente as variáveis Tempo de lazer ao ar livre e IMC

b) Qual é o teste de hipótese mais adequado para verificar esta correlação? formule a hipótese nula e a alternativa

c) Há evidências de que existe correlação entre Tempo de lazer ao ar livre e IMC (utilize 95% de confiança)? apresente como você obteve elementos para a resposta

d) Qual é a validade externa deste estudo?

Resposta da questão:

[editar | editar código-fonte]

a)   A construção de um gráfico deve levar em conta inúmeros determinantes, principalmente o conjunto de dados e suas características (ex: dados categóricos, ordinais, numéricos e etc). No caso em questão tanto a variável independente (preditor) quanto a dependente (desfecho) são numéricas, levando a escolha do gráfico de dispersão. Um gráfico de dispersão tem dois eixos de valores para mostrar um conjunto de dados numéricos em um eixo horizontal (variável independente) e outro conjunto de valores numéricos em um eixo vertical (variável dependente). O gráfico exibe pontos na interseção de valores numérico x e y, combinando esses valores em pontos de dados únicos. Esses pontos de dados podem ser distribuídos de modo uniforme ou irregular no eixo horizontal, dependendo dos dados. Esses gráficos são úteis para mostrar os relacionamentos entre os valores numéricos em várias séries de dados e podem plotar dois grupos de números como uma série de coordenadas xy. ¹

b)   Um teste de hipótese (ou teste estatístico) é um procedimento para se determinar se a evidência que uma amostra fornece é suficiente para concluirmos se o parâmetro populacional está num intervalo específico (GRAYBILL, IVER & BURDICK, 1998). Os componentes de um Teste de Hipótese são: Hipótese Nula e Hipótese Alternativa. Para a criação de um teste de hipóteses é necessária a elaboração correta de uma hipótese nula, denotada por H0, que nada mais é do uma afirmação sobre a correlação entre as variáveis que deve conter obrigatoriamente a condição de igualdade. (“Testamos a hipótese nula, no sentido em que, supondo-a verdadeira, procuramos chegar a uma conclusão que nos leve à sua rejeição.”). ²

A hipótese alternativa deve ser contrária, oposta, antagônica à hipótese nula. É comumente designada por H1 ou Ha. H0 e H1 consequentemente não poderão ser simultaneamente verdadeiras. Assim, quando se aceita H0 também rejeita-se H1 e vice-versa.³

H0: Não existe correlação linear entre o IMC das crianças e o tempo de lazer ao ar livre (ρ = 0).

H1: Existe correlação linear entre o IMC das crianças e o tempo de lazer ao ar livre (ρ≠0).

c)   “Diz-se que existe correlação entre duas ou mais variáveis quando as alterações sofridas por uma delas são acompanhadas por modificações nas outras. Ou seja, no caso de duas variáveis x e y os aumentos (ou diminuições) em x correspondem a aumentos (ou diminuições) em y. Assim, a correlação revela se existe uma relação funcional entre uma variável e as restantes. Note-se que a palavra regressão em Estatística corresponde à palavra função em Matemática. Ou seja, enquanto o matemático diz que y é função de x, o estatístico fala em regressão de y sobre x.”4 Quando temos duas variáveis quantitativas podemos utilizar o coeficiente de correlação linear de Pearson para medir a associação entre as variáveis, desde que a relação entre elas seja linear. Importante lembrar que correlação não significa causalidade, e que a ausência de correlação linear não implica na ausência de qualquer outra correlação (pode haver, por exemplo, correlação exponencial).

Utilizando o software estatístico R5, obtemos:

> tempo=c(12,11,8,9,8,7,10,3,0,9,2,3,4,10,6,13)

>imc=c(13.5,14.5,14.8,12.7,13.9,16.1,13,16.8,17.6,15.4,19,15.8,15.1,15.7,16.2,17.1)

> cor.test(tempo,imc)

Pearson's product-moment correlation

data: tempo and imc

t = -2.6728, df = 14, p-value = 0.0182

alternative hypothesis: true correlation is not equal to 0

95 percent confidence interval: -0.8360699 -0.1201950           

sample estimates: cor -0.5812676

Os valores no gráfico nos dão um valor de r=-0,58127, valor que pode ser comprovado através do teste de correlação realizado pelo software em questão (-0.5812676), o que nos leva a concluir que há confiança de 95% para afirmar a existência de uma correlação linear negativa de força moderada4 (valor está entre -0,5 e -0,95).

O intervalo para o índice de correlação tem como limite inferior -0.8360699 e como limite superior -0.1201950, considerando 95% de confiança. O p-valor amostral =0.0182 é relativamente pequeno, ou seja, devemos rejeitar a hipótese nula ao nível de 5% de significância.

d)   Levando em consideração a ausência de informações referentes ao delineamento do estudo, a analise da validação externa desse estudo pode ser baseada no IC (Intervalo de Confiança) e no valor o p. O IC utilizado foi de 95%, que é o mais comum em pesquisas, e o valor de p foi menor que 0,05, o que permite inferir que esse estudo possui validade externa. O IC=95% pode ser interpretado da seguinte fora: "estamos 95% confiantes em que o intervalo de -0,836 a -0,120 realmente contém o verdadeiro valor de p"6, portanto refere-se "à taxa de sucesso do processo em uso para se estimar a proporção populacional"6.

Indexadores do tema deste exercício

[editar | editar código-fonte]

Estatística descritiva

Apresentação de dados científicos sobre saúde

Preparação e análise de gráficos sobre dados de saúde

Teste de correlação linear simples

Desenhos de estudo cientifico em saúde

Bibliografia utilizada

[editar | editar código-fonte]

REFERÊNCIAS:

http://www.revista.ufpe.br/politicahoje/index.php/politica/article/viewFile/6/6

http://www.feg.unesp.br/dpd/cegp/2011/ETD/17%20-%20Correla%E7%E3o.pdf

http://www.ctec.ufal.br/professor/mgn/05CorrelacaoERegressao.pdf

http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0066-782X1998001000003

http://leg.ufpr.br/~silvia/CE055/node15.html

http://www.aurea.uac.pt/pdf_MBA/coef_correl_Pearson.pdf

http://www.ufsj.edu.br/portal2-repositorio/File/lapsam/Metodo%20de%20pesquisa/Metodos%20de%20pesquisa%202013/Texto_4_-_Validade_Interna_e_Externa_de_uma_Pesquisa.pdf

1 https://support.office.com/pt-br/article/Apresentar-os-dados-em-um-gr%C3%A1fico-de-dispers%C3%A3o-ou-de-linhas-4570a80f-599a-4d6b-a155-104a9018b86e

2  http://www.ufscar.br/jcfogo/Estat_2/arquivos/Teste_Hipotese.pdf

3 http://www.ufpa.br/dicas/biome/biotestes.htm#testehip

4 http://www.cultura.ufpa.br/dicas/biome/bioreg.htm#pearson

5 http://www.im.ufrj.br/probest/Minicurso_R_SBPO_2010.pdf

http://www.uft.edu.br/engambiental/prof/catalunha/arquivos/r/r_bruno.pdf

6 Livro Introdução à Estatística - Mario F. Triola, Editora LTC, cap. 7