Está en la página 1de 20

1. Ejercicio Nro.

1 (tomado de Bioestadística Métodos y Aplicaciones de Barón-


Lopez 2005)

Para comprobar si la tolerancia a la glucosa en sujetos sanos tiende a decrecer con la edad, se
realizó un test oral de glucosa a dos muestras de pacientes sanos (jóvenes y adultos). El test
consistió en medir la glucosa en sangre en el momento de la ingesta (basal) de 100gr. de
glucosa y luego de 60 minuto de la toma. Los datos son:

1. ¿Se detecta una variación significativa del nivel de glucosa en sangre en cada
grupo?

Después de las pruebas realizadas se observa que existe una variación de glucosa
basal y posprandial en adultos y en jóvenes, siendo así que la concentración basal
y posprandial es mayor en adultos que en jóvenes. Esto lo pudimos evidencia
tanto en los boxplot como en el valor p, esto será explicado y evidenciado en los
siguientes literales.

2. ¿Es mayor la concentración de glucosa en sangre a los 60 minutos, en adultos o


en jóvenes?

En efecto, la glucosa posprandial en adultos es mayor que en jóvenes. En el


ejercicio planteamos la hipótesis nula “La glicemia posprandial n es mayor en
jóvenes que en adultos”. Y el valor p resulto de 2.343e-06, esto nos lleva a
rechazar la hipótesis nula. Fuera de ello el boxplot fue el siguiente.
Reiterando la respuesta de que la glicemia posprandial es mayor en adultos que en jóvenes
por alrededor de 30.

3. El contenido basal de glucosa en sangre ¿es menor en jóvenes que en adultos?

La glicemia basal es menor en jóvenes que en adultos. En el ejercicio planteamos la hipótesis


nula “La glicemia basal no es menor en jóvenes que en adultos”, el vapor p obtenido en el t
test fue de 0.024, permitiéndonos así rechazar la hipótesis nula y aceptar la hipótesis
alternativa “La glicemia basal es menor en jóvenes que en adultos”.

Fuera de ello, la imagen obtenida en el boxplot fue la siguiente


4. ¿Se detecta a los 60 minutos una variación del nivel de glucosa en sangre
diferente de los adultos en jóvenes?

Para esto realizamos el boxplot comparando la glicemia basal y posprandial tanto en jóvenes
como en adultos.

Luego de ello notamos que hay diferencia en ambos, pero como podemos ver en jóvenes va
desde 80 hasta un poco más de los 140, en cambio en adultos hay mayor variación ya que va
desde los 80 hasta aproximadamente los 200.

Para verificar pasamos a realizar los t test y comprobar las hipótesis. En el t test de jóvenes
obtuvimos una valor p de 1.359e-11con una diferencia significativa de -63.5. Por otro lado,
en el t test de adultos obtuvimos un valor p de 1.1394e-11 y una diferencia significativa de -
96.1. Se debe rescatar que en ambas se planteó la hipótesis “No hay diferencia entre glicemia
basal y posprandial”. pudiendo así reafirmar que hay una mayor variación en adultos que en
jóvenes.

2. Ejercicio Nro. 2 (tomado de Bioestadística de Daniel Wayne 2006)

Realizar el proceso completo del anova y graficar, para el siguiente ejercicio.


Primero lo que debemos hacer es plantear una hipótesis nula y una hipótesis alternativa:

Ho= No hay diferencia significativa en la concentración de antígenos de cada grupo.

Ha= Si hay diferencia significativa en la concentración de antígenos de cada grupo.

Una vez planteadas dichas hipótesis procedmos a aplicar el plotsmeans para darnos
una idea gráfica de la variación de antígenos entre grupos.

Luego procedemos aplicar el summary(modelo) para obtener un resultado del p valor y poder
reafirmar lo que vemos en la imagen, que nos expresa que si hay una diferencia de la
concentración antigénica de cada grupo. El valor obtenido es el siguiente:

Df Sum Sq Mean Sq F value Pr(>F)


grupo 2 185159 92580 5.091 0.00871 **
Residuals 68 1236697 18187
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Por este motivo sencillamente rechazamos la hipótesis nula y apoyamos la hipótesis
alternativa, concluyendo de que si hay una diferencia significativa.

Luego de esto procedemos a aplicar el test de comparación multiple Tuckey con su respectivo
plot para verlo gráfica y numericamente.

En la gráfica podemos observar que hay variación entre los grupos, siendo la
variación más alta entre niños autistas y niños normales. Esto lo corroboramos a
través de la prueba de Tuckey, donde obtuvimos los siguientes resultados:
diff lwr upr p adj
normales-autistas -114.91304 -202.68435 -27.14174 0.0070326
retraso mental-autistas -90.57971 -197.82092 16.66150 0.1142305
retraso mental-normales 24.33333 -76.28971 124.95638 0.8315432
Pudiendo reafirmar de esta manera que se rechaza la hipótesis nula.

Finalmente verificamos los supuestos para tener seguridad de que la normalidad y la


hocedasticidad nos permiten aplicar las pruebas paramétricas usadas.
Es evidente que la normalidad se cumple pero la homocedasticidad es dudosa,
especialmente por los puntos 16, 61 y 19. Para salir de dudas aplicamos la pruba de
Sahpiro para normalidad y la de Barlett para la homocedasticidad. En la prueba de
Shapiro se confirma la normalidad con un valor de 4.43e-06 y confirmamos la
homocedasticidad a través del valor p de 6.81e-07 obtenida en la prueba de Barlett.
Apoyamos la hipótesis alternativa, acpetando que la concentración de antígenos
podría ser un método de diagnóstico cuando se quiere comprabar si un niño es autista,
claramente agregando pruebas adicionales.

3. Ejercicio Nro. 3

La cotinina es uno de los principales metabolitos de la nicotina. Actualmente se le considera


el mejor indicador de la exposición al humo de tabaco. Se ha realizado un estudio con
distintas marcas de tabaco distinguiendo principalmente entre negro y rubio para detectar las
posibles diferencias en el nivel de nicotina de personas expuestas al humo de tabaco. Para
ello, se han analizado personas de distintas edades (niños, jóvenes y adultos) y se ha
distinguido entre mujeres y hombres. Se han obtenido los datos de la siguiente tabla sobre el
nivel de nicotina en miligramos por mililitro.
1. Identificar el diseño adecuado a este experimento, escribir el modelo matemático
y explicar los distintos elementos que intervienen.

En este caso el modelo matemático planteado es:

plot.design(y ~ x * z * w, lwd=3, cex.axis=1.3, cex.lab=1.3, las=1, cex=0.7)

require(gplots)

plotmeans(y ~ interaction(x, z, w), lwd=3, barwidth=2)

Donde:

X es la edad

Z es la marca del tabaco

X es el sexo del individuo

Y es la concentración de nicotina
2. Contrastar la hipótesis nula de no interacción entre los factores.

Las hipotesis nulas planteadas con respecto de la interacción de los factores fueron;

Ho: "El efecto de los tabacos en las distintas edades es igual"

Ho: "La edad y el sexo no influyen en el efecto"

Ho: "El sexo del individuo no influye en el efecto de las 2 marcas de tabaco"

Ho: "La edad, la marca del tabaco y el sexo no influyen en el efecto del consumo".

De estas hipótesis las aceptas fueron las 4 ya que el p valor era mayor a 0.05 en todas.

Con respecto de las interacciones obtuvimos las siguientes imágenes:


Reiterando de esta manera que hay interacción en adultos y jóvenes y en mujeres y hombres,
lo que significa que su variación no es significativa.
3. ¿Hay diferencias significativas en el nivel de nicotina en las distintas edades? ¿En
qué edad el nivel de nicotina es mayor?

Para observar esto lo primero que vamos a hacer es plantear un boxplot para
identeficar en que edad es mayor el consumo de tabaco.

En el boxplot claramente podemos observar que el mayor consumo de tabaco es en


mujeres jovenes y la marca de tabaco consumida es “Negro”. Y las diferencias de
consumo entre edades si es significativa, especialmente entre niños y jóvenes y niños
y adultos. Esto lo podemos comprobar a través de la prueba de Tukey que nos arroja
los siguientes resultados:

diff lwr upr p adj

jovén-adulto -41.00 -299.8487 217.84866 0.9070037

niño-adulto -256.75 -515.5987 2.09866 0.0519362

niño-jovén -215.75 -474.5987 43.09866 0.1072595

además cuando se realizó la prueba de summary (modelo) obtuvimos el siguiente


resultado:
Dejando claro que el único factor que es determinante en la concentración de nicotina
es el de la edad.

4. ¿El tipo de tabaco es un factor determinante en el nivel de nicotina?

Despues de realizar las distintas pruebas, entre ellas la summary modelo obtuvimos
para la hipotesis nula “Las dos marcas de tabaco posee el mismo efecto” un valor p de
0.93, pudiendo así aceptar la hipóteis, quedando claro que las dos marcas poseen el
mismo efecto por lo tanto no es un factor determinante en el nivel de nicotina.

modelo=aov(y ~ x * z * w)

> summary(modelo)

Df Sum Sq Mean Sq F value Pr(>F)


x 2 304399 152199 4.042 0.0455 *
z 1 267 267 0.007 0.9343
w 1 4817 4817 0.128 0.7268
x:z 2 42744 21372 0.568 0.5814
x:w 2 225216 112608 2.991 0.0883 .
z:w 1 37446 37446 0.994 0.3383
x:z:w 2 3 1 0.000 1.0000

Residuals 12 451862 37655

5. Comparar el nivel medio de nicotina entre las mujeres y los hombres. ¿Se detectan
diferencias significativas?

En este planteamos la hipótesis “No hay diferencia de la concentración de nicotina en


hombres y mujeres”,luego de realizar la prueba de summary (modelo) obtuvimos un p
valor de 0.73, siendo mayor que 0.05 aceptamos la hipótesis, quedando claro que no
hay diferencia.

modelo=aov(y ~ x * z * w)

> summary(modelo)

Df Sum Sq Mean Sq F value Pr(>F)


x 2 304399 152199 4.042 0.0455 *
z 1 267 267 0.007 0.9343
w 1 4817 4817 0.128 0.7268
x:z 2 42744 21372 0.568 0.5814
x:w 2 225216 112608 2.991 0.0883 .
z:w 1 37446 37446 0.994 0.3383
x:z:w 2 3 1 0.000 1.0000
Residuals 12 451862 37655

Un factor importante a mencionar es que se pudo utilizar pruebas paramétricas porque


sobre todo la normalidad se cumplió:
ANEXOS:

EJERCICIO 1

> j2=Libro1$`Jóvenes 60`

> d2=Libro1$`Adultos 60`

> boxplot(j2, d2, names=c("GPj","GPa"),

+ las=1, ylab="glicemia",xlab="grupo")

> medias=c(mean(j2),mean(d2))

> points(medias,col=2,cex=2, pch=20)

> segments(1,medias[1],2,medias[2],col=2,lty=2,lwd=3)

> #Ho: "La glicemia pospandrial en adultos no es mayor que en jóvenes"

> #H1: "La glicemia pospandrial en adultos es mayor que en jóvenes"

> d= j2-d2

>d

[1] -60 -40 -42 -48 -21 -31 -41 -35 -25 -50

> shapiro.test(d)

Shapiro-Wilk normality test

data: d

W = 0.98321, p-value = 0.98

> t.test(j2, d2, paired=TRUE)

Paired t-test

data: j2 and d2
t = -10.52, df = 9, p-value = 2.343e-06

alternative hypothesis: true mean difference is not equal to 0

95 percent confidence interval:

-47.75111 -30.84889

sample estimates:

mean difference

-39.3

> boxplot(j1, d1, names=c("GBj","GBa"),

+ las=1, ylab="glicemia",xlab="grupo")

> medias=c(mean(j1),mean(d1))

> points(medias,col=2,cex=2, pch=20)

> segments(1,medias[1],2,medias[2],col=2,lty=2,lwd=3)

> #Ho: "La glicemia basal no es menor en jóvenes que en adultos"

> #H1: "La glicemia basal es menor en jóvenes que en adultos"

> d= j1-d1

>d

[1] -17 -5 -13 -13 -5 7 -10 0 2 -13

> shapiro.test(d)

Shapiro-Wilk normality test

data: d

W = 0.93449, p-value = 0.4935

> t.test(j1, d1, paired=TRUE)


Paired t-test

data: j1 and d1

t = -2.71, df = 9, p-value = 0.024

alternative hypothesis: true mean difference is not equal to 0

95 percent confidence interval:

-12.292711 -1.107289

sample estimates:

mean difference

-6.7

> str(Libro1)

tibble [10 × 4] (S3: tbl_df/tbl/data.frame)

$ Jóvenes B : num [1:10] 81 89 80 75 74 97 76 89 83 77

$ Jóvenes 60: num [1:10] 136 150 149 141 138 154 141 155 145 147

$ Adultos B : num [1:10] 98 94 93 88 79 90 86 89 81 90

$ Adultos 60: num [1:10] 196 190 191 189 159 185 182 190 170 197

> j1=Libro1$`Jóvenes B`

> j2=Libro1$`Jóvenes 60`

> boxplot(j1, j2, names=c("GBj","GPj"),las=1,

+ ylab="glicemia",xlab="grupo")

> medias=c(mean(j1),mean(j2))

> points(medias,col=2,cex=2, pch=20)

> segments(1,medias[1],2,medias[2],col=2,lty=2,lwd=3)

> # Ho: No hay diferencia entre la glicemia basal y pospandrial

> # H1: Si hay diferencia entre la glicemia basal y pospandrial

> d= j1-j2
>d

[1] -55 -61 -69 -66 -64 -57 -65 -66 -62 -70

> shapiro.test(d)

Shapiro-Wilk normality test

data: d

W = 0.95203, p-value = 0.6926

> t.test(j1, j2, paired=TRUE)

Paired t-test

data: j1 and j2

t = -41.521, df = 9, p-value = 1.359e-11

alternative hypothesis: true mean difference is not equal to 0

95 percent confidence interval:

-66.95961 -60.04039

sample estimates:

mean difference

-63.5

> boxplot(d1, d2, names=c("GBa","GPa"),las=1,

+ ylab="glicemia",xlab="grupo")

> medias=c(mean(d1),mean(d2))

> points(medias,col=2,cex=2, pch=20)

> segments(1,medias[1],2,medias[2],col=2,lty=2,lwd=3)
> # Ho: No hay diferencia entre la glicemia basal y pospandrial

> # H1: Si hay diferencia entre la glicemia basal y pospandrial

> d= d1-d2

>d

[1] -98 -96 -98 -101 -80 -95 -96 -101 -89 -107

> shapiro.test(d)

Shapiro-Wilk normality test

data: d

W = 0.91378, p-value = 0.308

> t.test(d1, d2, paired=TRUE)

Paired t-test

data: d1 and d2

t = -41.402, df = 9, p-value = 1.394e-11

alternative hypothesis: true mean difference is not equal to 0

95 percent confidence interval:

-101.35083 -90.84917

sample estimates:

mean difference

-96.1

EJERCICIO 2

autistas=c(755,385,380,215,400,343,415,360,345,450,410,435,460,360,225,900,365,440,820,
400,170,300,325)
normales=c(165,390,290,435,235,345,320,330,205,375,345,305,220,270,355,360,335,305,32
5,245,285,370,345,345,230,370,285,315,195,270,305,375,220)

retraso=c(380,510,315,565,715,380,390,245,155,335,295,200,105,105,245)

#### Solucion:

#Ho=No hay diferencia entre la concentración sérica de un antígeno en los niños

#Ha= Si hay diferencia entre la concentración sérica de un antígeno en los niños

# creamos el vector y juntando A,B,C

y=c(autistas,normales,retraso)

# Creamos la variable de grupo (categ?rica)

grupo=factor(rep(c("autistas","normales","retraso mental"), c(23,33,15)))

# Explorando los datos

plotmeans(y ~grupo, lwd=2, ylab="Concentración serica de antígeno",las=1)

modelo=aov(y ~ grupo)

summary(modelo)

# Concl: Puesto que p-valor > 0.05, se acepta la Ho

# Aplicamos la prueba de comparacion multiple

# Test de Tukey

TukeyHSD(modelo)

plot(TukeyHSD(modelo))

# Verificaci?n de supuestos

plot(modelo, 1, pch=20)

plot(modelo, 2, pch=20)
# Normalidad

shapiro.test(modelo$residuals)

# Homocedasticidad

bartlett.test(modelo$residuals~grupo)

EJERCICIO 3

str(Libro2)

x=as.factor(Libro2$edad)

z=as.factor(Libro2$tabaco)

w=as.factor(Libro2$sexo)

y=Libro2$nicotina

## Hipotesis estad?

#Ho: "La edad no influye en el efecto de consumo"

#Ho: "Las dos marcas de tabáco poseen el mismo efecto"

#Ho: "No hay diferencia del efecto en hombres y mujeres"

#Ho: "El efecto de los tabacos en las distintas edades es igual"

#Ho: "La edad y el sexo no influyen en el efecto"

#Ho: "El sexo del individuo no influye en el efecto de las 2 marcas de tabaco"

#Ho: "La edad, la marca del tabaco y el sexo no influyen en el efecto del consumo"

# graficando:

plot.design(y ~ x * z * w, lwd=3, cex.axis=1.3, cex.lab=1.3, las=1, cex=0.7)

require(gplots)

plotmeans(y ~ interaction(x, z, w), lwd=3, barwidth=2)

# usando cajas

colores=rep(c(2,3),3)

par(mar=c(8,4,4,2))

boxplot(y ~ x + z + w, col=colores, las=2, xlab="")


interaction.plot(z, x, y, lwd=2)

interaction.plot(z, w, y, lwd=2)

interaction.plot(w, x, y, lwd=2)

modelo=aov(y ~ x * z * w)

summary(modelo)

TukeyHSD(modelo, which="x")

TukeyHSD(modelo)

plot(modelo, 1, pch=20)

plot(modelo, 2, pch=20)

También podría gustarte