Está en la página 1de 7

Diseño de Experimentos Unidad - 4

Harold Castillo-Navarro

2024-02-23

Título: Intervalos de confianza

Ejercicio de ejemplo

Cargamos datos
 
pul
La base de datos contiene valores de pulsasiones por minuto min de tilapia negra (Orechromis niloticus) en
un experimento para observar el cambio en el metabolismo del pez como respuesta a diferentes temperaturas
del ambiente.

Ambiente Temperatura (°C)


Frío 17 - 20
Normal 30 - 32
Caliente 33 - 35

#install.packages("openxlsx")
library(openxlsx)

## Warning: package ’openxlsx’ was built under R version 4.3.1

datos <- read.xlsx("O.niloticus.xlsx")


summary(datos)

## id ambiente pul.min
## Min. : 1.00 Length:24 Min. : 76.0
## 1st Qu.: 6.75 Class :character 1st Qu.: 79.0
## Median :12.50 Mode :character Median :137.5
## Mean :12.50 Mean :121.4
## 3rd Qu.:18.25 3rd Qu.:145.2
## Max. :24.00 Max. :160.0

Estimamos los principales estadísticos n, x, S 2 para cada tipo de medio evaluado.

#Para realizar el calculo de una forma más fácil y rápida utilizaremos la función aggregate()

#Número de mediciones por medio evaluado


ns <- aggregate(datos, pul.min ~ ambiente, FUN = length)
ns

1
## ambiente pul.min
## 1 caliente 8
## 2 frio 8
## 3 normal 8

#Promedios
medias <- aggregate(datos, pul.min ~ ambiente, FUN = mean)
medias

## ambiente pul.min
## 1 caliente 143.375
## 2 frio 77.875
## 3 normal 142.875

#Varianzas
varis <- aggregate(datos, pul.min ~ ambiente, FUN = var)
varis

## ambiente pul.min
## 1 caliente 80.267857
## 2 frio 2.982143
## 3 normal 18.410714

sqrt(varis$pul.min)

## [1] 8.959233 1.726888 4.290771

#Desviaciones
desv <- aggregate(datos, pul.min ~ ambiente, FUN = sd)
desv

## ambiente pul.min
## 1 caliente 8.959233
## 2 frio 1.726888
## 3 normal 4.290771

Intervalos de confianza para la media poblacional (µ)

1. Estimar intervalos de confianza para la media poblacional (µ) para cada ambiente evaluado.
Siguiendo la tabla de decisión para una población que se distribuye normalmente N (µ, σ),
varianza poblacional (σ 2 ) desconocida y muestra pequeña (n < 30 datos por ambiente):

De la tabla anterior se obtiene que el intervalo de confianza estaría dado por:

S S
x − t α2 · √ ≤ µ ≤ x + t α2 · √
n n

Estimaremos el intervalo de confianza para la media poblacional de las pulsaciones de O. niloticus para un
ambiente frío.

2
Figure 1: Decisión sobre forma de estimar el intervalo de confianza para la media poblacional

#Intervalos de confianza para el ambiente frío


error <- qt(0.975, ns[2,2]-1) * (desv[2,2] / sqrt(ns[2,2]))
L <- medias[2,2] - error
U <- medias[2,2] + error
#Intervalo de confianza para ambiente frio
ic.frio <- c(L,U)
ic.frio

## [1] 76.43129 79.31871

Ejercicio para el estudiante:

Estime los intervalos de confianza para la media poblacional, para los ambientes caliente y
normal.

#Intervalos de confianza para el ambiente caliente

#Intervalos de confianza para el ambiente normal

Intervalos de confianza para diferencias de medias µ1 − µ2 .

2. Estimar intervalos de confianza para la diferencia de las medias poblacionales de los difer-
entes ambientes.

µf río − µcaliente µf río − µnormal µnormal − µcaliente

Siguiendo la tabla de decisión para una población que se distribuye normalmente N (µ, σ), varianzas pobla-
cionales no conocidas pero sí son iguales (σ12 = σ22 ) y además son muestras pequeñas (n1 < 30 y n2 < 30):
Tenemos que para este caso los grados de libertad (v) para una distribución de probabilidad t de Student
estarián estimados como:

3
Figure 2: Decisión sobre la manera de estimar los intervalos de confianza para la diferencia de medias
poblacionales.

v = n1 + n2 − 2

Mientras que la varianza muestral conjunta sería estimada como:

(n1 − 1) · S12 + (n2 − 1) · S22


Sp2 =
n1 + n2 − 2

Primero estimaremos la diferencia de las medias poblacionales de los ambientes normal y caliente (µnormal −
µcaliente ). Para esto estimamos los grados de libertad (v) y la varianza muestral conjunta(Sp2 ):

#Grados de libertad
n1 <- ns[3,2] #Número de muestras para ambiente normal
n2 <- ns[1,2]#Número de muestras para ambiente caliente
v <- n1 + n2 - 2 #grados de libertad para diferencias de medias
var1 <- varis[3,2]
var2 <- varis[1,2]
media1 <- medias[3,2]
media2 <- medias[1,2]
#varianza muestral conjunta
var.p <- (((n1-1) * var1) + ((n2-1) * var2)) / v
var.p

## [1] 49.33929

Los intervalos de confianza estarian dado por:

4
s s
Sp2 Sp2 Sp2 Sp2
(x1 − x2 ) − t α2 · + ≤ µ1 − µ2 ≤ (x1 − x2 ) + t α2 · +
n1 n2 n1 n2

Estimaremos el intervalo de confianza para la diferencia de medias poblacionales de las pulsaciones de O.


niloticus entre los ambientes normal y caliente.

dif_error <- qt(0.975, v) * sqrt((var.p/n1)+(var.p/n2))


L.dif <- (media1-media2) - dif_error
U.dif <- (media1-media2) + dif_error
ic.n_c <- c(L.dif, U.dif)
ic.n_c

## [1] -8.032698 7.032698

Interpretación: Los intervalos de confianza estimados para la diferencia de las medias poblacionales de las
pulsaciones para las condiciones normales y un ambiente caliente en el que se sometió un ejemplar de O.
niloticus fueron [−8.032, 7.032].Podemos observar que el intervalo incluye el cero, lo cual sugiere que no
existe evidencia suficiente en la muestra como para rechazar la idea de la igualdad de medias entre ambas
poblaciones. En otras palabras podemos inferir que µnormal − µcaliente = 0.

Ejercicio para el estudiante:

Estime los intervalos de confianza para la diferencias de medias poblacionales faltantes.

#Intervalos de confianza para la diferencia de medias entre los ambientes frío - caliente

#Intervalos de confianza para la diferencia de medias entre los ambientes frío - normal

Intervalos de confianza para la proporción poblacional (p)

Cargamos datos

Para la estimación de los intervalos de confianza para porprociones, utilizaremos una base de datos que
contiene longitudes totales (Ltotal) y la presencia de Loligo sp en los estomagos asociados a cada toyo (Rhi-
zoprionodon lalandii) en dos ciudades subyacentes (Cartagena y Santa Marta) al Caribe de Colombia. Los
datos presentan una columna llamada estomago estos valores es el número de identificación del estomago.
Otra columna pertenece a la ciudad donde CTG = Cartagena y SMR = Santa Marta, los datos de longitud
total se encuentran en la columna Ltotal, por ultimo la variable Loligo.sp es de presencia-ausencia, los
datos con valor uno (1) son los estomagos donde se encoentro presencia de este calamar en el estomago del
tiburón.

library(openxlsx)
stomach <- read.xlsx("stomach_R.lalandi.xlsx")
summary(stomach)

## estomago ciudad Ltotal Loligo.sp


## Min. : 1.00 Length:170 Min. :27.50 Min. :0.0000

5
## 1st Qu.: 43.25 Class :character 1st Qu.:48.90 1st Qu.:0.0000
## Median : 85.50 Mode :character Median :56.20 Median :0.0000
## Mean : 85.50 Mean :55.71 Mean :0.1059
## 3rd Qu.:127.75 3rd Qu.:61.15 3rd Qu.:0.0000
## Max. :170.00 Max. :86.90 Max. :1.0000

3. Estimar intervalos de confianza para la proproción poblacional (p) de estomagos con pres-
encia de Loligo sp. en los tiburones analizados en la ciudad de Cartagena (CTG).

#Estimamos la cantidad de estómagos con presencia de Loligo sp

x <- aggregate(stomach, Loligo.sp~ciudad, FUN = sum)


#Número de estomagos para cada ciudad con presencia de Loligo sp
x1 <- x[1,2]
np <- aggregate(stomach, estomago~ciudad, FUN = length)
#Número de estomagos analizados para cada ciudad
np1 <- np[1,2]
p1 <- round(x1/np1,2)#Lo redondeamos a 2 cifras
p1

## [1] 0.12

Siguiendo la tabla de decisión para la proporción muestral y sabiendo que es una población que se distribuye
normalmente y además es una muestra grande (n > 30):

Figure 3: Tabla 3. Decisión sobre la manera de estimar los intervalos de confianza para la porporción
poblacional.

De la tabla anterior se obtiene que el intervalo de confianza estaría dado por:


r r
p(1 − p) p(1 − p)
p−Z2 ·α < µ < p+Z2 · α
n n

Siguiendo la ecuación anterior, estimaremos el intervalo de confianza para la proporcion poblacional de las
presencias del calamar Loligo sp. en la dieta del toyo R. lalandii para la ciudad de Cartagena (CTG).

6
p_error <- qnorm(0.975) * sqrt((p1*(1-p1)/np1))
L.p1<- p1 - p_error
U.p1 <- p1 + p_error
ic.p1 <- c(L.p1, U.p1)
ic.p1_porc <- round(ic.p1,2)*100
ic.p1_porc

## [1] 5 19

Interpretación: Siguiendo con los intervalos de confianza obtenidos en términos de porcentajes, podemos
inferir con una confianza del 95%, que la verdadera proporciónn de estómagos con presencia de calamar en
la población de R.lalandii en la ciudad de Cartagena se encuentra entre el el 5% y el 19%.

Ejercicio para el estudiante:

Estime los intervalos de confianza para la diferencias de proprociones poblacionales de estom-


agos con presencia de Loligo sp para las dos ciudades muestreadas (CTG y SMR).

#Intervalos de confianza para la diferencia de proporciones


#de estomagos con presencia de
#calamar en las ciudades CTG y SMR

Nota: Para cada ejercicio que realice debe concluir sobre los resultados obtenidos.
ESTE TALLER SE REALIZARÁ EN CLASES Y SU ENTREGA SERÁ: Viernes 01 de marzo
de 2024, hasta las 07:00 h

También podría gustarte