Está en la página 1de 6

Intervalos de confianza Dr.

Jesús Alberto Mellado

1 La media muestral como variable


Suponiendo que se tiene un población 60 de vacas de la cuales se desea conocer el
peso promedio. Se obtiene una muestra de 6 animales seleccionados al azar, de los
cuales se calcula la media y su varianza. Si se realiza otra muestra también con 6
animales seleccionados al azar, y de la segunda muestra se calcula la media y la
varianza, seguramente la media de la primera muestra será diferente a la media de la
segunda muestra.
Dado que la media de la muestra puede variar según los datos que sean seleccionados
en la muestra, entonces la media muestral se considera una variable aleatoria, ya que
cada vez que se obtenga una muestra diferente, la media también lo será.

Muestra 1 _
población x1

s21

Muestra 2 _
x2

s22

2 Teorema del límite central


El teorema del límite central establece que la media muestral es una variable que se
distribuye normal con una desviación de 𝑠 𝑛 , donde “s” es la desviación estándar de
la muestra. Esta condición se cumple cuando la población es normal o cuando no lo
es pero se tiene una muestra grande (mas de 30 observaciones).
Esto significa que al calcular la media muestral, este valor podrá subir o bajar 𝑠 𝑛.
población Muestra

Tiene una media µ y una desviación


estándar 𝜎 desconocidas
s
La desviación estándar de
la muestra indica la
𝑥 distancia promedio que
están los datos respecto
La media muestral tiene una desviación a la media y es un
de 𝑠 𝑛 , es decir, la media puede subir estimador de la
o bajar esa cantidad desviación poblacional

Ejemplo
Se tiene una población de 100 vacas. La media de producción   14.3
Población
de leche es de 14.3 litros al día, con una desviación de 1.2   1.2
litros.

Se extrae una muestra de 32 vacas. La media de producción


Muestra x  14.1
de leche de esa muestra es de 14.1 litros al día, con una
desviación de 1.3 s  1.3
s 1.3
La desviación de la media muestral es: Sx    0.229
n 32
Quiere decir que la media muestral es 14.1; pero puede subir o bajar 0.229, es decir, la
mayoría de las muestras van a tener una media de producción de leche entre 13.87 y
14.329 litros (sumando y restando la desviación de la media).

En resumen, la población tiene su media (μ) y su varianza (σ2), pero si no se puede


evaluar toda una población se obtiene una muestra. La muestra tiene su media (𝑥) y
su varianza (s2), y la media de la muestra tiene una varianza (s2/n). Nótese que al
incrementar el tamaño de la muestra la varianza de la media va a disminuir su valor.

3 Intervalo de confianza para la media usando la


normal (n≥30).
Dado que la media muestral es variable y nunca se tendrá la certeza de que sea igual a
la media poblacional, es conveniente marcar un límite inferior y superior a su valor
para tener cierta seguridad del rango donde se ubica.
Como la media se distribuye normal y como el 95% de Área 0.025
seguridad es un nivel aceptado científicamente, en la
normal estándar se buscan los valores de z, tal que en
el área central se tenga el 0.95 del total y en cada
extremo el 0.025, estos valores son 1.96 a la derecha y
-1.96 1.96
-1.96 a la izquierda, que se utilizarán como constantes.

Como la varianza de la media es s2/n, la s


sx 
desviación estándar de la media es: n

Si a la media se le resta su desviación multiplicada por 1.96 se tendrá el límite


inferior, y de igual manera, si a la media se le suma su desviación multiplicada por
1.96 se tendrá el límite superior.

Entonces la ecuación queda:

 s   s 
x  1.96     x  1.96 
 n  n

La probabilidad de que la media poblacional se encuentre en ese rango, es de 0.95; A


este nivel se le llama “al 95% de seguridad”, o también se le llama “0.05 nivel de
significancia”.
  s   s 
P x  1.96     x  1.96    0.95
  n  n 

Ejemplo  s 
x  1.96
 s 
    x  1.96 
 n  n
Se desea saber el peso promedio de una
población de 600 vacas. Para el cálculo se tomó  20.49   20.49 
una muestra de 30 vacas, de donde se obtuvo 485  1.96     485  1.96 
una media de 485 kg. y una varianza de 420  30   30 
kg. Especificar el intervalo de confianza al 95% 485  7.33    485  7.33
de seguridad para la media.

La media se encuentra entre 477.66 y 492.33 477.66    492.33


con 95% de seguridad.
4 Distribución t de student
En 1908 se descubrió que en las muestras pequeñas, la distribución normal de la
media sufre un pequeño cambio, se acorta la altura y se amplia en los extremos. A
esta distribución se le llamó t (de student) porque la persona que firmó el artículo con
la demostración se puso el pseudónimo de “estudiante”. Entonces, cuando la muestra
es pequeña (30 o menos), se debe usar la distribución t de student.
Una característica de la distribución t es que se va modificando según el número de
datos que se hayan obtenido, de tal forma que para muestras mayores a 30 la t será
igual a la normal.
Si el número de datos es n, entonces n-1 serán los grados de libertad que dan la forma
a la distribución t, así que para encontrar un valor en tablas es necesario conocer los
grados de libertad.
El manejo de las tabla de la distribución t es diferente a la de la normal, ya que en la
normal se calcula el valor de z (en el eje horizontal) y luego se localiza el valor del
área. En la tabla t se selecciona el área que se quiere a la derecha del valor t, los
grados de libertad y en la tabla se expresa el valor t (la distancia en el eje horizontal
que tiene la probabilidad buscada).

Área
t de student Área 0.025 Tabla t 0.025

10 gl 2.22
t = 2.22 con 10 gl.

5 Intervalo de confianza para la media usando


la t de student (n<30)
El intervalo de confianza para la media usando la distribución t es la siguiente

 s   s 
x  t n 1, 0.025      x  t n 1, 0.025  
 n   n 
Donde el valor t n-1,0.025 se localizará en la tabla t en el renglón n-1 y en la columna
0.025
Ejemplo  s   s 
x  2.08     2.08 
 n  n
Después de aplicar un desparasitante a 22 vacas se
midieron el número de huevesillos en el estiércol.  9.59   9.59 
No se sabe si el número de huevesillos se 32  2.08     32  2.08 
distribuye normal. La media encontrada es de 32  22   22 
con una varianza de 92. Encontrar el intervalo de 32  4.25    32  4.25
confianza al 95% de seguridad para la media.

La media se encuentra entre 27.75 y 36.25 con 95% 27.75    36.25


de seguridad.

6 Intervalo de confianza para la varianza muestral

En el centro de la distribución debe quedar el 95% del área,


pero como la distribución no es simétrica, los valores de los
extremos son diferentes.
Para encontrar el valor de la izquierda, se busca el punto
cuya área sea a la izquierda 0.025 o lo que es lo mismo,
cuya área a la derecha sea 0.975 para n-1 gl, a este valor se
3.24 para 10gl. le llamará x2 0.975, n-1

Para encontrar el valor de la derecha, se busca el punto


cuya área sea a la derecha 0.025 para n-1 gl, a este valor
se le llamará x2 0.025, n-1
20.48 para 10gl.

El intervalo de confianza para la varianza es el siguiente:


(n  1) s 2 (n  1) s 2
  2

x02.025 ,n 1 x02.975 ,n 1

Nótese que los valores para los límites se


cambian debido a que en la fórmula forman el
denominador.
(n  1) s 2 (n  1) s 2
  2

x02.025 ,n 1 x02.975 ,n 1
Ejemplo
(30  1)420 (30  1)420
Se desea saber el peso promedio de una población  2 
16.04 45.72
de 600 vacas. Para el cálculo se tomó una muestra
de 30 vacas, de donde se obtuvo una media de 485 12180 12180
kg. y una varianza de 420 kg. Especificar el  2 
45.72 16.04
intervalo de confianza al 95% de seguridad para la
varianza.
266.40   2  759.35
La varianza se encuentra entre 266.40 y 759.35
con 95% de seguridad.

© Dr. Jesús Mellado Bosque

También podría gustarte