Está en la página 1de 7

UNIVERSIDAD DE CUENCA

Facultad de Ciencias Económicas y Administrativas

Material de Clase
Carrera: Sociología
Docente: Econ. Margarita Guillén

Estimación e intervalos de confianza

Introducción

En el capítulo anterior se inició el estudio de la estadística inferencial a partir del estudio de


muestras para estimar parámetros poblacionales. Las razones para seleccionar una muestra
son: costos altos, mucho tiempo, algunas pruebas son de naturaleza dañina, es casi imposible
llegar a todos los elementos de la población, y además a partir de los resultados de una
muestra probabilística hay como realizar generalizaciones a la población.

Los tipos de muestreo probabilísticos fueron: Muestreo aleatorio simple, Muestreo aleatorio
sistemático, muestreo aleatorio estratificado y el Muestreo aleatorio por conglomerados. Los
tipos de muestreo no probabilísticos más utilizados son Bola de nieve, Por cuota,
Discriminación, a Juicio.

También se analizó el error de muestreo que es la diferencia entre el estadístico de la muestra


y el parámetro de la población. Se presentó el teorema central del límite que indica que la
distribución de medias muestrales seguirá la distribución de probabilidad normal si se han
tomado todas las posibles medias de tamaño “n” de una población. La aproximación a la
distribución normal mejora a medida que el tamaño de la muestra aumenta.

En este capítulo se analizará lo que es un estimador puntual, un intervalo de confianza en


varios casos: para medias en muestras grandes y en muestras pequeñas y para proporciones.
Para ello se analizará nuevamente las características de la distribución de probabilidad normal
y adicionalmente la distribución t de student. También se aprenderá a calcular el tamaño de
muestra necesario para estimar una proporción o una media. Y finalmente, el juste que se
realiza en los intervalos de confianza cuando la población es finita (conocida).

Estimador puntual: Un estimador puntual es la mejor estimación del parámetro poblacional. Y


la mejor estimación del parámetro poblacional es el estadístico muestral.

Estimador puntual es el estadístico calculado para estimar el parámetro de la población.

Por ejemplo:

El mejor estimador puntual de la media poblacional es la media muestral.

El mejor estimador puntual de la proporción poblacional es la proporción de la muestra.

El mejor estimador puntual de la desviación estándar poblacional es la desviación estándar


muestral.

Intervalo de confianza: Son los valores entre los que se espera que se encuentre el verdadero
valor del parámetro poblacional con una probabilidad específica. Esta probabilidad se conoce
como nivel de confianza.

Para calcular un intervalo de confianza se consideran las siguientes situaciones:


UNIVERSIDAD DE CUENCA
Facultad de Ciencias Económicas y Administrativas

1) Para una media:


a) Se conoce la desviación estándar poblacional (no importa si la
muestra es grande o pequeña)
b) Se desconoce la desviación estándar poblacional y la muestra es
pequeña (menor a 200)
c) Se desconoce la desviación estándar poblacional y la muestra es
grande (mayor a 200 se puede utilizar Z o t, ya que los valores son
semejantes)

2) Para una proporción

Intervalo de confianza para una media cuando se conoce la desviación estándar de la


población

Cuando se conoce la desviación estándar de la población se utiliza la distribución de


probabilidad normal, ya que in intervalo de confianza se calcula con dos estadísticos: la media
muestral X́ y el error estándar muestral σ X́ .

σ
Recordar que el error estándar muestral es: σ X́ =
√n
A partir del teorema del límite central se puede afirmar:

1) Aproximadamente el 90% de las medias muestrales están a 1.65 errores estándares de


la media poblacional.
2) Aproximadamente el 95% de las medias muestrales están a 1.96 errores estándares de
la media poblacional.
3) Aproximadamente el 99% de las medias muestrales están a 2.58 errores estándares de
la media poblacional.

Los porcentajes del 95%, 99% se conoce como el nivel de confianza.

Fórmula para el intervalo de confianza:

σ
IC= X́ ± Z
√n
Donde:

IC=Intervalo de confianza
X́ =Media muestral
NC =Nivel de confianza
Z=Es el valor delestadístico Z a partir del nivel de confianza .
σ
= Error estándar de muestreo
√n
Ejemplo:
UNIVERSIDAD DE CUENCA
Facultad de Ciencias Económicas y Administrativas

Un local de comida rápida se especializa en hamburguesas de media onza, y sándwiches de


pescado y de pollo. También ofrece refrescos y papas a la francesa. El departamento de
planeación informa que la distribución de ventas diarias de los restaurantes tiende a seguir la
distribución normal. La desviación estándar de la distribución de ventas diarias es de $300.
Una muestra de 40 mostró que las ventas medias diarias suman $2000.

Responder:

a) ¿Cuál es la media de la población?


Se desconoce.
b) ¿Cuál es la mejor estimación de la media de la población? ¿Qué nombre recibe este
valor?
Es el valor de la media muestral, recibe el nombre de estimador puntual. $2000
c) Construya e interprete un intervalo de confianza de 99% de la media poblacional.

Datos:

X́ =Media muestral=2000
NC =99 %
Z=¿+-2.58
n = 40

𝞼=300

σ
IC= X́ ± Z
√n
300
IC=2000 ± 2.58
√ 40
IC=2000 ± 122.38
Li=1877.62

Ls=2122.38

𝞼=300

0,495
0,495
99%

1877.62 2000 2122.38 $ ventas

Interpretación

De cada 100 muestras que se tomen, 99 de ellas contendrán a la media de las ventas de la
población en un intervalo de 1877.62 a 2122.38.

Se espera encontrar a la media poblacional de las ventas en un intervalo de 1877.62 a 2122.38


con un nivel de confianza del 99%.
UNIVERSIDAD DE CUENCA
Facultad de Ciencias Económicas y Administrativas

d) Construya e interprete un intervalo de confianza de 88% de la media poblacional.

88%

1926 2000 2074 $ ventas

X́ =2000
NC =88 %
Z=¿+-1.56
n = 40

𝞼=300

σ
IC= X́ ± Z
√n
300
IC=2000 ± 1.56
√ 40
IC=2000 ± 74
Li=1926

Ls=2074

Interpretación:

Con un nivel de confianza del 88% se espera que las ventas promedio poblacionales del
restaurante se encuentren en un intervalo de $1926 a $2074.

Intervalo de confianza para una media cuando no se conoce la desviación estándar de la


población

Cuando no se conoce la desviación estándar poblacional se utiliza como mejor estimador


puntual la desviación estándar de la muestra y para calcular el intervalo de confianza ya no se
utiliza Z, sino t.

Características de la distribución t
UNIVERSIDAD DE CUENCA
Facultad de Ciencias Económicas y Administrativas

1. Es una distribución continua (trabaja con variables continuas) con características


similares a la distribución de probabilidad normal.
X́−µ
t=
s
√n

2. Es una distribución simétrica: es decir el 50% de los datos se encuentran a la izquierda


y el 50% restante de los datos están a la derecha. Cuando una distribución es simétrica
la media, la mediana y la moda tienen el mismo valor.
3. Es asintótica: Se aproxima al eje x, pero jamás lo toca.
4. Tiene forma de campana, posee una sola cima en el centro de la distribución,
comparándola con la distribución normal es más aplanada, por lo tanto, existe mayor
dispersión que en la distribución normal.

Distribución Normal

Distribución t

5. El área total bajo la curva es uno. La mitad de los datos se encuentran a la izquierda y a
la otra mitad a la derecha.
6. Existe una familia de distribuciones t, que están en función de los grados de libertad
(los grados de libertad dependen del tamaño de la muestra). Grados de libertad= gl =
n- 1
7. A medida que el tamaño de la muestra es mayor la distribución t se aproxima más a
una distribución de probabilidad Z. Por ello cuando el tamaño de la muestra es mayor
a 200 elementos hay como utilizar Z para calcular el intervalo de confianza.

Fórmula para el intervalo de confianza:

s
IC= X́ ± t
√n
Donde:

IC=Intervalo de confianza

X́ =Media muestral
NC =Nivel de confianza
t=Se calcula a partir del nivel de confianza .
UNIVERSIDAD DE CUENCA
Facultad de Ciencias Económicas y Administrativas

s
= Error estándar de muestreo
√n

Ejemplo: La industria de lácteos desea calcular el consumo medio de leche por año. Una
muestra de 16 personas revela que el consumo medio anual es de 60 galones, con una
desviación estándar de 20 galones.

a) ¿Cuál es el valor de la media poblacional? ¿Cuál es el mejor estimador de este valor?


Si bien el promedio poblacional no se conoce su mejor estimador puntual es la media
muestral. Es 60.
b) Explique por qué necesita utilizar la distribución t. ¿Qué suposiciones necesita hacer?
No se conoce la desviación estándar poblacional por ello se ocupa la distribución t. la
distribución de los datos sigue la distribución normal de acuerdo al teorema del límite
central.
c) ¿Cuál es el valor de t en un intervalo de confianza de 90%?
gl=16-1= 15gl valor de t=+-1.753
d) Construya e interprete el intervalo de confianza de 90% de la media de población.
Datos:

X́ =60
NC =¿90%
t=¿+-1.753
n = 16

s=20

s
IC= X́ ± t
√n
20
IC=60 ± 1.753
√ 16
IC=60 ± 8.77
Li=51.23

Ls=68.77

51.23 60 68.77 Galones

De cada 100 intervalos, se espera que 90 contengan el promedio de galones anual


poblacional en un intervalo de 51.23 a 68.77 galones.
UNIVERSIDAD DE CUENCA
Facultad de Ciencias Económicas y Administrativas

Con un nivel de confianza del 90%, se espera que el promedio poblacional de galones
de venta de lecha anual se encuentre entre 51.23 a 68.77 galones.

e) ¿Es razonable concluir que la media poblacional es de 63 galones?


Si, ya que se encuentra en el intervalo.

También podría gustarte