Está en la página 1de 79

Estimación de intervalos e

Intervalos de Confianza
Rocío San Pedro - Mayo 2020
Este es una presentación en desarrollo y se agradece que cualquier error o sugerencia sea
enviada a rochi98sanpedroo@gmail.com
Bibliografía 1. Conceptos Básicos
Capítulo 7 - Levin y Rubin
Obligatoria 2. Intervalos de Confianza
Capítulo 7 - “Estadística Capítulo 7 - Levin y Rubin
para Adm. y Economía” 2.4 Estimación p 𝞂^2
de Levin y Rubin Capítulo 2 - Capriglioni
tomo II
(7.3 a 7.8)
Capítulo 2 - “Intervalos
de Confianza” de
Capriglioni Tomo II
1. Conceptos Básicos
¿Qué es la Estimación por Intervalos?
Una estimación de intervalo describe un rango de valores dentro del cual es más probable
que esté un parámetro de la población.

● Supongamos el director de fábrica de refacciones automotrices necesita hacer una


estimación de la vida promedio de las baterías para automóvil que produce su
compañía. Seleccionamos una m.a. 200 baterías, registramos a los propietarios de los
automóviles, y entrevistamos a estas personas con respecto a la duración de la
batería de su automóvil. Nuestra muestra de 200 usuarios tiene una vida media de las
baterías de 36 meses.
_
Si utilizamos la estimación puntual de la media de la muestra x como el mejor estimador de
la media de la población μ , informaríamos que la vida media de las baterías de la empresa
es 36 meses
Error estándar
Pero también nos serviría tener una idea acerca del nivel de incertidumbre que
acompaña esta estimación que acabamos de hacer.

⇒ Una afirmación acerca del intervalo dentro del cual es probable que esté la media
de la población desconocida.

En la clase de Muestreo vimos que si tomamos muchas muestras


de una población y graficamos sus medias, la distribución de estas
medias se aproximará a la curva normal. Además, la media de las
medias muestrales será la misma que la media de la población.
Error estándar
● Cuando trabajamos con muestras grandes (n mayor 30) podemos aplicar
el TCL y p/ medir la extensión, o dispersión, de nuestra distribución de medias
muestrales, podemos utilizar la siguiente fórmula
Desviación El error debido a la estimación de la media
_ estándar de la
poblacional a partir de medias muestrales.
población

Error estándar
de la media p/
población
infinita
Error estándar
Supongamos ya se estimó la desviación estándar
de la población de baterías y se informó que es 10 meses.

Ahora, podemos informar al director que nuestra estimación de la vida útil de las
baterías de la compañía es 36 meses y que el error estándar que acompaña a esta
estimación es 0.707. En otras palabras, la vida útil real para todas las baterías puede
estar en alguna parte de la estimación de intervalo comprendida entre 35.293 y
36.707 meses.
Error estándar
“El promedio real de la vida util puede estar en alguna parte de la estimación de
intervalo comprendida entre :”

Necesitamos calcular la posibilidad de que a duración real de las baterías esté en este
intervalo o en otros intervalos de diferentes anchos que podamos escoger,
y así sucesivamente
Intervalos con respecto a la media
Si expresamos un intervalo con respecto a los errores estándar (o
desvíos estándar)... ¡La probabilidad no depende de los parámetros de la
distribución normal!
P de que el verdadero parámetro poblacional
caiga dentro del intervalo
La probabilidad es 0.955 de que la media de una muestra de 200 baterías esté dentro
de 2 errores estándar de la media de la población.

El 95.5% de todas las medias muestrales está


dentro de ±2 errores estándar de la media
y, en consecuencia, μ está dentro de ±2 errores
estándar del 95.5% de todas las medias muestrales.
Intervalos con respecto a la media
Entonces, independientemente de los parámetros de la distribución
normal, podemos construir estos intervalos:
Ejercicio:
Los precios de los artículos que vende un
supermercado, tienen media US$ 4 y desvío estándar
US$ 0,75. ¿Cuál es la probabilidad de que la media
muestral se encuentre a dos desvíos estándar de la
media poblacional, si se toma una muestra de 100
personas?
Ejercicio
Como n>30, podemos aplicar el teorema central del límite para la
distribución de la media muestral. Por lo tanto:

El ejercicio nos está pidiendo el intervalo:

μ−2σ μ+2σ
Ejercicio
Estandarizando las variables, vamos a encontrar que:

Z1
F(-2)=0,0228 F(2)=0,9775

Z2
0,9545

-2 2
Ejercicio
Estandarizando las variables, vamos a encontrar que:

Z1
F(-2)=0,0228 F(2)=0,9775

Z2
0,9545

-2 2
2. Intervalos de confianza
Intervalo de Confianza
Intervalo de confianza: Método de estimación que consiste en determinar un
conjunto (cerrado y acotado) de posibles valores del parámetro.

Intervalo de Confianza
Por ejemplo P(8,5≤ μ ≤12,1) = 0,95

Nivel de Confianza
Intervalo de Confianza
Nivel de confianza (1-α): Probabilidad de que la estimación de intervalo incluya al verdadero
valor del parámetro de población. Una probabilidad más alta implica una mayor confianza.
(Geralmente 90;95;99)

Nivel de riesgo (α): Probabilidad de que la estimación de intervalo no incluya al verdadero


valor del parámetro de población. Una probabilidad más alta implica una menor confianza.
α/2 1-(α/2)

α=0,05 1-α = 0,95


0,025 0,025

8,5 μ 12,1
Límites: x ± |zα/2 |. σx

P(8,5≤ μ ≤12,1) = 0,95


α/2 1-(α/2)

1-α = 0,95
2,5 2,5

8,5 μ 12,1
x - zα/2 . σx x + z1-α/2 . σx
Relación entre Intervalo y Nivel de Confianza
Mientras mayor Nivel de Confianza mejor? No necesariamente… o mejor dicho,
depende

x: soja exp en millones 0,90

0,95
de toneladas
0,99

8 10 13 μ 14 18 20

Nota: este ejemplo es meramente ilustrativo


Ojo con la interpretación
Con base en una sola muestra estimamos el parámetro de la población. Debemos tener
cuidado en la interpretación de los resultados de este proceso.

“Tenemos el 95% de confianza de que la cant. de toneladas de soja exportadas es entre


10 y 15millones”

Esta afirmación no significa que se tiene 0.95 de probabilidad de que la cantida de soja
exportada de todas las temporadas caiga dentro del intervalo establecido para esta
muestra. Indica que si seleccionamos muchas m.a. del mismo tamaño y calculamos un
intervalo de confianza para cada una de esas muestras, entonces en alrededor del 95% de
los casos la media de la población caerá dentro de dicho intervalo.
2.1 Estimación de μ a partir de
muestras grandes
Conocemos la Desviación Poblacional?
SI

P⦏ x ± |zα/2|.(𝛔/√n) ≤ μ⦎ = (1-α)

α/2 1-(α/2)

1-α

zα/2 z1-ɑ/2
Conocemos la Desviación Poblacional?
NO

Muestra grande (>30) → ~ No x TCL

Estimamos la desviación poblacional 𝝈


α/2 1-(α/2)
con la desviación de la muestra s

1-α P⦏ x ± |zα/2|.(s/√n) ≤ μ⦎ = (1-α)

zα/2 z1-ɑ/2
Conocemos la Desviación Poblacional?
SI NO

Muestra grande (>30) → ~ No x TCL

Estimamos la desviación poblacional 𝝈


α/2 1-(α/2)
con la desviación de la muestra s

1-α P⦏ x ± |zα/2|.(s/√n) ≤ μ⦎ = (1-α)

zα/2 z1-ɑ/2
El Universo es finito? (Conocido)
Agregamos factor de Corrector por Desviación Poblacional conocida
finitud al Error Muestral

Desviación Poblacional desconocida


2.2 Estimación de la
proporción 𝝿 a partir de
muestras grandes
Habíamos visto que
- Muestra grande (>30) → ~ No x TCL

En la dist. binomial: Media y Desvío de la distribución de


muestreo de la proporción de éxitos
μ=np (número de éxitos)
μ=np/n → jfcdsfs (proporción de
𝛔=√npq éxitos)

𝛔=√npq/n →

error estándar de la proporción


Intervalo de Confianza para 𝛑
Factor de corrección por finitud SÓLO SI el universo es finito conocido

α/2 1-(α/2)

1-α

𝞹
2.3 Distribución t de student
- muestras pequeñas -
Condiciones para usar t de student

Muestra con tamaño menor a 30 y desviación poblacional desconocida.

● n < 30
● 𝞂 desconocida

Al utilizar la distribución t, suponemos que la población es normal o


aproximadamente normal
Distribución t y Normal
Ambas son simétricas. La distribución t es más plana que la distribución normal y hay
una distribución t diferente para cada tamaño posible de muestra.
Grados de Libertad ¿Qué son?
Podemos definirlos como el número de valores que podemos escoger libremente… okay
puede que siga sin entenderse . Vamos a poner un ejemlo:

Suponganse que se encuestaron dos personas (n=2), y cada una dijo su edad (xi). Se calculó
el promedio y dió 18 años (X=18)
Grados de Libertad ¿Qué son?
Podemos definirlos como el número de valores que podemos escoger libremente… okay
puede que siga sin entenderse . Vamos a poner un ejemlo:

Suponganse que se encuestaron dos personas (n=2), y cada una dijo su edad (xi). Se calculó
el promedio y dió 18 años (X=18)

¿Cómo podemos encontrar los valores que x1 y x2 pueden


tomar? Bueno pueden tomar cualquier valor tal que ambos
sumen 36.
Si x1=10

→ 10+x2 = 36 → x2 = 26

Somos libres de especificar sólo uno de los elementos, porque el otro estará determinado
por el hecho de que los dos elementos suman el doble de la media de la muestra. En un
lenguaje estadístico decimos que “tenemos 1 grado de libertad”.
Grados de Libertad ¿Qué son?
Podemos definirlos como el número de valores que podemos escoger libremente.

GL: n -1

Por ejemplo, si utilizamos una muestra de 20 para estimar una media de población,
usaremos 19 grados de libertad para elegir la distribución t apropiada
Intervalo de Confianza p/ μ con n<30

Si el universo no fuera
α/2 1-(α/2) ~tgl:n-1 conocido y finito, el IC es
el mismo pero SIN el
corrector por finitud (en
1-α rojo)

tα/2 μ t1-α/2
Resumen de I.C. p/ cada caso
Muestras chicas
𝛔
desconocida
Muestras grandes
P/ estimar μ

𝛔 conocida

P/ estimar 𝝿
Ejercicio
Se ha obtenido una muestra de 35 alumnos de una
Facultad para estimar la calificación media de los
expedientes de los alumnos en la Facultad con un nivel
de riesgo del 5%. Se sabe por otros cursos que la
desviación típica de las puntuaciones en dicha
Facultad es de 2.01 puntos.
La media de la muestra fue de 4.9
Analicemos la consigna
Datos Se quiere estimar la media con un nivel
de riesgo del 5%
𝛔 = 2.01
ɑ = 0,05 ( 1 - ɑ ) = 0,95
n = 35
_
x = 4,9
Analicemos la consigna
Datos Se quiere estimar la media con un nivel
de riesgo del 5%
𝛔 = 2.01
ɑ = 0,05 ( 1 - ɑ ) = 0,95
n = 35
_ 𝛔 conocida
x = 4,9
Analicemos la consigna
Datos Se quiere estimar la media con un nivel
de riesgo del 5%
𝛔 = 2.01
ɑ = 0,05 ( 1 - ɑ ) = 0,95
n = 35
_ 𝛔 conocida
x = 4,9
n > 30

N desconocido
Analicemos la consigna
Se quiere estimar la media

ɑ = 0,05 ( 1 - ɑ ) = 0,95

𝛔 conocida; n = 35 > 30 ⇒ ∼No x TCL

n = 35
_
x = 4,9
α/2 1-(α/2)

1-α

zα/2 z1-ɑ/2
α/2 1-(α/2)

1-α

zα/2 z1-ɑ/2
α/2 1-(α/2) 0,025 0,975

1-α 0,95

zα/2 z1-ɑ/2
zα/2 z1-ɑ/2
α/2 1-(α/2) 0,025 0,975

1-α 0,95

zα/2 z1-ɑ/2
-1,96 1,96
Respuesta
Rta:

Con una confianza del 95% se estima


que la calificación media de los alumnos
de la Facultad se encuentra entre los
4,23 y 5,57
¿Y si desconozco el valor de 𝛔?
Ejercicio
Se ha obtenido una muestra de 35 alumnos de una
Facultad para estimar la calificación media de los
expedientes de los alumnos en la Facultad con un nivel
de riesgo del 5%. La media de la muestra fue de 4.9,
con una variación absoluta de 1,98
Analicemos la consigna
Datos Se quiere estimar la media con un nivel
de riesgo del 5%
n = 35
_ ɑ = 0,05 ( 1 - ɑ ) = 0,95
x = 4,9

s = 1,98
Analicemos la consigna
Datos Se quiere estimar la media con un nivel
de riesgo del 5%
n = 35
_ ɑ = 0,05 ( 1 - ɑ ) = 0,95
x = 4,9

s = 1,98 𝛔 desconocida
Analicemos la consigna
Datos Se quiere estimar la media con un nivel
de riesgo del 5%
n = 35
_ ɑ = 0,05 ( 1 - ɑ ) = 0,95
x = 4,9

s = 1,98 𝛔 desconocida

n>30

N desconocido
Analicemos la consigna
Se quiere estimar la media

ɑ = 0,05 ( 1 - ɑ ) = 0,95

𝛔 desconocida; n = 35 > 30 ⇒ ∼No x TCL

n = 35
_
x = 4,9 y s=1,98
α/2 1-(α/2)

1-α

zα/2 z1-ɑ/2
α/2 1-(α/2) 0,025 0,975

1-α 0,95

zα/2 z1-ɑ/2 -1,96 1,96


α/2 1-(α/2) 0,025 0,975

1-α 0,95

zα/2 z1-ɑ/2 -1,96 1,96


Respuesta
Rta:

Con una confianza del 95% se estima


que la calificación media de los alumnos
de la Facultad se encuentra entre los
4,24 y 5,56
¿Y si la muestra hubiera sido de 25
personas?
2.4 Estimación de 𝞂^2
Intervalos de C. a partir de Estadigrafos de
Transformación
Intervalos de C. a partir de Estadigrafos de
Transformación
Intervalos de C. a partir de Estadigrafos de
Transformación
Intervalos de C. a partir de Estadigrafos de
Transformación
Del Estadígrafo de Transformación al Intervalo
Estadígrafo de Transformación de la
Varianza Muestral

Cuya distribución es Ji-cuadrado con


(n-1) gl
Distribución Ji-cuadrado
ɑ/2

1-(ɑ/2)

1-ɑ

a b
Resumen de I.C. p/ cada caso
Muestras chicas
𝛔
desconocida
Muestras grandes
P/ estimar μ

𝛔 conocida

P/ estimar 𝝿

P/ estimar 𝞂
Ejercicio
Una muestra de 26 personas seleccionadas al azar de
una población de un barrio, tiene una media salarial de
1800 euros y una varianza de 10.000 euros. Estime la
varianza salarial en el barrio a un nivel confianza del
90%.
Se quiere estimar la 𝞂
Datos: Se quiere estimar la Varianza Poblacional con un
nivel de confianza del 90%.
n = 26
(1-ɑ) = 0,90 ⇨ ɑ = 0,1

s2 = $10.000
ɑ/2

1-(ɑ/2)

1-ɑ

a b
ɑ/2

1-(ɑ/2)

b a
1-ɑ

a b
0,05

0,95

b a
0,9

14,61 37,65
0,5

0,95

0,9

14,61 37,65
Error de muestreo e
Es la máxima diferencia entre el estimador y el parámetro que podría haber.

Por ejemplo, en el caso de μ con 𝞂 conocida


Respuesta
Rta:

Con una confianza del 95% se estima


que la calificación media de los alumnos
de la Facultad se encuentra entre los
4,23 y 5,57
De que nos sirve esto?
Ejemplo: ⇒ Estimación de μ con 𝞂 conocido

Se desea estimar el peso medio de cajas de dulces


envasados por una máquina. Se sabe que los pesos
se distribuyen normalmente con desvío estándar
igual a 35,7 g ¿Cual deberá ser el tamaño de la
muestra necesario si se desea que el error de
muestreo no sea superior a 10g con una
confianza del 99%?
De que nos sirve esto?
Ejemplo: ⇒ Estimación de μ con 𝞂 conocido

Se desea estimar el peso medio de cajas de dulces


envasados por una máquina. Se sabe que los pesos
se distribuyen normalmente con desvío estándar
igual a 35,7 g ¿Cual deberá ser el tamaño de la
muestra necesario si se desea que el error de
muestreo no sea superior a 10g con una
confianza del 99%?
e ≤ 10g con (1-ɑ) = 0,99

0,005 0,995

0,99

-2,58 2,58
e ≤ 10g con (1-ɑ) = 0,99

0,005 0,995

0,99 Rta:
Se necesitan como mínimo 85 cajas para estimar el peso
medio con un error de muestreo no supere los 10g y una
-2,58 2,58 confianza de 99%.

También podría gustarte