Está en la página 1de 41

INFERENCIA • APUNTE 02: INTERVALOS DE CONFIANZA

ESTADÍSTICA • PROFESOR: CELSO SOTO


CONTENIDO

➢ Inferencia

• Intervalo de confianza para la media


• Intervalo de confianza para la varianza
• Intervalo de confianza para la proporción
Estadística Inferencial
La estadística inferencial se usa para obtener conclusiones sobre ciertas características de interés
de una población en base a observaciones de una muestra.

Lo que se busca es inferir información para una población a partir de una muestra de ésta.

Cuando se hace alguna inferencia, lo que se está haciendo es estimar un valor. Tal estimación viene
acompañada por un error. Lo interesante de la estadística inferencial es que permite conocer ese
error y reducirlo.
Estadística Inferencial
Definiciones

Población:
Una población consiste en la totalidad de las observaciones que son motivo de interés.
Las poblaciones pueden ser finitas o infinitas.
El número de observaciones de la población se llama tamaño poblacional.

Muestra:
Una muestra es un subconjunto de observaciones seleccionadas desde la población.
El número de observaciones de la muestra se llama tamaño muestral.
Estadística Inferencial
Definiciones
Población:
- Conjunto de observaciones del cual se quiere obtener información.
- Su tamaño se denota por N.
- Los estadísticos de la población se llaman parámetros.
- La media de la población es 𝝁.
- La desviación estándar de la población es 𝝈.

Muestra:
- Subconjunto de observaciones obtenidas desde la población.
- Su tamaño se denota por n.
- Los datos obtenidos desde la muestra se llaman estadísticos.
- La media de la muestra es ഥ
𝒙.
- La desviación estándar de la muestra es 𝒔.
Población y Muestra
Medición o Caracterización

Estadístico

Estimador

Parámetro
Muestra Aleatoria

Muestreo aleatorio simple (mas):


Cada muestra posible tiene la misma probabilidad de ser seleccionada.

La muestra aleatoria está formada por variables aleatorias denotadas por 𝑿𝟏 , 𝑿𝟐 , … , 𝑿𝒏 .

Los valores números obtenidos se denotan por 𝒙𝟏 , 𝒙𝟐 , … , 𝒙𝒏 .

Las variables aleatorias de una muestra aleatoria son independientes y tienen la misma distribución
de probabilidad 𝑓(𝑥) debido a las condiciones idénticas bajo las cuales se obtiene cada observación.
Estadísticos y Parámetros

Los estadísticos que se calculan usando las muestras poblacionales permiten estimar los
parámetros de la población.

Observación: los estimadores de algunas muestras van a estar más cerca del valor real del
parámetro poblacional.

Las variables aleatorias de una muestra aleatoria son independientes y tienen la misma distribución
de probabilidad 𝑓(𝑥) debido a las condiciones idénticas bajo las cuales se obtiene cada observación.
Estadísticos y Parámetros
Ejemplo
Considerar la siguiente población 𝑃 = {1,2,3}

Se puede ver que 𝜇 = 2 y 𝜎 = 0,67.

Se consideran muestras de tamaño dos, con reposición.

Las muestras posibles son las siguientes:

1,1 , 1,2 , 1,3 , 2,1 , 2,2 , 2,3 , 3,1 , 3,2 , 3,3

Las media y varianza de esas muestras son las siguientes

Media : 1 ; 1,5 ; 2 ; 1,5 ; 2 ; 2,5 ; 2 ; 2,5 ; 3.


Varianza : 0 ; 0,25 ; 1 ; 0,25 ; 0 ; 0,25 ; 1 ; 0,25 ; 0.
Distribución de medias muestrales

Considerar una muestra aleatoria de tamaño 𝑛 de una población normal.


La media y varianza de la población son 𝜇 y 𝜎 2 , respectivamente.

La media muestral es la variable aleatoria definida por

𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛
𝑋ത =
𝑛
Resultado:
Se cumple que
𝜎2
- E 𝑋ത = 𝜇 y V 𝑋ത = 𝑛
𝜎 2

- 𝑋~𝑁 𝜇,
𝑛
Intervalo de confianza
Un intervalo de confianza es un par o varios pares de números entre los cuales se estima que estará
cierto valor desconocido con un determinado nivel de confianza.
Se denota el intervalo de confianza como 𝐼(𝑥).
Se dice que un parámetro pertenece a dicho intervalo al nivel de confianza (1 − 𝛼)

Definiciones:
- 𝑃 𝜃𝜖𝐼(𝑥) = 1 − 𝛼. Nivel de confianza.
- 𝑃 𝜃 ∉ 𝐼(𝑥) = 𝛼. Nivel de significación.

𝛼 es una probabilidad que depende de la rigurosidad que el investigador desea usar en la


estimación.
Intervalo de confianza
Un intervalo de confianza es un conjunto aleatorio que depende de la muestra elegida. Por lo tanto,
para cada muestra se tiene un intervalo de confianza diferente.

Si se elige un nivel de confianza de 1 − 𝛼 = 0,95 (o 95%), se tendrán intervalos al nivel de


confianza del 95%, lo que significa que el 95% de los casos los intervalos acertaron al parámetro
poblacional buscado.

Dada una variable aleatoria de distribución normal 𝑁(𝜇, 𝜎 2 ) se quiere calcular intervalos para los
parámetros 𝜇 y 𝜎 2 .
Intervalo de confianza

Dada una variable aleatoria de distribución normal 𝑁(𝜇, 𝜎 2 ) se quiere calcular intervalos para los
parámetros 𝜇 y 𝜎 2 .

En general los intervalos de confianza se usan para determinar:

- La media con varianza poblacional conocida.

- La media con varianza poblacional desconocida.

- Estimación del tamaño muestral.

- La proporción.
Intervalo de confianza
para media con varianza conocida
ത pues se conoce su
Para estimar 𝜇 el estadístico que mejor ayuda es la media de la muestra, 𝑋,
distribución:
𝜎2

𝑋~𝑁 𝜇,
𝑛

Estandarizando la variable, se tiene


𝑋ത − 𝜇
𝑍 = 𝜎 ~𝑁 0,1
𝑛
Intervalo de confianza
para media con varianza conocida
Se quieren 𝑧1 y 𝑧2 tales que
𝑃 𝑧1 ≤ 𝑍 ≤ 𝑧2 = 1 − 𝛼

De lo anterior se deduce que el intervalo de confianza está dado por


𝜎 𝜎

𝐼1−𝛼 𝜇 = 𝑋 − 𝑍1−𝛼 ∙ ത
, 𝑋 + 𝑍1−𝛼 ∙
2 𝑛 2 𝑛

Donde 𝑍1−𝛼 representa el valor de 𝑧 en la normal estándar que concentra un probabilidad de


2
𝛼
1−2 .
Intervalo de confianza para media con varianza conocida
𝜎 𝜎
𝐼1−𝛼 𝜇 = 𝑋ത − 𝑍1−𝛼 ∙ ത
, 𝑋 + 𝑍1−𝛼 ∙
2 𝑛 2 𝑛
Intervalo de confianza para media con varianza desconocida
𝑆 𝑆
𝑛 ≥ 30, 𝐼1−𝛼 𝜇 = 𝑋ത − 𝑍1−𝛼 ∙ , 𝑋ത + 𝑍1−𝛼 ∙
2 𝑛 2 𝑛
𝑆 𝑆
𝑛 < 30, ത
𝐼1−𝛼 𝜇 = 𝑋 − 𝑡1−𝛼,𝑛−1 ∙ ത
, 𝑋 + 𝑡1−𝛼,𝑛−1 ∙
2 𝑛 2 𝑛
Donde 𝑡 es la distribución t student con n-1 grados de libertad, y S es la desviación estándar muestral.
Intervalo de confianza para la varianza
(𝑛 − 1)𝑆 2 (𝑛 − 1)𝑆 2
𝐼1−𝛼 𝜎 2 = ,
𝜒 2 𝛼,𝑛−1 𝜒 21−𝛼,𝑛−1
2 2

Donde 𝜒 2 es la distribución chi-cuadrado con n-1 grados de libertad, y S es la desviación estándar muestral.

Intervalo de confianza para la proporción

𝑝Ƹ 1 − 𝑝Ƹ 𝑝(1
Ƹ − 𝑝)Ƹ
𝐼1−𝛼 𝑝 = 𝑝Ƹ − 𝑍1−𝛼 ∙ , 𝑝Ƹ + 𝑍1−𝛼 ∙
2 𝑛 2 𝑛

Donde 𝑝Ƹ es la proporción de la característica de la muestra.


Estimación del tamaño muestral

Se define el error de estimación de un intervalo de convergencia por


𝜎
𝐸𝐸 = 𝑍1−𝛼 ∙
2 𝑛

Despejando, se tiene que el tamaño muestral es


2
𝑍1−𝛼
2
𝑛= ∙𝜎
𝐸𝐸
Intervalo de confianza
para media con varianza conocida

Ejemplo:
Un ingeniero analiza la resistencia de compresión del concreto. La resistencia está distribuida
aproximadamente de manera normal, con varianza 1000 (psi)^2. Al tomar una muestra aleatoria de
12 especímenes, se tiene una media muestral de 3250 psi.
Construir intervalos de confianza para la media poblacional con una confianza de
a) 95%
b) 99%
c) Determinar el tamaño muestral para un intervalo al 95% de confianza, cuya longitud sea igual a
la mitad de la longitud del intervalo hallado en la parte a)
Intervalo de confianza
para media con varianza conocida
Intervalo de confianza
para media con varianza conocida
Intervalo de confianza
para media con varianza conocida
Intervalo de confianza para media con varianza desconocida
Ejemplo:
El artículo “Study on the Life Distribution of Microdrills” (Z. Yang, Y. Cheng y Y. Yang, en Journal of
Engineering Manufactura, 2002:301-305) notifica que en una muestra de 50 microperforadoras
(éstas perforan una aleación de acero con bajo contenido de carbono) el tiempo de vida promedio
(expresado como el número de huecos perforados antes de que falle) era de 12,68 con desviación
estándar de 6,83.
a) Determinar un intervalo de confianza al 95% para la media del tiempo de vida de las
microperforadoras bajo estas condiciones.
b) Con base a los datos del tiempo de vida de las microperforadoras presentados en el enunciado,
un ingeniero notifica un intervalo de confianza para la media de (11.09,14,27), pero olvidó
especificar el nivel. ¿Cuál es el nivel de confianza de este intervalo de confianza?
c) Determinar el tamaño muestral para obtener un intervalo de confianza al 95% que especifique
un error de estimación de 0,5.
Intervalo de confianza para media con varianza desconocida
Intervalo de confianza para media con varianza desconocida
Intervalo de confianza para media con varianza desconocida
Intervalo de confianza para una proporción

Ejemplo:
Se realizó una encuesta a 902 mujeres para saber sus hábitos de alimentación.
De las 902 mujeres encuestadas, 397 consideraban que tienen una buena alimentación.
Determinar el intervalo de confianza para la proporción de la población de mujeres que consideran
que tienen una buena alimentación, con un nivel de confianza del 95%.
Sol:
Intervalo de confianza para una proporción
Ejemplo:
Un equipo de geólogos planea medir los pesos de 250 rocas. Después de pesar cada roca muchas
veces, calculará un intervalo de confianza de 95% para su peso (se genera un intervalo de confianza
por cada roca). Suponer que no hay sesgo en el procedimiento de pesado. ¿Cuál es la probabilidad
de que más de 240 de los intervalos de confianza contengan los pesos verdaderos de las rocas?
Ejemplo:
Un equipo de geólogos planea medir los pesos de 250 rocas. Después de pesar cada roca muchas
veces, calculará un intervalo de confianza de 95% para su peso (se genera un intervalo de confianza
por cada roca). Suponer que no hay sesgo en el procedimiento de pesado. ¿Cuál es la probabilidad
de que más de 240 de los intervalos de confianza contengan los pesos verdaderos de las rocas?
Ejemplo:
Un equipo de geólogos planea medir los pesos de 250 rocas. Después de pesar cada roca muchas
veces, calculará un intervalo de confianza de 95% para su peso (se genera un intervalo de confianza
por cada roca). Suponer que no hay sesgo en el procedimiento de pesado. ¿Cuál es la probabilidad
de que más de 240 de los intervalos de confianza contengan los pesos verdaderos de las rocas?
Ejemplo:
Se desea estimar con un nivel de confianza del 95% la talla media de los estudiantes de 17 años de
cierto colegio. Se tiene como información que la desviación estándar de la talla de los estudiantes
de 17 años de la población es 4 cm.
Determinar un intervalo de confianza al 95% para la talla media de la población, si se tiene una
muestra de 15 estudiantes de 17 años cuyas alturas, en cm, son

167, 167, 168, 168, 168, 169, 171, 172, 173, 175, 175, 175, 177, 182, 195
Ejemplo:
Para una muestra de 30 estudiantes se obtuvo una nota media en el último examen de matemáticas
de 5,83 con una desviación estándar de 1,92.
Determinar el intervalo de confianza para la media poblacional con una confianza al 80%.
Interpretar.
Sol:
Ejemplo:
La afluencia de visitantes a un parque durante un mes, medida a través de una muestra aleatoria
durante 10 días elegidos aleatoriamente, han sido los siguientes:
682, 553, 555, 666, 657, 649, 522, 568, 700, 552
¿Es posible afirmar, con un 95% de confianza, que la afluencia media al parque es de 600 personas
diariamente?
Sol:
Ejemplo:
En una muestra de 25 bebés varones de 12 semanas de vida, se obtuvo un peso medio de 5900 gr.
Además, se sabe que el peso de un bebé en condiciones normales posee una desviación estándar
de 94 gr.
a) Obtener un intervalo de confianza al 99% para el peso medio poblacional.
b) ¿Cuántos niños habría que tomar para estimar dicha media con una precisión de 15 gr?
Sol:
Ejemplo:
Con el fin de analizar el nivel de entendimiento de cierta materia por parte de los estudiantes de
cuarto medio del país, el ministerio de educación preparó una prueba a nivel nacional.
Para analizar los resultados se tomó una muestra de 12 pruebas, cuyos resultados se muestran a
continuación:
6,0; 6,4; 7,0; 5,8; 6,0; 5,8; 5,9; 6,7; 6,1; 6,5; 6,3; 5,8
Suponiendo que las notas siguen una distribución normal, se pide construir un intervalo de
confianza para la varianza poblacional al 95% de confianza.
Sol:

También podría gustarte