Está en la página 1de 39

Intervalos de Confianza

Prof. Jesús Gómez


Contenido

⌦Estimación de parámetros
⌦Estimación de intervalos

⌦Intervalo de confianza para la media

⌦Intervalo de confianza para la varianza

⌦Otros Intervalos de Confianza


Estimación de Parámetros
Parámetros poblacionales y Estadísticos Muestrales

Parámetros:
Media (μ)

Datos Varianza(σ2)
(Población de Desv. Est. (σ)
Interés) Etc.
Infer
encia
Muestreo s
Estadísticos:
Promedio ( X )

Muestras Varianza muestral(S2)


Desv. Est. muestral(S)
Etc.
Estimación de Parámetros
Ejemplo: Estimación de la media de una población

Parámetro que se pretende estimar : La media de la población ( µ ) que en


general no se conoce, no se puede conocer, o se conoce sólo un valor teórico:

Estimador: La media muestral ( X ) que se calcula a partir de una muestra de


N datos como sigue:

El estimador (en el ejemplo la media muestral) puede tomar diferentes


valores (aleatorios) dependiendo de la muestra (aleatoria) considerada, es
decir, el estimador es una variable aleatoria

Es natural preguntarse : ¿Cuál será la distribución de probabilidad del


estimador? De hecho ¿cuáles serán sus parámetros? ¿tendrán que ver con los
de la población?
Estimación de Parámetros
Ejemplo: Lanzamiento de un dado
Población de interés : El conjunto de datos obtenidos al lanzar un dado legal
en diversas ocasiones
Parámetro de interés : La media (µ) de la población
Estimador: La media muestral ( X )

Experimento aleatorio : Lanzar un dado


Variable aleatoria X= número obtenido en la cara superior
Espacio muestral = {1, 2 , 3, 4, 5 , 6}
Distribución de la variable aleatoria X: Uniforme
Media teórica: µ=3.5
Estimación de Parámetros
Ejemplo: Lanzamiento de un dado
Distribución de la variable aleatoria (X) del experimento
Función de Probabilidad: f(x) = P(X=x)

x 1 2 3 4 5 6
f(x) 1/6 1/6 1/6 1/6 1/6 1/6
Función de Probabilidad
0.2

0.15

0.1
f(x)

μ
0.05

0
1 2 3 4 5 6
x
Estimación de Parámetros
Ejemplo: Lanzamiento de un dado

Distribución del estadístico X .

Diferentes cálculos de X para N=10:


Muestra x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 X
1 1 3 5 1 1 2 2 4 2 2 2.1
2 1 5 3 6 3 3 6 4 2 5 3.8
3 6 1 5 3 5 4 5 3 2 2 3.2
4 2 5 2 4 1 5 3 6 6 4 3.8
5 3 6 5 4 5 4 3 2 3 4 3.7
... ...

Cada muestra puede considerarse como:


▪ 10 valores de la variable aleatoria X,
▪ 1 sólo valor para 10 variables aleatorias X1,X2,...,X10
Estimación de Parámetros
Ejemplo: Lanzamiento de un dado

Distribución del estadístico X .

Si obtenemos 1000 muestras, obtendremos 1000 valores de X , para


estos 1000 valores realizamos el histograma:
Distribución de la media
0.25
muestral

0.2
frecuencia relativa

0.15

0.1

0.05

0
1 2 3 4 5 6
X
Estimación de Parámetros

En general: un estadístico X que pretende estimar un


parámetro μ es una variable aleatoria que depende de los
sujetos que forman una muestra,

Así, una muestra es un conjunto de valores (x1,x2,...,xN)

En la explicación previa, un estimador X produce un valor


que pretende aproximar a un parámetro μ. A este enfoque se le
llama estimación puntual
Estimación de Intervalos

En el enfoque de estimación de intervalos, para un parámetro μ no


se estima un valor, sino un intervalo de la forma L ≤ μ ≤ U, donde
los valores extremos L, U dependen del valor numérico del
estadístico X para una muestra en particular y de la distribución de
muestreo de este estadístico.

Es decir, L,U dependen de la muestra, por lo tanto son valores de


variables aleatorias L, U
Estimación de Intervalos
Partiendo de la distribución de muestreo para X, es posible
determinar valores de L,U tales que se cumpla lo siguiente:
P(L ≤ θ ≤ U) =1 – α
Donde 0 < α < 1

Es decir, se puede garantizar con una probabilidad de 1-α que


la muestra elegida contendrá el valor verdadero de θ

Al intervalo resultante L ≤ θ ≤ U se le conoce como el intervalo


de confianza del 100(1– α) % para el parámetro desconocido μ
Estimación de Intervalos
Ejemplo: Construcción repetida de un intervalo de confianza
para la media μ:
μ

Si los intervalos de confianza mostrados son del 95% significa


que si se construye un gran número de ellos, el 95% de ellos
contendrá a la media
Estimación de Intervalos

En la práctica se obtiene solamente una muestra y se calcula con


ella un intervalo de confianza dicho intervalo contiene o no
contiene a μ, no es razonable asignar una probabilidad a este
evento.
La proposición adecuada es que el intervalo contiene a μ “con
una confianza” del 95%

La longitud del intervalo de confianza (U-L) es una medida de la


calidad de la información obtenida en la muestra,
¿Qué significado tiene un intervalo grande?
¿És deseable que sea grande o que sea pequeño?
¿Qué relación tiene con el valor de 1-α?
Estimación de Intervalos
Intervalo para la Media (Varianza conocida)
Situación: Se tiene una población con media desconocida μ, pero
se supone conocida la varianza σ2.

Se toma una muestra aleatoria (X1,X2,...,XN). Con esta muestra


se calcula el estadístico X el cual es un estimador puntual
insesgado para la media μ desconocida. Se puede obtener un
intervalo de confianza del 100(1-α) % para μ si consideramos
los siguientes hechos acerca de la distribución de X:
Intervalo para la media
Intervalo para la Media (Varianza conocida)
1. Si la población es Normal, la distribución de X es Normal

2. Si la población no es Normal, el Teorema del límite central nos


garantiza una distribución de X aproximadamente normal
cuando N →∞

3. La media de X es μ( X es insesgado)

4. La varianza de X es σ2/N

Teorema del Límite Central:


Afirma que la media muestral tiene una distribución Normal
aunque la población original no la tenga, siempre y cuando la
muestra sea muy grande (de manera práctica N>30)
Intervalo para la media
Intervalo para la Media (Varianza conocida)
De acuerdo a lo anterior, podemos suponer que la variable

Tiene una distribución N(0,1)

α/2 α/2

-zα/2 zα/2 Z

de la figura: P{-zα/2 ≤ Z ≤ zα/2 }=1-α.


Con lo cual el intervalo de confianza del 100(1-α)% para la media es
Intervalo para la media
Intervalo para la Media (Varianza conocida)
Ejemplo: Los siguientes son datos de conductividad térmica de cierto tipo de
hierro (en BTU/hr-ft-°F):
41.60 41.48 42.34 41.95 41.86
42.18 41.72 42.26 41.81 42.04
Una estimación puntual para la media, es X = 41.924. Hallar un intervalo de
confianza del 95 % y uno del 99% para la media.
Se supone que la población tiene una distribución Normal con σ=0.3

Usamos la expresión para encontrar el


intervalo de confianza para la media:
L = 41.924 - 1.96(0.3)/√10 = 41.738, U = 41.924+1.96(0.3)/√10 = 42.110
Entonces el intervalo de confianza del 95% es
41.738 ≤ μ ≤ 42.11
Intervalo para la media
Intervalo para la Media (Varianza conocida)
Selección del tamaño de la muestra:
La precisión del intervalo de confianza es zα/2σ/√N esto significa
que al usar X para estimar μ, el error de estimación, dado por
E=| X - μ| es menor o igual que zα/2σ/√N, con una confianza de
100(1-α)%.

El problema inverso consiste en calcular N para obtener un error


E con una confianza del 100(1-α)% previamente especificado:
N1/2= zα/2σ/E

Ejercicio: Calcular el tamaño adecuado de la muestra para lograr


que el error de estimación de conductividad del hierro sea menor
de 0.05 Btu/hr-ft-°F con una confianza del 95%
Intervalo para la media
Intervalo para la Media (Varianza desconocida)
Si no se conoce la varianza σ2 de la población, una posibilidad es
utilizar la varianza muestral S2 en las ecuaciones obtenidas para
estimar intervalos en el caso de varianza conocida

Este procedimiento funciona para muestras grandes (N>30), por


ello los intervalos de confianza anteriores se les suele llamar
intervalos de confianza para muestras grandes.

Si las muestras son pequeñas el enfoque anterior no funciona y


para lograr un procedimiento válido se supondrá que la población
tiene una distribución Normal
Intervalo para la media
Intervalo para la Media (Varianza desconocida)
Si la población es Normal, la siguiente estadística

Tiene una distribución t con N-1 grados de libertad

α/2 α/2

-tα/2,N-1 tα/2,N-1 T
Intervalo para la media
Intervalo para la Media (Varianza desconocida)

α/2 α/2

-tα/2,N-1 tα/2,N-1 T

de la figura: P{-tα/2,N-1 ≤ T ≤ tα/2,N-1 }=1-α. Con lo cual el


intervalo de confianza del 100(1-α)% para la media es

Ejercicio: Repetir el ejemplo de la conductividad del hierro suponiendo que no se


conoce la varianza
Intervalo para la Varianza
Intervalo para la Varianza de una distribución
Normal
Si la Población es Normal, la distribución muestral del estadístico
siguiente

Donde S2 es la varianza muestral usada como estimador puntual de σ2


Es de tipo Ji-cuadrada con N-1 grados de libertad

α/2 α/2

0 χ2α/2,N-1 χ21−α/2,N-1 X
Intervalo para la Varianza
Intervalo para la Varianza de una distribución Normal

α/2 α/2

0 χ2α/2,N-1 χ21−α/2,N-1 X

De acuerdo a la figura, P(χ21-α/2,N-1 ≤ X ≤ χ2α/2,N-1) = 1-α


Por lo tanto, el intervalo de confianza del 100(1-α)% buscado para
la varianza es

Ejercicio: Hallar el intervalo de confianza del 95% para la varianza en el


ejemplo de la conductividad del hierro
Intervalo para la Varianza
Intervalo para la Varianza de una distribución Normal

Ejercicio: Un fabricante de detergente líquido está interesado


en la efectividad de su proceso para llenar envases de
detergente. La norma dice que no se debe tener una desviación
estándar σ en el proceso mayor de 0.15, ya que de lo contrario
habrá envases más vacíos de lo permitido.
Se toma una muestra aleatoria de 20 envases y se obtiene una
varianza muestral s2=0.0153 onzas2. ¿Es esta medición una
evidencia de que se está cumpliendo la norma con una
confianza del 95% ?

Sugerencia: se puede usar la función PRUEBA.CHI.INV de EXCEL


Otros intervalos de Confianza
Intervalo de confianza para una Proporción

Se toma una muestra de tamaño N de una población muy grande y


resulta que X datos de la muestra pertenecen a alguna clase de
interés. Entonces un estimador puntual de la proporción p de los
datos de la población que pertenecen a la clase en cuestión es:
^P=X/N

Nótese que N y p son los parámetros de una distribución binomial

^ se puede considerar
La distribución de muestreo de P
aproximadamente Normal con media p y varianza p(1-p)/N,
siempre que p no esté muy cerca de 0 o de 1 y si N es
relativamente grande
Otros intervalos de Confianza
Intervalo de confianza para una Proporción

De lo anterior, la distribución de la variable

Es aproximadamente N(0,1)

Entonces, partiendo de P{-zα/2 ≤ Z ≤ zα/2 }=1-α

Obtenemos el siguiente intervalo de confianza aproximado del


100(1-α)% para la proporción p de la población que pertenece a la
clase dada:
Otros intervalos de Confianza
Intervalo de confianza para una Proporción

Ejemplo: De 1000 casos de cáncer pulmonar seleccionados al


azar, 823 son de pacientes que fallecieron. Construya un intervalo
de confianza del 95% para la tasa de mortalidad del cáncer
pulmonar

Solución: La tasa de mortalidad es la proporción de los que


mueren a los que contraen el cáncer pulmonar, de la muestra
tenemos que p^ = 0.823. Por otro lado z0.025=1.96, entonces:

Es decir, 0.799 ≤p≤0.847


Otros intervalos de Confianza
Intervalo de confianza para el cociente de varianzas de dos
distribuciones Normales
Situación: Se tienen dos poblaciones normales e independientes
con varianzas desconocidas σ12, σ22 respectivamente. Se tienen
disponibles dos muestras aleatorias de tamaños N1, N2 una de
cada población respectivamente. Sean S12 S22 las varianzas
muestrales respectivas. Se busca un intervalo de confianza del
100(1-α)% del cociente de varianzas σ12/ σ22
Para hallar el intervalo de confianza se debe recordar que la
distribución de muestreo del estadístico siguiente

Es de tipo F con N2-1 y N1-1 grados de libertad en el numerador y


denominador respectivamente. (Ver la figura siguiente)
Otros intervalos de Confianza
Intervalo de confianza para el cociente de varianzas de dos
distribuciones Normales

α/2 α/2

0 fα/2,N2-1,N1-1 f1−α/2,N2-1,N1-1 F

Así, de la figura: P{fα/2,N2-1,N1-1 ≤ F ≤ f1−α/2,N2-1,N1-1}=1-α

Por lo tanto, el intervalo de confianza buscado es:


Para construir el intervalo de confianza para el cociente de dos
varianzas poblacionales, se coloca la varianza muestral mayor en el
numerador del estadístico F.

Despejando:

Esto nos da permite calcular la probabilidad de que el cociente se


encuentre entre dos valores de F
Para construir el intervalo de confianza empleamos entonces:

En este caso se requiere calcular los


grados de libertad del numerador que
son n1-1(recordando que se toma a n1
como el tamaño de la muestra de la
varianza más grande) y los del
denominador que son n2-1.

El caso de la
distribución la F,
para un nivel de
confianza (por
ejemplo de 95%)
requiere calcular los
grados de libertad
del numerador y del
denominador, por
ejemplo, en este
caso, 30 y 24
respectivamente:
Ejemplo. Un fabricante de automóviles pone a prueba dos nuevos métodos de
ensamblaje de motores respecto al tiempo en minutos. Los resultados se
muestran en la tabla siguiente:

Construir un intervalo de confianza del 90%


para

Solución: Sabemos que

Tomamos a s21 como numerador porque es el valor más grande. Los


valores de F requieren los grados de libertad del numerador (n1-1 = 30) y
del denominador (n2-1 = 24).
DISTRIBUCION F DE SNEDECOR
El intervalo de confianza para el cociente de las desviaciones
estándares sería:

Ejemplo 2. Una empresa fabrica propulsores. A los ingenieros les gustaría saber cuál
de dos procesos tiene la menor rugosidad en las superficies. Para ello se toman
muestras aleatorias de cada proceso.
Datos:
Proceso1. n1= 16 mm, s1= 4.7
Proceso2. n2= 12 mm, s2= 5.1
Resumen de intervalos de confianza

Parámetros de interés Suposiciones


Dist. Muestral Normal (o N grande) σ2 conocida
La media μ
σ2 desconocida (Dist. Muestral T)
La varianza σ2 Dist. Normal (Dist. Muestral Ji2 )
Proporción p Dist. Muest. Normal (N grande, p alejado de 0 y de 1)
Cociente de varianzas Dos poblaciones Normales e independientes (Dist.
σ12/σ22 Muestral tipo F)
σ12 y σ22 conocidas
Diferencia de medias Distribuciones
σ12 = σ22 desconocidas (Dist muest T)
μ1−μ2 normales,
σ12 ≠ σ22 desconocidas (Dist muest T)
Diferencia entre dos Dist. Muestral Normal (N1 y N2 grandes, p1 y p2
proporciones p1-p2 alejados de 0 y de 1)
Otras... (Ver libros de estadística)

También podría gustarte