Está en la página 1de 10

2.

5-Intervalo de confianza para la media μ de una población


normal con desviación típica conocida σ
Si partimos de una población que sigue una distribución Z ~ N (0,1) bastará con encontrar el punto
crítico zα/2 para tener un intervalo que contenga la media poblacional con probabilidad c.

p (-zα/2 < Z < zα/2) = c


Si en el caso general tomamos:

Bastará con hacer unas sencillas operaciones para llegar a que el intervalo de confianza para la
media μ de una población normal con desviación típica conocida σ es:

Intervalo de confianza para la media μ de una población con desviación típica conocida σ

En el caso de poblaciones que no son normales, o que simplemente no sabemos si lo son o no,
necesitamos que el tamaño de la muestra sea suficientemente grande (n > 30) para poder aplicar
el Teorema central del límite para obtener que el intervalo de confianza para la media μ de una
población con desviación típica conocida σ es:

Intervalo de confianza para la media μ de una población con desviación típica desconocida

Cuando se desconoce la desviación típica poblacional se usa como estimador la desviación típica
de la muestra con lo que el intervalo de confianza para la media μ de una población con desviación
típica desconocida es:

Determinación del tamaño de la muestra

Un problema típico es determinar el tamaño muestral mínimo para que el intervalo de confianza
para la media con un nivel de confianza dado tenga una cota de error igual a una cantidad
conocida.
Para calcular el tamaño muestral mínimo basta plantear la igualdad:

de donde:

Si el valor que se obtiene no es entero se tomará el menor entero mayor que el valor obtenido.

En estos problemas no es necesario conocer la media muestral. Si se conoce la media muestral se


puede determinar el intervalo de confianza

2.6.- INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE


MEDIAS.

Sean 11 x , 12 x , ... 1 n 1 x , una muestra aleatoria de n 1 observaciones tomadas de una


primera población con valor esperado μ1 , y varianza 2 σ 1 ; y 21 x , 22 x , ... 2 n 2 x , una
muestra aleatoria de n2 observaciones tomada de la segunda población con valor
esperado μ 2 y varianza 2 σ 2 . Si X1 y X2 son las medias muéstrales, la estadística X1 – X2 es
un estimador puntual de μ1 − μ 2 , y tiene una distribución normal si las dos poblaciones
son normales, o aproximadamente normal si cumple con las condiciones del teorema del
límite central (tamaños de muestras relativamente grandes).
Por lo tanto:

Para calcular el intervalo de confianza para la diferencia de dos medias se debe saber si las
varianzas poblacionales son conocidas o desconocidas, y en caso de que sean
desconocidas, se debe probar si son igual es o diferentes. Cada uno de estos tres casos se
analizará por separado
Varianzas conocidas pero diferentes,
Si las varianzas poblacionales son conocidas y diferentes, los pasos a seguir para encontrar
el intervalo de confian za son los siguientes: a) El estadístic o usado como estimador
puntual de la diferencia d e medias μ1 − μ 2 , será T = x 1 − x 2 , que es un estimador
suficiente b) La variable aleat oria asociada con el estimador será l a variable normal
estándar dada por:

c) Para calcular el intervalo de confianza se debe tener en cuenta el nivel de confianza que
se quiere considerar.
Teorema. Si x1 − x2 son las medias de dos muestras aleatorias independientes de tamaño
n1 y n2 tomadas de poblaciones que tienen varianzas conocidas 2 σ 1 y 2 σ 2 ,
respectivamente, entonces el intervalo de confianza para μ1 − μ 2 es:

Ejemplo. Construya un intervalo de confianza del 94% para la diferencia real entre las
duraciones de dos marcas de focos, si una muestra de 40 focos tomada al azar de la
primera marca dio una duración media de 418 horas, y una muestra de 50 focos de otra
marca dieron una duración media de 402 horas. Las desviaciones estándares de las dos
poblaciones son 26 horas y 22 horas, respectivamente.
Varianzas desconocidas e iguales
Cuando las varianzas son desconocidas, se debe realizar previamente una prueba
estadística para verificar si éstas son iguales o diferente s. Para hacerlo debemos hace r
uso de la distribución F, bien sea mediante el cálculo de la probabilidad de que la muestra
tomada provenga de dos poblaciones con varianzas iguales, o mediante el uso de un
intervalo de confianza para la relación de dos varianzas, según se estudiará más adelante.
Como se desconocen las varianzas de la población, se usa n las varianzas de las muestras
como estimadores.
El procedimiento a seguir para el cálculo del intervalo de confianza para la diferencia de
dos medias será el siguiente:
a) El estadístico usado como estimador puntual de la diferencia de medias μ1 − μ 2 será x
1 − x 2, que es un estimador suficiente.
La variable aleatoria asociada con el estimador será la variable definida como (se usa t en
caso de muestras pequeñas):

Donde 𝑠𝑝 es un estimador combinado de las 𝑠 2 , “mejor” que 𝑠12 , 𝑠22 por separado,

Donde

c) Para calcular el intervalo de confianza se debe tener en cuenta el nivel de confianza que
se quiere considerar y los grados de libertad que se calculan:

g.l.= 𝑛1 +𝑛2 -2
De nuevo, manipulando la expresión anterior en forma similar al caso previo se llega al
siguiente teorema que nos define el intervalo de confianza para la diferencia entre dos
medias μ1 − μ 2 con varianzas desconocidas pero iguales:

Teorema. Si 𝑥1 ,𝑥2 , 𝑠12 , 𝑠22 , son las medias y las varianzas de dos muestras aleatorias de
tamaños 1 2 n ,n , respectivamente, tomadas de dos poblaciones normales e
independientes con varianzas desconocidas pero i guales, entonces un intervalo de
confianza para la diferencia entre medias μ1 − μ 2 es:
2.7.-INTERVALO DE CONFIANZA PARA UNA PROPORCIÓN
En la inferencia sobre una proporción el problema se concreta en estimar y contrastar la
proporción p de individuos de una población que presentan una determinada
característica A (proporción de votantes a un partido político, proporción de parados, ...).
El problema se modeliza mediante una variable dicotómica que toma el valor 1 si se
presenta la característica de interés y 0 en caso contrario, esto es, una variable de

Bernoulli, ,de la que se dispone de una muestra de tamaño n. Entonces, la


proporción poblacional p no es otra cosa que la media poblacional de dicha variable,
estimándose con la correspondiente proporción muestral o media muestral, .

En el caso de dos poblaciones, se trata de comparar la proporción en la que se presenta


una cierta característica A en las mismas (comparar la proporción de voto a un partido en
dos regiones, comparar la proporción de parados entre hombres y mujeres, ...). El
problema se modeliza mediante dos variables de Bernoulli independientes, de las que se
dispone de sendas muestras aleatorias de tamaño y , respectivamente.

Intervalo de confianza sobre la proporción poblacional


A partir del estadístico

Se construye el intervalo:

siendo el valor que en una distribución normal estándar deja a su derecha una
probabilidad de .
Véase en la hoja adjunta un ejemplo.
Cuando se va a realizar una encuesta para estimar una proporción, lo habitual es
plantearse a priori obtener una cierta fiabilidad y precisión en la estimación, buscando el
tamaño muestral necesario para conseguirlas. La longitud del intervalo de confianza
para p resulta:

De aquí podremos calcular el valor de n en función de la longitud del intervalo, L, y de su


fiabilidad, 1- :

Adviértase que llegamos a un resultado en principio incongruente: queremos saber


cuántas observaciones tenemos que realizar para estimar p y para ello necesitaremos
conocer su estimación, valor que conoceremos una vez hayamos realizado las
observaciones. ¿Cómo solucionar este problema? Existen tres posibles vías:
a) Si tuviésemos información (encuestas anteriores, opiniones de experto,...) sobre el
posible valor de la proporción a estimar, sustituiríamos este valor en la anterior expresión.
b) Podríamos realizar una pequeña encuesta (encuesta piloto) que nos proporcionase una
primera evaluación de la proporción muestral. Además, esta encuesta puede servir para
probar y reformar el cuestionario, organizar el trabajo de campo, etc.
c) Si no contásemos con información alguna ni tuviésemos la posibilidad de realizar la
encuesta piloto, nos pondríamos en la situación más desfavorable, esto es, la que da lugar
al tamaño muestral más grande para la fiabilidad y precisión deseadas. Esa situación se
produce cuando n alcanza su máximo, lo cual ocurre cuando p=q=0.5.
En este caso, por otro lado el más habitual, resulta:
2.8.-INTERVALO DE CONFIANZA PARA DIFERENCIAS ENTRE PROPORCIONES
A partir del estadístico

se construye el intervalo:

siendo el valor que en una distribución normal estándar deja a su derecha una
probabilidad de .

2.9.- INTERVALOS DE CONFIANZA PARA VARIANZAS.

Para estimar un intervalo de confianza para la varianza, nos ayudaremos de la siguiente

propiedad de la distribución :

Consideremos dos cuantiles de esta distribución que nos dejen una probabilidad en
la ``zona central'' de la distribución (cf. figura 8.7):

Figura: Cuantiles de la distribución


Entonces un intervalo de confianza al nivel para la varianza de una distribución
gaussiana (cuyos parámetros desconocemos) lo obtenemos teniendo en cuenta que existe

una probabilidad de que:

Por tanto el intervalo que buscamos es:

2.10.-INTERVALOS DE CONFIANZA PARA RAZONES DE DOS VARIANZAS


La necesidad de disponer de métodos estadísticos para comparar las varianzas de dos
poblaciones es evidente a partir del análisis de una sola población. Frecuentemente se
desea comparar la precisión de un instrumento de medición con la de otro, la estabilidad
de un proceso de manufactura con la de otro o hasta la forma en que varía el
procedimiento para calificar de un profesor universitario con la de otro.
Intuitivamente, podríamos comparar las varianzas de dos poblaciones, σ 2 1 y σ 2 2,
utilizando la razón de las varianzas maestrales y si es casi igual a 1, se tendrá poca
evidencia para indicar que σ 2 1 y σ 2 2 no son i guales.
Por otra parte, un valor muy grande o muy pequeño para, proporcionará evidencia de una
diferencia en las varianzas de las poblaciones.
Para encontrar un intervalo de confianza para el cociente de do s varianzas, empleamos la
distribución F que es similar a como hicimos en el caso de una sola varianza empleando la
distribución chicuadrada, sólo que ahora usamos el estadístico definido por:
Supóngase que se tienen dos poblaciones normales e independientes con varianzas
desconocidas σ 2 1 y σ 2 2, respectivamente. De este par de poblaciones, se tienen
disponibles dos muestras aleatorias de tamaños n 1 y n 2, respectivamente, sean s 2 1 y s
2 2 las dos varianzas muéstrales. Si se desea, por ejemplo, conocer un intervalo de
confianza del 95% por ciento para el cociente de las dos varianzas:

El caso de la distribución la F, para un nivel de confianza (por ejemplo de 95%) requiere


calcular los grados de libertad del numerador y del denominador, este ejemplo son 30 y
24 respectivamente:

Para construir el intervalo de confianza para el cociente de dos varianzas poblacionales, se


coloca la varianza muestral mayor en el numerador del estadístico F.
Esto nos da permite calcular la probabilidad de que el cociente se encuentre entre dos
valores de F.
Para construir el intervalo de confianza empleamos entonces:

En este caso se requiere calcular los grados de libertad del numerador que son n1-1
(recordando que se toma a n1 como el tamaño de la muestra de la varianza más grande) y
los del denominador que son n2 -1.

También podría gustarte