Está en la página 1de 48

INSTITUTO TECNOLÓGICO DE MÉRIDA

INGENIERIA EN GESTIÓN EMPRESARIAL


ESTADISTICA INFERENCIAL I
4G1
UNIDAD II
2 Inferencia estadística: estimación.

Profr. Raúl Alvar Rodríguez Sánchez.

Mérida, Yucatán, México.

2021
TEMARIO_U2

2.1 Conceptos básicos.__________________________________________________________2

1.- INTRODUCCIÓN_________________________________________2
2.1 Conceptos básicos__________________________________________4
2.2 Distribuciones de muestreo.__________________________________7
2.3 Estimación puntual._______________________________________12
2.4 Estimación de intervalo.____________________________________17
Cómo calcular el intervalo de confianza_____________________36
2.5 Intervalos de confianza para medias._________________________39
2.6 Intervalos de confianza para diferencia entre medias.____________42
2.7 Intervalos de confianza para proporciones.____________________43
2.8 Intervalos de confianza para diferencias entre proporciones.______44
2.9 Intervalos de confianza para varianzas._______________________45
2.10 Intervalos de confianza para razones de dos varianzas__________46

Reproduce los ejercicios y/o ejemplos, incluidos en el material de apoyo (hazlos de


nuevo), considéralos actividades de formación.
Nota: Activa hipervínculos para ubicarte en el subtema deseado-
2 Inferencia estadística: estimación.

2.1 Conceptos básicos.

1.- INTRODUCCIÓN
La Estadística descriptiva y la teoría de la Probabilidad van a ser los pilares de un
nuevo procedimiento (Estadística Inferencial) con los que se va a estudiar el
comportamiento global de un fenómeno. La probabilidad y los modelos de distribución
junto con las técnicas descriptivas, constituyen la base de una nueva forma de interpretar
la información suministrada por una parcela de la realidad que interesa investigar.
En el siguiente esquema representa el tema a tratar y que será desarrollado
a continuación.

Estadística Puntual
Estimación
Descriptiva
INFERENCIA

Probabilidad y
Contraste
modelos

Los métodos básicos de la estadística inferencial son la estimación y el contraste de

hipótesis, que juegan un papel fundamental en la investigación.

Por tanto, algunos de los objetivos que se persiguen en este tema son:

 Calcular los parámetros de la distribución de medias o proporciones muestrales de tamaño

n, extraídas de una población de media y varianza conocidas.

 Estimar la media o la proporción de una población a partir de la media o proporción

muestral.

 Utilizar distintos tamaños muestrales para controlar la confianza y el error admitido.

 Contrastar los resultados obtenidos a partir de muestras.

 Visualizargráficamente, mediante las respectivas curvas normales, las

estimaciones realizadas.

En la mayoría de las investigaciones resulta imposible estudiar a todos y cada uno

de los individuos de la población ya sea por el coste que supondría, o por la imposibilidad

de acceder a ello. Mediante la técnica inferencial obtendremos conclusiones para una

población no observada en su totalidad, a partir de estimaciones o resúmenes numéricos

efectuados sobre la base informativa extraída de una muestra de dicha población. Por

tanto, el esquema que se sigue es el flujo de acciones a proceder.


En definitiva, la idea es, a partir de una población se extrae una muestra por
algunos de los métodos existentes, con la que se generan datos numéricos que se van a
utilizar para generar estadísticos con los que realizar estimaciones o contrastes
poblacionales.
Existen dos formas de estimar parámetros: la estimación puntual y la estimación
por intervalo de confianza. En la primera se busca, con base en los datos muestrales, un
único valor estimado para el parámetro. Para la segunda, se determina un intervalo dentro
del cual se encuentra el valor del parámetro, con una probabilidad determinada.
Si el objetivo del tratamiento estadístico inferencial, es efectuar generalizaciones
acerca de la estructura, composición o comportamiento de las poblaciones no observadas,
a partir de una parte de la población, será necesario que la parcela de población
examinada sea representativa del total. Por ello, la selección de la muestra requiere unos
requisitos que lo garanticen, debe ser representativa y aleatoria.
Además, la cantidad de elementos que integran la muestra (el tamaño de la
muestra) depende de múltiples factores, como el dinero y el tiempo disponibles para el
estudio, la importancia del tema analizado, la confiabilidad que se espera de los
resultados, las características propias del fenómeno analizado, etcétera. Así, a partir de la
muestra seleccionada se realizan algunos cálculos y se estima el valor de los parámetros
de la población tales como la media, la varianza, la desviación estándar, o la forma de la
distribución, etc.
El estudio muestral no es un tema que entre a formar parte de este tema, pero si
necesitaremos una serie de conceptos necesarios para el desarrollo del tema, y que se
detallan a continuación.

2.1 Conceptos básicos.


POBLACIÓN: Conjunto de elementos sobre los que se observa un carácter común. Se
representa con la letra N.
MUESTRA: Conjunto de unidades de una población. Cuanto más significativa sea, mejor
será la muestra. Se representa con la letra n.
UNIDAD DE MUESTREO: Está formada por uno o más elementos de la población. El total
de unidades de muestreo constituyen la población. Estas unidades son disjuntas entre sí y
cada elemento de la población pertenece a una unidad de muestreo.
PARÁMETRO: Es un resumen numérico de alguna variable observada de la población.
Los parámetros normales que se estudian son:

La media poblacional: X
 Total poblacional: X
 Proporción: P
ESTIMADOR: Un estimador θ* de un parámetro θ, es un estadístico que se emplea para
conocer el parámetro θ desconocido.
ESTADÍSTICO: Es una función de los valores de la muestra. Es una variable aleatoria,
cuyos valores dependen de la muestra seleccionada. Su distribución de probabilidad, se
conoce como “Distribución muestral del estadístico”.
ESTIMACIÓN: Este término indica que a partir de lo observado en una muestra (un
resumen estadístico con las medidas que conocemos de Descriptiva) se extrapola o
generaliza dicho resultado muestral a la población total, de modo que lo estimado es el
valor generalizado a la población. Consiste en la búsqueda del valor de los parámetros
poblacionales objeto de estudio. Puede ser puntual o por intervalo de confianza:
- Puntual: cuando buscamos un valor concreto.
- Intervalo de confianza: cuando determinamos un intervalo, dentro del cual se supone que
va a estar el valor del parámetro que se busca con una cierta probabilidad.
CONTRATE DE HIPÓTESIS: Consiste en determinar si es aceptable, partiendo de datos
muestrales, que la característica o el parámetro poblacional estudiado tome un
determinado valor o esté dentro de unos determinados valores.
NIVEL DE CONFIANZA: Indica la proporción de veces que acertaríamos al afirmar que el
parámetro θ está dentro del intervalo al seleccionar muchas muestras.
2.2 Distribuciones de muestreo.
El objetivo de la inferencia es efectuar una generalización de los resultados de la
muestra de la población. La tarea que nos ocupa ahora es conocer las distribuciones de la
probabilidad de ciertas funciones de la muestra, es decir, variables aleatorias asociadas al
muestreo o estadísticos muestrales. Éstos serán útiles para hacer inferencia respecto a
los parámetros desconocidos de una población. Por ello se habla de distribuciones
muestrales, ya que están basados en el comportamiento de las muestras.
El primer objetivo es conocer el concepto de distribución muestral de un estadístico;
su comportamiento probabilístico dependerá del que tenga la variable X y del tamaño de
las muestras.
Sea x1.......xn, una muestra1 aleatoria simple (m.a.s) de la variable aleatoria X, con función
de distribución de la muestra que no contiene ninguna cantidad conocida.
Sea una población donde se observa la variable aleatoria X. Esta variable X, tendrá
una distribución de probabilidad, que puede ser conocida o desconocida, y ciertas
características o parámetros poblacionales. El problema será encontrar una función que
proporcione el mejor estimador de θ. El estimador, T, del parámetro θ debe tener una
distribución concentrada alrededor de θ y la varianza debe ser lo menor posible.
Los estadísticos más usuales en inferencia y su distribución asociada considerando
una población P sobre la que se estudia un carácter cuantitativo son:
Si se seleccionan muestras aleatorias de n observaciones de una población con media   

y desviación estándar  , entonces, cuando n es grande, la distribución muestral de

medias tendrá aproximadamente una distribución normal con una media igual a   y una

desviación estándar de  . La aproximación será cada vez más exacta a medida de
que n sea cada vez mayor.
Ejemplo
Para el cálculo de la distribución muestral de: las medias, varianza y la muestra total
muestral de la distribución:
Dados los valores de una muestra:(
(0,0 (0,2 (0,4 (0,6 (2,0 (2,2 (2,4 (2,6 (4,0 (4,2 (4,4 (4,6 (6,0 (6,2 (6,4 (6,6
) ) ) ) ) ) ) ) ) ) ) ) ) ) ) )

Muestr X(PM Error Error var(e a. El error muestral de


a ) muestral, muestral, -x)2
cada media
e-x- e-x-
(0,0) 0 0 - 3 = -3 -3 9 Le media b. La media de los errores
(0,2) 1 1 - 3 = -2 -2 4 aritmétic muestrales
(0,4) 2 2 - 3 = -1 -1 1 a
c. Σx/n = La desviación estándar de
(0,6) 3 3–3=0 0 0
(2,0) 1 1 – 3 = -2 -2 4 48/16 = 3 los errores muestrales.
(2,2) 2 2 – 3 = -1 -1 1
Σ ex = 0
(2,4) 3 3–3=0 0 0
(2,6) 4 4–3=1 1 1 Var =
(4,0) 2 2 – 3 = -1 -1 1 Σf(x-µ)2/n
(4,2) 3 3–3=0 0 0
(4,4) 4 4–3=1 1 1 σ2 =
(4,6) 5 5–3=2 2 4 40/16 2.2 Distribuciones de
(6,0) 3 3–3=0 0 0 =2.5
(6,2) 4 4–3=1 1 1 σ = muestreo.
(6,4) 5 5–3=2 2 4 1.58 Uno de los propósitos de la
(6,6) 6 6–3=3 3 9 estadística inferencial es
estimar las características poblacionales desconocidas, examinando la información
obtenida de una muestra, de una población.
El punto de interés es la muestra, la cual debe ser representativa de la población objeto de
estudio.
Se seguirán ciertos procedimientos de selección para asegurar de que las muestras
reflejen observaciones a la población de la que proceden, ya que solo se pueden hacer
observaciones probabilísticas sobre una población cuando se usan muestras
representativas de la misma.
Una población está formada por la totalidad de las observaciones en las cuales se tiene
cierto observa.
Una muestra es un subconjunto de observaciones seleccionadas de una población.
Muestras Aleatorias
Para el estudio de las características de poblaciones grandes, se utilizan muestras por
muchas razones;
una enumeración completa de la población, llamada censo, puede ser económicamente
imposible, o no se cuenta con el tiempo suficiente.
A continuación se verá algunos usos del muestreo en diversos campos:
1. Política. Las muestras de las opiniones de los votantes se usan para que los candidatos
midan la opinión pública y el apoyo en las elecciones.
2. Educación. Las muestras de las calificaciones de los exámenes de estudiantes se usan
para determinar la eficiencia de una técnica o programa de enseñanza.
3. Industria. Muestras de los productos de una línea de ensamble sirve para controlar la
calidad.
4. Medicina. Muestras de medidas de azúcar en la sangre de pacientes diabéticos prueban
la eficacia de una técnica o de un fármaco nuevo.
5. Agricultura. Las muestras del maíz cosechado en una parcela proyectan en la
producción los efectos de un fertilizante nuevo.
6. Gobierno. Una muestra de opiniones de los votantes se usaría para determinar los
criterios del público sobre cuestiones relacionadas con el bienestar y la seguridad
nacional.
Errores en el Muestreo
Cuando se utilizan valores muestrales, o estadísticos para estimar valores poblacionales,
o parámetros, pueden ocurrir dos tipos generales de errores: el error muestral y el error no
muestral.
El error muestral se refiere a la variación natural existente entre muestras tomadas de la
misma población.
Cuando una muestra no es una copias exacta de la población; aún si se ha tenido gran
cuidado para asegurar que dos muestras del mismo tamaño sean representativas de una
cierta población, no esperaríamos que las dos sean idénticas en todos sus detalles.
El error muestral es un concepto importante que ayudará a entender mejor la naturaleza
de la estadística inferencial.
Los errores que surgen al tomar las muestras no pueden clasificarse como errores
muestrales y se denominan errores no muestrales.
El sesgo de las muestras es un tipo de error no muestral. El sesgo muestral se refiere a
una tendencia sistemática inherente a un método de muestreo que da estimaciones de un
parámetro que son, en promedio, menores (sesgo negativo), o mayores (sesgo positivo)
que el parámetro real.
El sesgo muestral puede suprimirse, o minimizarse, usando la aleatorización.
La aleatorización se refiere a cualquier proceso de selección de una muestra de la
población en el que la selección es imparcial o no está sesgada; una muestra elegida con
procedimientos aleatorios se llama muestra aleatoria.
Los tipos más comunes de técnicas de muestreo aleatorios son el muestreo aleatorio
simple, el muestreo estratificado, el muestreo por conglomerados y el muestreo
sistemático.
Si una muestra aleatoria se elige de tal forma que todos los elementos de la población
tengan la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria simple.
Tipos de muetreo
Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo de
estadística de 20 alumnos. 20C5 da el número total de formas de elegir una muestra no
ordenada y este resultado es 15,504 maneras diferentes de tomar la muestra. Si listamos
las 15,504 en trozos separados de papel, una tarea tremenda, luego los colocamos en un
recipiente y después los revolvemos, entonces podremos tener una muestra aleatoria de 5
si seleccionamos un trozo de papel con cinco nombres. Un procedimiento más simple para
elegir una muestra aleatoria sería escribir cada uno de los 20 nombres en pedazos
separados de papel, colocarlos en un recipiente, revolverlos y después extraer cinco
papeles al mismo tiempo.
Otro método para obtener una muestra aleatoria de 5 estudiantes en un grupo de 20 utiliza
una tabla de números aleatorios. Se puede construir la tabla usando una calculadora o
una computadora. También se puede prescindir de estas y hacer la tabla escribiendo diez
dígitos del 0 al 9 en tiras de papel, las colocamos en un recipiente y los revolvemos, de
ahí, la primera tira seleccionada determina el primer número de la tabla, se regresa al
recipiente y después de revolver otra vez se selecciona la seguida tira que determina el
segundo número de la tabla; el proceso continúa hasta obtener una tabla de dígitos
aleatorios con tantos números como se desee.
Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco práctico,
imposible o no deseado; aunque sería deseable usar muestras aleatorias simples para las
encuestas nacionales de opinión sobre productos o sobre elecciones presidenciales, sería
muy costoso o tardado.
El muestreo estratificado requiere de separar a la población según grupos que no se
traslapen llamados estratos, y de elegir después una muestra aleatoria simple en cada
estrato. La información de las muestras aleatorias simples de cada estrato constituiría
entonces una muestra global.
Ejemplo 1.2 Suponga que nos interesa obtener una muestra de las opiniones de los
profesores de una gran universidad. Puede ser difícil obtener una muestra con todos los
profesores, así que supongamos que elegimos una muestra aleatoria de cada colegio, o
departamento académico; los estratos vendrían a ser los colegios, o departamentos
académicos.
El muestreo por conglomerados requiere de elegir una muestra aleatoria simple de
unidades heterogéneas entre sí de la población llamadas conglomerados. Cada elemento
de la población pertenece exactamente a un conglomerado, y los elementos dentro de
cada conglomerado son usualmente heterogéneos o disímiles.
Ejemplo 1.3
Suponga que una compañía de servicio de televisión por cable está pensando en abrir una
sucursal en una ciudad grande; la compañía planea realizar un estudio para determinar el
porcentaje de familias que utilizarían sus servicios, como no es práctico preguntar en cada
casa, la empresa decide seleccionar una parte de la ciudad al azar, la cual forma un
conglomerado.
En el muestreo por conglomerados, éstos se forman para representar, tan fielmente como
sea posible, a toda la población; entonces se usa una muestra aleatoria simple de
conglomerados para estudiarla. Los estudios de instituciones sociales como iglesias,
hospitales, escuelas y prisiones se realizan, generalmente, con base en el muestreo por
conglomerados.
El muestreo sistemático es una técnica de muestreo que requiere de una selección
aleatoria inicial de observaciones seguida de otra selección de observaciones obtenida
usando algún sistema o regla.
Ejemplo 1.4
Para obtener una muestra de suscriptores telefónicos en una ciudad grande, puede
obtenerse primero una muestra aleatoria de los números de las páginas del directorio
telefónico; al elegir el vigésimo nombre de cada página obtendríamos un muestreo
sistemático, también podemos escoger un nombre de la primera página del directorio y
después seleccionar cada nombre del lugar número cien a partir del ya seleccionado. Por
ejemplo, podríamos seleccionar un número al azar entre los primeros 100; supongamos
que el elegido es el 40, entonces seleccionamos los nombres del directorio que
corresponden a los números 40, 140, 240, 340 y así sucesivamente. Error Muestral
Cualquier medida conlleva algún error. Si se usa la media para medir, estimar, la media
poblacional m, entonces la media muestral, como medida, conlleva algún error. Por
ejemplo, supongamos que se ha obtenido una muestra aleatoria de tamaño 25 de una
población con media m = 15: si la media de la muestra es x=12, entonces a la diferencia
observada x-m = -3 se le denomina el error muestral. Una media muestral x puede
pensarse como la suma de dos cantidades, la media poblacional m y el error muestral; si e
denota el error muestral, entonces: X = m + e
Ejemplo 1.5
Se toman muestras de tamaño 2 de una población consistente en tres valores, 2, 4 y 6,
para simular una población “grande” de manera que el muestreo pueda realizarse un gran
número de veces, supondremos que éste se hace con reemplazo, es decir, el número
elegido se reemplaza antes de seleccionar el siguiente, además, se seleccionan muestras
ordenadas. En una muestra ordenada, el orden en que se seleccionan las observaciones
es importante, por tanto, la muestra ordenada (2,4) es distinta de la muestra ordenada
(4,2). En la muestra (4,2), se seleccionó primero 4 y después 2. La siguiente tabla contiene
una lista de todas las muestras ordenadas de tamaño 2 que es posible seleccionar con
reemplazo y también contiene las medioas muestrales y los correspondientes errores
muestrales. La media poblacional es igual a m = (2+4+6)/3 = 4. Ver la tabla en la siguiente
página.
Notese las interesantes relaciones siguientes contenidas en la tabla:
La media de la colección de medias muestrales es 4, la media de la población de la que se
extraen las muestras. Si mx denota la media de todas las medias muestrales entonces
tenemos: mx = (3+4+3+4+5+5+2+4+6)/9 = 4
La suma de los errores muestrales es cero. e1 + e2 + e3 + . . . + e9 = (-2) + (-1) + 0 + (-1)
+0+1+0+1+2=0
Muestras ,x, Error muestral e = x - m
ordenadas
(2,2) 2 2-4=-2
(2,4) 3 3-4=-1
(2,6) 4 4-4=0
(4,2) 3 3-4=-1
(4-4) 4 4-4=0
(4-6) 5 5-4=1
(6-2) 4 4-4=0
(6-4) 5 5-4=1
(6-6) 6 6-4=2

En consecuencia, si x se usa para medir, estimar, la media poblacional m, el promedio de


todos los errores muestrales es cero.
Distribuciones Muestrales Las muestras aleatorias obtenidas de una población son, por
naturaleza propia, impredecibles. No se esperaría que dos muestras aleatorias del mismo
tamaño y tomadas de la misma población tenga la misma media muestral o que sean
completamente parecidas; puede esperarse que cualquier estadístico, como la media
muestral, calculado a partir de las medias en una muestra aleatoria, cambie su valor de
una muestra a otra, por ello, se quiere estudiar la distribución de todos los valores posibles
de un estadístico. Tales distribuciones serán muy importantes en el estudio de la
estadística inferencial, porque las inferencias sobre las poblaciones se harán usando
estadísticas muestrales. Como el análisis de las distribuciones asociadas con los
estadísticos muestrales, podremos juzgar la confiabilidad de un estadístico muestral como
un instrumento para hacer inferencias sobre un parámetro poblacional desconocido.
Como los valores de un estadístico, tal como x, varían de una muestra aleatoria a otra, se
le puede considerar como una variable aleatoria con su correspondiente distribución de
frecuencias. La distribución de frecuencia de un estadístico muestral se denomina
distribución muestral. En general, la distribución muestral de un estadístico es la de todos
sus valores posibles calculados a partir de muestras del mismo tamaño.
2.3 Estimación puntual.
Intervalos de confianza

Ahora queremos, a partir de una muestra de tamaño n, estimar el valor de un parámetro de la


población dando un intervalo en el que confiamos que esté dicho parámetro. A este intervalo lo
denominamos, intervalo de confianza, y se calcula la probabilidad de que eso ocurra a la que se
denomina nivel de confianza.
Este curso únicamente estudiaremos estimaciones para la media y para la proporción.
Antes de concretarse en un valor para una muestra determinada, cualquier estadístico puede ser
tratado como una variable aleatoria cuya distribución de probabilidad dependerá de la distribución
de la variable que represente el comportamiento de la población objeto de estudio. Parece
razonable aprovechar la distribución de probabilidad del estadístico utilizado como estimador
puntual de un parámetro para, basándose en ella, llegar a determinar un intervalo de confianza
para el parámetro que se desea estimar. El método que se utiliza para la obtención del intervalo se
conoce como método del estadístico pivote y consta básicamente de los siguientes pasos:
Se elige un estadístico t(X), denominado estadístico pivote, que cumpla los siguientes requisitos:
o Su expresión debe depender del parámetro θ que se quiere estimar.
o Por último, su distribución de probabilidad ha de ser conocida (y en muchos casos
tabulada) y no debe depender del valor de θ.
Para un determinado nivel de confianza, γ, utilizando la distribución de probabilidad de t(X;θ) se
calculan los valores k1 y k2, conocidos como valores críticos.
En el siguiente apartado se muestran los desarrollos necesarios con vistas a obtener intervalos de
confianza para estimar uno de los parámetros de distribución normal, es decir, la media. También
se detalla el cálculo de intervalos de confianza para la proporción de éxitos en pruebas binomiales
(1, p).

Conceptos:
Intervalo de confianza: Si P(a < X < b) = 0'95 tenemos el intervalo de confianza (a, b)
Nivel de confianza o coeficiente de confianza: 1 − α = γ, en nuestro ejemplo, 0’95
Nivel de significación o de riesgo: α, en nuestro ejemplo, 0’05
Valor crítico: k1 y k2, que dejan a la derecha (o a la izquierda) un área α/2.
En la N(0, 1) son −1’96 y 1’96 para α = 0’05.
Margen de error: Diferencia entre los extremos del intervalo de confianza.
Máximo error admisible: Valor prefijado que no puede superar el valor absoluto de la diferencia
entre el estimador y el parámetro.
conceptos ya definidos:
Población. Parámetro de la población (media, proporción)
Muestra. Estadístico de la muestra. Tamaño de la muestra.

Puntualizando:
“Un Intervalo de confianza es un conjunto de valores formado a partir de una muestra de
datos de forma que exista la posibilidad de que el parámetro poblacional ocurra dentro de
dicho conjunto con una probabilidad específica. La probabilidad específica recibe el
nombre de nivel de confianza.”
Basandonos en el teorema del limte central, los procedimientos de calculo se darán en
ámbito de las distribuciones normales y para las muestras pdqueñas en l distribución t
Student.
Ahora procederemos queremos, a partir de una muestra de tamaño n, estimar el valor de
un parámetro de la población dando un intervalo en el que confiamos que esté dicho
parámetro. A este intervalo lo denominamos, intervalo de confianza, y se calcula la
probabilidad de que eso ocurra a la que se denomina nivel de confianza.
Antes de concretarse en un valor para una muestra determinada, cualquier estadístico
puede ser tratado como una variable aleatoria cuya distribución de probabilidad dependerá
de la distribución de la variable que represente el comportamiento de la población objeto
de estudio. Parece razonable aprovechar la distribución de probabilidad del estadístico
utilizado como estimador puntual de un parámetro para, basándose en ella, llegar a
determinar un intervalo de confianza para el parámetro que se desea estimar. El método
que se utiliza para la obtención del intervalo se conoce como método del estadístico pivote
y consta básicamente de los siguientes pasos:
Se elige un estadístico t(X), denominado estadístico pivote, que cumpla los siguientes
requisitos:
o Su expresión debe depender del parámetro θ que se quiere estimar.
o Por último, su distribución de probabilidad ha de ser conocida (y en muchos casos
tabulada) y no debe depender del valor de θ.
Para un determinado nivel de confianza, γ, utilizando la distribución de probabilidad de
t(X;θ) se calculan los valores k1 y k2, conocidos como valores críticos.
En el siguiente apartado se muestran los desarrollos necesarios con vistas a obtener
intervalos de confianza para estimar uno de los parámetros de distribución normal, es
decir, la media. También se detalla el cálculo de intervalos de confianza para la proporción
de éxitos en pruebas binomiales (1, p).
Para ejemplificar:
Conceptos:
Intervalo de confianza: Si P(a < X < b) = 0.95 tenemos el intervalo de confianza
(a, b)
Nivel de confianza o coeficiente de confianza: 1 − α = ., en nuestro ejemplo, 0’95
Nivel de significación o de riesgo: α, en nuestro ejemplo.0’05
Valor crítico: k1 y k2, que dejan a la derecha (o a la izquierda) un área α/2.
En la N(0, 1) son −1.96 y 1.96 para α = 0.05.
Margen de error: Diferencia entre los extremos del intervalo de confianza.
Máximo error admisible: Valor prefijado que no puede superar el valor absoluto de la
diferencia entre el estimador y el parámetro.
conceptos ya definidos:
Población. Parámetro de la población (media, proporción)
Muestra. Estadístico de la muestra. Tamaño de la muestra.
Importante:
Para establecer un intervalo de confianza para la media de una población determinada
utilizaremos una de dos distribuciones: distribución normal estándar o
distribución t de Student, cada una de ellas se utilizará en función de los supuestos que
se hagan de la población investigada, de la información que de ella se tenga y del tamaño
de la muestra elegida.
Un detalle importante es conocer el significado práctico del término Nivel de confianza,
por ejemplo, un nivel de confianza de 95% significa que el 95% de las observaciones
estarán ubicadas en el centro de la distribución y el 5% restante se ubicarán en partes
iguales en “las colas” de la distribución, esto es, 2.5% a cada lado.

2.5% significa que cada “cola” representa un 0.025 del área debejo de la curva de la
distribución normal estándar. El valor señalado se localiza en la tabla Z, entonces Z α/2 =
1.96 para la cola derecha y Zα/2 = -1.96 para la coa izquierda.
2.4 Estimación de intervalo.
Si  es desconocida.
2

Xn 
n 1 t n
En este caso tenemos que
sn
1

tn 1 

Por el mismo razonamiento anterior, si llamamos 1


2 al percentil de la distribución t de


Ptn 1  x 1 
Student tal que

2 , el intervalo de confianza al nivel de significación  (o
equivalentemente, al nivel de confianza 1-  ) será:
 sn sn 
Xn tn
 , X t

1 
1
2 n 1 n n 1 
1 
2 n 1 

Ejemplo: Extraemos una m.a.s. de 61 estudiantes universitarios. Responden a una prueba
de inteligencia espacial, en la que alcanzan una media de 80 y una varianza de 100.
¿Entre qué límites se hallará la verdadera inteligencia espacial media de los estudiantes, a
un nivel de confianza del 99%?

1  0' 99  0' 01 1  0' 995
2
La varianza poblacional es desconocida y la población no es normal, pero el tamaño
muestral es mayor que 30, por tanto, el intervalo correspondiente será:
 sn sn 
Xn tn
 , X t

1 
1
2 n 1 n n 1 
1 
2 n 1 


t60 2' 66
Buscamos en las tablas la distribución t de Student 0 ,995 .

Sabemos que Xn  80 y sn 10 . Sustituyendo en el intervalo de confianza tenemos:


 10 10 
80
  2' 66 , 80 2' 66
 60 60 


por tanto,  76' 57, 83' 43con un nivel de confianza del 99%.
INTERVALO DE CONFIANZA PARA LA PROPORCIÓN
Si en una población Bernouilli de parámetro p definimos la v.a. X= nº éxitos en la muestra,
X sigue una distribución binomial de parámetros (n,p). Si la muestra es grande, tenemos
que la proporción muestral P=X/n se distribuye aproximadamente como una normal

 pq 
N p, 
 n  y podremos usar el teorema central del límite.

En una población Bernoulli,   p ,   p(1  p ) y si denotamos por P a la proporción


2

en la muestra Xn  P . Así pues podemos aplicar el intervalo de confianza para la media


con varianza conocida visto anteriormente, sustituyendo lo anterior y aproximando p(1-p)
por P(1-P). un intervalo de confianza aproximado para p a nivel 1  sería:
 P(1 P ) P(1 P ) 
P z 1 
n
, P z 1 
n 
 
2

2 
Ejemplo: Uno de los líderes de un colectivo laboral desea plantear una cuestión a todos
los miembros del grupo. Si más de la mitad respondieran NO entonces preferiría no
plantearla para no minar su prestigio. Para salir de dudas, elige aleatoriamente a 100
trabajadores a los que hace la pregunta y sólo 30 responden NO. ¿Entre qué límites se
hallará la verdadera proporción al nivel del 95%?
Como el tamaño muestral es grande, podemos aplicar el teorema central del límite.

Tenemos que 1 – α = 0.95 1 – α/2 = 0.975 Z1- α/2 = 1.96

Sustituyendo los valores en el intervalo correspondiente:


[0.3 – 1.96 (√(0.3)(0.7)/100 , 0.3 + 1.96 (√(0.3)(0.7)/100 ] =

= [0.2102 ; 0.3898]

Por tanto, la verdadera proporción está en el intervalo 0.3 – 1.96 (√(0.3)(0.7)/100 con un
nivel de confianza del 95%.
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS.
Suponemos dos poblaaciones independientes

X  N (1 , 12 ) , Y  N(2 , 22 )


Tomamos muestras de tamaño n1 y n2 , respectivamente.

 12 22 
Xn Yn  N 1 2 ,  
1 2
 n n2 
a) Si 1 y 2 son conocidas, como
2 2
1
, el
intervalo de confianza será:

 12 22 12 22 


1 2 Xn Y n z  , Xn Y n z  

1 2 1 

2
n1 n2 1 1 2 

2
n1 n2 
b) Si 1 y 2 son desconocidas pero iguales, como
2 2

Xn Yn 1 2 


1 2
tn 1  n 2  2
n s n 2 s  1 1 
2 2

  
1 1 2

n1 n2 2  n1 n2 
, el intervalo de confianza será:

 
X Y t n1 s12 n 2 s 22  1 1  n1 s12  n 2 s 22  1 1  
  
, X n1 Y n 2 t n1  n 2  21   
 n1 n 1  n 2 2  n1 n 2 2  
n2 n1  n 2  2

1 

2
n
 1 n 2 


2  n1 n 2  

Ejemplo: Dos universidades públicas tienen dos métodos distintos para inscribir a sus
alumnos. Los dos desean comprobar el tiempo promedio que toma la inscripción de los
alumnos. En cada universidad se tomaron los tiempos de inscripción de 31 alumnos

tomados al azar. Las medias y desviaciones típicas muestrales fueron: x 20 ' 3 , s x 2' 5 ,
y 23 , s y 3 . Si se supone que el muestreo se llevó a cabo en dos poblaciones normales

e independientes, obtener los intervalos de confianza al nivel de riesgo 0'05 para la


diferencia entre las medias del tiempo de inscripción para las dos universidades,

a) suponiendo que las varianzas poblacionales son x 9 , y 10 .
2 2

b) suponiendo que las varianzas poblacionales son desconocidas pero iguales.



  0 05 1    0 ' 95 1   0 ' 975  z 
1 ' 96
2 1 
Para el apartado a 2

Sustituyendo los valores en el intervalo obtenemos:

 9 10 9 10 
1  2 20 ' 3 23 1' 96  , 20' 3  23 1' 96   

 31 31 31 31 


 2' 7 1' 53, 2 ' 7 1' 53 4 ' 23 , 1' 17 

t 31 31  2 0 '975 2


Para el apartado b, buscamos en la tabla de la t de Student .
Sustituyendo los valores en el intervalo obtenemos:
 31 2 ' 3 231 3 2  1 1  31 2 ' 3 2 31 3 2 1 1 
20 ' 3 23 2

 31 31 2 31 31 , 20 ' 3 23 2 31 31 2 31 31 



2 ' 7 1' 4 , 2' 7 1' 4 


 4' 1, 1' 3 
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES.

Sean X  Be( p1 ) e Y Be( p2 ) dos poblaciones independientes con p1 y p2

desconocidos. Extraemos muestras de tamaño n1 y n2 , respectivamente. Como

 p1 q1 p2 q2 
P1 P2 N p1  p2 ,  
 n1 n2 y desconocemos los valores de p1 y p2 ,
aproximaremos las proporciones poblacionales por las proporciones muestrales
correspondientes. Por tanto, el intervalo de confianza será:
 P1 Q1 P2 Q2 P1 Q1 P2 Q2 
p1  p2 P1 P2 z  , P1  P2 z  
n1 n2 n1 n2 
 
 1 
2
1 
2

Caso particular: Si tenemos p1  p2  p , entonces EP1 P2 0 y

 1 1  n1 P1 n2 P2


Var P1  P2  pq  
 n1 n2 . Lo que haremos es sustituir p por n1 n2
Ejemplo: En dos grandes empresas se lleva a cabo un estudio sobre la proporción de
mujeres entre sus empleados diplomados y licenciados. De cada empresa se toma una
m.a.s. de 40 empleados entre los diplomados y licenciados, obteniéndose que en la
empresa A había 16 mujeres y en la empresa B, 22 mujeres. Obtener el intervalo de
confianza para la diferencia de proporciones poblacionales al nivel de confianza 0'96
¿Podemos pensar que la proporción es la misma?

1  0' 96 1  0' 98 z  2' 05
2 1 

2

16 22
P1   0' 4 P2  0' 55
40 40
Sustituyendo en el intervalo:
 0' 4 0 ' 6 0' 55 0 ' 45 0 ' 4 0' 6 0' 55 0' 45 
0 ' 4 0 ' 55 2 ' 05  , 0' 4 0' 55 2' 05 

 40 40 40 40 
=

=0 ' 15 0' 2265 , 0 ' 15 0 ' 2265 
 0' 3765 , 0' 0765 

El intervalo contiene al cero, pero el extremo inferior se aleja bastante de cero.


INTERVALO DE CONFIANZA PARA LA VARIANZA.

Si tenemos una población X  N (,  ) con  desconocida, entonces


2
2

 n  1 sn21
  2n 1
 2

El intervalo de confianza para la varianza poblacional al nivel de confianza 1  lo


podemos obtener como sigue:
 (n  1)sn21 
P  2n 1    2n 1    1  
 2
 2
1 
2

Despejando  tenemos:
2

 
 (n  1) s 2 2 
(n  1) sn1
P 2
n 1
  2
 2
 1

 n1   n1 
 1
2 2 
Es decir,
 
 ( n  1)sn21 (n  1)sn21 
  2
2
,
 n 1   2n 1 
 1
2 2


Ejemplo: De acuerdo con las tablas de altura, los varones tienen una altura superior a las
mujeres en la población española. Según las últimas tablas en el servicio militar, los
varones entre 18 y 20 años presentan una varianza de 0'0529. de las mujeres no tenemos
información, por ello tomamos una muestra de 101 mujeres entre 18 y 20 años y

s
obtenemos n1
 0'18 ¿Entre qué valores se encontrará la verdadera varianza a un nivel
de 0'95 de confianza?
 2
1    0'95  1   0'975  100  74'22
2 0 ' 025
Sustituyendo en el intervalo tendremos:

100  0'182 100  0'182 


 ,    0'025,0'0436
 129 '56 74 '22 
INTERVALO DE CONFIANZA PARA EL COCIENTE DE VARIANZAS.

La distribución muestral del cociente de varianzas muestrales, cuando teníamos dos


poblaciones normales e independientes era:

s n21
 12
 Fn 1,m 1
s m2 1
 22

A partir de aquí deducimos el intervalo de confianza para el cociente de varianzas

poblacionales al nivel de 1   y obtenemos


 
 12  s n21 1 s n21 1 
 2 , 2 
 22  s m 1 Fn 1,m1  s m 1 Fn 1,m1  
 1
2 2 

Ejemplo: Con los datos del ejemplo de la pag. 11 , calcular el intervalo de confianza para
el cociente de varianzas al nivel de confianza 0'95. ¿Podríamos aceptar la suposición de
que las varianzas poblacionales son iguales?

1    0'95  1   0'975  F30,300 '975  2'07
2 y

 1 1
 0'025  F30,300 '025  
2 F30,300 '975 2'07
n 2 31 2 m 2 31 2
s n21  sn  2'3  5'47 s m2 1  s m  3  9'3
n 1 30 m 1 30

Sustituyendo en el intervalo obtenemos


 5'47 1 5'47 1 
 9'3  2'07 , 9'3  1 2'07    0'284,1'218
 
El intervalo contiene al 1 y los extremos están bastante próximos al 1. Hay mayor
diferencia por el extremo inferior, lo que indica que la varianza de la población X es menor
que la de la población Y.
En el caso de la distribución t de Student, el principio es el mismo y más adelante veremos un ejemplo de como
leerla. 

Ahora resolvamos algunos ejemplos: 

Intervalo de confianza para la media de una población con 


Desviación Estándar conocida – Muestras Grandes (n > 30). 
Una empresa de investigación llevó a cabo una encuesta para determinar la cantidad media que los
fumadores gastan en cigarrillos durante una semana. La empresa encontró que la distribución de
cantidades gastadas por semana tendía a seguir la distribución normal, con una desviación estándar de $5.
Una muestra de 49 fumadores reveló que el promedio era de $20.

a. ¿Cuál es el estimador puntual de la media de la población? 

Según la muestra tomada $20 es la estimación de la media poblacional. 

b. Con el nivel de confianza de 95%, determine el intervalo de confianza para 𝞵


Podemos comprobar nuestra respuesta utilizando la siguiente función en Excel:

INTERVALO.CONFIANZA.NORM(alfa;desv_estándar;tamaño)
Donde:

alfa: es el nivel de confianza, para nuestro ejemplo alfa = 0.05

desv_estándar: es la desviación estándar de la población, en este caso es 5

tamaño: se refiere al tamaño de la muestra n = 49

Reemplazando en la función, tenemos:

INTERVALO.CONFIANZA.NORM(0.05;5;49) = 1.3999

Por tanto, el intervalo de confianza estará dado por:

20 ± 1.3999

Intervalo de confianza para la media de una población con 


Desviación Estándar desconocida – Muestras Grandes (n > 30).

Cuando desconocemos la desviación estándar de la población (en la vida real es lo más probable) si el tamaño de
muestra es lo suficientemente grande (n ≥ 30), el teorema del Límite Central nos permite utilizar la distribución
normal como la distribución de muestreo, teniendo en cuenta lo siguiente: 
Jon Jackobsen, un pasante de posgrado muy dedicado, acaba de terminar una primera versión de su tesis
de 700 páginas. Jon mecanografió el trabajo por sí mismo y está interesado en conocer el número promedio
de errores tipográficos por página, pero no quiere leer todo el documento. Como sabe algo acerca de
estadística para la administración, Jon leyó 40 páginas seleccionadas de manera aleatoria y encontró que el
promedio de errores tipográficos por página fue de 4.3 y la desviación estándar de la muestra fue de 1.2
errores por página.

a. Calcule el error estándar estimado de la media.

b. Calcule un intervalo de confianza del 90% para el número promedio verdadero de errores por página en
su trabajo.
En Excel no existe una función directa para calcular el intervalo de confianza de este escenario particular, pero
podemos utilizar la función mostrada en el ejercicio anterior y calculando manualmente el factor de
corrección:√(N-n)/(N-1)

Intervalo de confianza para la media de una población con  Desv.


Estándar desconocida – Muestras Pequeñas (n < 30).
Para este caso particular utilizaremos la distribución t de Student con n -1 grados de libertad:

El propietario de Britten’s Egg Farm desea calcular la cantidad media de huevos que pone cada gallina.
Una muestra de 20 gallinas indica que ponen un promedio de 20 huevos al mes, con una desviación estándar
de 2 huevos al mes.

a.     ¿Cuál es el valor de la media de la población? ¿Cuál es el mejor estimador?

No se conoce la media poblacional, pero su mejor estimador es   huevos al mes.

b.  Explique por qué necesita utilizar la distribución t. ¿Qué suposiciones necesita hacer?

Utilizamos la distribución t porque se desconoce la desviación estándar de la población, pero para aplicarla,
debemos suponer que la población sigue una distribución normal.
c. ¿Cuál es el valor t para un intervalo de confianza de 95%?

Con 95% de confianza y n – 1 = 20 – 1 = 19 grados de libertad, entonces, t = 2.093

d. Construya un intervalo de confianza de 95% para la media de la población.


Podemos comprobar nuestra respuesta utilizando la siguiente función en Excel:

INTERVALO.CONFIANZA.T(alfa;desv_estándar;tamaño)
Donde:

alfa: es el nivel de confianza, para nuestro ejemplo alfa = 0.05

desv_estándar: es la desviación estándar de la muestra, en este caso es 2

tamaño: se refiere al tamaño de la muestra n = 20

Reemplazando en la función, tenemos:

INTERVALO.CONFIANZA.NORM(0.05;2;20) = 0.9360

Por tanto, el intervalo de confianza estará dado por:

20 ± 0.9360

En nuestra página de descargas puedes obtener un archivo en formato PDF totalmente GRATIS con los


ejercicios aquí resueltos. 
Cómo calcular el intervalo de confianza

Pasos 

Un intervalo de confianza (o nivel de confianza) es un indicador de la precisión de una


medición que hiciste. También es un indicador de cuán estable es tu valor estimado, el
cual es la medida de lo cerca que estará la medición hecha con respecto al valor estimado
original si repitieras tu experimento. Sigue los pasos a continuación para calcular el
intervalo de confianza para tus datos.
Pasos
1 Escribe el fenómeno que te gustaría examinar. Supongamos que trabajas con la
siguiente situación: el peso promedio de un estudiante de género masculino en
determinado centr educativo es de 82 kg (180 lb). Analizarás qué tan precisamente podrás
predecir el peso de los estudiantes varones dentro de un intervalo de confianza dado.

2 Selecciona una muestra de tu población escogida. Esta es la que utilizarás en la


recolección de datos para evaluar tu hipótesis. Supongamos que seleccionaste, al azar,
1000 estudiantes hombres.

3 se require calcular el promedio(media aritmetica) y la desviación estándar de tu


muestra. 

Escoge un dato estadístico de tu muestra (por ejemplo, el promedio o la desviación


estándar) que quieras usar para estimar el parámetro de tu población escogida.

Un parámetro de población es un valor que representa una característica particular de la


población. Así es cómo puedes encontrar el promedio y la desviación estándar de tu
muestra:
Para calcular el promedio (o media) de los datos de la muestra, solo suma todos los pesos
de la muestra. X = Σx/n

Para calcular la desviación estándar de la muestra, tendrás que encontrar el promedio o la


media de los datos. Luego, tendrás que encontrar la varianza de los datos o el promedio al
cuadrado de las diferencias con respecto al valor medio. Una vez que encuentres este
número, solo calcula su raíz cuadrada.

σ = √Σ(X – X)2/n

1.

4 Elige el nivel de confianza que desees. Los niveles de confianza usados con mayor
frecuencia son 90 %, 95 % y 99 %. Al resolver un problema, es posible que tengas este
dato a tu disposición. Supongamos que escogiste 95 %.

5.-Calcula tu margen de error. Puedes encontrar el margen de error usando la siguiente


fórmula:

Za/2 σ/√(n)

Za/2 = coeficiente de confianza, donde

a = nivel de confianza,

σ = desviación estándar,

n = tamaño de muestra.

Esta es otra forma de decir que deberías multiplicar el valor crítico por el error estándar.
Así es como puedes resolver esta fórmula al dividirla en partes:

Para hallar el valor crítico, o Za/2: en este caso el nivel de confianza es de 95 %. Convierte
el porcentaje a un número decimal 0.95 y divídelo entre 2 para tener 0.025. Luego, revisa
la tabla de valores z para encontrar el valor que corresponde a 0.025. Verás que el valor
más cercano es -1.96 en la intersección de la fila 1.9 y la columna 0.6.

 Calcula el error estándar: toma la desviación estándar, 14 kg (30 lb), y divídela entre la
raíz cuadrada del tamaño de la muestra, 1000. Obtendrás 14/31,6 o 0,44 kg (0,95 lb).
 Multiplica 1,96 por 0,44 (tu valor crítico por tu error estándar) para obtener 0,86; tu

margen de error.

X ± Zα/2 (σ/√n)

6.- Expresa tu intervalo de confianza. Para expresar el intervalo de confianza,


simplemente tienes que substituir el promedio o la media (82), y escribirla al lado de ± y el
margen de error. La respuesta es: 82 ± 0,86. Puedes encontrar los límites superior e
inferior del intervalo de confianza, sumando y restando el margen de error a la media.
Entonces, tu límite inferior es 82 – 0,86 o 81,14 kg (178,14 lb), y tu límite superior es 82 +
0,86, o 82,86 kg (181,86 lb).

Tomar en cuenta las siguientes aseveraciones.

o Tanto los valores t como los valores z se pueden calcular de forma manual, así como con una
calculadora gráfica o tablas estadísticas, las cuales se encuentran a menudo en los textos de
estadística. Los valores z también se pueden encontrar utilizando una calculadora de
distribución normal, mientras que los valores t se pueden encontrar usando una calculadora de
distribución T. También encontrarás herramientas de cálculo en Internet y en los software
estadísticos.
o Tu población de muestra debe seguir una distribución normal para que tu intervalo de
confianza sea válido.
o El valor crítico que se usa para calcular el margen de error es una constante que se expresa,
ya sea como un valor t o como un valor z. Generalmente se prefiere usar los valores t cuando
la desviación estándar de la población es desconocida o cuando se usa una muestra pequeña.
o Hay muchos métodos, como: el muestreo simple aleatorio, el muestreo sistemático o el
muestreo por estratos, con los cuales podrás seleccionar una muestra representativa que
permita analizar tu hipótesis.
o Un intervalo de confianza no indica la probabilidad de un resultado posible. Por ejemplo, si
estás 95 % seguro de que el promedio de tu población está entre 75 y 100, el intervalo de
confianza de 95 % no significa que haya 95 % de probabilidades de que la media se encuentre
dentro del rango que calculaste.
2.5 Intervalos de confianza para medias.
INTERVALOS DE CONFIANZA MUESTRAS GRANDES
Intervalo de confianza para la media de una población con σ, Desviación
Estándar conocida y Muestras Grandes (n > 30). 

Aplicación en el siguiente ejemplo.


Una empresa de investigación llevó a cabo una encuesta para determinar la
cantidad media que los fumadores gastan en cigarrillos durante una semana. La
empresa encontró que la distribución de cantidades gastadas por semana tendía a
seguir la distribución normal, con una desviación estándar de $5. Una muestra de 49
fumadores reveló que el promedio era de $20.
a. ¿Cuál es el estimador puntual de la media de la población? 
Según la muestra tomada $20 es la estimación de la media poblacional. 
b. Con el nivel de confianza de 95%, determine el intervalo de confianza para 𝞵
b) para determinar el intervalo de confianza el estadístico es:
Región de α α/2 zα/2
confianza
90% 0.1 0.05 1.645
95% 0.05 0.025 1.96
99% 0.01 0.005 2.576

Por lo que la media poblacional, con un nivel de confianza de 95% se encontrará en el


intervalo producto de calcular

20 – 1.96 (5/√49) ≤ 𝞵 ≤ 20 + 1.96(5/√49)


20 – 1.96 (5/√49) = 18.6084
20 + 1.96(5/√49) = 21.3916
Por lo tanto, con un 95% de confianza, la media poblacional se encontrará en el intervalo.
(18.6084 ; 21.3916)
En la gráfica, la media poblacional se ubicará en la región azul.

Podemos comprobar nuestra respuesta utilizando la siguiente función en Excel:


De donde 20 ± 1.399974275 es el intervalo.
Con PHSTAT2
Empleando la siguiente secuencia de comandos:
Complementos_PHSTAT_confident intervals_estimate for the mean sigma known
Doble click y en la pantalla emergente incorporar la información.

Al acepta (OK)

Construir intervalo con


2.6 Intervalos de confianza para diferencia entre medias.
Suponemos dos poblaaciones independientes

X  N (1 , 12 ) , Y  N(2 , 22 )


Tomamos muestras de tamaño n1 y n2 , respectivamente.

 12 22 
Xn Yn  N 1 2 ,  
a) Si 1 y 2 son conocidas, como
2 2 1 2
 n1
n2 , el
intervalo de confianza será:
 12 22 12 22 
1 2 Xn Y n z  , Xn Y n z  
n1 n2 n1 n2 
 

1
1 2  1 1 2 
2 2

b) Si 1 y 2 son desconocidas pero iguales, como


2 2

Xn Yn 1 2 


1 2
tn 1  n 2  2
n s n 2 s  1 1 
2 2

  
1 1 2

n1 n2 2  n1 n2 
, el intervalo de confianza será:

 
X Y t n1 s12 n 2 s 22  1 1  n1 s12  n 2 s 22  1 1  
  
, X n1 Y n 2 t n1  n 2  21   
 n1 n 1  n 2 2  n1 n 2 2   
n2 n1  n 2  2
 n1 n 2   n1 n 2  
 


1  
2 2

Ejemplo: Dos universidades públicas tienen dos métodos distintos para inscribir a sus
alumnos. Los dos desean comprobar el tiempo promedio que toma la inscripción de los
alumnos. En cada universidad se tomaron los tiempos de inscripción de 31 alumnos

tomados al azar. Las medias y desviaciones típicas muestrales fueron: x 20 ' 3 , s x 2' 5 ,
y 23 , s y 3 . Si se supone que el muestreo se llevó a cabo en dos poblaciones normales

e independientes, obtener los intervalos de confianza al nivel de riesgo 0'05 para la


diferencia entre las medias del tiempo de inscripción para las dos universidades,

a) suponiendo que las varianzas poblacionales son x 9 , y 10 .
2 2

b) suponiendo que las varianzas poblacionales son desconocidas pero iguales.



  0 05 1    0 ' 95 1   0 ' 975  z 
1 ' 96
2 1 
Para el apartado a 2

Sustituyendo los valores en el intervalo obtenemos:

 9 10 9 10 
1  2 20 ' 3 23 1' 96  , 20' 3  23 1' 96   

 31 31 31 31 


2' 7 1' 53, 2 ' 7 1' 53 4 ' 23 , 1' 17 


t 31 31  2 0 '975 2
Para el apartado b, buscamos en la tabla de la t de Student .
Sustituyendo los valores en el intervalo obtenemos:

 31 2 ' 331 3 2  1 1 


2
31 2 ' 331 3 2 1 1 
2

20 ' 3 23 2



 31 31 2 31 31 , 20 ' 3 23 2 31 31 2 31 31 



2 ' 7 1' 4 , 2' 7 1' 4 


 4' 1, 1' 3 

2.7 Intervalos de confianza para proporciones.


Si en una población Bernouilli de parámetro p definimos la v.a. X= nº éxitos en la muestra,
X sigue una distribución binomial de parámetros (n,p). Si la muestra es grande, tenemos
que la proporción muestral P=X/n se distribuye aproximadamente como una normal

 pq 
N p, 
 n  y podremos usar el teorema central del límite.

En una población Bernoulli,   p ,   p(1  p ) y si denotamos por P a la proporción


2

en la muestra Xn  P . Así pues podemos aplicar el intervalo de confianza para la media


con varianza conocida visto anteriormente, sustituyendo lo anterior y aproximando p(1-p)
por P(1-P). un intervalo de confianza aproximado para p a nivel 1  sería:
 P(1 P ) P(1 P ) 
P z 1 
n
, P z1 
n 
 
2

2 
Ejemplo: Uno de los líderes de un colectivo laboral desea plantear una cuestión a todos
los miembros del grupo. Si más de la mitad respondieran NO entonces preferiría no
plantearla para no minar su prestigio. Para salir de dudas, elige aleatoriamente a 100
trabajadores a los que hace la pregunta y sólo 30 responden NO. ¿Entre qué límites se
hallará la verdadera proporción al nivel del 95%?
Como el tamaño muestral es grande, podemos aplicar el teorema central del límite.

Tenemos que 1 – α = 0.95 1 – α/2 = 0.975 Z1- α/2 = 1.96

Sustituyendo los valores en el intervalo correspondiente:


[0.3 – 1.96 (√(0.3)(0.7)/100 , 0.3 + 1.96 (√(0.3)(0.7)/100 ] =

= [0.2102 ; 0.3898]

Por tanto, la verdadera proporción está en el intervalo 0.3 – 1.96 (√(0.3)(0.7)/100 con un
nivel de confianza del 95%.

2.8 Intervalos de confianza para diferencias entre proporciones.


INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES.

Sean X  Be( p1 ) e Y Be( p2 ) dos poblaciones independientes con p1 y p2

desconocidos. Extraemos muestras de tamaño n1 y n2 , respectivamente. Como

 p1 q1 p2 q2 
P1 P2 N p1  p2 ,  
 n1 n2 y desconocemos los valores de p1 y p2 ,
aproximaremos las proporciones poblacionales por las proporciones muestrales
correspondientes. Por tanto, el intervalo de confianza será:
 P1 Q1 P2 Q2 P1 Q1 P2 Q2 
p1  p2 P1 P2 z  , P1  P2 z  
 1 

2 n1 n2 1 

2 n1 n2 

Caso particular: Si tenemos p1  p2  p , entonces EP1 P2 0 y

 1 1  n1 P1 n2 P2


Var P1  P2  pq  
 n1 n2 . Lo que haremos es sustituir p por n1 n2
Ejemplo: En dos grandes empresas se lleva a cabo un estudio sobre la proporción de
mujeres entre sus empleados diplomados y licenciados. De cada empresa se toma una
m.a.s. de 40 empleados entre los diplomados y licenciados, obteniéndose que en la
empresa A había 16 mujeres y en la empresa B, 22 mujeres. Obtener el intervalo de
confianza para la diferencia de proporciones poblacionales al nivel de confianza 0'96
¿Podemos pensar que la proporción es la misma?

1  0' 96 1  0' 98 z  2' 05
2

1 
2

16 22
P1   0' 4 P2  0' 55
40 40
Sustituyendo en el intervalo:
 0' 4 0 ' 6 0' 55 0 ' 45 0 ' 4 0' 6 0' 55 0' 45 
0 ' 4 0 ' 55 2 ' 05  , 0' 4 0' 55 2' 05 

 40 40 40 40 
=

=0 ' 15 0' 2265 , 0 ' 15 0 ' 2265 
 0' 3765 , 0' 0765 
El intervalo contiene al cero, pero el extremo inferior se aleja bastante de cero.

2.9 Intervalos de confianza para varianzas.

Si tenemos una población X  N (,  ) con  desconocida, entonces


2
2

 n  1 sn21
  2n 1
 2

El intervalo de confianza para la varianza poblacional al nivel de confianza 1  lo


podemos obtener como sigue:
 2 (n  1)sn21 
P  n 1    2
n 1   1
 2
2 1 

2

Despejando  tenemos:
2

 
 (n  1) s 2 2 
(n  1) sn1
P 2
n 1
  2
 2
 1
  n1   n1 

 1
2 2 
Es decir,
 
 ( n  1)sn21 (n  1)sn21 
  2
2
,
 n 1   2n 1 
 1
2 2


Ejemplo: De acuerdo con las tablas de altura, los varones tienen una altura superior a las
mujeres en la población española. Según las últimas tablas en el servicio militar, los
varones entre 18 y 20 años presentan una varianza de 0'0529. de las mujeres no tenemos
información, por ello tomamos una muestra de 101 mujeres entre 18 y 20 años y

s
obtenemos n1
 0'18 ¿Entre qué valores se encontrará la verdadera varianza a un nivel
de 0'95 de confianza?
 2
1    0'95  1   0'975  100  74'22
2 0 ' 025

Sustituyendo en el intervalo tendremos:

100  0'182 100  0'182 


 ,    0'025,0'0436
 129 '56 74 '22 
2.10 Intervalos de confianza para razones de dos varianzas.
INTERVALO DE CONFIANZA PARA EL COCIENTE DE VARIANZAS.
La distribución muestral del cociente de varianzas muestrales, cuando teníamos dos
poblaciones normales e independientes era:

s n21
 12
 Fn 1,m 1
s m2 1
 22

A partir de aquí deducimos el intervalo de confianza para el cociente de varianzas

poblacionales al nivel de 1   y obtenemos


 
 12  s n21 1 s n21 1 
 2 , 2 
 22  s m 1 Fn 1,m1  s m 1 Fn 1,m1  
 1
2 2 

Ejemplo: Con los datos del ejemplo de la pag. 11 , calcular el intervalo de confianza para
el cociente de varianzas al nivel de confianza 0'95. ¿Podríamos aceptar la suposición de
que las varianzas poblacionales son iguales?

1    0'95  1   0'975  F30,300 '975  2'07
2 y

 1 1
 0'025  F30,300 '025  
2 F30,300 '975 2'07
n 2 31 2 m 2 31 2
s n21  sn  2'3  5'47 s m2 1  s m  3  9'3
n 1 30 m 1 30

Sustituyendo en el intervalo obtenemos

 5'47 1 5'47 1 
 9'3 2'07 9'3 1 2'07    0'284,1'218
 , 
 

El intervalo contiene al 1 y los extremos están bastante próximos al 1. Hay mayor


diferencia por el extremo inferior, lo que indica que la varianza de la población X es menor
que la de la población Y.

También podría gustarte