Está en la página 1de 23

UNIVERSIDAD DE SUCRE

ASIGNATURA: Estadística II
Docente: Lina Pérez

TEMAS: Estimación, Intervalos de Confianza – Capítulo 7

PALABRAS CLAVES: Estimación puntual, intervalo de confianza, nivel de confianza, nivel de


significancia, distribución t.

TEXTO GUÍA: Estadística para administración y economía – Richard I. Levin

Estadística para administración y economía – Anderson Sweeney y Williams

OTRAS AYUDAS: www.geogebra.org

1. OBJETIVOS

 Aprender cómo hacer estimaciones de ciertas características de una población a partir de


muestras.
 Aprender las fortalezas y limitaciones de las estimaciones puntuales y las estimaciones de
intervalo
 Calcular qué tan precisas son en realidad nuestras estimaciones
 Aprender a utilizar la distribución t para hacer estimaciones de intervalo en algunos casos
en los que la distribución normal no se puede utilizar

2. TEORÍA
2.1. Introducción
Los administradores también deben hacer estimaciones rápidas. El resultado de estas
estimaciones puede afectar sus organizaciones. ¿De qué manera los administradores
utilizan estadísticas para estimar los parámetros de una población? El jefe de departamento
de alguna universidad intenta estimar el número de inscripciones que tendrá el siguiente
semestre a partir de las inscripciones actuales en los mismos cursos. El director de un
departamento de crédito intentará estimar el valor crediticio de los futuros clientes a partir
de una muestra de sus hábitos de pago. El comprador de una casa intenta estimar el curso
futuro de las tasas de interés mediante la observación de su comportamiento actual. En
cada caso, alguien trata de inferir algo acerca de una población a partir de la información
adquirida de una muestra. Todas estas personas hacen estimaciones sin preocuparse de si
son científicas o no, pero con la esperanza de que las estimaciones tengan una semejanza
razonable con el resultado.

Más allá de confiar en presentimientos sobre las decisiones y estimaciones que realizamos,
podemos aplicar los conceptos de la estadística para obtener mejores resultados y estimar
la precisión de la medida numérica que estemos calculando.
2.2. Tipos de Estimación
Podemos hacer dos tipos de estimaciones concernientes a una población: una estimación
puntual y una estimación de intervalo.

 Una estimación puntual es un solo número que se utiliza para estimar un parámetro de
población desconocido. Por ejemplo, el jefe de departamento de una universidad estaría
haciendo una estimación puntual si afirmara: “Nuestros datos actuales indican que en esta
materia tendremos 350 estudiantes el siguiente semestre.” A menudo, una estimación
puntual es insuficiente debido a que sólo tienen dos opciones: es correcta o está
equivocada. Si le dicen solamente que la afirmación sobre la inscripción está equivocada, no
sabe qué tanto está mal y no puede tener la certeza de que la estimación es confiable.

 Una estimación por intervalo es un rango de valores que se utiliza para estimar un
parámetro de la población.

Cualquier estadístico de la muestra que se utilice para estimar un parámetro poblacional se


conoce como estimador, es decir, un estimador es un estadístico de la muestra utilizado
para estimar un parámetro poblacional. La media de la muestra 𝑋̅ puede ser un estimador
de la media de la población µ, y la proporción de la muestra se puede utilizar como un
estimador de la proporción de la población. En otras palabras, un estimador es un
estadístico usado para estimar un parámetro desconocido de la población.

Por ejemplo, si se desea conocer el precio medio de un artículo (el parámetro desconocido)
se recogerán observaciones del precio de dicho artículo en diversos establecimientos (la
muestra) y la media aritmética de las observaciones puede utilizarse como estimador del
precio medio. El valor de un estimador proporciona lo que se denomina en estadística una
estimación puntual del valor del parámetro en estudio.

Para cada parámetro pueden existir varios estimadores diferentes. En general, escogeremos
el estimador que posea mejores propiedades.

2.3. Cualidades de un buen estimador

Insesgado. Ésta es una propiedad deseable para un buen estimador. El término insesgado
se refiere al hecho de que una media de la muestra es un estimador no sesgado de una
media de la población porque la media de la distribución muestral de las medias de las
muestras tomadas de la misma población es igual a la media de la población misma.

Eficiencia. Otra propiedad deseable de un buen estimador es que sea eficiente. La eficiencia
se refiere al tamaño de la desviación estándar del estadístico (la desviación estándar del
estadístico también se conoce con el nombre de error estándar). Si comparamos dos
estadísticos de una muestra del mismo tamaño y tratamos de decidir cuál de ellas es un
estimador más eficiente, escogeríamos la estadística que tuviera el menor error estándar o
la menor desviación estándar de la distribución muestral.
Consistencia. Una estadística es un estimador consistente de un parámetro de población si
al aumentar el tamaño de la muestra, se tiene casi la certeza de que el valor de la estadística
se aproxima bastante al valor del parámetro poblacional. Si un estimador es consistente, se
vuelve más confiable al tener tamaños de muestra más grandes.

Suficiencia. Un estimador es suficiente si utiliza tanta información de la muestra que ningún


otro estimador puede extraer información adicional acerca del parámetro de población que
se está estimando.

2.4. Estimación puntual


La media de la muestra 𝑋̅ es el mejor estimador de la media de la población µ. Es insesgada,
consistente, el estimador más eficiente y, siempre y cuando la muestra sea suficientemente
grande, su distribución muestral puede ser aproximada por medio de la distribución normal.
La forma de hacer una estimación puntual sobre la media es por medio de su fórmula:

El estimador más utilizado para estimar la desviación estándar de la población σ, es la


desviación estándar de la muestra, s.

Varianza muestral

Desviación estándar de
la muestra

La proporción de unidades de una población dada que tiene una característica particular se
denota por p. Si conocemos la proporción de unidades de una muestra que tiene la misma
característica (denotada por 𝑝̂ ), podemos utilizar esta 𝑝̂ como estimador de p. Se puede
demostrar que 𝑝̂ tiene todas las características deseables analizadas; es insesgado (no
sesgado), consistente, eficiente y suficiente. La proporción se puede estimar de la siguiente
manera:

𝑥
𝑝̂ =
𝑛

Donde "x" es el número de éxitos u observaciones de interés y "n" el tamaño de la muestra.

Ejemplo de estimaciones puntuales

Ej. 1 El Greensboro Coliseum estudia la posibilidad de ampliar su capacidad de asientos y


necesita conocer tanto el número promedio de personas que asisten a los eventos como la
variabilidad de este número. Los datos se refieren a la asistencia (en miles) a nueve eventos
deportivos seleccionados al azar. Encuentre las estimaciones puntuales de la media y la
varianza de la población de la que se tomó la muestra.

8.8 14.0 21.3 7.9 12.5 20.6 16.3 14.1 13.0


Solución:

Ej. 2 Suponga que la administración de una empresa desea estimar el número de cajas que
llegarán dañadas a su destino por mal manejo en el traslado. Podemos verificar una muestra
de 50 cajas a partir del punto de embarque hasta su arribo al punto de destino, y luego
registrar la presencia o ausencia de daños. En este caso, si encontramos que la proporción
de cajas dañadas en la muestra es 0.08, diríamos que:

Y, debido a que la proporción de la muestra 𝑝̂ es un estimador conveniente de la proporción


de la población p, podemos estimar que la proporción de cajas dañadas de toda la población
será también 0.08.

2.5. Estimación por intervalos

El propósito de tomar muestras es conocer más acerca de una población. Podemos calcular
esta información a partir de las muestras como estimaciones puntuales, que acabamos de
analizar, o como estimaciones de intervalo. Una estimación de intervalo describe un rango
de valores dentro del cual es posible que esté un parámetro de la población.

El intervalo de confianza es un intervalo en torno a la estimación obtenida donde, con un


nivel de significación fijado, tenemos la confianza de encontrar el auténtico valor del
parámetro estimado.

En estadística, la probabilidad que asociamos con una estimación de intervalo se conoce


como nivel de confianza, lo denotamos como 1 – α, donde α se denomina nivel de
significancia o nivel de significación. Esta probabilidad indica qué tanta confianza tenemos
de que la estimación de intervalo incluya al parámetro de población. Una probabilidad más
alta implica una mayor confianza. En la estimación, los niveles de confianza que se utilizan
con más frecuencia son 90, 95 y 99%, pero somos libres de aplicar cualquier nivel de
confianza.

Podría pensarse que deberíamos utilizar un alto nivel de confianza, como 99%, en todos los
problemas sobre estimaciones. Después de todo, parece ser que un alto nivel de confianza
significa un alto grado de precisión en lo que a la estimación concierne. En la práctica, sin
embargo, altos niveles de confianza producen intervalos de confianza grandes, y éstos, de
hecho, dan estimaciones bastante imprecisas.

Un intervalo de confianza con un nivel de confianza del 95% no significa que la probabilidad
de encontrar el parámetro de la población entre esos márgenes sea 0,95. Lo que realmente
significa es que, si extraemos un número determinado de muestras del mismo tamaño de
una población con un parámetro de valor constante, el 95% de los intervalos de confianza
construidos a partir de esas muestras contendrán el valor del parámetro que buscamos y el
5% restante no lo contendrán.

2.6. Intervalo de confianza para la media µ


Con objeto de obtener una estimación por intervalo para la media poblacional, se necesita
la desviación estándar poblacional σ. En la mayor parte de los casos, no se conoce σ y para
calcular el intervalo de confianza se emplea s, que es la desviación estándar de la muestra.
La fórmula para hallar el límite inferior y superior del intervalo de confianza variará entonces
dependiendo si se conoce σ. A continuación se muestra cuál sería el intervalo de confianza
en cada caso y su interpretación.

Distribución Muestral de la Media

Nivel de Confianza = 1 - α

Límite Inferior Límite Superior

Intervalo de confianza para la media µ, con σ conocida


Se parte de la siguiente expresión que se da con base en la distribución muestral de la media,
es decir, la distribución de la variable aleatoria 𝑋̅, donde σ es la desviación estándar de la
población con distribución normal de la cual se extraen muestras aleatorias de tamaño n:
𝜎 𝜎
𝑃 (𝑋̅ − 𝑍𝛼⁄2 ≤ 𝜇 ≤ 𝑋̅ + 𝑍𝛼⁄2 )=1− 𝛼
√𝑛 √𝑛
Si 𝑥̅ es la media de una muestra aleatoria de una población normal con desviación estándar
σ, un intervalo de confianza del 100(1 − 𝛼)% para µ está dado por:

𝜎 𝜎
(𝑥̅ − 𝑍𝛼⁄2 , 𝑥̅ + 𝑍𝛼⁄2 )
√𝑛 √𝑛
Ejemplo 1.

Dada una muestra de 60 personas se investigó que el gasto promedio anual en psicología
de una persona que utiliza estos servicios en forma particular es de $11.500.000 por año
con una desviación estándar poblacional σ = $4.000.000, construya un intervalo de
confianza para inferir el verdadero valor del gasto promedio anual de una persona por
servicios particulares de psicología. Use 95% de confianza.

Solución

i. Primero miramos los datos con los que contamos:

𝑥̅ = $11.500.000
σ = $4.000.000
n = 60
1 - α = 95% nivel de confianza
α = 5% nivel de significacia

Para poder sustituir estos valores en la fórmula y hallar nuestro intervalo de


confianza, lo único que nos faltaría es el valor de 𝑍𝛼⁄ , que es el valor de la variable
2
aleatoria Z en una normal estándar que deja a su derecha un área de α/2. El valor
de 𝑍𝛼⁄2 lo podemos hallar fácilmente por medio de geogebra1. En el ejemplo α=5%,
por lo que tenemos que buscar 𝑍0.05⁄ = 𝑍0.025 .
2
ii. Entramos a https://www.geogebra.org/classic#probability y nos aseguramos que
estemos en una normal estándar, es decir que 𝜇 = 0 𝑦 𝜎 = 1.
iii. Seleccionamos el botón del corchete abierto a la derecha .
iv. Digitamos el área buscada

Aquí
digitamos
el área
buscada
Valor de 𝑍0.025

1
https://www.geogebra.org/classic#probability
v. Damos enter y obtenemos el valor de 𝑍0.025 , que nos da 1,96

vi. Con esto ya tenemos toda la información requerida para elaborar el intervalo de
confianza:
𝜎 𝜎 4.000.000 4.000.000
(𝑥̅ − 𝑍𝛼⁄2 , 𝑥̅ + 𝑍𝛼⁄2 ) → (11.500.000 − 1,96 , 11.500.000 + 1,96 )
√𝑛 √𝑛 √60 √60

𝐼𝐶95% 𝜇 = (10.487.869 , 12.512.140)


vii. Interpretación: Con un 95% de confianza podemos decir que el gasto promedio
anual de una persona en servicios particulares de psicología se encontrará entre
$10.487.869 y $12.512.140.

Ejemplo 2.

The National Quality Research Center proporciona medidas trimestrales de las opiniones de
los consumidores acerca de productos y servicios. En una encuesta sobre 35 clínicas de salud
mental la media del índice de satisfacción de los pacientes fue 71 en una escala de cero a
cien. Datos anteriores indican que la desviación estándar ha sido relativamente estable y es
σ = 5.
a. Con 99% de confianza, calcule un intervalo de confianza para la media poblacional
µ.
b. Con 90% de confianza, calcule un intervalo de confianza para la media poblacional
µ.

Solución parte a.
i. Primero miramos los datos con los que contamos:

𝑥̅ = 71 σ = 5
n = 35
1 - α = 99%
α = 1%
α=1%/2=0,01/2 = 0.005

Para poder sustituir estos valores en la fórmula y hallar nuestro intervalo de


confianza, lo único que nos faltaría es el valor de 𝑍𝛼⁄ . En el ejemplo α=1%, por lo
2
que tenemos que buscar 𝑍0.01⁄ = 𝑍0.005 .
2
ii. Entramos a https://www.geogebra.org/classic#probability y nos aseguramos que
estemos en una normal estándar, es decir que 𝜇 = 0 𝑦 𝜎 = 1.
iii. Seleccionamos el botón del corchete abierto a la derecha .
iv. Digitamos el área buscada

Aquí
digitamos
el área
buscada
Valor de 𝑍0.005

v. Con esto ya tenemos toda la información requerida para elaborar el intervalo de


confianza:
𝜎 𝜎 5 5
(𝑥̅ − 𝑍𝛼⁄2 , 𝑥̅ + 𝑍𝛼⁄2 ) → (71 − 2,576 , 71 + 2,576 )
√𝑛 √𝑛 √35 √35

𝐼𝐶99% 𝜇 = (68.8 , 73.2)


vi. Interpretación: Con un 99% de confianza podemos decir que el índice de
satisfacción medio de los pacientes se encontrará entre 68.8 y 73.2.

Solución parte b.

i. Primero miramos los datos con los que contamos:

𝑥̅ = 71
σ=5
n = 35
1 - α = 90%
α = 10%

Para poder sustituir estos valores en la fórmula y hallar nuestro intervalo de


confianza, lo único que nos faltaría es el valor de 𝑍𝛼⁄ . En el ejemplo α=10%, por lo
2
que tenemos que buscar 𝑍0.1⁄ = 𝑍0.05 .
2
ii. Siguiendo los pasos del ii al iv de la parte a, encontramos que 𝑍0.05 = 1.645
iii. Con esto ya tenemos toda la información requerida para elaborar el intervalo de
confianza:
𝜎 𝜎 5 5
(𝑥̅ − 𝑍𝛼⁄2 , 𝑥̅ + 𝑍𝛼⁄2 ) → (71 − 1,645 , 71 + 1,645 )
√𝑛 √𝑛 √35 √35

𝐼𝐶90% 𝜇 = (69.6 , 72.4)


iv. Interpretación: Con un 90% de confianza podemos decir que el índice de
satisfacción medio de los pacientes se encontrará entre 69.6 y 72.4.

Nota: Al comparar la parte a con la parte b del ejercicio notamos que el primer intervalo
hallado 𝐼𝐶99% 𝜇 es más amplio que el segundo intervalo 𝐼𝐶90% 𝜇, es decir que este último
intervalo nos da un mayor nivel de precisión para encontrar el parámetro poblacional
µ, no obstante es menos confiable que el primero. Por el contrario, 𝐼𝐶99% 𝜇 es más
confiable pero es más laxo en los límites calculados para obtener el parámetro
poblacional.

Intervalo de confianza para la media µ, con σ desconocida

Se parte de la siguiente expresión que se da con base en la distribución muestral de la media,


es decir, la distribución de la variable aleatoria 𝑋̅, donde S representa la desviación estándar
de las posibles muestras aleatorias extraída de tamaño n. Cuando no se conoce la desviación
estándar poblacional σ, el estadístico 𝑋̅ sigue una distribución t-student.

𝑆 𝑆
𝑃 (𝑋̅ − 𝑡𝛼⁄2 ≤ 𝜇 ≤ 𝑋̅ + 𝑡𝛼⁄2 )=1− 𝛼
√𝑛 √𝑛
Si 𝑥̅ y 𝑠 son la media y la desviación estándar de una muestra aleatoria de una población
normal de la que se desconoce la varianza 𝜎 2 , un intervalo de confianza del 100(1 − 𝛼)%
para µ está dado por:

𝑠 𝑠
(𝑥̅ − 𝑡𝛼⁄2 , 𝑥̅ + 𝑡𝛼⁄2 )
√𝑛 √𝑛
Donde 𝑡𝛼⁄2 es el valor t, con 𝑣 = 𝑛 − 1 grados de libertad, que deja un área de α/2 a la
derecha.
Ejemplo 1.
El área de Prestación de Servicios de una EPS presenta un informe semanal del número de
afiliados contactados semanalmente para ofrecerles ingresar a los programas de promoción
y prevención. En una muestra de 65 informes semanales la media muestral es 19.5 afiliados
por semana. La desviación estándar muestral es 5.2. Dé intervalos de confianza de 90% y
95% para la media poblacional del número de afiliados contactados semanalmente por el
personal de Promoción y Prevención.

Solución parte a. 𝐼𝐶90% 𝜇

i. Primero miramos los datos con los que contamos:

𝑥̅ = 19,5
s = 5,2
n = 65
1 - α = 90%
α = 10%
v = n – 1 = 64 (grados de libertad)

Para poder sustituir estos valores en la fórmula y hallar nuestro intervalo de


confianza, lo único que nos faltaría es el valor de 𝑡𝛼⁄ , que es el valor de la variable
2
aleatoria t Student que deja a su derecha un área de α/2. El valor de 𝑡𝛼⁄2 lo
podemos hallar fácilmente por medio de geogebra2. En el ejemplo α=10%, por lo
que tenemos que buscar 𝑡0.1⁄ = 𝑡0.05 .
2
ii. Entramos a https://www.geogebra.org/classic#probability y buscamos la
distribución Student.

Seleccionamos la distribución t
Student

iii. Seleccionamos el botón del corchete abierto a la derecha .


iv. Digitamos el área buscada e ingresamos los grados de libertad.

2
https://www.geogebra.org/classic#probability
Aquí digitamos los grados
de libertad

Aquí digitamos el
área buscada.

Valor de 𝑡𝛼⁄2 = 𝑡0.05

v. Con esto ya tenemos toda la información requerida para elaborar el intervalo de


confianza:
𝑠 𝑠 5,2 5,2
(𝑥̅ − 𝑡𝛼⁄2 , 𝑥̅ + 𝑡𝛼⁄2 ) → (19,5 − 1,67 , 19,5 + 1,67 )
√𝑛 √𝑛 √65 √65

𝐼𝐶90% 𝜇 = (18.4 , 20.6)

vi. Interpretación: Con un 90% de confianza podemos decir que la media poblacional
del número de afiliados contactados semanalmente se encontrará entre 18.4 y 20.6.

Solución parte b. 𝐼𝐶95% 𝜇

i. Primero miramos los datos con los que contamos:

𝑥̅ = 19,5
s = 5,2
n = 65
1 - α = 95%
α = 5%
v = 64 (grados de libertad)

Para poder sustituir estos valores en la fórmula y hallar nuestro intervalo de


confianza, lo único que nos faltaría es el valor de 𝑡𝛼⁄ con 64 grados de libertad. En
2
el ejemplo α=5%, por lo que tenemos que buscar 𝑡0.05⁄ = 𝑡0.025 .
2
ii. Siguiendo los pasos del ii al iv de la parte a, encontramos que 𝑡0.025 = 1.9977
iii. Con esto ya tenemos toda la información requerida para elaborar el intervalo de
confianza:
𝑠 𝑠 5,2 5,2
(𝑥̅ − 𝑡𝛼⁄2 , 𝑥̅ + 𝑡𝛼⁄2 ) → (19,5 − 1,9977 , 19,5 + 1,9977 )
√𝑛 √𝑛 √65 √65

𝐼𝐶95% 𝜇 = (18.2 , 20.8)

iv. Interpretación: Con un 95% de confianza podemos decir que la media poblacional
del número de afiliados contactados semanalmente se encontrará entre 18.2 y 20.8.

Ejemplo 2

En un estudio de National Retail Foundation se encontró que las familias estaban dispuestas
a gastar en promedio $649 durante las vacaciones decembrinas (The Wall Street Journal, 2
de diciembre de 2002). Suponga que en el estudio participaron 600 familias y que la
desviación estándar muestral fue $175. ¿Cuál es el intervalo de confianza de 95% para
estimar la media poblacional?

Solución

i. Primero miramos los datos con los que contamos:

𝑥̅ = 649
s = 175
n = 600
1 - α = 95%
α = 5%
v = 599 (grados de libertad)

Para poder sustituir estos valores en la fórmula y hallar nuestro intervalo de


confianza, lo único que nos faltaría es el valor de 𝑡𝛼⁄2 . En el ejemplo α=5%, por lo
que tenemos que buscar 𝑡0.05⁄ = 𝑡0.025 .
2
ii. Entramos a https://www.geogebra.org/classic#probability y buscamos la
distribución Student.
Seleccionamos el botón del corchete abierto a la derecha .
iii. Digitamos el área buscada e ingresamos los grados de libertad.
iv. Con esto ya tenemos toda la información requerida para elaborar el intervalo de
confianza:
𝑠 𝑠 175 175
(𝑥̅ − 𝑡𝛼⁄2 , 𝑥̅ + 𝑡𝛼⁄2 ) → (649 − 1,9639 , 649 + 1,67 )
√𝑛 √𝑛 √600 √600

𝐼𝐶95% 𝜇 = (635 , 663)

v. Interpretación: Con un 95% de confianza podemos decir que el promedio de gastos


de una familia en diciembre se encontrará entre $635 y $663 dólares.

2.7. Intervalo de confianza para la diferencia de medias 𝜇1 − 𝜇2

Si tenemos dos poblaciones con medias 𝜇1 y 𝜇2 , y desviaciones estándar 𝜎1 y 𝜎2 ,


respectivamente, el estadístico que da un estimador puntual de la diferencia entre 𝜇1 y 𝜇2 ,
es 𝑋̅1 − 𝑋̅2 . Por lo tanto, para obtener una estimación puntual de 𝜇1 y 𝜇2 , se seleccionan
dos muestras aleatorias independientes, una de cada población, de tamaño 𝑛1 y 𝑛2 , y se
calcula 𝑥̅1 − 𝑥̅ 2, la diferencia de las medias muestrales. Para esto debemos considerar la
distribución muestral de 𝑋̅1 − 𝑋̅2 . Al igual que en el caso de una sola media, existen dos
posibles escenarios, el primero en el que las desviaciones estándar sean conocida y el
segundo, el cual es el escenario más probable, es el que las desviaciones estándar no se
conozcan. Los dos casos los miraremos a continuación.

Intervalo de confianza para la diferencia de medias 𝜇1 − 𝜇2 , con σ conocida

Se parte de la siguiente expresión que se da con base en la distribución muestral de la


diferencia de medias 𝑋̅1 − 𝑋̅2 , donde 𝜎1 y 𝜎2 son las desviaciones estándar de la población
1 y la población 2, respectivamente, de las cuales se extraen las muestras de tamaño 𝑛1 y
𝑛2 :

𝜎12 𝜎22 𝜎12 𝜎22


𝑃 ((𝑋̅1 − 𝑋̅2 ) − 𝑍𝛼⁄2 √ + ≤ 𝜇1 − 𝜇2 ≤ (𝑋̅1 − 𝑋̅2 ) + 𝑍𝛼⁄2 √ + ) = 1 − 𝛼
𝑛1 𝑛2 𝑛1 𝑛2

Si 𝑥̅1 y 𝑥̅ 2 son las medias de muestras aleatorias independientes de tamaño 𝑛1 y 𝑛2 , de


poblaciones que tienen varianzas conocidas 𝜎12 y 𝜎22 , respectivamente, un intervalo de
confianza del 100(1 − 𝛼)% para 𝜇1 − 𝜇2 es dado por:

𝜎21 𝜎22 𝜎21 𝜎22


((𝑥̅1 − 𝑥̅2 ) − 𝑍𝛼⁄2 √ + , (𝑥̅1 − 𝑥̅2 ) + 𝑍𝛼⁄2 √ + )
𝑛1 𝑛2 𝑛1 𝑛2

Donde 𝑍𝛼⁄2 es el valor que deja un área de α/2 a la derecha.

Ejemplo 1

Construya un intervalo de confianza del 94% para la diferencia real entre la vida útil de la
batería de dos marcas de glucómetros, si una muestra de 40 glucómetros tomada al azar de
la primera marca dio una duración media de 418 horas, y una muestra de 50 glucómetros
de otra marca dieron una duración media de 402 horas. Las desviaciones estándares de las
dos poblaciones son 26 horas y 22 horas, respectivamente.

Solución

i. Primero miramos los datos con los que contamos:

𝑥̅1= 418
𝑥̅ 2 = 402
𝜎1 = 26
𝜎2 = 22
𝑛1 = 40
𝑛2 = 50
1 - α = 94%
α = 6%

Para poder sustituir estos valores en la fórmula y hallar nuestro intervalo de


confianza, lo único que nos faltaría es el valor de 𝑍𝛼⁄ . En el ejemplo α=6%, por lo
2
que tenemos que buscar 𝑍0.06⁄ = 𝑍0.03 .
2
ii. Entramos a https://www.geogebra.org/classic#probability y nos aseguramos que
estemos en una normal estándar, es decir que 𝜇 = 0 𝑦 𝜎 = 1.
iii. Obtenemos el valor de 𝑍0.03 , que nos da 1,88

iv. Con esto ya tenemos toda la información requerida para elaborar el intervalo de
confianza:
𝜎21 𝜎22 𝜎21 𝜎22
((𝑥̅ 1 − 𝑥̅ 2 ) − 𝑍𝛼⁄2 √ + , (𝑥̅ 1 − 𝑥̅ 2 ) + 𝑍𝛼⁄2√ + )
𝑛1 𝑛2 𝑛1 𝑛2

262 222 262 222


→ ((418 − 402) − 1,88√ + , (418 − 402) + 1,88√ + )
40 50 40 50

𝐼𝐶94% 𝜇1 − 𝜇2 = (6.31 , 25.69)

v. Interpretación: Con un 94% de confianza podemos decir que la diferencia en horas


entre la duración promedio de la primera marca de glucómetro y la segunda marca
de glucómetro se encontrará entre 6.31 y 25.69 horas.

Intervalo de confianza para la diferencia de medias 𝜇1 − 𝜇2 , con σ desconocida

Se parte de la siguiente expresión que se da con base en la distribución muestral de la


diferencia de medias 𝑋̅1 − 𝑋̅2 , donde 𝑆1 y 𝑆2 son las desviaciones estándar de las posibles
muestras extraídas de tamaño 𝑛1 y 𝑛2 de la población 1 y la población 2, respectivamente.
Cuando no se conoce la desviación estándar poblacional σ, el estadístico ̅̅̅̅̅̅̅̅̅̅̅
𝑋1 − 𝑋 ̅ 2 sigue una
distribución t-student:

𝑆12 𝑆22 𝑆12 𝑆22


𝑃 ((𝑋̅1 − 𝑋̅2 ) − 𝑡𝛼⁄2 √ + ≤ 𝜇1 − 𝜇2 ≤ (𝑋̅1 − 𝑋̅2 ) + 𝑡𝛼⁄2 √ + ) = 1 − 𝛼
𝑛1 𝑛2 𝑛1 𝑛2
Si 𝑥̅1 y 𝑥̅ 2 son las medias de muestras aleatorias independientes de tamaño 𝑛1 y 𝑛2 , y 𝑠12 y
𝑠22 las varianzas de dichas muestras aleatorias, respectivamente, tomadas de poblaciones
aproximadamente normales con varianzas desconocidas 𝜎12 y 𝜎22 , un intervalo de confianza
del 100(1 − 𝛼)% para 𝜇1 − 𝜇2 está dado por:

𝑠21 𝑠22 𝑠21 𝑠22


((𝑥̅1 − 𝑥̅2 ) − 𝑡𝛼⁄2 √ + , (𝑥̅1 − 𝑥̅2 ) + 𝑡𝛼⁄2 √ + )
𝑛1 𝑛2 𝑛1 𝑛2

Donde 𝑡𝛼⁄2 es el valor t con 𝑣 grados de libertad, que deja un área de α/2 a la derecha. Los
𝑣 grados de libertad se calculan como sigue:
2
𝑠2 𝑠2
( 1 + 2)
𝑛1 𝑛2
𝑣= 2 2
𝑠2 𝑠2
(𝑛1 ) (𝑛2 )
1 2
+
𝑛1 − 1 𝑛2 − 1
[ ] [ ]

Ejemplo 1

Cierto tipo de tapaboca se produce mediante un proceso estándar. Ante la emergencia del
Covid19, se desarrolla un nuevo proceso en el que se añade una mejora de producción del
tapaboca. Los fabricantes se encuentran interesados en estimar la verdadera diferencia
entre la producción por día de tapabocas utilizando el proceso estándar y el nuevo proceso.
Para cada proceso se registran los datos de producción diarias de unidades durante 12 días.

Si se supone que el muestreo se llevó a cabo sobre dos distribuciones normales e


independientes, obtener un intervalo de confianza estimado del 95% para la diferencia
entre los dos procesos. Interprete los resultados.

Solución

i. Primero miramos los datos con los que contamos para construir un 𝐼𝐶95%𝜇1 − 𝜇2 :

𝑥̅1= ¿?
𝑥̅ 2 = ¿?
𝑠1 = ¿?
𝑠2 = ¿?
𝑛1 = 12
𝑛2 = 12
1 - α = 95%
α = 5%

Luego, antes de poder aplicar la fórmula para construir un intervalo de confianza,


es necesario poder hallar varios valores que desconocemos. Para esto vamos a
hacer uso de los datos muestrales que nos da el ejercicio y los pasamos a un Excel
para poder hallar de manera rápida las estimaciones faltantes.

Recordemos que las fórmulas en Excel:

La media “=PROMEDIO(seleccionamos el rango de valores)”


La varianza poblacional “=VAR.P(seleccionamos el rango de valores)”
La varianza muestral “=VAR.S(seleccionamos el rango de valores)”
La desviación estándar poblacional “=DESVEST.P(seleccionamos el rango de
valores)”
La desviación estándar muestral “=DESVEST.M(seleccionamos el rango de valores)”

Utilizamos las fórmulas para una muestra.

Luego ya tendríamos los siguientes valores:

𝑥̅1= 443,3
𝑥̅ 2 = 451,4
𝑠1 = 24,82
𝑠2 = 14,94
𝑛1 = 12
𝑛2 = 12
1 - α = 95%
α = 5%

Con estos valores hallamos los grados de libertad:


𝑠2 2 2 2
𝑠 24.822 14.942
(𝑛1 +𝑛2 ) ( 12 + 12 )
1 2
𝑣= 2 2 → 𝑣= 2 2 = 18
𝑠2 𝑠2 24.822 14.942
(𝑛1 ) (𝑛2 ) (
12 ) (
12 )
1 2 +
𝑛1 −1
+ 𝑛 −1 11 11
2
[ ] [ ]
[ ] [ ]

Para poder sustituir estos valores en la fórmula y hallar nuestro intervalo de


confianza, lo único que nos faltaría es el valor de 𝑡𝛼⁄2 , que es el valor de la variable
aleatoria t Student que deja a su derecha un área de α/2. El valor de 𝑡𝛼⁄ lo
2
podemos hallar fácilmente por medio de geogebra3. En el ejemplo α=5%, por lo que
tenemos que buscar 𝑡0.5⁄ = 𝑡0.025 .
2
ii. Entramos a https://www.geogebra.org/classic#probability y buscamos la
distribución Student.
iii. Seleccionamos el botón del corchete abierto a la derecha .
iv. Digitamos el área buscada e ingresamos los grados de libertad.
Aquí digitamos los grados
de libertad

Aquí digitamos el
área buscada.

Valor de 𝑡𝛼⁄2 = 𝑡0.05

v. Con esto ya tenemos toda la información requerida para elaborar el intervalo de


confianza:

𝑠21 𝑠22 𝑠21 𝑠22


((𝑥̅ 1 − 𝑥̅2 ) − 𝑡𝛼⁄2 √ + , (𝑥̅1 − 𝑥̅2 ) + 𝑡𝛼⁄2 √ + )
𝑛1 𝑛2 𝑛1 𝑛2

24.822 14.942 24.822 14.942


→ ((443.3 − 451.4) − 2.1√ + , (443.3 − 451.4) − 2.1√ + )
12 12 12 12

𝐼𝐶95% 𝜇1 − 𝜇2 = (−25.6 , 9.46)

3
https://www.geogebra.org/classic#probability
vi. Con un 95% de confianza podemos decir que la diferencia en unidades diarias entre
el proceso de producción estándar y el nuevo proceso de producción de encontrará
entre -25.6 y 9.46 unidades. Con estos resultados podemos decir que no hay una
gran diferencia entre el número de unidades de tapabocas producidas en el proceso
estándar y el nuevo proceso.

2.8. Intervalo de confianza para la proporción p

Se parte de la siguiente expresión que se da con base en la distribución muestral de la


proporción, es decir, la distribución de la variable aleatoria 𝑃̂ cuando se extraen dotas las
posibles muestras aleatorias de tamaño n:

𝑃̂(1 − 𝑃̂) 𝑃̂ (1 − 𝑃̂)


𝑃 (𝑃̂ − 𝑍𝛼⁄2 √ ≤ 𝑝 ≤ 𝑃̂ + 𝑍𝛼⁄2 √ )=1− 𝛼
𝑛 𝑛

Si 𝑝̂ es la proporción de éxitos en una muestra aleatoria de tamaño 𝑛, un intervalo de


confianza aproximado del 100(1 − 𝛼)% para el parámetro binomial 𝑝 se obtiene por medio
de:

𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
( 𝑝̂ − 𝑍𝛼⁄2 √ , 𝑝̂ + 𝑍𝛼⁄2 √ )
𝑛 𝑛

Ejemplo 1

En una muestra aleatoria simple de 400 individuos, 100 de las respuestas fueron Sí.
a. Dé la estimación puntual de la proporción poblacional de individuos cuya respuesta será
Sí.
b. Calcule el intervalo de confianza de 95% para la proporción poblacional.

Solución parte a

Teniendo en cuenta la muestra de los 400 individuos, la estimación puntual la calculamos


de la siguiente manera:

𝑥 100
𝑝̂ = = = 0,25
𝑛 400

Donde x es el número de éxitos en la muestra y n es el total de elementos de la muestra.

Solución parte b 𝐼𝐶95%𝑝


i. Primero miramos los datos con los que contamos:

𝑝̂ = 0,25
1 − 𝑝̂ = 0,75
n = 400
1 - α = 95%
α = 5%

Para poder sustituir estos valores en la fórmula y hallar nuestro intervalo de


confianza, lo único que nos faltaría es el valor de 𝑍𝛼⁄ . En el ejemplo α=5%, por lo
2
que tenemos que buscar 𝑍0.05⁄ = 𝑍0.025 .
2

En el ejemplo α=8%, por lo que tenemos que buscar 𝑍0.08⁄ = 𝑍0.04 = 1.75.
2

ii. Entramos a https://www.geogebra.org/classic#probability y nos aseguramos que


estemos en una normal estándar, es decir que 𝜇 = 0 𝑦 𝜎 = 1.
iii. Seleccionamos el botón del corchete abierto a la derecha .
iv. Digitamos el área buscada y hallamos que el valor de 𝑍0.025 = 1,96
v. Con esto ya tenemos toda la información requerida para elaborar el intervalo de
confianza:
𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ ) 0.25(0.75) 0.25(0.75)
( 𝑝̂ − 𝑍𝛼⁄2 √ , 𝑝̂ + 𝑍𝛼⁄2 √ ) → (0.25 − 1.96√ ,0.25 + 1.96√ )
𝑛 𝑛 400 400

𝐼𝐶95% 𝑝 = (20.76% , 29.24%)

vi. Interpretación: Con un 95% de confianza podemos decir que la proporción de


encuestados que dieron una respuesta afirmativa se encontrará entre 20,76% y
29,24%.

Ejemplo 2

La juventud de Estados Unidos usa Internet intensamente; el 87% de los jóvenes entre 12 y
17 años son usuarios de Internet (The Cincinnati Enquirer, 7 de febrero de 2006). En una
muestra de usuarios de Internet de esta edad, 9% votó por Facebook como el sitio de
Internet más popular. Suponga que en este estudio participaron 1 400 jóvenes. ¿Cuál es la
estimación por intervalo de la proporción poblacional de quienes consideran que este sitio
es el más popular? Use 95% de confianza.

i. Primero miramos los datos con los que contamos:

𝑝̂ = 9%
1 − 𝑝̂ = 91%
n = 1400
1 - α = 95%
α = 5%

Para poder sustituir estos valores en la fórmula y hallar nuestro intervalo de


confianza, lo único que nos faltaría es el valor de 𝑍𝛼⁄2 . En el ejemplo α=5%, por lo
que tenemos que buscar 𝑍0.05⁄ = 𝑍0.025 .
2
ii. Entramos a https://www.geogebra.org/classic#probability y nos aseguramos que
estemos en una normal estándar, es decir que 𝜇 = 0 𝑦 𝜎 = 1.
iii. Seleccionamos el botón del corchete abierto a la derecha .
iv. Digitamos el área buscada y hallamos que el valor de 𝑍0.025 = 1,96
v. Con esto ya tenemos toda la información requerida para elaborar el intervalo de
confianza:
𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ ) 0.09(0.91) 0.09(0.91)
( 𝑝̂ − 𝑍𝛼⁄2 √ , 𝑝̂ + 𝑍𝛼⁄2 √ ) → (0.09 − 1.96√ ,0.25 + 1.96√ )
𝑛 𝑛 1400 1400

𝐼𝐶95% 𝑝 = (7.5% , 10.5%)

vi. Interpretación: Con un 95% de confianza podemos decir que la proporción de


encuestados que dieron una respuesta afirmativa se encontrará entre 7.5% y 10.5%.

3. RESUMEN DE CONCEPTOS CLAVES

Distribución t de Student Familia de distribuciones de probabilidad que se distinguen por sus grados
de libertad individuales; es parecida, en forma, a la distribución normal y se utiliza cuando se
desconoce la desviación estándar de la población y el tamaño de la muestra es relativamente
pequeño (n < 30).
Estimación Valor específico observado de un estimador.
Estimación de intervalo Un rango de valores utilizado para estimar un parámetro de población
desconocido.
Estimación puntual Un solo número que se utiliza para estimar un parámetro de población
desconocido.
Estimador Estadístico de muestra utilizada para estimar un parámetro de población.
Estimador consistente Estimador que produce valores que se acercan más al parámetro de la
población conforme aumenta el tamaño de la muestra.
Estimador eficiente Estimador con un error estándar menor que algún otro estimador del
parámetro de la población, esto es, cuanto más pequeño sea el error estándar de un estimador, más
eficiente será.
Estimador no sesgado Estimador de un parámetro de población que, en promedio, toma valores
mayores que el parámetro de la población con la misma frecuencia, y al mismo grado, con que
tiende a tomar valores menores que el parámetro de la población.
Estimador suficiente Estimador que utiliza toda la información disponible en los datos
correspondientes a un parámetro.
Grados de libertad Número de valores de una muestra que podemos especificar libremente, una
vez que se sabe algo sobre dicha muestra.
Intervalo de confianza Un rango de valores que tiene designada una probabilidad de que incluya el
valor verdadero del parámetro de la población.
Límites de confianza Límites inferior y superior de un intervalo de confianza.
Nivel de confianza Probabilidad que los estadísticos asocian a una estimación de intervalo de un
parámetro y que indica qué tan seguros están de que la estimación de intervalo incluirá al parámetro
de la población.

4. ACTIVIDAD
a) ¿Por qué los que toman decisiones a menudo miden muestras en lugar de medir
poblaciones completas? ¿Cuál es la desventaja?
b) Explique una limitación que se presenta al hacer una estimación puntual, pero que no
se presenta al hacer una estimación de intervalo.
c) ¿Qué es un estimador? ¿En qué se diferencia un estimador de una estimación?
d) Dé una lista de los criterios de un buen estimador y descríbalos brevemente.
e) Defina el nivel de confianza para una estimación de intervalo.
f) Defina el intervalo de confianza.
g) ¿De qué forma podría una estimación ser menos significativa debido a
i. un alto nivel de confianza?
ii. un estrecho nivel de confianza?
h) Suponga que se toma una muestra de 50 elementos de una población con desviación
estándar de 27, y que la media de la muestra es 86. Establezca una estimación de
intervalo para la media de la población que tenga el 95.5% de certeza de incluir a la
media verdadera de la población.
i) Después de recolectar una muestra de 250 elementos de una población con una
desviación estándar conocida de 13.7, se encuentra que la media es 112.4.
i. Encuentre un intervalo de confianza del 95% para la media. De una
interpretación para el intervalo que acaba de construir.
ii. Encuentre un intervalo de confianza del 99% para la media. De una
interpretación para el intervalo que acaba de construir.
j) Suponga que desea utilizar un nivel de confianza del 80%. Dé el límite superior e inferior
del intervalo de confianza para µ, si se sabe que se tomó una muestra de 40 elementos
que tenían desviación estándar de 2 y una media de 20.
k) Al evaluar la efectividad de un programa federal de rehabilitación, en una investigación
de 52 de los 900 internos de una prisión se encontró que el 35% de éstos era
reincidente. Construya un intervalo de confianza del 90% para la proporción de
reincidentes entre los internos de esta prisión.

También podría gustarte