Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ASIGNATURA: Estadística II
Docente: Lina Pérez
1. OBJETIVOS
2. TEORÍA
2.1. Introducción
Los administradores también deben hacer estimaciones rápidas. El resultado de estas
estimaciones puede afectar sus organizaciones. ¿De qué manera los administradores
utilizan estadísticas para estimar los parámetros de una población? El jefe de departamento
de alguna universidad intenta estimar el número de inscripciones que tendrá el siguiente
semestre a partir de las inscripciones actuales en los mismos cursos. El director de un
departamento de crédito intentará estimar el valor crediticio de los futuros clientes a partir
de una muestra de sus hábitos de pago. El comprador de una casa intenta estimar el curso
futuro de las tasas de interés mediante la observación de su comportamiento actual. En
cada caso, alguien trata de inferir algo acerca de una población a partir de la información
adquirida de una muestra. Todas estas personas hacen estimaciones sin preocuparse de si
son científicas o no, pero con la esperanza de que las estimaciones tengan una semejanza
razonable con el resultado.
Más allá de confiar en presentimientos sobre las decisiones y estimaciones que realizamos,
podemos aplicar los conceptos de la estadística para obtener mejores resultados y estimar
la precisión de la medida numérica que estemos calculando.
2.2. Tipos de Estimación
Podemos hacer dos tipos de estimaciones concernientes a una población: una estimación
puntual y una estimación de intervalo.
Una estimación puntual es un solo número que se utiliza para estimar un parámetro de
población desconocido. Por ejemplo, el jefe de departamento de una universidad estaría
haciendo una estimación puntual si afirmara: “Nuestros datos actuales indican que en esta
materia tendremos 350 estudiantes el siguiente semestre.” A menudo, una estimación
puntual es insuficiente debido a que sólo tienen dos opciones: es correcta o está
equivocada. Si le dicen solamente que la afirmación sobre la inscripción está equivocada, no
sabe qué tanto está mal y no puede tener la certeza de que la estimación es confiable.
Una estimación por intervalo es un rango de valores que se utiliza para estimar un
parámetro de la población.
Por ejemplo, si se desea conocer el precio medio de un artículo (el parámetro desconocido)
se recogerán observaciones del precio de dicho artículo en diversos establecimientos (la
muestra) y la media aritmética de las observaciones puede utilizarse como estimador del
precio medio. El valor de un estimador proporciona lo que se denomina en estadística una
estimación puntual del valor del parámetro en estudio.
Para cada parámetro pueden existir varios estimadores diferentes. En general, escogeremos
el estimador que posea mejores propiedades.
Insesgado. Ésta es una propiedad deseable para un buen estimador. El término insesgado
se refiere al hecho de que una media de la muestra es un estimador no sesgado de una
media de la población porque la media de la distribución muestral de las medias de las
muestras tomadas de la misma población es igual a la media de la población misma.
Eficiencia. Otra propiedad deseable de un buen estimador es que sea eficiente. La eficiencia
se refiere al tamaño de la desviación estándar del estadístico (la desviación estándar del
estadístico también se conoce con el nombre de error estándar). Si comparamos dos
estadísticos de una muestra del mismo tamaño y tratamos de decidir cuál de ellas es un
estimador más eficiente, escogeríamos la estadística que tuviera el menor error estándar o
la menor desviación estándar de la distribución muestral.
Consistencia. Una estadística es un estimador consistente de un parámetro de población si
al aumentar el tamaño de la muestra, se tiene casi la certeza de que el valor de la estadística
se aproxima bastante al valor del parámetro poblacional. Si un estimador es consistente, se
vuelve más confiable al tener tamaños de muestra más grandes.
Varianza muestral
Desviación estándar de
la muestra
La proporción de unidades de una población dada que tiene una característica particular se
denota por p. Si conocemos la proporción de unidades de una muestra que tiene la misma
característica (denotada por 𝑝̂ ), podemos utilizar esta 𝑝̂ como estimador de p. Se puede
demostrar que 𝑝̂ tiene todas las características deseables analizadas; es insesgado (no
sesgado), consistente, eficiente y suficiente. La proporción se puede estimar de la siguiente
manera:
𝑥
𝑝̂ =
𝑛
Ej. 2 Suponga que la administración de una empresa desea estimar el número de cajas que
llegarán dañadas a su destino por mal manejo en el traslado. Podemos verificar una muestra
de 50 cajas a partir del punto de embarque hasta su arribo al punto de destino, y luego
registrar la presencia o ausencia de daños. En este caso, si encontramos que la proporción
de cajas dañadas en la muestra es 0.08, diríamos que:
El propósito de tomar muestras es conocer más acerca de una población. Podemos calcular
esta información a partir de las muestras como estimaciones puntuales, que acabamos de
analizar, o como estimaciones de intervalo. Una estimación de intervalo describe un rango
de valores dentro del cual es posible que esté un parámetro de la población.
Podría pensarse que deberíamos utilizar un alto nivel de confianza, como 99%, en todos los
problemas sobre estimaciones. Después de todo, parece ser que un alto nivel de confianza
significa un alto grado de precisión en lo que a la estimación concierne. En la práctica, sin
embargo, altos niveles de confianza producen intervalos de confianza grandes, y éstos, de
hecho, dan estimaciones bastante imprecisas.
Un intervalo de confianza con un nivel de confianza del 95% no significa que la probabilidad
de encontrar el parámetro de la población entre esos márgenes sea 0,95. Lo que realmente
significa es que, si extraemos un número determinado de muestras del mismo tamaño de
una población con un parámetro de valor constante, el 95% de los intervalos de confianza
construidos a partir de esas muestras contendrán el valor del parámetro que buscamos y el
5% restante no lo contendrán.
Nivel de Confianza = 1 - α
𝜎 𝜎
(𝑥̅ − 𝑍𝛼⁄2 , 𝑥̅ + 𝑍𝛼⁄2 )
√𝑛 √𝑛
Ejemplo 1.
Dada una muestra de 60 personas se investigó que el gasto promedio anual en psicología
de una persona que utiliza estos servicios en forma particular es de $11.500.000 por año
con una desviación estándar poblacional σ = $4.000.000, construya un intervalo de
confianza para inferir el verdadero valor del gasto promedio anual de una persona por
servicios particulares de psicología. Use 95% de confianza.
Solución
𝑥̅ = $11.500.000
σ = $4.000.000
n = 60
1 - α = 95% nivel de confianza
α = 5% nivel de significacia
Aquí
digitamos
el área
buscada
Valor de 𝑍0.025
1
https://www.geogebra.org/classic#probability
v. Damos enter y obtenemos el valor de 𝑍0.025 , que nos da 1,96
vi. Con esto ya tenemos toda la información requerida para elaborar el intervalo de
confianza:
𝜎 𝜎 4.000.000 4.000.000
(𝑥̅ − 𝑍𝛼⁄2 , 𝑥̅ + 𝑍𝛼⁄2 ) → (11.500.000 − 1,96 , 11.500.000 + 1,96 )
√𝑛 √𝑛 √60 √60
Ejemplo 2.
The National Quality Research Center proporciona medidas trimestrales de las opiniones de
los consumidores acerca de productos y servicios. En una encuesta sobre 35 clínicas de salud
mental la media del índice de satisfacción de los pacientes fue 71 en una escala de cero a
cien. Datos anteriores indican que la desviación estándar ha sido relativamente estable y es
σ = 5.
a. Con 99% de confianza, calcule un intervalo de confianza para la media poblacional
µ.
b. Con 90% de confianza, calcule un intervalo de confianza para la media poblacional
µ.
Solución parte a.
i. Primero miramos los datos con los que contamos:
𝑥̅ = 71 σ = 5
n = 35
1 - α = 99%
α = 1%
α=1%/2=0,01/2 = 0.005
Aquí
digitamos
el área
buscada
Valor de 𝑍0.005
Solución parte b.
𝑥̅ = 71
σ=5
n = 35
1 - α = 90%
α = 10%
Nota: Al comparar la parte a con la parte b del ejercicio notamos que el primer intervalo
hallado 𝐼𝐶99% 𝜇 es más amplio que el segundo intervalo 𝐼𝐶90% 𝜇, es decir que este último
intervalo nos da un mayor nivel de precisión para encontrar el parámetro poblacional
µ, no obstante es menos confiable que el primero. Por el contrario, 𝐼𝐶99% 𝜇 es más
confiable pero es más laxo en los límites calculados para obtener el parámetro
poblacional.
𝑆 𝑆
𝑃 (𝑋̅ − 𝑡𝛼⁄2 ≤ 𝜇 ≤ 𝑋̅ + 𝑡𝛼⁄2 )=1− 𝛼
√𝑛 √𝑛
Si 𝑥̅ y 𝑠 son la media y la desviación estándar de una muestra aleatoria de una población
normal de la que se desconoce la varianza 𝜎 2 , un intervalo de confianza del 100(1 − 𝛼)%
para µ está dado por:
𝑠 𝑠
(𝑥̅ − 𝑡𝛼⁄2 , 𝑥̅ + 𝑡𝛼⁄2 )
√𝑛 √𝑛
Donde 𝑡𝛼⁄2 es el valor t, con 𝑣 = 𝑛 − 1 grados de libertad, que deja un área de α/2 a la
derecha.
Ejemplo 1.
El área de Prestación de Servicios de una EPS presenta un informe semanal del número de
afiliados contactados semanalmente para ofrecerles ingresar a los programas de promoción
y prevención. En una muestra de 65 informes semanales la media muestral es 19.5 afiliados
por semana. La desviación estándar muestral es 5.2. Dé intervalos de confianza de 90% y
95% para la media poblacional del número de afiliados contactados semanalmente por el
personal de Promoción y Prevención.
𝑥̅ = 19,5
s = 5,2
n = 65
1 - α = 90%
α = 10%
v = n – 1 = 64 (grados de libertad)
Seleccionamos la distribución t
Student
2
https://www.geogebra.org/classic#probability
Aquí digitamos los grados
de libertad
Aquí digitamos el
área buscada.
vi. Interpretación: Con un 90% de confianza podemos decir que la media poblacional
del número de afiliados contactados semanalmente se encontrará entre 18.4 y 20.6.
𝑥̅ = 19,5
s = 5,2
n = 65
1 - α = 95%
α = 5%
v = 64 (grados de libertad)
iv. Interpretación: Con un 95% de confianza podemos decir que la media poblacional
del número de afiliados contactados semanalmente se encontrará entre 18.2 y 20.8.
Ejemplo 2
En un estudio de National Retail Foundation se encontró que las familias estaban dispuestas
a gastar en promedio $649 durante las vacaciones decembrinas (The Wall Street Journal, 2
de diciembre de 2002). Suponga que en el estudio participaron 600 familias y que la
desviación estándar muestral fue $175. ¿Cuál es el intervalo de confianza de 95% para
estimar la media poblacional?
Solución
𝑥̅ = 649
s = 175
n = 600
1 - α = 95%
α = 5%
v = 599 (grados de libertad)
Ejemplo 1
Construya un intervalo de confianza del 94% para la diferencia real entre la vida útil de la
batería de dos marcas de glucómetros, si una muestra de 40 glucómetros tomada al azar de
la primera marca dio una duración media de 418 horas, y una muestra de 50 glucómetros
de otra marca dieron una duración media de 402 horas. Las desviaciones estándares de las
dos poblaciones son 26 horas y 22 horas, respectivamente.
Solución
𝑥̅1= 418
𝑥̅ 2 = 402
𝜎1 = 26
𝜎2 = 22
𝑛1 = 40
𝑛2 = 50
1 - α = 94%
α = 6%
iv. Con esto ya tenemos toda la información requerida para elaborar el intervalo de
confianza:
𝜎21 𝜎22 𝜎21 𝜎22
((𝑥̅ 1 − 𝑥̅ 2 ) − 𝑍𝛼⁄2 √ + , (𝑥̅ 1 − 𝑥̅ 2 ) + 𝑍𝛼⁄2√ + )
𝑛1 𝑛2 𝑛1 𝑛2
Donde 𝑡𝛼⁄2 es el valor t con 𝑣 grados de libertad, que deja un área de α/2 a la derecha. Los
𝑣 grados de libertad se calculan como sigue:
2
𝑠2 𝑠2
( 1 + 2)
𝑛1 𝑛2
𝑣= 2 2
𝑠2 𝑠2
(𝑛1 ) (𝑛2 )
1 2
+
𝑛1 − 1 𝑛2 − 1
[ ] [ ]
Ejemplo 1
Cierto tipo de tapaboca se produce mediante un proceso estándar. Ante la emergencia del
Covid19, se desarrolla un nuevo proceso en el que se añade una mejora de producción del
tapaboca. Los fabricantes se encuentran interesados en estimar la verdadera diferencia
entre la producción por día de tapabocas utilizando el proceso estándar y el nuevo proceso.
Para cada proceso se registran los datos de producción diarias de unidades durante 12 días.
Solución
i. Primero miramos los datos con los que contamos para construir un 𝐼𝐶95%𝜇1 − 𝜇2 :
𝑥̅1= ¿?
𝑥̅ 2 = ¿?
𝑠1 = ¿?
𝑠2 = ¿?
𝑛1 = 12
𝑛2 = 12
1 - α = 95%
α = 5%
𝑥̅1= 443,3
𝑥̅ 2 = 451,4
𝑠1 = 24,82
𝑠2 = 14,94
𝑛1 = 12
𝑛2 = 12
1 - α = 95%
α = 5%
Aquí digitamos el
área buscada.
3
https://www.geogebra.org/classic#probability
vi. Con un 95% de confianza podemos decir que la diferencia en unidades diarias entre
el proceso de producción estándar y el nuevo proceso de producción de encontrará
entre -25.6 y 9.46 unidades. Con estos resultados podemos decir que no hay una
gran diferencia entre el número de unidades de tapabocas producidas en el proceso
estándar y el nuevo proceso.
𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
( 𝑝̂ − 𝑍𝛼⁄2 √ , 𝑝̂ + 𝑍𝛼⁄2 √ )
𝑛 𝑛
Ejemplo 1
En una muestra aleatoria simple de 400 individuos, 100 de las respuestas fueron Sí.
a. Dé la estimación puntual de la proporción poblacional de individuos cuya respuesta será
Sí.
b. Calcule el intervalo de confianza de 95% para la proporción poblacional.
Solución parte a
𝑥 100
𝑝̂ = = = 0,25
𝑛 400
𝑝̂ = 0,25
1 − 𝑝̂ = 0,75
n = 400
1 - α = 95%
α = 5%
En el ejemplo α=8%, por lo que tenemos que buscar 𝑍0.08⁄ = 𝑍0.04 = 1.75.
2
Ejemplo 2
La juventud de Estados Unidos usa Internet intensamente; el 87% de los jóvenes entre 12 y
17 años son usuarios de Internet (The Cincinnati Enquirer, 7 de febrero de 2006). En una
muestra de usuarios de Internet de esta edad, 9% votó por Facebook como el sitio de
Internet más popular. Suponga que en este estudio participaron 1 400 jóvenes. ¿Cuál es la
estimación por intervalo de la proporción poblacional de quienes consideran que este sitio
es el más popular? Use 95% de confianza.
𝑝̂ = 9%
1 − 𝑝̂ = 91%
n = 1400
1 - α = 95%
α = 5%
Distribución t de Student Familia de distribuciones de probabilidad que se distinguen por sus grados
de libertad individuales; es parecida, en forma, a la distribución normal y se utiliza cuando se
desconoce la desviación estándar de la población y el tamaño de la muestra es relativamente
pequeño (n < 30).
Estimación Valor específico observado de un estimador.
Estimación de intervalo Un rango de valores utilizado para estimar un parámetro de población
desconocido.
Estimación puntual Un solo número que se utiliza para estimar un parámetro de población
desconocido.
Estimador Estadístico de muestra utilizada para estimar un parámetro de población.
Estimador consistente Estimador que produce valores que se acercan más al parámetro de la
población conforme aumenta el tamaño de la muestra.
Estimador eficiente Estimador con un error estándar menor que algún otro estimador del
parámetro de la población, esto es, cuanto más pequeño sea el error estándar de un estimador, más
eficiente será.
Estimador no sesgado Estimador de un parámetro de población que, en promedio, toma valores
mayores que el parámetro de la población con la misma frecuencia, y al mismo grado, con que
tiende a tomar valores menores que el parámetro de la población.
Estimador suficiente Estimador que utiliza toda la información disponible en los datos
correspondientes a un parámetro.
Grados de libertad Número de valores de una muestra que podemos especificar libremente, una
vez que se sabe algo sobre dicha muestra.
Intervalo de confianza Un rango de valores que tiene designada una probabilidad de que incluya el
valor verdadero del parámetro de la población.
Límites de confianza Límites inferior y superior de un intervalo de confianza.
Nivel de confianza Probabilidad que los estadísticos asocian a una estimación de intervalo de un
parámetro y que indica qué tan seguros están de que la estimación de intervalo incluirá al parámetro
de la población.
4. ACTIVIDAD
a) ¿Por qué los que toman decisiones a menudo miden muestras en lugar de medir
poblaciones completas? ¿Cuál es la desventaja?
b) Explique una limitación que se presenta al hacer una estimación puntual, pero que no
se presenta al hacer una estimación de intervalo.
c) ¿Qué es un estimador? ¿En qué se diferencia un estimador de una estimación?
d) Dé una lista de los criterios de un buen estimador y descríbalos brevemente.
e) Defina el nivel de confianza para una estimación de intervalo.
f) Defina el intervalo de confianza.
g) ¿De qué forma podría una estimación ser menos significativa debido a
i. un alto nivel de confianza?
ii. un estrecho nivel de confianza?
h) Suponga que se toma una muestra de 50 elementos de una población con desviación
estándar de 27, y que la media de la muestra es 86. Establezca una estimación de
intervalo para la media de la población que tenga el 95.5% de certeza de incluir a la
media verdadera de la población.
i) Después de recolectar una muestra de 250 elementos de una población con una
desviación estándar conocida de 13.7, se encuentra que la media es 112.4.
i. Encuentre un intervalo de confianza del 95% para la media. De una
interpretación para el intervalo que acaba de construir.
ii. Encuentre un intervalo de confianza del 99% para la media. De una
interpretación para el intervalo que acaba de construir.
j) Suponga que desea utilizar un nivel de confianza del 80%. Dé el límite superior e inferior
del intervalo de confianza para µ, si se sabe que se tomó una muestra de 40 elementos
que tenían desviación estándar de 2 y una media de 20.
k) Al evaluar la efectividad de un programa federal de rehabilitación, en una investigación
de 52 de los 900 internos de una prisión se encontró que el 35% de éstos era
reincidente. Construya un intervalo de confianza del 90% para la proporción de
reincidentes entre los internos de esta prisión.