Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INTRODUCCIÓN
Esta unidad inicia con el estudio de la estimación con muestras grandes, introducción,
tipos de estimadores, estimadores puntuales y por intervalo. La inferencia estadística se
ocupa de tomar decisiones o predicciones acerca de parámetros, es decir, las medidas
numéricas descriptivas que caracterizan a una población.
2. ESTRUCTURA DE CONTENIDOS
1.1 Introducción.
1.2 Tipos de estimadores.
1.3 Estimación puntual.
1.4 Estimación por intervalo.
3. DESARROLLO DE CONTENIDOS.
2
1.1 Introducción.
Hay muchas formas de tomar estas decisiones o predicciones, algunas son subjetivas y
otras son objetivas por naturaleza. ¿Qué tan buenas serán las predicciones o decisiones?
Aun cuando se pueda pensar que se tiene una excelente capacidad sobre la tomar
decisiones, la experiencia sugiere que el error puede ser mayor cuando no se tiene una
evidencia empírica. Entonces la función del estadístico es proporcionar los métodos de
toma de decisiones mejores y más confiables basados en la inferencia estadística en
lugar de tener solo información y que únicamente cálculos subjetivos.
Los métodos para hacer inferencias acerca de parámetros poblacionales caen en una de
dos categorías:
Prueba de hipótesis: Tomar una decisión acerca del valor de un parámetro, con base
en alguna idea preconcebida acerca de cuál podría ser su valor.
3
1.2 Tipos de estimadores
Un estimador es una regla, generalmente expresada como fórmula, que nos dice cómo
calcular una estimación basada en información de la muestra
Estimación puntual: Con base en datos muéstrales, se calcula un solo número para
estimar el parámetro poblacional. La regla o fórmula que describe este cálculo se
denomina estimador puntual y el número resultante recibe el nombre de estimación
puntual.
Estimación por intervalo: Con base en datos muéstrales, dos números se calculan para
formar un intervalo dentro del cual se espera esté el parámetro. La regla o fórmula que
describe este cálculo se denomina estimador de intervalo y el par de números resultantes
se llama estimación de intervalo o intervalo de confianza.
En una situación práctica, puede haber varias estadísticas que podrían usarse como
estimadores puntuales para un parámetro poblacional. Para determinar cuál de las
opciones es mejor, usted necesita saber cómo se comporta el estimador en muestreo
repetido, descrito por su distribución muestral.
Las distribuciones muéstrales dan información que se puede usar para seleccionar el
mejor estimador. ¿Qué características serían valiosas? Primero, la distribución muestral
del estimador puntual debe estar centrada sobre el verdadero valor del parámetro a ser
4
estimado. Esto es, el estimador no debe subestimar o sobreestimar de manera
consistente al parámetro de interés.
Figura 1: Estimador.
5
Por supuesto que sería preferible el estimador con la varianza más pequeña, porque las
estimaciones tienden a estar más cerca del verdadero valor del parámetro que en la
distribución con la varianza más grande.
Estimadores puntuales
𝑠𝑠
𝑆𝑆𝑆𝑆 =
√𝑛𝑛
𝑠𝑠
∓1.96 � �
√𝑛𝑛
𝑝𝑝̂ 𝑞𝑞�
𝑆𝑆𝑆𝑆 = �
𝑛𝑛
El 95% de margen de error se estima como:
𝑝𝑝̂ 𝑞𝑞�
∓1.96 �� �
𝑛𝑛
Ejemplo 1: Un ambientalista está realizando un estudio del oso polar, especie que se
encuentra en el océano Ártico y sus alrededores. Su zona de distribución está limitada
por la existencia de hielo en el mar, que usan como plataforma para cazar focas, principal
6
sostén de los osos. La destrucción de su hábitat en el hielo del Ártico, que se ha atribuido
al calentamiento global, amenaza la supervivencia de los osos como especie; puede
extinguirse antes de un siglo. Una muestra aleatoria de n = 50 osos polares produjo un
peso promedio de 980 libras con una desviación estándar de 105 libras. Use esta
información para estimar el peso promedio de todos los osos polares del Ártico.
Solución
𝑠𝑠 105
1.96 𝑆𝑆𝑆𝑆 = 1.96 � � = 1.96 � � = 29.10 Libras
√𝑛𝑛 √50
Se puede tener confianza en que la estimación muestral de 980 libras está a no más de
29 libras de la media poblacional.
Ejemplo 2: Además del peso promedio del oso polar del Ártico, el ambientalista del
ejemplo anterior también está interesado en las opiniones de adultos sobre el tema del
calentamiento global. En particular, desea estimar la proporción de personas que piensan
que el calentamiento global es un problema muy serio. En una muestra aleatoria de n =
100 adultos, 73% de la muestra indicaron que, de lo que han oído o leído, el
calentamiento global es un problema muy serio. Estime la verdadera proporción de
población de adultos que piensan que el calentamiento global es un problema muy serio
y encuentre el margen de error para la estimación.
Solución
Con este margen de error, se puede estar bastante cierto de que la estimación de .73
7
está a no más de .09 del verdadero valor de p. En consecuencia, se puede concluir que
el verdadero valor de p podría ser de sólo .64 o de hasta .82.
Un estimador por intervalo es una regla para calcular dos números, por ejemplo, a y b,
para crear un intervalo del que usted está completamente seguro que contiene el
parámetro de interés. El concepto de “completamente seguro” significa “con gran
probabilidad”. Medimos esta probabilidad usando el coeficiente de confianza, designado
por 1-α.
Cuando el tamaño muestral n sea grande, la media muestral 𝑥𝑥̅ es el mejor estimador
puntual
para la media poblacional 𝜇𝜇. Como su distribución muestral es aproximadamente normal,
puede usarse para construir un intervalo de confianza.
𝑠𝑠
𝑥𝑥̅ ± 𝑧𝑧𝛼𝛼/2
√𝑛𝑛
Donde
𝑧𝑧𝛼𝛼/2 : Es el valor z correspondiente a un área 𝛼𝛼/2 de una distribución normal estándar.
n: Tamaño de muestra
s: Desviación estándar
8
aleatoria de n = 50 adultos hombres. Se encontró que el promedio de ingesta diaria de
productos lácteos fue de 𝑥𝑥̅ =756 gramos por día, con una desviación estándar de s = 35
gramos por día. Use esta información muestral para construir un intervalo de confianza
de 95% para la ingesta diaria media de productos lácteos para hombres.
Solución
𝑥𝑥̅ = 756 gr
S = 35
𝑧𝑧𝛼𝛼/2 = 1.96
𝑠𝑠
𝑥𝑥̅ ± 𝑧𝑧𝛼𝛼/2
√𝑛𝑛
35
756 ± 1.96
√50
756 ± 9.70
Por tanto, el intervalo de confianza de 95% para 𝜇𝜇 es de 746.30 a 765.70 gramos por día.
9
Intervalo de la confianza para la proporción
𝑝𝑝̂ 𝑞𝑞�
𝑝𝑝̅ ± 𝑧𝑧𝛼𝛼/2 �
𝑛𝑛
Donde
𝑧𝑧𝛼𝛼/2 : Es el valor z correspondiente a un área 𝛼𝛼/2 de una distribución normal estándar.
𝑝𝑝̂ : es el estimador de la proporción de estudio
𝑞𝑞�: es la proporción de fracaso 1- 𝑝𝑝̂
n: Tamaño de muestra.
Ejemplo 4: Una muestra aleatoria de 985 “probables” electores, o sea los que
probablemente voten en la próxima elección, fueron encuestados durante un maratón
telefónico realizado por el Partido Republicano. De ellos, 592 indicaron que tenían la
intención de votar por la candidata republicana. Construya un intervalo de confianza de
90% para p, la proporción de electores probables de la población que tienen la intención
de votar por la candidata republicana. Con base en esta información, ¿se puede concluir
que la candidata ganará la elección?
Solución
𝑥𝑥 592
𝑝𝑝̂ = 𝑛𝑛 = 985 = .601 y 𝑞𝑞� = 1 − .601 = .399
El valor z para un intervalo de confianza de 90% es el valor que tiene área de ∝/2 =.05
en la cola superior de la distribución z.05 =1.645 de la tabla normal estándar.
𝑝𝑝̂ 𝑞𝑞�
𝑝𝑝̅ ± 𝑧𝑧𝛼𝛼/2 �
𝑛𝑛
(. 601)(.399)
. 601 ± 1.645�
985
. 601 ± .026
. 601 − .026 = 0.575
. 601 + .026 = 0.627
10
Se estima que el porcentaje de probables electores que tienen intención de votar por la
candidata republicana es entre 57.5% y 62.7%
Un problema de igual importancia que la estimación de una sola media poblacional 𝜇𝜇,
para una población cuantitativa, es la comparación de dos medias poblacionales.
𝑠𝑠12 𝑠𝑠22
(𝑥𝑥
���1 − 𝑥𝑥
���)
2 ± 𝑧𝑧𝛼𝛼/2 � +
𝑛𝑛1 𝑛𝑛2
Donde
𝑥𝑥1 𝑥𝑥
���, 2 Son las medias de estudio.
���:
𝑠𝑠1 , 𝑠𝑠2 : son las desviaciones estándar correspondientes a cada muestra.
𝑛𝑛1 , 𝑛𝑛2 : Son los tamaños de cada muestra.
𝑧𝑧𝛼𝛼/2 : Es el valor z correspondiente a un área 𝛼𝛼/2 de una distribución normal estándar.
Solución
El valor z para un intervalo de confianza de 99% es el valor que tiene área de ∝/2 =.005
en la cola superior de la distribución z.005 =2.58 de la tabla normal estándar.
11
Por lo tanto, sustituyen los datos en la formula
𝑠𝑠12 𝑠𝑠22
(𝑥𝑥
���1 − 𝑥𝑥2 ± 𝑧𝑧𝛼𝛼/2 �
���) +
𝑛𝑛1 𝑛𝑛2
La diferencia en el promedio de millas hasta el completo desgaste para los dos tipos de
llantas se estima que está entre el límite inferior 824.2 y el límite superior 1775.8 millas
de desgaste, con una confianza del 99%.
Donde
𝑝𝑝
�,1 𝑝𝑝�:2 Son las proporciones de estudio.
�,
𝑞𝑞1 𝑞𝑞�:2 : Son las proporciones de fracaso.
𝑛𝑛1 , 𝑛𝑛2 : Son los tamaños de cada muestra.
𝑧𝑧𝛼𝛼/2 : Es el valor z correspondiente a un área 𝛼𝛼/2 de una distribución normal estándar.
12
diferencia en las proporciones verdaderas a favor de la propuesta de bono con un 99%
de intervalo de confianza. Los resultados se muestran en la siguiente tabla.
Solución
El valor z para un intervalo de confianza de 99% es el valor que tiene área de ∝/2 =.005
en la cola superior de la distribución z.005 =2.58 de la tabla normal estándar.
�𝑞𝑞
𝑝𝑝1� 1 �𝑞𝑞
𝑝𝑝2� 2
(𝑝𝑝
�1 − 𝑝𝑝
�)2 ± 𝑧𝑧𝛼𝛼/2 � +
𝑛𝑛1 𝑛𝑛2
(. 76)(.24) (. 65)(.35)
(. 76 − .65) ± 2.58� +
50 100
. 11 ± 2.58(.0770)
. 11 ± .199
. 11 − .199 = −0.089
. 11 + .199 = 0.309
La diferencia en las proporciones a favor del asunto del bono en las dos secciones de la
ciudad se encuentra entre -0.089 y 0.309 con una confianza del 99%. Como este intervalo
contiene el valor (p1 - p2) = 0, es posible que p1 = p2, lo cual implica que puede no haber
diferencia en las proporciones a favor del asunto del bono en las dos secciones de la
ciudad.
4. GLOSARIO
Parámetro: Son las medidas numéricas descriptivas que caracterizan a una población.
Estimación: Estimar o predecir el valor del parámetro.
13
Estimador: Es una regla, generalmente expresada como fórmula, que nos dice cómo
calcular una estimación basada en información de la muestra.
Estimación puntual: Con base en datos muéstrales, se calcula un solo número para
estimar el parámetro poblacional.
Estimación por intervalo: Con base en datos muéstrales, dos números se calculan
para formar un intervalo dentro del cual se espera esté el parámetro.
5. RECURSOS BIBLIOGRÁFICOS
14