Está en la página 1de 14

1.

INTRODUCCIÓN

Esta unidad inicia con el estudio de la estimación con muestras grandes, introducción,
tipos de estimadores, estimadores puntuales y por intervalo. La inferencia estadística se
ocupa de tomar decisiones o predicciones acerca de parámetros, es decir, las medidas
numéricas descriptivas que caracterizan a una población.

Es importante conocer Los métodos para hacer inferencias acerca de parámetros


poblacionales. Porque es la función del estadístico dar métodos de toma de decisiones
mejores y más confiables que únicamente cálculos subjetivos.

2. ESTRUCTURA DE CONTENIDOS

Unidad 1: Intervalos de confianza.

1.1 Introducción.
1.2 Tipos de estimadores.
1.3 Estimación puntual.
1.4 Estimación por intervalo.

3. DESARROLLO DE CONTENIDOS.

Estimación de muestras grandes

Las distribuciones binomiales y normales se destacan como importantes para las


aplicaciones prácticas. Numerosas estadísticas se basan en sumas o promedios
calculados de mediciones muéstrales. El teorema del límite central dice que, incluso que
si las poblaciones muéstrales no son normales, las distribuciones muéstrales de esas
estadísticas serán aproximadamente normales cuando el tamaño muestra n es grande.
Estas estadísticas son las herramientas que se usarán para estadísticas inferenciales, es
decir, hacer inferencias acerca de una población usando información contenida en una
muestra.

2
1.1 Introducción.

La inferencia, específicamente la toma y predicción de decisiones, tiene siglos de


antigüedad y desempeña un papel muy importante en la vida de casi todas las personas.
Por ejemplo, estas son algunas aplicaciones:

• El gobierno necesita predecir las tasas de interés a corto y largo plazos.


• Un corredor financiero desea pronosticar el comportamiento del mercado de
acciones.
• Un metalurgista desea determinar si un nuevo tipo de acero es más resistente
a altas temperaturas que el actual.
• Una consumidora desea estimar el precio de venta de su casa antes de ponerla
en el mercado.

Hay muchas formas de tomar estas decisiones o predicciones, algunas son subjetivas y
otras son objetivas por naturaleza. ¿Qué tan buenas serán las predicciones o decisiones?
Aun cuando se pueda pensar que se tiene una excelente capacidad sobre la tomar
decisiones, la experiencia sugiere que el error puede ser mayor cuando no se tiene una
evidencia empírica. Entonces la función del estadístico es proporcionar los métodos de
toma de decisiones mejores y más confiables basados en la inferencia estadística en
lugar de tener solo información y que únicamente cálculos subjetivos.

La inferencia estadística se ocupa de tomar decisiones o predicciones acerca de


parámetros, es decir, las medidas numéricas descriptivas que caracterizan a una
población. Tres parámetros que encontramos en capítulos anteriores son la media
poblacional μ, la desviación poblacional estándar s y la proporción binomial p. En
inferencia estadística, un problema práctico se expone de otra forma en el marco de una
población con un parámetro específico de interés. Por ejemplo, el metalurgista podría
medir el promedio de coeficientes de expansión de ambos tipos de acero y luego
comparar sus valores.

Los métodos para hacer inferencias acerca de parámetros poblacionales caen en una de
dos categorías:

Estimación: Estimar o predecir el valor del parámetro.

Prueba de hipótesis: Tomar una decisión acerca del valor de un parámetro, con base
en alguna idea preconcebida acerca de cuál podría ser su valor.

3
1.2 Tipos de estimadores

Para estimar el valor de un parámetro poblacional, se puede usar información de la


muestra en la forma de un estimador. Los estimadores se calculan usando información
de las observaciones muéstrales y, en consecuencia, por definición son también
estadísticas.

Un estimador es una regla, generalmente expresada como fórmula, que nos dice cómo
calcular una estimación basada en información de la muestra

Los estimadores se usan en dos formas diferentes:

Estimación puntual: Con base en datos muéstrales, se calcula un solo número para
estimar el parámetro poblacional. La regla o fórmula que describe este cálculo se
denomina estimador puntual y el número resultante recibe el nombre de estimación
puntual.

Estimación por intervalo: Con base en datos muéstrales, dos números se calculan para
formar un intervalo dentro del cual se espera esté el parámetro. La regla o fórmula que
describe este cálculo se denomina estimador de intervalo y el par de números resultantes
se llama estimación de intervalo o intervalo de confianza.

Los procedimientos de estimación tanto puntuales como de intervalo usan información


dada por la distribución muestral del estimador específico que se haya escogido para
usarse.

1.3 Estimación puntual

En una situación práctica, puede haber varias estadísticas que podrían usarse como
estimadores puntuales para un parámetro poblacional. Para determinar cuál de las
opciones es mejor, usted necesita saber cómo se comporta el estimador en muestreo
repetido, descrito por su distribución muestral.

Las distribuciones muéstrales dan información que se puede usar para seleccionar el
mejor estimador. ¿Qué características serían valiosas? Primero, la distribución muestral
del estimador puntual debe estar centrada sobre el verdadero valor del parámetro a ser

4
estimado. Esto es, el estimador no debe subestimar o sobreestimar de manera
consistente al parámetro de interés.

Se dice que un estimador de un parámetro es insesgado si la media de su distribución es


igual al verdadero valor del parámetro. De otro modo, se dice que el estimado está
sesgado.

Las distribuciones muéstrales para un estimador insesgado y estimador sesgado se ven


en la figura 1. La distribución muestral para el estimador sesgado está corrida a la
derecha del verdadero valor del parámetro. Este estimador sesgado es más probable que
uno insesgado para sobreestimar el valor del parámetro.

Figura 1: Estimador.

La segunda característica deseable de un estimador es que la dispersión (medida por la


varianza) de la distribución muestral debe ser tan pequeña como sea posible. Esto
asegura que, con una alta probabilidad, una estimación individual caerá cerca del valor
verdadero del parámetro. Las distribuciones muéstrales para dos estimadores
insesgados, una con una varianza pequeña y la otra con una varianza más grande, como
se ve en la figura 2.

Figura 2: Comparación de variabilidad de un estimador

5
Por supuesto que sería preferible el estimador con la varianza más pequeña, porque las
estimaciones tienden a estar más cerca del verdadero valor del parámetro que en la
distribución con la varianza más grande.

En situaciones muéstrales prácticas, es posible saber que la distribución muestral de un


estimador está centrada alrededor del parámetro que se trate de estimar, pero todo lo
que se tiene es la estimación calculada de las n mediciones contenidas en la muestra.
¿A qué distancia del verdadero valor del parámetro estará esta estimación? ¿Qué tan
cercana está la diana o blanco de la bala del tirador? La distancia entre la estimación y
el verdadero valor del parámetro se denomina error de estimación.

Estimadores puntuales

Para estimar la media poblacional μ para una población cuantitativa, el estimador


puntual 𝑥𝑥̅ es insesgado con el error estándar estimado como:

𝑠𝑠
𝑆𝑆𝑆𝑆 =
√𝑛𝑛

El 95% de margen de error cuando 𝑛𝑛 ≥ 30 se estima como:

𝑠𝑠
∓1.96 � �
√𝑛𝑛

Para estimar la proporción poblacional p para una población binomial, el estimador


𝑥𝑥
puntual 𝑝𝑝̂ = 𝑛𝑛 es insesgado, con un error estándar estimado como:

𝑝𝑝̂ 𝑞𝑞�
𝑆𝑆𝑆𝑆 = �
𝑛𝑛
El 95% de margen de error se estima como:

𝑝𝑝̂ 𝑞𝑞�
∓1.96 �� �
𝑛𝑛

Ejemplo 1: Un ambientalista está realizando un estudio del oso polar, especie que se
encuentra en el océano Ártico y sus alrededores. Su zona de distribución está limitada
por la existencia de hielo en el mar, que usan como plataforma para cazar focas, principal

6
sostén de los osos. La destrucción de su hábitat en el hielo del Ártico, que se ha atribuido
al calentamiento global, amenaza la supervivencia de los osos como especie; puede
extinguirse antes de un siglo. Una muestra aleatoria de n = 50 osos polares produjo un
peso promedio de 980 libras con una desviación estándar de 105 libras. Use esta
información para estimar el peso promedio de todos los osos polares del Ártico.

Solución

La variable aleatoria medida es el peso, una variable aleatoria cuantitativa mejor


descrita por su media 𝜇𝜇. La estimación puntual de μ, el peso promedio de todos los
osos polares del Ártico, es 𝑥𝑥̅ = 980 libras. El margen de error se estima como:

𝑠𝑠 105
1.96 𝑆𝑆𝑆𝑆 = 1.96 � � = 1.96 � � = 29.10 Libras
√𝑛𝑛 √50

Se puede tener confianza en que la estimación muestral de 980 libras está a no más de
29 libras de la media poblacional.

Ejemplo 2: Además del peso promedio del oso polar del Ártico, el ambientalista del
ejemplo anterior también está interesado en las opiniones de adultos sobre el tema del
calentamiento global. En particular, desea estimar la proporción de personas que piensan
que el calentamiento global es un problema muy serio. En una muestra aleatoria de n =
100 adultos, 73% de la muestra indicaron que, de lo que han oído o leído, el
calentamiento global es un problema muy serio. Estime la verdadera proporción de
población de adultos que piensan que el calentamiento global es un problema muy serio
y encuentre el margen de error para la estimación.

Solución

El parámetro de interés es ahora p, la proporción de personas en la población que


piensan que el calentamiento global es un problema muy serio. El mejor estimador de p
es la proporción muestral 𝑝𝑝̂ , que para esta muestra es 𝑝𝑝̂ =.73. Para hallar el margen de
error, usted puede aproximar el valor de p con su estimación 𝑝𝑝̂ =.73.

𝑝𝑝̂ 𝑞𝑞� . 73 ∗ .27


1.96 𝑆𝑆𝑆𝑆 = 1.96 �� � = 1.96 �� � = .09
𝑛𝑛 100

Con este margen de error, se puede estar bastante cierto de que la estimación de .73

7
está a no más de .09 del verdadero valor de p. En consecuencia, se puede concluir que
el verdadero valor de p podría ser de sólo .64 o de hasta .82.

1.4 Estimación por intervalo

Un estimador por intervalo es una regla para calcular dos números, por ejemplo, a y b,
para crear un intervalo del que usted está completamente seguro que contiene el
parámetro de interés. El concepto de “completamente seguro” significa “con gran
probabilidad”. Medimos esta probabilidad usando el coeficiente de confianza, designado
por 1-α.

Intervalo de confianza para la media con muestras grandes

Es muy frecuente que problemas prácticos lleven a m, la media de una población de


mediciones cuantitativas. He aquí algunos ejemplos:

• El promedio de calificaciones de estudiantes universitarios en una universidad


Particular.
• El promedio de resistencia de un nuevo tipo de acero.
• El número promedio de fallecimientos por categoría de edad.
• El promedio de demanda para un nuevo producto de cosmético.

Cuando el tamaño muestral n sea grande, la media muestral 𝑥𝑥̅ es el mejor estimador
puntual
para la media poblacional 𝜇𝜇. Como su distribución muestral es aproximadamente normal,
puede usarse para construir un intervalo de confianza.

Intervalo de la confianza para la media

𝑠𝑠
𝑥𝑥̅ ± 𝑧𝑧𝛼𝛼/2
√𝑛𝑛
Donde
𝑧𝑧𝛼𝛼/2 : Es el valor z correspondiente a un área 𝛼𝛼/2 de una distribución normal estándar.
n: Tamaño de muestra
s: Desviación estándar

Ejemplo 3: Un científico interesado en vigilar contaminantes químicos en alimentos y, por


lo tanto, la acumulación de contaminantes en la dieta humana, seleccionó una muestra

8
aleatoria de n = 50 adultos hombres. Se encontró que el promedio de ingesta diaria de
productos lácteos fue de 𝑥𝑥̅ =756 gramos por día, con una desviación estándar de s = 35
gramos por día. Use esta información muestral para construir un intervalo de confianza
de 95% para la ingesta diaria media de productos lácteos para hombres.

Solución

Como el tamaño muestral de n = 50 es grande, la distribución de la media Muestral 𝑥𝑥̅


está distribuida normalmente en forma aproximada. Y se tiene que:

𝑥𝑥̅ = 756 gr
S = 35
𝑧𝑧𝛼𝛼/2 = 1.96

Por lo tanto sustituyendo en le formula se tiene

𝑠𝑠
𝑥𝑥̅ ± 𝑧𝑧𝛼𝛼/2
√𝑛𝑛
35
756 ± 1.96
√50
756 ± 9.70

756 − 9.70= 746.3

756 + 9.70= 765.7

Por tanto, el intervalo de confianza de 95% para 𝜇𝜇 es de 746.30 a 765.70 gramos por día.

Intervalo de confianza para la proporción con muestras grandes

Muchos experimentos de investigación o estudios muéstrales tienen como objetivo la


estimación de la proporción de personas u objetos de un grupo grande, que posean cierta
característica.

Cuando el tamaño muestral es grande, la proporción muestral

𝑥𝑥 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁 𝑑𝑑𝑑𝑑 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒


𝑝𝑝̂ = =
𝑛𝑛 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁 𝑑𝑑𝑑𝑑 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖

9
Intervalo de la confianza para la proporción

𝑝𝑝̂ 𝑞𝑞�
𝑝𝑝̅ ± 𝑧𝑧𝛼𝛼/2 �
𝑛𝑛
Donde
𝑧𝑧𝛼𝛼/2 : Es el valor z correspondiente a un área 𝛼𝛼/2 de una distribución normal estándar.
𝑝𝑝̂ : es el estimador de la proporción de estudio
𝑞𝑞�: es la proporción de fracaso 1- 𝑝𝑝̂
n: Tamaño de muestra.

Ejemplo 4: Una muestra aleatoria de 985 “probables” electores, o sea los que
probablemente voten en la próxima elección, fueron encuestados durante un maratón
telefónico realizado por el Partido Republicano. De ellos, 592 indicaron que tenían la
intención de votar por la candidata republicana. Construya un intervalo de confianza de
90% para p, la proporción de electores probables de la población que tienen la intención
de votar por la candidata republicana. Con base en esta información, ¿se puede concluir
que la candidata ganará la elección?

Solución

La estimación de la proporción de estudio es

𝑥𝑥 592
𝑝𝑝̂ = 𝑛𝑛 = 985 = .601 y 𝑞𝑞� = 1 − .601 = .399
El valor z para un intervalo de confianza de 90% es el valor que tiene área de ∝/2 =.05
en la cola superior de la distribución z.05 =1.645 de la tabla normal estándar.

Por lo tanto sustituyendo se tiene

𝑝𝑝̂ 𝑞𝑞�
𝑝𝑝̅ ± 𝑧𝑧𝛼𝛼/2 �
𝑛𝑛

(. 601)(.399)
. 601 ± 1.645�
985
. 601 ± .026
. 601 − .026 = 0.575
. 601 + .026 = 0.627

10
Se estima que el porcentaje de probables electores que tienen intención de votar por la
candidata republicana es entre 57.5% y 62.7%

Intervalo de confianza para la diferencia de medias con muestras grandes

Un problema de igual importancia que la estimación de una sola media poblacional 𝜇𝜇,
para una población cuantitativa, es la comparación de dos medias poblacionales.

Intervalo de la confianza para la diferencia de medias.

𝑠𝑠12 𝑠𝑠22
(𝑥𝑥
���1 − 𝑥𝑥
���)
2 ± 𝑧𝑧𝛼𝛼/2 � +
𝑛𝑛1 𝑛𝑛2
Donde
𝑥𝑥1 𝑥𝑥
���, 2 Son las medias de estudio.
���:
𝑠𝑠1 , 𝑠𝑠2 : son las desviaciones estándar correspondientes a cada muestra.
𝑛𝑛1 , 𝑛𝑛2 : Son los tamaños de cada muestra.
𝑧𝑧𝛼𝛼/2 : Es el valor z correspondiente a un área 𝛼𝛼/2 de una distribución normal estándar.

Ejemplo 5: Las resistencias al desgaste de dos tipos de llantas para automóvil se


compararon en muestras de pruebas en camino de n1 y n2 = 100 llantas para cada tipo.
El número de millas hasta el completo desgaste se definió como una cantidad específica
de desgaste
de la llanta. Los resultados de la prueba se muestran en la siguiente tabla. Estime un
intervalo de confianza para la diferencia media del desgaste de los dos tipos de llantas,
usando una confianza de 99%.

Llanta tipo 1 Llanta tipo 2


𝑥𝑥1 = 26 400 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚
��� 𝑥𝑥2 = 25 100 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚
���
𝑠𝑠12 = 1440 000 𝑠𝑠12 = 1440 000
𝑛𝑛1 = 100 𝑛𝑛2 = 100

Solución

El valor z para un intervalo de confianza de 99% es el valor que tiene área de ∝/2 =.005
en la cola superior de la distribución z.005 =2.58 de la tabla normal estándar.

11
Por lo tanto, sustituyen los datos en la formula
𝑠𝑠12 𝑠𝑠22
(𝑥𝑥
���1 − 𝑥𝑥2 ± 𝑧𝑧𝛼𝛼/2 �
���) +
𝑛𝑛1 𝑛𝑛2

1440 000 1960 000


(26 400 − 25 100) ± 2.58� +
100 100
1 300 ± 2.58 (184.4)
1 300 ± 475.8
1 300 − 475.8 = 824.2
1 300 + 475.8 = 1775.8

La diferencia en el promedio de millas hasta el completo desgaste para los dos tipos de
llantas se estima que está entre el límite inferior 824.2 y el límite superior 1775.8 millas
de desgaste, con una confianza del 99%.

Intervalo de confianza para la diferencia de proporciones con muestras grandes

Una simple extensión de la estimación de una proporción p es la estimación de


la diferencia entre dos proporciones.

Intervalo de la confianza para la diferencia de proporciones.


𝑝𝑝
�𝑞𝑞
1� 1 𝑝𝑝
�𝑞𝑞
2� 2
(𝑝𝑝
�1 − 𝑝𝑝
�)2 ± 𝑧𝑧𝛼𝛼/2 � +
𝑛𝑛1 𝑛𝑛2

Donde
𝑝𝑝
�,1 𝑝𝑝�:2 Son las proporciones de estudio.
�,
𝑞𝑞1 𝑞𝑞�:2 : Son las proporciones de fracaso.
𝑛𝑛1 , 𝑛𝑛2 : Son los tamaños de cada muestra.
𝑧𝑧𝛼𝛼/2 : Es el valor z correspondiente a un área 𝛼𝛼/2 de una distribución normal estándar.

Ejemplo 6: La propuesta de un bono para la construcción de una escuela será enviada a


los votantes en la siguiente elección municipal. Una parte importante del dinero derivado
de esta emisión de bonos se empleará en construir escuelas en una zona de rápido
desarrollo de la ciudad y lo demás se usará para renovar y actualizar los edificios
escolares del resto de ésta. Para evaluar la viabilidad de la propuesta de un bono, a una
muestra aleatoria de n1 = 50 residentes de la zona de rápido desarrollo y n2 = 100 de las
otras partes de la ciudad, se les preguntó si piensan votar por la propuesta. Estime la

12
diferencia en las proporciones verdaderas a favor de la propuesta de bono con un 99%
de intervalo de confianza. Los resultados se muestran en la siguiente tabla.

Sección en Resto de la ciudad


desarrollo
Tamaño de muestra 50 100
Numero a favor de la propuesta 38 65
Proporción a favor de la .76 .65
propuesta

Solución

El valor z para un intervalo de confianza de 99% es el valor que tiene área de ∝/2 =.005
en la cola superior de la distribución z.005 =2.58 de la tabla normal estándar.

Por lo tanto, sustituyen los datos en la formula

�𝑞𝑞
𝑝𝑝1� 1 �𝑞𝑞
𝑝𝑝2� 2
(𝑝𝑝
�1 − 𝑝𝑝
�)2 ± 𝑧𝑧𝛼𝛼/2 � +
𝑛𝑛1 𝑛𝑛2

(. 76)(.24) (. 65)(.35)
(. 76 − .65) ± 2.58� +
50 100
. 11 ± 2.58(.0770)
. 11 ± .199
. 11 − .199 = −0.089
. 11 + .199 = 0.309

La diferencia en las proporciones a favor del asunto del bono en las dos secciones de la
ciudad se encuentra entre -0.089 y 0.309 con una confianza del 99%. Como este intervalo
contiene el valor (p1 - p2) = 0, es posible que p1 = p2, lo cual implica que puede no haber
diferencia en las proporciones a favor del asunto del bono en las dos secciones de la
ciudad.

4. GLOSARIO

Parámetro: Son las medidas numéricas descriptivas que caracterizan a una población.
Estimación: Estimar o predecir el valor del parámetro.

13
Estimador: Es una regla, generalmente expresada como fórmula, que nos dice cómo
calcular una estimación basada en información de la muestra.

Estimación puntual: Con base en datos muéstrales, se calcula un solo número para
estimar el parámetro poblacional.

Estimación por intervalo: Con base en datos muéstrales, dos números se calculan
para formar un intervalo dentro del cual se espera esté el parámetro.

Error de estimación: Es la distancia entre una estimación y el parámetro estimado.


Población: Es el conjunto de mediciones de interés para el investigador.

5. RECURSOS BIBLIOGRÁFICOS

González, E. G. (2016). Estadística inferencial 1 para ingeniería y ciencias. Mexico:


Grupo Editorial Patria.

Solano, H. L. (2017). Estadística Inferencial. Mexico: Universidad del Norte.

Viedma, C. d. (2016). Estadística descriptiva e inferencial. Mexico: Ediciones IDT.

William Mendenhall, R. J. (2010). Introducción a la probabilidad y estadística. Mexico:


Cengage Learning.

Fotografía de portada designed by freepik

14

También podría gustarte