Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Área: SOCIAL
Inferencia estadística
Índice
Introducción ......................................................................................................................................................... 1
1. Conceptos previos ............................................................................................................................................ 2
2. Distribución muestral ....................................................................................................................................... 3
2.1 Distribución de la media muestral (con varianza poblacional conocida) .................................................................... 4
2.2 Distribución de la media muestral (con varianza poblacional desconocida) ............................................................... 6
2.3 Distribución de la proporción muestral ....................................................................................................................... 7
3. Intervalos de confianza..................................................................................................................................... 8
3.1 Intervalo de Confianza para la media poblacional con varianza poblacional conocida .............................................. 8
3.2 Intervalo de Confianza para la media poblacional con varianza poblacional desconocida y muestras grandes ........ 9
3.3 Intervalo de Confianza para la media poblacional con varianza poblacional desconocida y muestras pequeñas .... 10
3.4 Intervalo de Confianza para la diferencia de medias: 𝝁𝟏 − 𝝁𝟐. ............................................................................... 11
a. Caso 1: Varianzas conocidas .................................................................................................................................... 11
b. Caso 2: Varianzas desconocidas pero iguales ......................................................................................................... 11
c. Caso 3: Varianzas desconocidas y distintas ............................................................................................................. 13
3.5 Intervalo de Confianza para la proporción poblacional, muestras grandes .............................................................. 14
3.6 Intervalo de Confianza para la diferencia de proporciones: 𝑷𝟏 − 𝑷𝟐 ...................................................................... 14
4.Tamaños de muestras aleatorias..................................................................................................................... 15
4.1 Tamaño de muestra para estimar la media 𝝁 ........................................................................................................... 16
4.2 Tamaño de muestra para estimar la proporción 𝒑 ................................................................................................... 17
5. Pruebas de Hipótesis ...................................................................................................................................... 18
5.1 Prueba de hipótesis para la media, con varianza conocida ....................................................................................... 21
5.2 Prueba de hipótesis para la media con varianza desconocida y muestra pequeña .................................................. 22
5.3 Prueba de hipótesis para la diferencia de medias: 𝝁𝟏 − 𝝁𝟐................................................................................... 23
a. Caso 1: Varianzas conocidas .................................................................................................................................... 23
b. Caso 2: Varianzas desconocidas pero iguales ......................................................................................................... 24
c. Caso 3: Varianzas desconocidas pero distintas ....................................................................................................... 24
5.4 Prueba de hipótesis para la proporción poblacional, muestras grandes .................................................................. 25
5.5 Prueba de hipótesis para la diferencia de proporciones: 𝑷𝟏 − 𝑷𝟐 .......................................................................... 26
Cierre .................................................................................................................................................................. 27
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES
Inferencia estadística
Mapa de Contenido
Tamaños de muestras
aleatorias
Tamaño de muestra para estimar la proporción p
5. Pruebas de Hipótesis Prueba de hipótesis para la diferencia de medias: Caso 2: Varianzas desconocidas
μ1 - μ2 pero iguales
Inferencia estadística
RESULTADO DE
Estima tamaño muestral, incorporando las herramientas fundamentales de la
APRENDIZAJE
inferencia Estadística.
DEL MÓDULO
Introducción
En el módulo 1 se comentó que para entender y llegar a inferencia estadística, es necesario comprender la
naturaleza de una población y muestra, en particular entender los conceptos y poder utilizar estadística
descriptiva. Una población representa la forma de las cosas o el estado de la naturaleza con respecto a un
fenómeno aleatorio en particular, de tal modo que pueda identificarse por medio de una característica medible
X. La forma en que se comporta u ocurren las cosas en relación con X, puede definirse por un modelo de
probabilidad, que fue llamado como distribución de probabilidad de la población. Por otra parte, una muestra
es un conjunto de datos que se obtienen de manera imparcial y técnicamente buena, si es ese el caso, la
muestra puede contener información relevante sobre el estado de la naturaleza, y sobre ello se podrá realizar
inferencias. Ahora, estas inferencias son bajo supuestos, por lo que, están sujetas a cierto riesgo de fallar o
simplemente error, dado que representan una deducción que va de lo particular (muestra) a lo general
(población). En el módulo anterior se estudió el concepto de variables aleatorias, junto a ciertas distribuciones
de probabilidad que pueden ser útil como modelo para la distribución de una población de interés.
En este módulo 4 y último examinaremos diferentes técnicas, de las cuales usaremos supuestos de inferencia
estadística para proporcionar resultados útiles y confiables. La inferencia estadística se divide en dos grandes
campos, primero tenemos el problema de la estimación de los parámetros de una distribución, y por otro lado,
las pruebas de hipótesis. En estimación de parámetros, se trata de elegir el valor de un parámetro de la
población, por medio de estimación. El problema de estimación de parámetros se subdivide en dos áreas, la
estimación puntual y la estimación por intervalos de confianza.
La estimación puntual trata de utilizar el valor de un estadístico para calcular el parámetro de una población.
Por ejemplo, cuando usamos la media muestral (𝑥̅ ) para estimar la media de una población (µ), con la media
muestral nos tratamos de acercar al verdadero valor del parámetro; o cuando usamos la proporción de una
muestra p, para estimar el parámetro de una distribución binomial. Una estimación puntual de algún
parámetro de una población, es un solo valor obtenido a partir de un estadístico. Las estadísticas se emplean
para estimar los valores de parámetros desconocidos, y la estimación de un parámetro involucra el uso de los
datos muestrales junto a alguna estadística. Emplearemos intervalos en el que, en forma probable, se
encuentra el valor del parámetro.
Por otra parte, una hipótesis estadística es una afirmación con respecto a alguna característica desconocida de
una población de interés. La esencia de probar una hipótesis estadística es el decidir si la afirmación o un valor
específico, planteados al inicio, se encuentran apoyadas o no, por la evidencia experimental que se obtiene a
través de una muestra aleatoria. Normalmente la afirmación involucra un parámetro, y la decisión acerca de si
los datos muestrales apoyan estadísticamente la afirmación se toma con base en la probabilidad, y si esta es
mínima, entonces será rechazada.
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 2
Inferencia estadística
1. Conceptos previos
Recordemos y aprendamos algunos conceptos fundamentales para trabajar este módulo.
Inferencia estadística
2. Distribución muestral
Un estadístico es prácticamente lo mismo que un parámetro, solo que el parámetro es obtenido con todos los
datos de la población y un estadístico con los datos de una muestra, es por esto que también lo denotamos de
manera distinta. Además, un estadístico es una variable aleatoria que tiene asociada una distribución de
probabilidades, y nos referiremos a sus distribuciones como Distribuciones muestrales.
Entender las distribuciones muestrales nos proporciona fundamentos para comprender los procedimientos
para inferir sobre un parámetro que no conocemos, a partir del valor de un estadístico obtenido por medio de
una muestra.
Para continuar con las distribuciones muestrales es fundamental conocer el siguiente teorema:
Se dice que dado una muestra aleatoria simple de tamaño n, de cualquier población (conocida o desconocida)
de media µ y desviación estándar finita 𝜎. Cuando n es grande (n>30) la distribución de la media muestral 𝑥̅ se
𝜎2 𝜎
aproxima mucho o tiende a la distribución normal 𝑁 (𝜇, ), con media µ y desviación estándar . Además,
𝑛 √𝑛
como ya tiende aproximadamente a una distribución normal, podemos estandarizar la media muestral para
encontrar valores de probabilidad, o sea:
FÓRMULAS
𝑥 −𝜇
𝑍= 𝜎 ~ 𝑁(0, 1)
√𝑛
Inferencia estadística
2.1 Distribución de la media muestral (con varianza poblacional
conocida)
Sea una muestra aleatoria de tamaño n, entonces llamamos media muestral o promedio muestral a:
FÓRMULAS
𝒏
𝒊=𝟏 𝒙𝒊
𝒙=
𝒏
Teorema 1: Sea una muestra aleatoria de una población infinita, con media µ y varianza 𝜎 2 . Entonces:
FÓRMULAS
a) 𝐸(𝑥̅ ) = 𝜇
𝜎2
b) 𝑉𝑎𝑟(𝑥̅ ) = 𝑛
FÓRMULAS
𝜎2 𝑁 − 𝑛
𝑉𝑎𝑟(𝑥̅ ) = ∙
𝑛 𝑁−1
Teorema 2: Sea una muestra aleatoria de tamaño n, de una población que se distribuye Normal, con media µ
y varianza 𝜎 2 , entonces:
FÓRMULAS
𝜎2
𝑥 ~ 𝑁 𝜇,
𝑛
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 5
Inferencia estadística
Como la media muestral se distribuye Normal con los parámetros establecidos, si deseamos encontrar alguna
probabilidad en base a la media muestral, solo debemos estandarizar de igual forma como para una variable
aleatoria normal, vista en el módulo 3. En consecuencia, tenemos:
FÓRMULAS
𝑥 − 𝜇
𝑍= 𝜎 ~ 𝑁(0, 1)
√𝑛
EJEMPLO 1
Una prueba de inteligencia para adultos, donde sus resultados (el puntaje) siguen una distribución normal
con media 100 ptos y una desviación estándar de 15 ptos.
a. ¿Cuál es la probabilidad de que un individuo elegido al azar tenga un resultado de 105 o superior?
b. ¿Cuál es la probabilidad de que el puntaje medio en la prueba, de una muestra aleatoria de 60
personas, sea de 105 o superior?
La probabilidad de que un individuo elegido al azar tenga un puntaje en la prueba de inteligencia mayor o
igual a 105 es de 0,3707.
𝜎2 152
b. Según el teorema anterior tenemos que: 𝑥 ~ 𝑁 (𝜇 = 100; 𝑛
= 60
) Por lo tanto, ya tenemos
la distribución normal, ahora para encontrar la probabilidad pedida, debemos estandarizar la
variable.
𝑥̅ −𝜇 105 − 100
P(𝑋 ≥ 105 ) = 𝑃 𝜎 ≥ 1,9365
= 𝑃 (𝑍 ≥ 2,58) =
√60
= 1 − 𝑃(𝑍 ≤ 2,58) = 1 − 0,9951 = 0,0049
La probabilidad de que el puntaje medio en la prueba, de una muestra de 60 personas, sea mayor o igual
a 105 es de 0,0049.
Nota: Recordemos que para obtener el valor de la probabilidad, cuando estandarizamos, debemos buscar el
valor en la tabla de la distribución normal estándar.
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 6
Inferencia estadística
2.2 Distribución de la media muestral (con varianza poblacional
desconocida)
Cuando la varianza poblacional (𝜎 2 ) es desconocida, problema al cual siempre estaremos expuestos, es preciso
utilizar la información que nos provee la muestra respecto de este parámetro y estimar la desviación estándar,
utilizando las fórmulas adecuadas (módulo 2).
Teorema 3: Sea una muestra aleatoria de tamaño n, de una población que se distribuye Normal, con media µ
y varianza desconocida, la distribución de la media muestral tiende a una distribución t-Student con n-1 grados
de libertad, entonces:
FÓRMULAS
𝑥 ~ 𝑡(𝑛−1)
Luego como conocemos la media y varianza de 𝑥̅ (por medio de una muestra), realizamos una estandarización,
entonces:
FÓRMULAS
𝑥 − 𝜇
~ 𝑡(𝑛−1)
𝑆
√𝑛
EJEMPLO 2
Un grupo de doctores especializados en cáncer, descubrieron que el tamaño de los tumores se distribuye
normal con media 3,1. Tomaron una muestra aleatoria de 12 mujeres que padecían cáncer, la muestra
arroja una desviación estándar de 0,5 cm. ¿Cuál es la probabilidad de que el tamaño promedio del tumor
de esta muestra fluctúe entre 3,2 y 3,5 cm?
Del enunciado tenemos que: X: el tamaño de tumores. 𝑋 ~ 𝑁(𝜇 = 3,1; 𝜎 2 ). n = 12. 𝑆 = 0,5
Por lo tanto realizamos la probabilidad según el enunciado.
La probabilidad de que el tamaño medio del tumor esté entre 3,2 y 3,5, de una muestra de 12 mujeres,
es de 0,24.
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 7
Inferencia estadística
Nota: Recordemos que, para obtener el valor de la probabilidad, cuando estandarizamos, debemos buscar el
valor en la tabla de la distribución t-Studendt.
FÓRMULAS
𝑋 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 é𝑥𝑖𝑡𝑜𝑠
𝑃= =
𝑁 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
FÓRMULAS
𝑥 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 é𝑥𝑖𝑡𝑜𝑠
𝑝= =
𝑛 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
Entonces, si P es la proporción de individuos en una población que representa cierta característica de interés
y p es la proporción de individuos en una muestra que representa dicha característica, teniendo una muestra
de tamaño n (grande) y aplicando el teorema del límite central se puede demostrar que p distribuye
𝑃(1−𝑃)
aproximadamente normal, con media P y varianza 𝑛
, siempre y cuando np ≥ 5. Dado lo anterior, tenemos:
FÓRMULAS
𝑃(1 − 𝑃)
𝑝 ~ 𝑁 𝑃,
𝑛
De manera análoga a toda distribución normal, podemos estandarizar para encontrar cualquier probabilidad
que nos pidan, entonces:
FÓRMULAS
𝑝− 𝑃
𝑍= ~ 𝑁(0, 1)
𝑃(1 − 𝑃)
𝑛
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 8
Inferencia estadística
EJEMPLO 3
Según los resultados de cierta encuesta, en Chile el 12,9% de los habitantes tiene problemas de astigmatismo. Si se
elige una muestra de 200 personas, ¿Cuál es la probabilidad de que, en la muestra, sobre el 15% de ellos tenga alguna
discapacidad?
La probabilidad de que, en la muestra de 200 personas, sobre el 15% de ellos tenga astigmatismo es de 18,67%, o
sea, es poco probable que ocurra.
3. Intervalos de confianza
Un intervalo de confianza está determinado por dos valores dentro de los cuales se espera encontrar el
verdadero valor de un parámetro, con un pequeño margen de error. Por lo tanto, el parámetro que se está
estimando, se encuentra en él con una determinada certeza o con algún grado o nivel de confianza,
Para trabajar intervalos de confianza, debemos tener en cuenta que uno de los grandes supuestos es que los
datos o muestras provienen de una población que se distribuye normal.
FÓRMULAS
𝜎2 𝜎2
𝐼𝐶(1−𝛼)100% [ 𝜇 ] = 𝑥̅ − 𝑍1−𝛼 ∙ ; 𝑥̅ + 𝑍1−𝛼 ∙
2 𝑛 2 𝑛
Inferencia estadística
1. 𝑍1−𝛼 ∙ es conocido como error de muestreo.
2 √𝑛
EJEMPLO 4
Se obtiene una muestra aleatoria de 100 adultos sanos, con el fin de establecer un patrón del nivel de
calcio. Se sabe de estudios anteriores que a varianza del nivel de calcio es 0,52 milígramos. Se extrae una
muestra de sangre de cada adulto. La variable estudiada es X: milígramos de calcio por decilitro de sangre.
Se encontró una media muestral de 9,5. Suponga que X presenta una distribución normal. Hallar un
intervalo de confianza para la media poblacional µ con un nivel de confianza del 95%.
0,52 0,52
𝐼𝐶95 % [ 𝜇 ] = 9,5 − 1,96 ∙ ; 9,5 + 1,96 ∙
100 100
Conclusión, se espera que los adultos que conforman la población en estudio, tengan una media que se
encuentre entre 9,4 y 9,6 milígramos de calcio por decilitro de sangre, con una confianza del 95%.
FÓRMULAS
𝑆2 𝑆2
𝐼𝐶(1−𝛼)100% [ 𝜇 ] = 𝑥̅ − 𝑍1−𝛼 ∙ ; 𝑥̅ + 𝑍1−𝛼 ∙
2 𝑛 2 𝑛
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 10
Inferencia estadística
la varianza es desconocida la distribución de probabilidad asociada es una t-Student. Sin embargo, cuando el
tamaño de muestra es grande, la distribución t-Student converge a una distribución normal estándar.
FÓRMULAS
𝑆2 𝑆2
𝐼𝐶(1−𝛼)100% [ 𝜇 ] = 𝑥̅ − 𝑡(𝑛−1; 1−𝛼) ∙ ; 𝑥̅ + 𝑡(𝑛−1; 1−𝛼) ∙
2 𝑛 2 𝑛
EJEMPLO 5
0,32 0,32
𝐼𝐶95% [ 𝜇 ] = 26 − 2,064 ∙ ; 26 + 2,064 ∙
25 25
Conclusión, se espera que los estudiantes tengan una media entre 25,876 y 26,124 en sus evaluaciones,
con un 95% de confianza.
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 11
Inferencia estadística
3.4 Intervalo de Confianza para la diferencia de medias: 𝝁𝟏 − 𝝁𝟐 .
a. Caso 1: Varianzas conocidas
Sean dos muestras aleatorias independientes provenientes de poblaciones distribuidas normales con medias
𝜇1 𝑦 𝜇2 y varianzas 𝜎12 𝑦 𝜎22 respectivamente, donde las varianzas poblacionales son conocidas, el intervalo
de confianza de (1 – 𝛼 )100% para la diferencia de medias 𝜇1 − 𝜇2 , es:
FÓRMULAS
𝜎12 𝜎22
𝐼𝐶(1−𝛼)100% [ 𝜇1 − 𝜇2 ] = (𝑥̅1 − 𝑥̅2 ) ± 𝑍1−𝛼 ∙ +
2 𝑛1 𝑛2
Sean dos muestras aleatorias independientes provenientes de poblaciones distribuidas normales con medias
𝜇1 𝑦 𝜇2 y varianzas 𝜎12 𝑦 𝜎22 respectivamente, donde las varianzas poblacionales son desconocidas pero
iguales, el intervalo de confianza de (1 – 𝛼 )100% para la diferencia de medias 𝜇1 − 𝜇2 , se define como:
FÓRMULAS
1 1
𝐼𝐶(1−𝛼)100% [ 𝜇1 − 𝜇2 ] = (𝑥̅1 − 𝑥̅2 ) ± 𝑡(𝑛 𝛼 ∙ 𝑆𝑝 +
1 +𝑛2 −2; 1− 2 ) 𝑛1 𝑛2
Donde además:
FÓRMULAS
Inferencia estadística
EJEMPLO 6
Un grupo de investigación, estudia la influencia que puede tener el tabaco con el peso de los niños al nacer.
Hay 2 grupos de mujeres embarazadas, las que fuman y las que no fuman. En ambos grupos los pesos de
los recién nacidos provienen de distribuciones normales de medias desconocidas y con varianzas
desconocidas, pero podemos suponer que son iguales. Se desea estimar la diferencia de medias entre los
pesos de los recién nacidos, con el fin de encontrar en cuanto influye el que la madre se fumadora en el
peso de su hijo (o con el fin de encontrar diferencias estadísticamente significativas).
Finalmente 𝑆𝑝 = 0,686
Y el valor de la distribución t-Student. 𝑡(𝑛 𝛼 = 𝑡(60; 0,975) = 2
1 +𝑛2 −2; 1− 2 )
Conclusión, como el intervalo de confianza incluye el cero, se afirma con un 95% de confianza que no hay
diferencias estadísticamente significativas entre los grupos, o sea, no hay evidencia en la muestra para
afirmar que los pesos de los recién nacidos son distintos.
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 13
Inferencia estadística
c. Caso 3: Varianzas desconocidas y distintas
Sean dos muestras aleatorias independientes provenientes de poblaciones distribuidas normales con medias
𝜇1 𝑦 𝜇2 y varianzas 𝜎12 𝑦 𝜎22 respectivamente, donde las varianzas poblacionales son desconocidas y además
distintas, el intervalo de confianza de (1 – 𝛼 )100% para la diferencia de medias 𝜇1 − 𝜇2 , se define como:
FÓRMULAS
𝑆12 𝑆22
𝐼𝐶(1−𝛼)100% [ 𝜇1 − 𝜇2 ] = (𝑥̅1 − 𝑥̅2 ) ± 𝑡(𝑔.𝑙.; 1−𝛼) ∙ +
2 𝑛1 𝑛2
Donde los grados de libertad para la distribución t-Student, tienen la siguiente corrección:
FÓRMULAS
2
𝑠12 𝑠22
𝑛1 + 𝑛2
𝑔𝑙 = 2 2
𝑠12 𝑠22
𝑛1 𝑛2
𝑛1 − 1 + 𝑛2 − 1
EJERCITEMOS
Ejercicio 1: Se quiere estimar la diferencia entre las remuneraciones de los empleados de dos empresas
distintas. Dos muestras independientes, provenientes de poblaciones normales con varianzas diferentes,
han entregado los siguientes resultados:
Estime un intervalo de confianza del 99% para la diferencia de las remuneraciones reales de los
empleados.
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 14
Inferencia estadística
Observación:
FÓRMULAS
𝑃 (1 − 𝑃) 𝑃 (1 − 𝑃)
𝐼𝐶(1−𝛼)100% [ 𝑃 ] = 𝑝 − 𝑍1−𝛼 ∙ ; 𝑝 + 𝑍1−𝛼 ∙
2 𝑛 2 𝑛
EJERCITEMOS
Ejercicio 2: Una encuesta reconocida informó que el 76% de todos los estudiantes de enseñanza media
tenía computadoras en sus casas. Si una muestra de 1085 estudiantes revela que 764 tienen
computadores caseros, ¿un intervalo de 95% de confianza apoya a la reconocida encuesta?
FÓRMULAS
𝑃1 (1 − 𝑃1 ) 𝑃2 (1 − 𝑃2 )
𝐼𝐶(1−𝛼)100% [𝑃1 − 𝑃2 ] = (𝑝1 − 𝑝2 ) ± 𝑍1−𝛼 ∙ +
2 𝑛1 𝑛2
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 15
Inferencia estadística
EJERCITEMOS
Ejercicio 3: Una distribuidora de cigarros confirma que su marca de cigarros X sobrepasa las ventas de
cigarros de marca Y en 8%. Si se encuesta y los resultados son que 72 de 200 fumadores prefieren la marca
X, y 43 de 150 fumadores prefieren la marca Y. Calcule un intervalo de confianza del 90% para la diferencia
entre las proporciones de ventas, de las dos marcas y determine si la diferencia del 8% es una afirmación
válida.
En intervalos de confianza nos basamos en el supuesto de conocer el tamaño muestral “n”. Sin embargo, en
muchos casos prácticos el tamaño muestral óptimo no se conoce. En aquellos casos es posible calcular el
tamaño de muestra óptimo, sí y solo si, podamos dar respuesta a lo siguiente:
De esta forma “e”, lo podemos definir como el máximo error permitido al querer estimar el parámetro
poblacional. Así, podemos obtener dos fórmulas, que definiremos a continuación, para estimar el tamaño
muestral
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 16
Inferencia estadística
4.1 Tamaño de muestra para estimar la media 𝝁
Para calcular y obtener un tamaño de muestra, para estimar la media 𝜇, tenemos la siguiente expresión:
FÓRMULAS
𝜎
𝑒 ≥ 𝑍1−𝛼 ∙
2 √𝑛
FÓRMULAS
2 2
𝑍1− 𝛼 ∙ 𝜎
2
𝑛≥
𝑒2
La varianza de la variable
(si es desconocida, se
Un nivel de confianza. Un error admitido (𝑒).
estima 𝑆 2 de una muestra
piloto).
EJEMPLO 7
Supongamos que nos interesa estimar el peso promedio bajado debido a una saludable alimentación. La
reducción de peso de una persona debido a una saludable alimentación sigue una distribución normal
con desviación estándar de 2,5Kg. Con un nivel de confianza del 95% y una estimación que no difiera en
más de 1,5Kg. del promedio real de las personas, ¿Cuántos individuos deben participar de este estudio?
El nivel de confianza es del 95%, por lo tanto, el valor crítico será: 𝑍1−𝛼 = 𝑍0,975 = 1,96.
2
El error permitido es de 1,5 Kg.
La varianza de la variable es 6,25 𝐾𝑔2
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 17
Inferencia estadística
EJEMPLO 7
1,962 ∙ 6,25
𝑛≥
1,52
𝑛 ≥ 10,67
FÓRMULAS
𝑃(1 − 𝑃)
𝑒 ≥ 𝑍1−𝛼 ∙
2 𝑛
FÓRMULAS
2
𝑍1− 𝛼 ∙ 𝑃(1 − 𝑃)
2
𝑛≥
𝑒2
Inferencia estadística
EJEMPLO 8
Se considera, según la última encuesta nacional, que el 40% de la población fuma. Si queremos estimar la
proporción con un 99% de confianza y un error a los más de 0,01, ¿Cuál es el tamaño de muestra adecuado?
El nivel de confianza es del 99%, por lo tanto, el valor crítico será: 𝑍1−𝛼 = 𝑍0,995 = 2,58.
2
El error permitido es de 0,01, y la proporción obtenida de otro estudio es de 0,4. Entonces:
𝑛 ≥ 15975,36
EJERCITEMOS
Ejercicio 4: Un político no muy conocido, desea estimar el porcentaje de personas que apoyan su actual
política relacionada con las nuevas reformas a la constitución. El político quiere que el cálculo se encuentre
a menos de 0,04 de la proporción real. Los asesores del político son optimistas, y calculan que la
proporción de personas que apoyan la actual política es de 0,6. Suponiendo un nivel de confianza del 95%:
1.- Calcule un tamaño de muestra para la proporción de personas que apoyan su actual política, y 2.-
Calcule un tamaño de muestra si no estuviera disponible ningún estimador de la proporción de personas
que apoyan su actual política.
5. Pruebas de Hipótesis
Una hipótesis estadística es una afirmación acerca de un parámetro desconocido (𝜇, 𝜎 2 , 𝑃) asociado con una
distribución de probabilidades de una o más variables aleatorias. En vez de encontrar un estimador para el
parámetro, la prueba de hipótesis consiste en que, dado que tenemos la información de la muestra, decidir
entre aceptar o rechazar dicha afirmación.
Las técnicas de prueba de hipótesis se encuentran muy relacionadas con los intervalos de confianza pero con
una interpretación un tanto distinta, cuando se construye un intervalo de confianza, lo que se hace es estimar
un intervalo donde se espera (con un cierto nivel de seguridad o confianza) que se encuentre el parámetro de
la población.
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 19
Inferencia estadística
Mientras que, cuando se realiza una prueba de hipótesis, se establecen valores posibles para el parámetro
poblacional, determinando la probabilidad de que se obtengan muestras más diferentes que la que se obtuvo.
Finalmente, si esta probabilidad es inferior a un valor previamente establecido, se rechaza la hipótesis.
Definimos las hipótesis estadísticas, estas son Hipótesis Nula (𝐻0 ) e Hipótesis Alternativa (𝐻1 ), las cuales son
opuestas y complementarias.
Las pruebas unilaterales también son llamadas pruebas de una cola, ya que se desea rechazar en una sola
dirección para los valores del parámetro. Por el contrario, las pruebas bilaterales, son llamadas pruebas de dos
colas, ya que se desea rechazar en ambas direcciones para los valores del parámetro.
El estadístico de prueba es un valor calculado a partir de la muestra, el cual se utilizará para contrastar la
hipótesis nula. Interesa que tenga el máximo de información sobre la hipótesis nula planteada ya que, en base
a la información contenida en el valor calculado, se tomará la decisión respecto de la aceptación o rechazo de
la hipótesis nula.
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 20
Inferencia estadística
La Regla de Decisión es una regla basada en la información muestral, que indica cuando se debe rechazar la
hipótesis nula, y por lo tanto, quedarse con la hipótesis alternativa. Para esto se establece una región de
rechazo y otra de aceptación.
La región crítica o región de rechazo de una prueba específica los valores del estadístico de la prueba para los
cuales se rechaza 𝐻0 . Por lo que, será dicha región que nos lleva a rechazar la hipótesis nula cuando el
estadístico de prueba cae en ella.
Inferencia estadística
Procedimiento o pasos a seguir para plantear una prueba de hipótesis:
Establecer las regiones que define la evidencia en contra de 𝐻0 que se encuentra en la muestra.
FÓRMULAS
𝑥̅ − 𝜇0
𝑍= 𝜎 ~ 𝑁(0, 1)
√𝑛
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 22
Inferencia estadística
EJEMPLO 9
En una investigación del peso de cierto producto luego de varios reclamos, el producto tiene un peso neto
de 300 gr según el frasco y sigue una distribución normal. Se seleccionó una muestra de 36 productos que
presentaron un promedio de 297 gr y una desviación estándar de 7,5 gr. Obtenga región crítica y concluya
la prueba de hipótesis correspondiente, con un nivel de confianza del 95%.
Solución:
1. El parámetro de interés es la media del peso de cierto producto.
2. Las hipótesis son:
𝐻0 : 𝜇 = 300 𝑔𝑟.
𝐻1 : 𝜇 ≠ 300 𝑔𝑟.
𝑥̅ − 𝜇0 297 − 300 −3
𝑍= 𝜎 = = = −2,4
7,5 1,25
√𝑛 √36
6. Por último como la región de rechazo son los valores menores a -1,96 y el valor del estadístico
de prueba resultó ser -2,4, este cae en la región de rechazo, por ende, se rechaza hipótesis nula que la
media sea igual a 300, hay evidencia significativa en la muestra para rechazar Hipótesis nula. Finalmente
podemos concluir que la media del peso neto de cierto producto es distinta de 300 gr
Inferencia estadística
El estadístico de prueba es:
FÓRMULAS
𝑥̅ − 𝜇0
𝑇= ~ 𝑡𝑛−1
𝑆
√𝑛
EJERCITEMOS
Ejercicio 5: El precio del kilo de pan sigue una distribución normal y de una muestra aleatoria de tamaño
15, se obtiene que el promedio del kilo de pan es de $1.120.- y una desviación estándar de $11,5.- ¿Hay
evidencia en la muestra para afirmar, con un nivel de significancia de 0,05, que el precio medio del pan es
superior a $1.100?
Sean dos muestras aleatorias independientes provenientes de poblaciones distribuidas normales con medias
𝜇1 𝑦 𝜇2 y varianzas 𝜎12 𝑦 𝜎22 respectivamente, donde las varianzas poblacionales son conocidas. Si se extrae
una muestra aleatoria de cada población, es posible realizar una prueba de hipótesis a objeto de determinar si
la diferencia de medias 𝜇1 − 𝜇2 , están diferenciadas o no:
FÓRMULAS
Inferencia estadística
b. Caso 2: Varianzas desconocidas pero iguales
Sean dos muestras aleatorias independientes provenientes de poblaciones distribuidas normales con medias
𝜇1 𝑦 𝜇2 y varianzas 𝜎12 𝑦 𝜎22 respectivamente, donde las varianzas poblacionales son desconocidas y
distintas. Si se extrae una muestra aleatoria de cada población, es posible realizar una prueba de hipótesis a
objeto de determinar si la diferencia de medias 𝜇1 − 𝜇2 , están diferenciadas o no:
FÓRMULAS
Donde además:
FÓRMULAS
Inferencia estadística
El estadístico de prueba es:
FÓRMULAS
Donde la distribución t-student no se ajuste bien, por lo que requiere una corrección de los grados de libertad.
FÓRMULAS
2
𝑠12 𝑠22
+
𝑛1 𝑛2
𝑔𝑙 = 2 2
𝑠12 𝑠22
𝑛1 𝑛2
𝑛1 − 1 + 𝑛2 − 1
FÓRMULAS
𝑝 − 𝑝0
𝑍= ~ 𝑁(0, 1)
𝑝0 (1 − 𝑝0 )
𝑛
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 26
Inferencia estadística
5.5 Prueba de hipótesis para la diferencia de proporciones: 𝑷𝟏 − 𝑷𝟐
Si p es la proporción de una muestra aleatoria de tamaño n (debe ser grande), proveniente de una población
que se distribuye binomial. El interés recae en probar uno de los siguientes conjuntos de hipótesis
FÓRMULAS
𝑝1 − 𝑝2
𝑍= ~ 𝑁(0, 1)
𝑝1 (1 − 𝑝1 ) 𝑝2 (1 − 𝑝2 )
𝑛1 + 𝑛2
EJERCITEMOS
Ejercicio 6: En un estudio de los hábitos de fumador para personas zurdas y derechas, una muestra aleatoria de 400
zurdos reveló que 190 de éstos fuman, y en una muestra aleatoria de 800 diestros, 300 de estos no fuman. Con base
a esta evidencia, ¿podría decidir si la proporción de personas zurdas y diestras que fuman es la misma?
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 27
Inferencia estadística
Cierre
Finalizamos la asignatura con inferencia estadística, las herramientas para poder decidir y tomar decisión
frente a problemáticas reales. El uso de intervalos de confianza es muy amplio, en muchas áreas de la ciencia,
son muy útiles ya que permite encontrar un rango en el cual podrá estar o moverse una verdadera proporción
de alguna característica de interés de la población, o de alguna media en base a la variable continua.
Por otra parte, el uso de pruebas de hipótesis nos otorga conocimientos, capacidades y poder de decisión
frente a alguna percepción, opinión u otra cualidad que pueda analizarse como probabilidad.
APORTE A TU FORMACIÓN
A estudios o investigaciones futuras, observarán que requieren tomar un tamaño de muestra, el cual debe ser óptimo
para asegurar la credibilidad de la información. Este tamaño muestral viene de la mano con intervalos de confianza.
Inferencia estadística
Bibliografía
Obligatoria
Naiman , Arnold, Rosenfeld, Robert, and Zirkel, Gene. Introducción a la estadística. México, D.F., MX: McGraw-
Hill Interamericana, 1987. ProQuest ebrary. Web. 19 December 2017. Pp. 179 -232.
Alvarado Verdín, Víctor Manuel. Probabilidad y estadística: Serie Universitaria Patria. México, D.F., MX: Grupo
Editorial Patria, 2014. ProQuest ebrary. Web. 19 December 2017. Pp. 71 -96.