Está en la página 1de 31

MÓDULO

Área: SOCIAL

4 Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES


Módulo: Inferencia estadística
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES

Inferencia estadística
Índice

Introducción ......................................................................................................................................................... 1
1. Conceptos previos ............................................................................................................................................ 2
2. Distribución muestral ....................................................................................................................................... 3
2.1 Distribución de la media muestral (con varianza poblacional conocida) .................................................................... 4
2.2 Distribución de la media muestral (con varianza poblacional desconocida) ............................................................... 6
2.3 Distribución de la proporción muestral ....................................................................................................................... 7
3. Intervalos de confianza..................................................................................................................................... 8
3.1 Intervalo de Confianza para la media poblacional con varianza poblacional conocida .............................................. 8
3.2 Intervalo de Confianza para la media poblacional con varianza poblacional desconocida y muestras grandes ........ 9
3.3 Intervalo de Confianza para la media poblacional con varianza poblacional desconocida y muestras pequeñas .... 10
3.4 Intervalo de Confianza para la diferencia de medias: 𝝁𝟏 − 𝝁𝟐. ............................................................................... 11
a. Caso 1: Varianzas conocidas .................................................................................................................................... 11
b. Caso 2: Varianzas desconocidas pero iguales ......................................................................................................... 11
c. Caso 3: Varianzas desconocidas y distintas ............................................................................................................. 13
3.5 Intervalo de Confianza para la proporción poblacional, muestras grandes .............................................................. 14
3.6 Intervalo de Confianza para la diferencia de proporciones: 𝑷𝟏 − 𝑷𝟐 ...................................................................... 14
4.Tamaños de muestras aleatorias..................................................................................................................... 15
4.1 Tamaño de muestra para estimar la media 𝝁 ........................................................................................................... 16
4.2 Tamaño de muestra para estimar la proporción 𝒑 ................................................................................................... 17
5. Pruebas de Hipótesis ...................................................................................................................................... 18
5.1 Prueba de hipótesis para la media, con varianza conocida ....................................................................................... 21
5.2 Prueba de hipótesis para la media con varianza desconocida y muestra pequeña .................................................. 22
5.3 Prueba de hipótesis para la diferencia de medias: 𝝁𝟏 − 𝝁𝟐................................................................................... 23
a. Caso 1: Varianzas conocidas .................................................................................................................................... 23
b. Caso 2: Varianzas desconocidas pero iguales ......................................................................................................... 24
c. Caso 3: Varianzas desconocidas pero distintas ....................................................................................................... 24
5.4 Prueba de hipótesis para la proporción poblacional, muestras grandes .................................................................. 25
5.5 Prueba de hipótesis para la diferencia de proporciones: 𝑷𝟏 − 𝑷𝟐 .......................................................................... 26
Cierre .................................................................................................................................................................. 27
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES

Inferencia estadística
Mapa de Contenido

Distribución de la media muestral (con varianza


Conceptos previos poblacional conocida)

Distribución de la media muestral (con varianza


Distribución muestral
poblacional desconocida)

Distribución de la proporción muestral

Intervalo de confianza para la media poblacional


con varianza poblacional conocida

Intervalo de confianza para la media poblacional


con varianza poblacional desconocida y muestras
grandes

Intervalo de confianza para la media poblacional


con varianza poblacional desconocida y muestras Caso 1: Varianzas conocidas
pequeñas
Intervalos de confianza
Intervalo de confianza para la diferencia de Caso 2: Varianzas desconocidas
medias: μ1-μ2 pero iguales
Inferencia
estadística
Intervalo de confianza para la proporción Caso 3: Varianzas desconocidas y
poblacional, muestras grandes distintas

Intervalo de confianza para la diferencia de


proporciones: P1-P2

Tamaño de muestra para estimar la media μ

Tamaños de muestras
aleatorias
Tamaño de muestra para estimar la proporción p

Prueba de hipótesis para la media, con varianza


conocida

Prueba de hipótesis para la media con varianza


Caso 1: Varianzas conocidas
desconocida y muestra pequeña

5. Pruebas de Hipótesis Prueba de hipótesis para la diferencia de medias: Caso 2: Varianzas desconocidas
μ1 - μ2 pero iguales

Prueba de hipótesis para la proporción Caso 3: Varianzas desconocidas


poblacional, muestras grandes pero distintas

Prueba de hipótesis para la diferencia de


proporciones: P1-P2
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 1

Inferencia estadística
RESULTADO DE
Estima tamaño muestral, incorporando las herramientas fundamentales de la
APRENDIZAJE
inferencia Estadística.
DEL MÓDULO

Introducción
En el módulo 1 se comentó que para entender y llegar a inferencia estadística, es necesario comprender la
naturaleza de una población y muestra, en particular entender los conceptos y poder utilizar estadística
descriptiva. Una población representa la forma de las cosas o el estado de la naturaleza con respecto a un
fenómeno aleatorio en particular, de tal modo que pueda identificarse por medio de una característica medible
X. La forma en que se comporta u ocurren las cosas en relación con X, puede definirse por un modelo de
probabilidad, que fue llamado como distribución de probabilidad de la población. Por otra parte, una muestra
es un conjunto de datos que se obtienen de manera imparcial y técnicamente buena, si es ese el caso, la
muestra puede contener información relevante sobre el estado de la naturaleza, y sobre ello se podrá realizar
inferencias. Ahora, estas inferencias son bajo supuestos, por lo que, están sujetas a cierto riesgo de fallar o
simplemente error, dado que representan una deducción que va de lo particular (muestra) a lo general
(población). En el módulo anterior se estudió el concepto de variables aleatorias, junto a ciertas distribuciones
de probabilidad que pueden ser útil como modelo para la distribución de una población de interés.

En este módulo 4 y último examinaremos diferentes técnicas, de las cuales usaremos supuestos de inferencia
estadística para proporcionar resultados útiles y confiables. La inferencia estadística se divide en dos grandes
campos, primero tenemos el problema de la estimación de los parámetros de una distribución, y por otro lado,
las pruebas de hipótesis. En estimación de parámetros, se trata de elegir el valor de un parámetro de la
población, por medio de estimación. El problema de estimación de parámetros se subdivide en dos áreas, la
estimación puntual y la estimación por intervalos de confianza.

La estimación puntual trata de utilizar el valor de un estadístico para calcular el parámetro de una población.
Por ejemplo, cuando usamos la media muestral (𝑥̅ ) para estimar la media de una población (µ), con la media
muestral nos tratamos de acercar al verdadero valor del parámetro; o cuando usamos la proporción de una
muestra p, para estimar el parámetro de una distribución binomial. Una estimación puntual de algún
parámetro de una población, es un solo valor obtenido a partir de un estadístico. Las estadísticas se emplean
para estimar los valores de parámetros desconocidos, y la estimación de un parámetro involucra el uso de los
datos muestrales junto a alguna estadística. Emplearemos intervalos en el que, en forma probable, se
encuentra el valor del parámetro.

Por otra parte, una hipótesis estadística es una afirmación con respecto a alguna característica desconocida de
una población de interés. La esencia de probar una hipótesis estadística es el decidir si la afirmación o un valor
específico, planteados al inicio, se encuentran apoyadas o no, por la evidencia experimental que se obtiene a
través de una muestra aleatoria. Normalmente la afirmación involucra un parámetro, y la decisión acerca de si
los datos muestrales apoyan estadísticamente la afirmación se toma con base en la probabilidad, y si esta es
mínima, entonces será rechazada.
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 2

Inferencia estadística
1. Conceptos previos
Recordemos y aprendamos algunos conceptos fundamentales para trabajar este módulo.

Parámetro: Es un número que representa a la aunque muchas veces suele escribirse en


población, respecto a un indicador utilizado para porcentaje (1–𝛼)100%.
resumir la información que nos interesa de dicha Nivel de significación: Es la probabilidad de fallar
población. Ejemplo: la media poblacional (µ), la en nuestra estimación, esto es, la diferencia entre
varianza poblacional (𝜎 2 ), la proporción la certeza (1) y el nivel de confianza (1- 𝛼). También
poblacional (P), entre otras. es llamado Valor de 𝜶 (valor de alfa). Por ejemplo,
en una estimación con un nivel de confianza del
Estadístico: Es un valor o cualquier función de los 95%, el valor de 𝛼 es: (1 − 0,95) = 0,05
elementos que se obtiene a partir de una muestra
aleatoria y que representa al parámetro. Ejemplo: Tamaño muestral: Es el número de elementos que
media muestral (𝑥̅ ), varianza muestral (S2), extraemos de una población para su observación y
proporción muestral (p), entre otras. La idea es que estudio. Se dice que es una muestra aleatoria
con el estadístico queremos llegar al verdadero simple (m.a.s.), si cada una de ellas al ser
valor del parámetro. El estadístico es utilizado para seleccionada tiene igual probabilidad de ser
hacer inferencias o estimaciones con respecto de extraída.
parámetros poblacionales que son desconocidos.
Además, un estadístico es una variable aleatoria Valor crítico: Se denota por 𝒁𝜶 . Es el valor de la
que tiene asociada una distribución de variable numérica en una determinada distribución
probabilidad. (en este caso se trata de una distribución normal
estándar, por ser una 𝒁) que deja a su izquierda un
Error de muestreo: Es aquel que procede del hecho área igual a 𝜶, siendo 𝟏 − 𝜶 el nivel de confianza.
de utilizar observaciones muestrales, o sea, de no Normalmente los valores críticos están tabulados o
observar la totalidad de los datos. Este error puede pueden calcularse en función de la distribución de
ser conocido e incorporado en los resultados a la población. Por ejemplo, para una distribución
través de un intervalo. normal estándar [𝑍 ~ 𝑁(0, 1)], el valor crítico de
𝛼 = 0,05, se busca en la tabla de distribución ese
Nivel de confianza: Es la probabilidad de que el valor o el más aproximado, dentro del cuadro de
verdadero valor del parámetro estimado en la valores de la probabilidad acumulada, luego
población se sitúe en el intervalo de confianza observamos que valor de Z cumple con el valor
obtenido. El nivel de confianza se denota por (1–𝛼), crítico y así se observa que corresponde con -1,64.
Entonces 𝒁𝜶 = −𝟏, 𝟔𝟒.
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 3

Inferencia estadística
2. Distribución muestral
Un estadístico es prácticamente lo mismo que un parámetro, solo que el parámetro es obtenido con todos los
datos de la población y un estadístico con los datos de una muestra, es por esto que también lo denotamos de
manera distinta. Además, un estadístico es una variable aleatoria que tiene asociada una distribución de
probabilidades, y nos referiremos a sus distribuciones como Distribuciones muestrales.

Entender las distribuciones muestrales nos proporciona fundamentos para comprender los procedimientos
para inferir sobre un parámetro que no conocemos, a partir del valor de un estadístico obtenido por medio de
una muestra.

Para continuar con las distribuciones muestrales es fundamental conocer el siguiente teorema:

Teorema Central del Límite

Se dice que dado una muestra aleatoria simple de tamaño n, de cualquier población (conocida o desconocida)
de media µ y desviación estándar finita 𝜎. Cuando n es grande (n>30) la distribución de la media muestral 𝑥̅ se
𝜎2 𝜎
aproxima mucho o tiende a la distribución normal 𝑁 (𝜇, ), con media µ y desviación estándar . Además,
𝑛 √𝑛
como ya tiende aproximadamente a una distribución normal, podemos estandarizar la media muestral para
encontrar valores de probabilidad, o sea:

FÓRMULAS

𝑥 −𝜇
𝑍= 𝜎 ~ 𝑁(0, 1)
√𝑛

A continuación, definiremos 3 distribuciones muestrales, necesarias para intervalos de confianza y prueba de


hipótesis.
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 4

Inferencia estadística
2.1 Distribución de la media muestral (con varianza poblacional
conocida)
Sea una muestra aleatoria de tamaño n, entonces llamamos media muestral o promedio muestral a:

FÓRMULAS

𝒏
𝒊=𝟏 𝒙𝒊
𝒙=
𝒏

Teorema 1: Sea una muestra aleatoria de una población infinita, con media µ y varianza 𝜎 2 . Entonces:

FÓRMULAS

a) 𝐸(𝑥̅ ) = 𝜇
𝜎2
b) 𝑉𝑎𝑟(𝑥̅ ) = 𝑛

Si la población es finita de tamaño N, entonces:

FÓRMULAS

𝜎2 𝑁 − 𝑛
𝑉𝑎𝑟(𝑥̅ ) = ∙
𝑛 𝑁−1

Teorema 2: Sea una muestra aleatoria de tamaño n, de una población que se distribuye Normal, con media µ
y varianza 𝜎 2 , entonces:

FÓRMULAS

𝜎2
𝑥 ~ 𝑁 𝜇,
𝑛
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 5

Inferencia estadística
Como la media muestral se distribuye Normal con los parámetros establecidos, si deseamos encontrar alguna
probabilidad en base a la media muestral, solo debemos estandarizar de igual forma como para una variable
aleatoria normal, vista en el módulo 3. En consecuencia, tenemos:

FÓRMULAS

𝑥 − 𝜇
𝑍= 𝜎 ~ 𝑁(0, 1)
√𝑛

EJEMPLO 1

Una prueba de inteligencia para adultos, donde sus resultados (el puntaje) siguen una distribución normal
con media 100 ptos y una desviación estándar de 15 ptos.
a. ¿Cuál es la probabilidad de que un individuo elegido al azar tenga un resultado de 105 o superior?
b. ¿Cuál es la probabilidad de que el puntaje medio en la prueba, de una muestra aleatoria de 60
personas, sea de 105 o superior?

Del enunciado tenemos que:


X: el puntaje de la prueba de inteligencia para adultos. 𝑋 ~ 𝑁(𝜇 = 100; 𝜎 2 = 152 )

𝑋−𝜇 105 − 100


a. P(X ≥ 105 ) = 𝑃 ( ≥ ) = 𝑃 (𝑍 ≥ 0,33) =
𝜎 15
= 1 − 𝑃(𝑍 ≤ 0,33) = 1 − 0,6293 = 0,3707.

La probabilidad de que un individuo elegido al azar tenga un puntaje en la prueba de inteligencia mayor o
igual a 105 es de 0,3707.

𝜎2 152
b. Según el teorema anterior tenemos que: 𝑥 ~ 𝑁 (𝜇 = 100; 𝑛
= 60
) Por lo tanto, ya tenemos
la distribución normal, ahora para encontrar la probabilidad pedida, debemos estandarizar la
variable.

𝑥̅ −𝜇 105 − 100
P(𝑋 ≥ 105 ) = 𝑃 𝜎 ≥ 1,9365
= 𝑃 (𝑍 ≥ 2,58) =
√60
= 1 − 𝑃(𝑍 ≤ 2,58) = 1 − 0,9951 = 0,0049

La probabilidad de que el puntaje medio en la prueba, de una muestra de 60 personas, sea mayor o igual
a 105 es de 0,0049.

Nota: Recordemos que para obtener el valor de la probabilidad, cuando estandarizamos, debemos buscar el
valor en la tabla de la distribución normal estándar.
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 6

Inferencia estadística
2.2 Distribución de la media muestral (con varianza poblacional
desconocida)
Cuando la varianza poblacional (𝜎 2 ) es desconocida, problema al cual siempre estaremos expuestos, es preciso
utilizar la información que nos provee la muestra respecto de este parámetro y estimar la desviación estándar,
utilizando las fórmulas adecuadas (módulo 2).

Teorema 3: Sea una muestra aleatoria de tamaño n, de una población que se distribuye Normal, con media µ
y varianza desconocida, la distribución de la media muestral tiende a una distribución t-Student con n-1 grados
de libertad, entonces:

FÓRMULAS

𝑥 ~ 𝑡(𝑛−1)

Luego como conocemos la media y varianza de 𝑥̅ (por medio de una muestra), realizamos una estandarización,
entonces:

FÓRMULAS

𝑥 − 𝜇
~ 𝑡(𝑛−1)
𝑆
√𝑛

EJEMPLO 2

Un grupo de doctores especializados en cáncer, descubrieron que el tamaño de los tumores se distribuye
normal con media 3,1. Tomaron una muestra aleatoria de 12 mujeres que padecían cáncer, la muestra
arroja una desviación estándar de 0,5 cm. ¿Cuál es la probabilidad de que el tamaño promedio del tumor
de esta muestra fluctúe entre 3,2 y 3,5 cm?

Del enunciado tenemos que: X: el tamaño de tumores. 𝑋 ~ 𝑁(𝜇 = 3,1; 𝜎 2 ). n = 12. 𝑆 = 0,5
Por lo tanto realizamos la probabilidad según el enunciado.

𝑥− 𝜇 3,5−3,1 𝑥− 𝜇 3,2 .3,1


𝑃(3,2 ≤ 𝑋 ≤ 3,5) = 𝑃( 𝑋 ≤ 3,5) − 𝑃(𝑋 ≤ 3,2) = 𝑃 𝑆 ≤ 0,5 − 𝑃 𝑆 ≤ 0,5
√𝑛 √60 √𝑛 √60
= 𝑃(𝑇 ≤ 2,77) − 𝑃(𝑇 ≤ 0,69) = 0,99 − 0,75 = 0,24

La probabilidad de que el tamaño medio del tumor esté entre 3,2 y 3,5, de una muestra de 12 mujeres,
es de 0,24.
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 7

Inferencia estadística
Nota: Recordemos que, para obtener el valor de la probabilidad, cuando estandarizamos, debemos buscar el
valor en la tabla de la distribución t-Studendt.

2.3 Distribución de la proporción muestral


Proporción es la fracción de una población que posee un rasgo o característica de interés.

FÓRMULAS

𝑋 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 é𝑥𝑖𝑡𝑜𝑠
𝑃= =
𝑁 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛

Luego un estimador para la proporción muestral está dado por:

FÓRMULAS

𝑥 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 é𝑥𝑖𝑡𝑜𝑠
𝑝= =
𝑛 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎

Entonces, si P es la proporción de individuos en una población que representa cierta característica de interés
y p es la proporción de individuos en una muestra que representa dicha característica, teniendo una muestra
de tamaño n (grande) y aplicando el teorema del límite central se puede demostrar que p distribuye
𝑃(1−𝑃)
aproximadamente normal, con media P y varianza 𝑛
, siempre y cuando np ≥ 5. Dado lo anterior, tenemos:

FÓRMULAS

𝑃(1 − 𝑃)
𝑝 ~ 𝑁 𝑃,
𝑛

De manera análoga a toda distribución normal, podemos estandarizar para encontrar cualquier probabilidad
que nos pidan, entonces:

FÓRMULAS

𝑝− 𝑃
𝑍= ~ 𝑁(0, 1)
𝑃(1 − 𝑃)
𝑛
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 8

Inferencia estadística
EJEMPLO 3

Según los resultados de cierta encuesta, en Chile el 12,9% de los habitantes tiene problemas de astigmatismo. Si se
elige una muestra de 200 personas, ¿Cuál es la probabilidad de que, en la muestra, sobre el 15% de ellos tenga alguna
discapacidad?

Del enunciado obtenemos que: 𝑃 = 0,129; 𝑛 = 200.

𝑝−𝑃 0,15 − 0,129


P( p > 0,15 ) = 𝑃 ≥ = 𝑃 (𝑍 ≥ 0,89) =
𝑃(1 − 𝑃) 0,129(1 − 0,129)
𝑛 200

= 1 − 𝑃(𝑍 ≤ 0,89) = 1 − 0,8133 = 0,1867.

La probabilidad de que, en la muestra de 200 personas, sobre el 15% de ellos tenga astigmatismo es de 18,67%, o
sea, es poco probable que ocurra.

3. Intervalos de confianza
Un intervalo de confianza está determinado por dos valores dentro de los cuales se espera encontrar el
verdadero valor de un parámetro, con un pequeño margen de error. Por lo tanto, el parámetro que se está
estimando, se encuentra en él con una determinada certeza o con algún grado o nivel de confianza,

Para trabajar intervalos de confianza, debemos tener en cuenta que uno de los grandes supuestos es que los
datos o muestras provienen de una población que se distribuye normal.

3.1 Intervalo de Confianza para la media poblacional con varianza


poblacional conocida
Si 𝑥̅ es la media de una muestra aleatoria de tamaño n, proveniente de una población que se distribuye normal

FÓRMULAS

𝜎2 𝜎2
𝐼𝐶(1−𝛼)100% [ 𝜇 ] = 𝑥̅ − 𝑍1−𝛼 ∙ ; 𝑥̅ + 𝑍1−𝛼 ∙
2 𝑛 2 𝑛

con varianza poblacional 𝜎 2 (conocida), el intervalo de confianza de (1 – 𝛼 )100% para µ es:


Observación:
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 9

Inferencia estadística
1. 𝑍1−𝛼 ∙ es conocido como error de muestreo.
2 √𝑛

EJEMPLO 4

Se obtiene una muestra aleatoria de 100 adultos sanos, con el fin de establecer un patrón del nivel de
calcio. Se sabe de estudios anteriores que a varianza del nivel de calcio es 0,52 milígramos. Se extrae una
muestra de sangre de cada adulto. La variable estudiada es X: milígramos de calcio por decilitro de sangre.
Se encontró una media muestral de 9,5. Suponga que X presenta una distribución normal. Hallar un
intervalo de confianza para la media poblacional µ con un nivel de confianza del 95%.

𝑍1−𝛼 = 𝑍1−0,05 = 𝑍0,975 = 1,96.


2 2
Se busca el valor crítico 0,975 dentro de la tabla normal estándar y el resultado es 1,96.

Ahora, se calcula el intervalo de confianza.

0,52 0,52
𝐼𝐶95 % [ 𝜇 ] = 9,5 − 1,96 ∙ ; 9,5 + 1,96 ∙
100 100

= [9,5 − 0,098 ; 9,5 + 0,098]

𝐼𝐶95 % [ 𝜇 ] = [9,402 ; 9,598]

Conclusión, se espera que los adultos que conforman la población en estudio, tengan una media que se
encuentre entre 9,4 y 9,6 milígramos de calcio por decilitro de sangre, con una confianza del 95%.

3.2 Intervalo de Confianza para la media poblacional con varianza


poblacional desconocida y muestras grandes
Si 𝑥̅ es la media de una muestra aleatoria de tamaño n, proveniente de una población que se distribuye normal
con varianza poblacional 𝜎 2 (desconocida), el intervalo de confianza de (1 – 𝛼 )100% para µ es:
El intervalo de confianza resulta prácticamente idéntico al anterior, solo que, en vez de la varianza poblacional,
ahora se estimará por medio de la varianza muestral. En Distribuciones muestrales, observamos que cuando

FÓRMULAS

𝑆2 𝑆2
𝐼𝐶(1−𝛼)100% [ 𝜇 ] = 𝑥̅ − 𝑍1−𝛼 ∙ ; 𝑥̅ + 𝑍1−𝛼 ∙
2 𝑛 2 𝑛
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 10

Inferencia estadística
la varianza es desconocida la distribución de probabilidad asociada es una t-Student. Sin embargo, cuando el
tamaño de muestra es grande, la distribución t-Student converge a una distribución normal estándar.

3.3 Intervalo de Confianza para la media poblacional con varianza


poblacional desconocida y muestras pequeñas
Cuando la varianza de una variable aleatoria no es conocida, y se tiene una muestra aleatoria pequeña, no se
puede usar la distribución normal, sino que en su lugar se debe emplear la distribución t. Si 𝑥̅ es la media y S
la desviación estándar de una muestra aleatoria de tamaño n, tomada de una distribución normal con varianza
poblacional 𝜎 2 desconocida, el intervalo de confianza de (1 – 𝛼 )100% para µ es:

FÓRMULAS

𝑆2 𝑆2
𝐼𝐶(1−𝛼)100% [ 𝜇 ] = 𝑥̅ − 𝑡(𝑛−1; 1−𝛼) ∙ ; 𝑥̅ + 𝑡(𝑛−1; 1−𝛼) ∙
2 𝑛 2 𝑛

EJEMPLO 5

Se ha calculado el promedio de una evaluación aplicada a 25 alumnos elegidos aleatoriamente de un curso


de último año de carrera, se obtiene un promedio de 26, y una desviación estándar S = 0,3. Obtenga un
intervalo de confianza para la media con el 95% de confianza. Calculamos el valor de la distribución t-
Student, con 24 grados de libertad.
𝑡(𝑛−1; 1−𝛼) = 𝑡 0,05 = 𝑡(24; 0,975) = 2,064
2 (24; 1− )
2

Ahora, se calcula el intervalo de confianza, reemplazando los datos:

0,32 0,32
𝐼𝐶95% [ 𝜇 ] = 26 − 2,064 ∙ ; 26 + 2,064 ∙
25 25

= [26 − 0,12384 ; 26 + 0,12384]

𝐼𝐶95% [ 𝜇 ] = [25,876 ; 26 + 26,124]

Conclusión, se espera que los estudiantes tengan una media entre 25,876 y 26,124 en sus evaluaciones,
con un 95% de confianza.
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 11

Inferencia estadística
3.4 Intervalo de Confianza para la diferencia de medias: 𝝁𝟏 − 𝝁𝟐 .
a. Caso 1: Varianzas conocidas
Sean dos muestras aleatorias independientes provenientes de poblaciones distribuidas normales con medias
𝜇1 𝑦 𝜇2 y varianzas 𝜎12 𝑦 𝜎22 respectivamente, donde las varianzas poblacionales son conocidas, el intervalo
de confianza de (1 – 𝛼 )100% para la diferencia de medias 𝜇1 − 𝜇2 , es:

FÓRMULAS

𝜎12 𝜎22
𝐼𝐶(1−𝛼)100% [ 𝜇1 − 𝜇2 ] = (𝑥̅1 − 𝑥̅2 ) ± 𝑍1−𝛼 ∙ +
2 𝑛1 𝑛2

b. Caso 2: Varianzas desconocidas pero iguales

Sean dos muestras aleatorias independientes provenientes de poblaciones distribuidas normales con medias
𝜇1 𝑦 𝜇2 y varianzas 𝜎12 𝑦 𝜎22 respectivamente, donde las varianzas poblacionales son desconocidas pero
iguales, el intervalo de confianza de (1 – 𝛼 )100% para la diferencia de medias 𝜇1 − 𝜇2 , se define como:

FÓRMULAS

1 1
𝐼𝐶(1−𝛼)100% [ 𝜇1 − 𝜇2 ] = (𝑥̅1 − 𝑥̅2 ) ± 𝑡(𝑛 𝛼 ∙ 𝑆𝑝 +
1 +𝑛2 −2; 1− 2 ) 𝑛1 𝑛2

Donde además:

FÓRMULAS

(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22


𝑆𝑝2 =
𝑛1 + 𝑛2 − 2
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 12

Inferencia estadística
EJEMPLO 6

Un grupo de investigación, estudia la influencia que puede tener el tabaco con el peso de los niños al nacer.
Hay 2 grupos de mujeres embarazadas, las que fuman y las que no fuman. En ambos grupos los pesos de
los recién nacidos provienen de distribuciones normales de medias desconocidas y con varianzas
desconocidas, pero podemos suponer que son iguales. Se desea estimar la diferencia de medias entre los
pesos de los recién nacidos, con el fin de encontrar en cuanto influye el que la madre se fumadora en el
peso de su hijo (o con el fin de encontrar diferencias estadísticamente significativas).

Tipo de madre Tamaño Media Desv. Estándar


Fumadora 35 3.0 kg 0,8 kg.
No fumadora 27 3.3 kg 0,5 kg.

Primero obtenemos el valor de 𝑆𝑝2 .

(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22 (35 − 1)0,82 + (27 − 1)0,52 28,26


𝑆𝑝2 = = = = 0,471
𝑛1 + 𝑛2 − 2 35 + 27 − 2 60

Finalmente 𝑆𝑝 = 0,686
Y el valor de la distribución t-Student. 𝑡(𝑛 𝛼 = 𝑡(60; 0,975) = 2
1 +𝑛2 −2; 1− 2 )

Ahora podemos calcular el valor del intervalo de confianza.


1 1
𝐼𝐶95% [ 𝜇1 − 𝜇2 ] = (3,0 − 3,3) ± 2 ∙ 0,686 +
35 27

𝐼𝐶95% [ 𝜇1 − 𝜇2 ] = [(−0,3) ± 0,3514 ]

𝐼𝐶95% [ 𝜇1 − 𝜇2 ] = [−0,6513 ; 0,0514 ]

Conclusión, como el intervalo de confianza incluye el cero, se afirma con un 95% de confianza que no hay
diferencias estadísticamente significativas entre los grupos, o sea, no hay evidencia en la muestra para
afirmar que los pesos de los recién nacidos son distintos.
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 13

Inferencia estadística
c. Caso 3: Varianzas desconocidas y distintas
Sean dos muestras aleatorias independientes provenientes de poblaciones distribuidas normales con medias
𝜇1 𝑦 𝜇2 y varianzas 𝜎12 𝑦 𝜎22 respectivamente, donde las varianzas poblacionales son desconocidas y además
distintas, el intervalo de confianza de (1 – 𝛼 )100% para la diferencia de medias 𝜇1 − 𝜇2 , se define como:

FÓRMULAS

𝑆12 𝑆22
𝐼𝐶(1−𝛼)100% [ 𝜇1 − 𝜇2 ] = (𝑥̅1 − 𝑥̅2 ) ± 𝑡(𝑔.𝑙.; 1−𝛼) ∙ +
2 𝑛1 𝑛2

Donde los grados de libertad para la distribución t-Student, tienen la siguiente corrección:

FÓRMULAS

2
𝑠12 𝑠22
𝑛1 + 𝑛2
𝑔𝑙 = 2 2
𝑠12 𝑠22
𝑛1 𝑛2
𝑛1 − 1 + 𝑛2 − 1

EJERCITEMOS

Ejercicio 1: Se quiere estimar la diferencia entre las remuneraciones de los empleados de dos empresas
distintas. Dos muestras independientes, provenientes de poblaciones normales con varianzas diferentes,
han entregado los siguientes resultados:

Empleado Tamaño Media Desv. Estándar


Empresa A 82 575 250
Empresa B 50 420 60

Estime un intervalo de confianza del 99% para la diferencia de las remuneraciones reales de los
empleados.
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 14

Inferencia estadística
Observación:

1. Si el intervalo contiene al cero, se dirá que no existe diferencia significativa entre 𝜇1 − 𝜇2


2. Si ambos límites del intervalo son positivos, se dirá que existe evidencia significativa para pensar que
𝜇1 es mayor que 𝜇2 . (𝜇1 − 𝜇2 > 0, entonces 𝜇1 > 𝜇2 ).
3. Si ambos límites del intervalo son negativos se dirá que existe evidencia significativa para pensar que
𝜇1 es menor que 𝜇2 . (𝜇1 − 𝜇2 < 0, entonces 𝜇1 < 𝜇2 ).

3.5 Intervalo de Confianza para la proporción poblacional, muestras


grandes
Si p es la proporción de una muestra aleatoria de tamaño n (debe ser grande), proveniente de una población
que se distribuye binomial, el intervalo de confianza aproximado del (1 – 𝛼 )100% para p, se define como:

FÓRMULAS

𝑃 (1 − 𝑃) 𝑃 (1 − 𝑃)
𝐼𝐶(1−𝛼)100% [ 𝑃 ] = 𝑝 − 𝑍1−𝛼 ∙ ; 𝑝 + 𝑍1−𝛼 ∙
2 𝑛 2 𝑛

EJERCITEMOS

Ejercicio 2: Una encuesta reconocida informó que el 76% de todos los estudiantes de enseñanza media
tenía computadoras en sus casas. Si una muestra de 1085 estudiantes revela que 764 tienen
computadores caseros, ¿un intervalo de 95% de confianza apoya a la reconocida encuesta?

3.6 Intervalo de Confianza para la diferencia de proporciones: 𝑷𝟏 − 𝑷𝟐


Sean dos muestras aleatorias independientes de tamaño 𝑛1 y 𝑛2 relativamente grandes, el intervalo de
confianza aproximado del (1-𝛼)100% para la diferencia de proporciones 𝑃1 − 𝑃2 , es:

FÓRMULAS

𝑃1 (1 − 𝑃1 ) 𝑃2 (1 − 𝑃2 )
𝐼𝐶(1−𝛼)100% [𝑃1 − 𝑃2 ] = (𝑝1 − 𝑝2 ) ± 𝑍1−𝛼 ∙ +
2 𝑛1 𝑛2
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 15

Inferencia estadística
EJERCITEMOS

Ejercicio 3: Una distribuidora de cigarros confirma que su marca de cigarros X sobrepasa las ventas de
cigarros de marca Y en 8%. Si se encuesta y los resultados son que 72 de 200 fumadores prefieren la marca
X, y 43 de 150 fumadores prefieren la marca Y. Calcule un intervalo de confianza del 90% para la diferencia
entre las proporciones de ventas, de las dos marcas y determine si la diferencia del 8% es una afirmación
válida.

La Observación de la diferencia de medias, es análoga para un intervalo de confianza para la diferencia de


proporciones.

4.Tamaños de muestras aleatorias


Un problema que surge de inmediato al trabajar intervalos de confianza es, ¿cuál es el tamaño mínimo de la
muestra para lograr un determinado grado de precisión?

En intervalos de confianza nos basamos en el supuesto de conocer el tamaño muestral “n”. Sin embargo, en
muchos casos prácticos el tamaño muestral óptimo no se conoce. En aquellos casos es posible calcular el
tamaño de muestra óptimo, sí y solo si, podamos dar respuesta a lo siguiente:

¿Cuál es la diferencia máxima


que podemos aceptar entre
¿Qué nivel de confianza el estadístico y el verdadero
deseamos? valor del parámetro? O sea,
¿Cuál es el error de muestreo
máximo que deseamos?

De esta forma “e”, lo podemos definir como el máximo error permitido al querer estimar el parámetro
poblacional. Así, podemos obtener dos fórmulas, que definiremos a continuación, para estimar el tamaño
muestral
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 16

Inferencia estadística
4.1 Tamaño de muestra para estimar la media 𝝁
Para calcular y obtener un tamaño de muestra, para estimar la media 𝜇, tenemos la siguiente expresión:

FÓRMULAS

𝜎
𝑒 ≥ 𝑍1−𝛼 ∙
2 √𝑛

Luego de un trabajo algebraico, resulta:

FÓRMULAS

2 2
𝑍1− 𝛼 ∙ 𝜎
2
𝑛≥
𝑒2

Donde necesitamos saber:

La varianza de la variable
(si es desconocida, se
Un nivel de confianza. Un error admitido (𝑒).
estima 𝑆 2 de una muestra
piloto).

EJEMPLO 7

Supongamos que nos interesa estimar el peso promedio bajado debido a una saludable alimentación. La
reducción de peso de una persona debido a una saludable alimentación sigue una distribución normal
con desviación estándar de 2,5Kg. Con un nivel de confianza del 95% y una estimación que no difiera en
más de 1,5Kg. del promedio real de las personas, ¿Cuántos individuos deben participar de este estudio?

Del enunciado, debemos extraer lo necesario:

El nivel de confianza es del 95%, por lo tanto, el valor crítico será: 𝑍1−𝛼 = 𝑍0,975 = 1,96.
2
El error permitido es de 1,5 Kg.
La varianza de la variable es 6,25 𝐾𝑔2
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 17

Inferencia estadística
EJEMPLO 7

Por lo tanto, reemplazando en la fórmula:


2 2
𝑍1− 𝛼 ∙ 𝜎
2
𝑛≥
𝑒2

1,962 ∙ 6,25
𝑛≥
1,52

𝑛 ≥ 10,67

Finalmente, un tamaño de muestra necesario (𝑛), es de 11 individuos.

4.2 Tamaño de muestra para estimar la proporción 𝒑


Para calcular y obtener un tamaño de muestra para estimar la proporción 𝑝, tenemos la siguiente expresión:

FÓRMULAS

𝑃(1 − 𝑃)
𝑒 ≥ 𝑍1−𝛼 ∙
2 𝑛

Luego de un trabajo algebraico, resulta:

FÓRMULAS

2
𝑍1− 𝛼 ∙ 𝑃(1 − 𝑃)
2
𝑛≥
𝑒2

Donde necesitamos saber:

P debe ser conocido


Un nivel de Un error admitido (si es desconocido, se
confianza. (𝑒). estima 𝑝, de un
estudio piloto).
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 18

Inferencia estadística
EJEMPLO 8

Se considera, según la última encuesta nacional, que el 40% de la población fuma. Si queremos estimar la
proporción con un 99% de confianza y un error a los más de 0,01, ¿Cuál es el tamaño de muestra adecuado?

Del enunciado tenemos:

El nivel de confianza es del 99%, por lo tanto, el valor crítico será: 𝑍1−𝛼 = 𝑍0,995 = 2,58.
2
El error permitido es de 0,01, y la proporción obtenida de otro estudio es de 0,4. Entonces:

2,582 ∙ 0,4(1 − 0,4)


𝑛≥
0,012

𝑛 ≥ 15975,36

Finalmente, un tamaño de muestra necesario para estimar la proporción es de 15976.

EJERCITEMOS

Ejercicio 4: Un político no muy conocido, desea estimar el porcentaje de personas que apoyan su actual
política relacionada con las nuevas reformas a la constitución. El político quiere que el cálculo se encuentre
a menos de 0,04 de la proporción real. Los asesores del político son optimistas, y calculan que la
proporción de personas que apoyan la actual política es de 0,6. Suponiendo un nivel de confianza del 95%:
1.- Calcule un tamaño de muestra para la proporción de personas que apoyan su actual política, y 2.-
Calcule un tamaño de muestra si no estuviera disponible ningún estimador de la proporción de personas
que apoyan su actual política.

5. Pruebas de Hipótesis
Una hipótesis estadística es una afirmación acerca de un parámetro desconocido (𝜇, 𝜎 2 , 𝑃) asociado con una
distribución de probabilidades de una o más variables aleatorias. En vez de encontrar un estimador para el
parámetro, la prueba de hipótesis consiste en que, dado que tenemos la información de la muestra, decidir
entre aceptar o rechazar dicha afirmación.

Las técnicas de prueba de hipótesis se encuentran muy relacionadas con los intervalos de confianza pero con
una interpretación un tanto distinta, cuando se construye un intervalo de confianza, lo que se hace es estimar
un intervalo donde se espera (con un cierto nivel de seguridad o confianza) que se encuentre el parámetro de
la población.
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 19

Inferencia estadística
Mientras que, cuando se realiza una prueba de hipótesis, se establecen valores posibles para el parámetro
poblacional, determinando la probabilidad de que se obtengan muestras más diferentes que la que se obtuvo.
Finalmente, si esta probabilidad es inferior a un valor previamente establecido, se rechaza la hipótesis.
Definimos las hipótesis estadísticas, estas son Hipótesis Nula (𝐻0 ) e Hipótesis Alternativa (𝐻1 ), las cuales son
opuestas y complementarias.

Hipótesis nula 𝐻0 Hipótesis alternativa 𝐻1

• Generalmente se plantea como, la • Es aquella hipótesis que se cree es


hipótesis de que no existe diferencia, o verdad, representa una idea nueva o no
sea, que la diferencia es nula entre los clásica respecto del parámetro, también
valores a comparar, y se plantea de tal llamada hipótesis de trabajo. Los datos
forma que especifique un valor exacto del de la muestra pueden mostrar evidencia
parámetro. Es la que contrastamos, a favor. No debería ser aceptada sin una
aquella que se cree que no es verdad. Los gran evidencia a favor.
datos de la muestra, pueden mostrar
evidencia en contra. No debería ser
rechazada sin una gran evidencia en
contra. El rechazo de esta, siempre
conduce a la aceptación de la hipótesis
alternativa.

Tipos de pruebas de hipótesis:

Unilateral Unilateral Bilateral


Hipótesis nula (𝐻0 ): ≤ ≥ =
Hipótesis alternativa (𝐻1 ): > < ≠

Las pruebas unilaterales también son llamadas pruebas de una cola, ya que se desea rechazar en una sola
dirección para los valores del parámetro. Por el contrario, las pruebas bilaterales, son llamadas pruebas de dos
colas, ya que se desea rechazar en ambas direcciones para los valores del parámetro.

La prueba de hipótesis es un procedimiento que conduce a la decisión de rechazar o no la hipótesis nula en


base a la información proporcionada por la muestra, de tal forma que si la información de la muestra no es
sólida con la hipótesis nula, la prueba debe conducir al rechazo. Para realizar una prueba de hipótesis es
necesario determinar ciertos elementos que la componen, como: Estadístico de prueba, la Regla de Decisión y
la Región Crítica.

El estadístico de prueba es un valor calculado a partir de la muestra, el cual se utilizará para contrastar la
hipótesis nula. Interesa que tenga el máximo de información sobre la hipótesis nula planteada ya que, en base
a la información contenida en el valor calculado, se tomará la decisión respecto de la aceptación o rechazo de
la hipótesis nula.
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 20

Inferencia estadística
La Regla de Decisión es una regla basada en la información muestral, que indica cuando se debe rechazar la
hipótesis nula, y por lo tanto, quedarse con la hipótesis alternativa. Para esto se establece una región de
rechazo y otra de aceptación.

La región crítica o región de rechazo de una prueba específica los valores del estadístico de la prueba para los
cuales se rechaza 𝐻0 . Por lo que, será dicha región que nos lleva a rechazar la hipótesis nula cuando el
estadístico de prueba cae en ella.

Para la prueba unilateral de lado derecho, tenemos la siguiente región de rechazo:

Para la prueba unilateral de lado izquierdo, tenemos la siguiente región de rechazo:

Para la prueba bilateral, tenemos la siguiente región de rechazo:


Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 21

Inferencia estadística
Procedimiento o pasos a seguir para plantear una prueba de hipótesis:

Identificación del parámetro poblacional a probar.

Formulación de las hipótesis:


- Hipótesis Nula.
- Hipótesis Alternativa.

Fijar el nivel de significación (𝛼), al cuál se desea trabajar.

Calcular el estadístico de prueba de acuerdo a l parámetro que se está probando.

Establecer las regiones que define la evidencia en contra de 𝐻0 que se encuentra en la muestra.

Concluir sobre aceptar o no aceptar la hipótesis nula.

5.1 Prueba de hipótesis para la media, con varianza conocida


Sea una muestra aleatoria de tamaño n, proveniente de una población que se distribuye normal con media 𝜇
desconocida, y varianza poblacional 𝜎 2 conocida. El interés recae en probar uno de los siguientes conjuntos
de hipótesis.

Unilateral Unilateral Bilateral


Hipótesis nula (𝐻0 ): 𝜇 ≤ 𝜇0 𝜇 ≥ 𝜇0 𝜇 = 𝜇0
Hipótesis alternativa (𝐻1 ): 𝜇 > 𝜇0 𝜇 < 𝜇0 𝜇 ≠ 𝜇0
Región crítica (𝑅𝐶): {𝑍|𝑍 > 𝑍1−𝛼 } {𝑍|𝑍 < 𝑍𝛼 } {𝑍|𝑍 > 𝑍1−𝛼 ó 𝑍 < 𝑍𝛼 }
2 2

El estadístico de prueba es:

FÓRMULAS

𝑥̅ − 𝜇0
𝑍= 𝜎 ~ 𝑁(0, 1)
√𝑛
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 22

Inferencia estadística
EJEMPLO 9

En una investigación del peso de cierto producto luego de varios reclamos, el producto tiene un peso neto
de 300 gr según el frasco y sigue una distribución normal. Se seleccionó una muestra de 36 productos que
presentaron un promedio de 297 gr y una desviación estándar de 7,5 gr. Obtenga región crítica y concluya
la prueba de hipótesis correspondiente, con un nivel de confianza del 95%.

Solución:
1. El parámetro de interés es la media del peso de cierto producto.
2. Las hipótesis son:
𝐻0 : 𝜇 = 300 𝑔𝑟.
𝐻1 : 𝜇 ≠ 300 𝑔𝑟.

3. El nivel de significación es de 𝛼 = 0,05.


4. El estadístico de prueba resulta:

𝑥̅ − 𝜇0 297 − 300 −3
𝑍= 𝜎 = = = −2,4
7,5 1,25
√𝑛 √36

5. La región de rechazo es 𝑅. 𝐶. = 𝑍 𝑍 < 𝑍𝛼 = {𝑍|𝑍 < −1,96}


2

6. Por último como la región de rechazo son los valores menores a -1,96 y el valor del estadístico
de prueba resultó ser -2,4, este cae en la región de rechazo, por ende, se rechaza hipótesis nula que la
media sea igual a 300, hay evidencia significativa en la muestra para rechazar Hipótesis nula. Finalmente
podemos concluir que la media del peso neto de cierto producto es distinta de 300 gr

5.2 Prueba de hipótesis para la media con varianza desconocida y


muestra pequeña
Sea una muestra aleatoria de tamaño n, proveniente de una población que se distribuye normal con media 𝜇
desconocida, y varianza poblacional 𝜎 2 desconocida. El interés recae en probar uno de los siguientes conjuntos
de hipótesis.

Unilateral Unilateral Bilateral


Hipótesis nula (𝐻0 ): 𝜇 ≤ 𝜇0 𝜇 ≥ 𝜇0 𝜇 = 𝜇0
Hipótesis alternativa (𝐻1 ): 𝜇 > 𝜇0 𝜇 < 𝜇0 𝜇 ≠ 𝜇0
Región crítica (𝑅𝐶): {𝑇|𝑇 > 𝑇1−𝛼 } {𝑇|𝑇 < 𝑇𝛼 } {𝑇|𝑇 > 𝑇1−𝛼 ó 𝑇 < 𝑍𝛼 }
2 2
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 23

Inferencia estadística
El estadístico de prueba es:

FÓRMULAS

𝑥̅ − 𝜇0
𝑇= ~ 𝑡𝑛−1
𝑆
√𝑛

EJERCITEMOS

Ejercicio 5: El precio del kilo de pan sigue una distribución normal y de una muestra aleatoria de tamaño
15, se obtiene que el promedio del kilo de pan es de $1.120.- y una desviación estándar de $11,5.- ¿Hay
evidencia en la muestra para afirmar, con un nivel de significancia de 0,05, que el precio medio del pan es
superior a $1.100?

5.3 Prueba de hipótesis para la diferencia de medias: 𝝁𝟏 − 𝝁𝟐


a. Caso 1: Varianzas conocidas

Sean dos muestras aleatorias independientes provenientes de poblaciones distribuidas normales con medias
𝜇1 𝑦 𝜇2 y varianzas 𝜎12 𝑦 𝜎22 respectivamente, donde las varianzas poblacionales son conocidas. Si se extrae
una muestra aleatoria de cada población, es posible realizar una prueba de hipótesis a objeto de determinar si
la diferencia de medias 𝜇1 − 𝜇2 , están diferenciadas o no:

Unilateral Unilateral Bilateral


Hipótesis nula (𝐻0 ): 𝜇1 − 𝜇2 ≤ 𝑑0 𝜇1 − 𝜇2 ≥ 𝑑0 𝜇1 − 𝜇2 = 𝑑0
Hipótesis alternativa (𝐻1 ): 𝜇1 − 𝜇2 > 𝑑0 𝜇1 − 𝜇2 < 𝑑0 𝜇1 − 𝜇2 ≠ 𝑑0
Región crítica (𝑅𝐶): {𝑍|𝑍 > 𝑍1−𝛼 } {𝑍|𝑍 < 𝑍𝛼 } {𝑍|𝑍 > 𝑍1−𝛼 ó 𝑍 < 𝑍𝛼 }
2 2

El estadístico de prueba es:

FÓRMULAS

(𝑥̅1 − 𝑥̅2 ) − (𝜇1 − 𝜇2 )


𝑍= ~ 𝑁(0, 1)
𝜎12 𝜎22
𝑛1 + 𝑛2
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 24

Inferencia estadística
b. Caso 2: Varianzas desconocidas pero iguales
Sean dos muestras aleatorias independientes provenientes de poblaciones distribuidas normales con medias
𝜇1 𝑦 𝜇2 y varianzas 𝜎12 𝑦 𝜎22 respectivamente, donde las varianzas poblacionales son desconocidas y
distintas. Si se extrae una muestra aleatoria de cada población, es posible realizar una prueba de hipótesis a
objeto de determinar si la diferencia de medias 𝜇1 − 𝜇2 , están diferenciadas o no:

Unilateral Unilateral Bilateral


Hipótesis nula (𝐻0 ): 𝜇1 − 𝜇2 ≤ 𝑑0 𝜇1 − 𝜇2 ≥ 𝑑0 𝜇1 − 𝜇2 = 𝑑0
Hipótesis alternativa (𝐻1 ): 𝜇1 − 𝜇2 > 𝑑0 𝜇1 − 𝜇2 < 𝑑0 𝜇1 − 𝜇2 ≠ 𝑑0
Región crítica (𝑅𝐶): {𝑇|𝑇 > 𝑇1−𝛼 } {𝑇|𝑇 < 𝑇𝛼 } {𝑇|𝑇 > 𝑇1−𝛼 ó 𝑇 < 𝑇𝛼 }
2 2

El estadístico de prueba es:

FÓRMULAS

(𝑥̅1 − 𝑥̅2 ) − (𝜇1 − 𝜇2 )


𝑇= ~ 𝑡𝑛−1
1 1
𝑆𝑝 𝑛1 + 𝑛2

Donde además:

FÓRMULAS

(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22


𝑆𝑝2 =
𝑛1 + 𝑛2 − 2

c. Caso 3: Varianzas desconocidas pero distintas


Sean dos muestras aleatorias independientes provenientes de poblaciones distribuidas normales con medias
𝜇1 𝑦 𝜇2 y varianzas 𝜎12 𝑦 𝜎22 respectivamente, donde las varianzas poblacionales son desconocidas y
distintas. Si se extrae una muestra aleatoria de cada población, es posible realizar una prueba de hipótesis a
objeto de determinar si la diferencia de medias 𝜇1 − 𝜇2 , están diferenciadas o no:

Unilateral Unilateral Bilateral


Hipótesis nula (𝐻0 ): 𝜇1 − 𝜇2 ≤ 𝑑0 𝜇1 − 𝜇2 ≥ 𝑑0 𝜇1 − 𝜇2 = 𝑑0
Hipótesis alternativa (𝐻1 ): 𝜇1 − 𝜇2 > 𝑑0 𝜇1 − 𝜇2 < 𝑑0 𝜇1 − 𝜇2 ≠ 𝑑0
Región crítica (𝑅𝐶): {𝑇|𝑇 > 𝑇1−𝛼 } {𝑇|𝑇 < 𝑇𝛼 } {𝑇|𝑇 > 𝑇1−𝛼 ó 𝑇 < 𝑇𝛼 }
2 2
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 25

Inferencia estadística
El estadístico de prueba es:

FÓRMULAS

(𝑥̅1 − 𝑥̅2 ) − (𝜇1 − 𝜇2 )


𝑇= ~ 𝑡𝑛−1
𝑆12 𝑆22
𝑛1 + 𝑛2

Donde la distribución t-student no se ajuste bien, por lo que requiere una corrección de los grados de libertad.

FÓRMULAS

2
𝑠12 𝑠22
+
𝑛1 𝑛2
𝑔𝑙 = 2 2
𝑠12 𝑠22
𝑛1 𝑛2
𝑛1 − 1 + 𝑛2 − 1

5.4 Prueba de hipótesis para la proporción poblacional, muestras


grandes
Si p es la proporción de una muestra aleatoria de tamaño n (debe ser grande), proveniente de una población
que se distribuye binomial. El interés recae en probar uno de los siguientes conjuntos de hipótesis

Unilateral Unilateral Bilateral


Hipótesis nula (𝐻0 ): 𝑝 ≤ 𝑝0 𝑝 ≥ 𝑝0 𝑝 = 𝑝0
Hipótesis alternativa (𝐻1 ): 𝑝 > 𝑝0 𝑝 < 𝑝0 𝑝 ≠ 𝑝0
Región crítica (𝑅𝐶): {𝑍|𝑍 > 𝑍1−𝛼 } {𝑍|𝑍 < 𝑍𝛼 } {𝑍|𝑍 > 𝑍1−𝛼 ó 𝑍 < 𝑍𝛼 }
2 2

El estadístico de prueba es:

FÓRMULAS

𝑝 − 𝑝0
𝑍= ~ 𝑁(0, 1)
𝑝0 (1 − 𝑝0 )
𝑛
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 26

Inferencia estadística
5.5 Prueba de hipótesis para la diferencia de proporciones: 𝑷𝟏 − 𝑷𝟐
Si p es la proporción de una muestra aleatoria de tamaño n (debe ser grande), proveniente de una población
que se distribuye binomial. El interés recae en probar uno de los siguientes conjuntos de hipótesis

Unilateral Unilateral Bilateral


Hipótesis nula (𝐻0 ): 𝑝1 − 𝑝2 ≤ 𝑑0 𝑝1 − 𝑝2 ≥ 𝑑0 𝑝1 − 𝑝2 = 𝑑0
Hipótesis alternativa (𝐻1 ): 𝑝1 − 𝑝2 > 𝑑0 𝑝1 − 𝑝2 < 𝑑0 𝑝1 − 𝑝2 ≠ 𝑑0
Región crítica (𝑅𝐶): {𝑍|𝑍 > 𝑍1−𝛼 } {𝑍|𝑍 < 𝑍𝛼 } {𝑍|𝑍 > 𝑍1−𝛼 ó 𝑍 < 𝑍𝛼 }
2 2

El estadístico de prueba es:

FÓRMULAS

𝑝1 − 𝑝2
𝑍= ~ 𝑁(0, 1)
𝑝1 (1 − 𝑝1 ) 𝑝2 (1 − 𝑝2 )
𝑛1 + 𝑛2

EJERCITEMOS

Ejercicio 6: En un estudio de los hábitos de fumador para personas zurdas y derechas, una muestra aleatoria de 400
zurdos reveló que 190 de éstos fuman, y en una muestra aleatoria de 800 diestros, 300 de estos no fuman. Con base
a esta evidencia, ¿podría decidir si la proporción de personas zurdas y diestras que fuman es la misma?
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES Pág. 27

Inferencia estadística
Cierre
Finalizamos la asignatura con inferencia estadística, las herramientas para poder decidir y tomar decisión
frente a problemáticas reales. El uso de intervalos de confianza es muy amplio, en muchas áreas de la ciencia,
son muy útiles ya que permite encontrar un rango en el cual podrá estar o moverse una verdadera proporción
de alguna característica de interés de la población, o de alguna media en base a la variable continua.

Por otra parte, el uso de pruebas de hipótesis nos otorga conocimientos, capacidades y poder de decisión
frente a alguna percepción, opinión u otra cualidad que pueda analizarse como probabilidad.

APORTE A TU FORMACIÓN

A estudios o investigaciones futuras, observarán que requieren tomar un tamaño de muestra, el cual debe ser óptimo
para asegurar la credibilidad de la información. Este tamaño muestral viene de la mano con intervalos de confianza.

En encuestas o investigaciones, darán cuenta de la necesidad de la estadística en muchos aspectos, además


observarán que los intereses ´puedes ser respondidos principalmente con categorías o percepciones.
Área: SOCIAL M4
Curso: ESTADÍSTICA PARA LAS CIENCIAS SOCIALES

Inferencia estadística
Bibliografía

Obligatoria
Naiman , Arnold, Rosenfeld, Robert, and Zirkel, Gene. Introducción a la estadística. México, D.F., MX: McGraw-
Hill Interamericana, 1987. ProQuest ebrary. Web. 19 December 2017. Pp. 179 -232.

Alvarado Verdín, Víctor Manuel. Probabilidad y estadística: Serie Universitaria Patria. México, D.F., MX: Grupo
Editorial Patria, 2014. ProQuest ebrary. Web. 19 December 2017. Pp. 71 -96.

También podría gustarte