Está en la página 1de 25

Instituto Tecnológico de Nuevo León

Estadística Inferencial 1
Equipo 2
Temas:
1.4.4 Distribución muestral de la diferencia de
proporciones
1.4.5 Distribución T-Student
1.4.4 Distribución muestral de la
diferencia de proporciones

Muchas aplicaciones involucran poblaciones de datos


cualitativos que deben compararse utilizando
proporciones o porcentajes.
Ejemplos
Educación.- ¿Es mayor la proporción de los estudiantes que
aprueban matemáticas que las de los que aprueban inglés? ·

Medicina.- ¿Es menor el porcentaje de los usuarios del


medicamento A que presentan una reacción adversa que el de los
usuarios del fármaco B que también presentan una reacción de
ese tipo? ·

Administración.- ¿Hay diferencia entre los porcentajes de


hombres y mujeres en posiciones gerenciales? ·

Ingeniería.- ¿Existe diferencia entre la proporción de artículos


defectuosos que genera la máquina A a los que genera la
máquina B?
Cuando el muestreo procede de dos poblaciones binomiales y se
trabaja con dos proporciones muestrales, la distribución muestral
de diferencia de proporciones es aproximadamente normal para
tamaños de muestra grande (n1p1³5, n1q1³5, n2p2³5 y n2q2³5).
Entonces p1 y p2 tienen distribuciones muestrales
aproximadamente normales, así que su diferencia p1-p2 también
tiene una distribución muestral aproximadamente normal.
Distribución a la diferencia de dos
proporciones muestrales

Este método se utiliza para comparar las proporciones


o porcentajes de dos distribuciones muestrales
distintas y formular una inferencia con respecto a la
diferencia de estas.
Ejercicios
Ejercicio 1
Los asesores de un candidato presidencial opinan que la
proporción de ciudadanos a favor de su líder es de 52.5% en
Lima Metropolitana y 50% en provincias. Si se seleccionan
muestras aleatorias de 400 y 250 en LM y provincias,
respectivamente, ¿cuál es la probabilidad de que la
proporción muestral de LM supere a la proporción muestral
de provincias en más del 5%?.
Solución
π1: Proporción de ciudadanos a favor de su líder en LM
π2: Proporción de ciudadanos a favor de su líder en Provincias.
p1: Proporción de ciudadanos en la muestra a favor de su líder
en LM
p2: Proporción de ciudadanos en la muestra a favor de su líder
en Provincias.
Según el problema:
Π1 = 0.525; Π2 = 0.50; n1 = 400 y n2 = 250
Se pide que encontremos P(p1 - p1 > 0.05)
Para resolver por normal, necesitamos encontrar su media y su
varianza.
μ(p1 - p2) = 0.025 y σ2((1 - p2) = 0.040292
Luego
P(p1 - p2 > 0.05) = 1-Distr.Norm(0.05,0.025,0.02029,1)= 1 -
0.732536 = 0.267464
Ejercicio 2
Se cree que, de cada 100 baterías producidas por
SOURCE, 10 son defectuosas y de cada 100 baterías
fabricadas por FUENTE, 5 son defectuosas. Si se
toma muestras al azar de 250 baterías tomadas de la
producción de SOURCE y otra de 300 unidades de las
fabricadas por FUENTE, ¿cuál es la probabilidad de
observar una diferencia menor o igual a 0.02 en las
proporciones muestrales de baterías defectuosas?
Solución
Si definimos a π1: Proporción de baterías SOURCE
defectuosas, entonces π1 = 0.10
Y si π2: Proporción de baterías FUENTE
defectuosas, entonces π2 = 0.05.
Debemos encontrar P( | p1 - p2 | ≤ 0.02) P( | p1 - p2 |
≤ 0.02) = P( 0.02 ≤ p1 - p1 ≤ 0.02)
Ahora sólo falta encontrar la media y varianza de
p1 - p2 .
Realizando los cálculos: μ(p1 - p1 ) = 0.05 y σ2(p1 - p1 ) =
0.02766942
Con lo cual
P( 0.02 ≤ p1 - p2 ≤ 0.02)
= Distr.Norm(0.02,0.05,0.02277,1) - Distr.Norm(-
0.02,0.05,0.02277) = 0.09278
1.4.5 Distribución T-Student
Historia del desarrollo de esta distribución de
probabilidad
William Sealy Gosset era un matemático y químico
inglés que después de terminar sus estudios comenzó a
trabajar en las destilerías Guinness en lo que se refiere
a control de calidad en el proceso de creación de la
cerveza.
Los bajos tamaños de muestra con los que
habitualmente contaba fueron los “culpables” de sus
estudios, y los que a la postre lo llevaron a
desarrollar la distribución t. En 1908, cuando
contaba con 32 años, publicó el artículo The
probable error of a mean en la revista Biometrika,
pero no con su nombre, sino con el seudónimo
Student.
Es la distribución de probabilidad que surge del problema de
estimar la media de una población normalmente distribuida
cuando el tamaño de la muestra es pequeña. Esta es la base de
la popular t de student para la determinación de las diferencias
entre dos medias muestrales y para la construcción del intervalo
de confianza para la diferencia entre las medias de dos
poblaciones.
La distribución t de Student es una distribución de
probabilidad asociada a la distribución normal. Aparece
cuando se quiere estimar la media de una población
distribuida según una normal cuando el tamaño de la
muestra utilizada para la estimación es pequeño y la
varianza de la población es desconocida.
Condiciones

•Se utiliza en muestras pequeñas de 30 o menos


elementos

•La desviación estándar no se conoce


Características

•La distribución t student es menor en la media y más


alta en los extremos que una distribución normal.

•Tiene mayor parte de su área en los extremos que la


distribución normal.
Grados de Libertad

Existe una distribución t para cada tamaño de la


muestra por lo que "existe una atribución para cada uno
de los grados de libertad".
Los grados de libertad son el numero de valores
elegidos libremente.
Fórmula

Media
poblacional

Media
muestral

Desviación Número de
estándar o datos
típica
Ejercicios
Ejemplos:
El Instituto Eléctrico Edison publica cifras del número
anual de Kilowatt-hora que gastan varios aparatos
eléctrodomésticos. Se afirma que una aspiradora gasta
un promedio de 46 kilowatt-hora al año. Si una muestra
aleatoria de 12 hogares que se incluye en un estudio
planeado indica que las aspiradoras gastan un promedio
de 42 kilowatt-hora al año con una desviación estándar
de11.9 kilowatt-hora, ¿esto sugiere con un nivel de
significancia de 0.05 que las aspiradoras gastan, en
promedio, menos de 46 kilowatt-hora anualmente?
Suponga que la población de kilowatt-hora es normal.
Solución:
1. Datos:
= 46 kilowatt-hora
s= 11.9 kilowatt-hora
= 42 kilowatt-hora
n = 12
= 0.05

2. Ensayo de hipótesis
Ho; = 46 kilowatt-hora
H1; < 46 kilowatt-hora
3. Regla de decisión:
Si tR -1.796 No se rechaza Ho
Si tR < -1.796 Se rechaza Ho

4. Cálculos:
5 Justificación y decisión:
Como –1.16 > -1.796, por lo tanto no se rechaza
Ho y se concluye con un nivel de significancia del
0.05 que el número promedio de kilowwatt-hora que
gastan al año las aspiradoras no es
significativamente menor que 46.
Ejemplo 2

Los pesos en libras de una muestra aleatoria de bebés de


seis meses son: 14.6, 12.5, 15.3, 16.1, 14.4, 12.9, 13.7 y
14.9. Haga una prueba con nivel de 5% de significancia para
determinar si el peso promedio de todos los bebés de seis
meses es distinto a 14 libras, suponga que sus pesos se
distribuyen normalmente y calcule el valor de P.

Solución:
1. Datos:
= 14 libras
s = 1.21 libras
= 14.3 libras
n=8
= 0.05

2. Ensayo de hipótesis
Ho; = 14 libras
H1; 14 libras
3. Regla de Decisión:
Si –2.365 tR 2.365 No se rechaza Ho
Si tR < -2.365 ó si tR > 2.365 Se rechaza Ho

4. Cálculos:
5. Justificación y decisión:
Como –2.365 0.7012 2.365 por lo tanto, no se
rechaza Ho y se concluye con un nivel de
significancia del 0.05 que el peso promedio de
todos los bebés de seis meses es de 14 libras.

También podría gustarte