Documentos de Académico
Documentos de Profesional
Documentos de Cultura
“Pruebas de hipótesis
con dos muestras y varias muestras de datos
numéricos”
medias .......................................................................................... 28
Conclusión ................................................................................... 30
Bibliografía/Referencias .............................................................. 31
2
Introducción
Esta investigación se concentra en la prueba de hipótesis, otro aspecto de la estadística
inferencial que al igual que la estimación del intervalo de confianza, se basa en la información
de la muestra. Se desarrolla una metodología paso a paso que le permita hacer inferencias
sobre un parámetro poblacional mediante el análisis diferencial entre los resultados observados
(estadístico de la muestra)y los resultados de la muestra esperados si la hipótesis subyacente es
realmente cierta. En el problema de estimación se trata de elegir el valor de un parámetro de la
población, mientras que en las pruebas de hipótesis se trata de decidir entre aceptar o rechazar
un valor especificado (por ejemplo, si el nivel de centra miento de un proceso es o no lo
es).Prueba de hipótesis: Estadísticamente una prueba de hipótesis es cualquier afirmación
acerca de una población y/o sus parámetros.
Una prueba de hipótesis consiste en contrastar dos hipótesis estadísticas. Tal contraste
involucra la toma de decisión acerca de las hipótesis. La decisión consiste en rechazar o no una
hipótesis en favor de la otra.
Por cada tipo de prueba de hipótesis se puede calcular una prueba estadística apropiada. Esta
prueba estadística mide el acercamiento del calor de la muestra (como un promedio) a la
hipótesis nula. La prueba estadística, sigue una distribución estadística bien conocida (normal,
etc.) o se puede desarrollar una distribución para la prueba estadística particular.
3
4.2 Distribuciones normales y t student
En estadística y probabilidad se llama distribución normal, distribución de Gauss o distribución
gaussiana, a una de las distribuciones de probabilidad de variable continua que con más
frecuencia aparece en fenómenos reales.
De hecho, la estadística es un modelo matemático que sólo permite describir un fenómeno, sin
explicación alguna. Para la explicación causal es preciso el diseño experimental, de ahí que al
uso de la estadística en psicología y sociología sea conocido como método correlacional. La
distribución normal también es importante por su relación con la estimación por mínimos
cuadrados, uno de los métodos de estimación más simples y antiguos.
La distribución normal también aparece en muchas áreas de la propia estadística. Por ejemplo,
la distribución muestral de las medias muéstrales es aproximadamente normal, cuando la
distribución de la población de la cual se extrae la muestra no es normal. Además, la
distribución normal maximiza la entropía entre todas las distribuciones con media y varianza
conocidas, lo cual la convierte en la elección natural de la distribución subyacente a una lista de
datos resumidos en términos de media muestral y varianza. La distribución normal es la más
extendida en estadística y muchos tests estadísticos están basados en una supuesta
"normalidad".
Dónde:
𝑍 𝑡𝑖𝑒𝑛𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙 𝑑𝑒 𝑚𝑒𝑑𝑖𝑎 𝑛𝑢𝑙𝑎 𝑦 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 1
𝑉 𝑡𝑖𝑒𝑛𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑐ℎ𝑖𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑐𝑜𝑛 𝑉 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑
𝑍 𝑦 𝑉 𝑠𝑜𝑛 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠
4
Si 𝜇 es una constane no nula, el cociente es una variable aleatoria que sigue la
distribución t student no central con parámetro de no-centralidad 𝜇.
̅𝟏 − 𝑿
(𝑿 ̅ 𝟐 ) − (𝝁𝟏 − 𝝁𝟐 )
𝒛=
𝝈𝑿𝟏 −𝑿𝟐
Pero como la hipótesis nula plantea que:
𝑯𝒐 : 𝝁 𝟏 − 𝝁 𝟐 = 𝟎
La expresión anterior se convierte en:
𝝈 𝟐 𝟏 𝝈𝟐 𝟐
𝝈𝑿𝟏−𝑿𝟐 =√ +
𝒏𝟏 𝒏𝟐
Sin embargo el caso más común es que no se conozcan las varianzas, entonces se utilizan la de
las muestras para estimarlas, y el procedimiento es exactamente igual.
5
Como se menciona en el párrafo anterior, la única diferencia entre las fórmulas para calcular el
estadístico de prueba y el error estándar de la diferencia entre 2 medias, cuando se utilizan
datos muestrales es que se sustituye 𝑺𝟐 por 𝝈𝟐 y 𝑺𝑿𝟏−𝑺𝟐 por 𝝈𝑿𝟏 −𝑿𝟐 de la siguiente
manera:
̅𝟏 − 𝑿
(𝑿 ̅ 𝟐 ) − (𝝁𝟏 − 𝝁𝟐 )
𝒛=
𝒔𝑿𝟏−𝑿𝟐
𝑺𝟐 𝟏 𝑺𝟐 𝟐
𝑺𝑿𝟏 −𝑿𝟐 =√ +
𝒏𝟏 𝒏𝟐
̅𝟏 − 𝑿
𝑿 ̅𝟐
𝒛=
𝒔𝑿𝟏−𝑿𝟐
Pero ahora, como se supone que las varianzas de las 2 poblaciones son iguales, se combinan las
varianzas muestrales de la siguiente manera:
𝑺𝒄 𝟐 𝑺𝒄 𝟐
𝑺𝒙𝟏−𝒙𝟐 =√ +
𝒏𝟏 𝒏𝟐
6
Cuando no se conocen las varianzas pero se asume que son iguales
̅ 𝟏 −𝑿
(𝑿 ̅ 𝟐 ) − (𝝁𝟏 − 𝝁𝟐 )
𝒕=
𝑺𝒙𝟏−𝒙𝟐
𝑯𝒐: 𝝁𝟏 − 𝝁𝟐 = 𝟎
Al igual que antes, cuando es asumido que las dos varianzas poblacionales son iguales, estas se
combinan, como en la formula anterior:
𝟐 (𝒏𝟏 − 𝟏)𝑺𝟏 𝟐 + (𝒏𝟐 − 𝟏)𝑺𝟐 𝟐
𝑺𝒄 =
𝒏𝟏 + 𝒏𝟐 − 𝟐
𝑺𝒄 𝟐 𝑺𝒄 𝟐
𝑺𝒙𝟏−𝒙𝟐 =√ +
𝒏𝟏 𝒏𝟐
7
Ejercicios
1. Un gerente de producción desea determinar si existe diferencia entre la productividad de los
trabajadores del turno matutino y los del turno vespertino. Para ello, toma una muestra
aleatoria de 30 trabajadores de cada turno y encuentra que produjeron un promedio de 68
artículos por turno, con una desviación estándar de 16, en tanto que los del turno vespertino
produjeron 65.5 artículos en promedio con desviación estándar de 17. ¿Existe diferencia entre la
productividad de los 2 turnos, a un nivel de significación de 0.01
𝑯𝒐: 𝝁𝟏 = 𝝁𝟐
𝑯𝒂: 𝝁𝟏 ≠ 𝝁𝟐
̅𝟏 − 𝑿
(𝑿 ̅ 𝟐 ) − (𝝁𝟏 − 𝝁𝟐 ) 𝟔𝟖 − 𝟔𝟓. 𝟓
𝒛= = = 𝟎. 𝟓𝟖𝟔𝟖
𝒔𝑿𝟏 −𝑿𝟐 𝟒. 𝟐𝟔
Este valor observado del estadístico de prueba está dentro del rango critico de -2.575 a 2.575,
así que no se tienen elementos para rechazar la hipótesis nula, por lo que se concluye que la
producción promedio en los dos turnos es igual.
2. Un departamento de control de calidad desea evaluar dos máquinas que fabrican ciertas
piezas circulares de plástico. Se desea saber si la maquina A la fábrica con un diámetro mayor
que la maquina B. Para ello se toma una muestra de 12 piezas de la maquina A y se encuentra
que su diámetro tiene una media de 1.061 cm con varianza de 0.000442. En tanto que una
muestra aleatoria de 10 piezas de la maquina B arroja una media de 1.038 cm con una varianza
de 0.000228. Si los diámetros de estas piezas se distribuyen de forma normal en las dos
máquinas y se sabe que sus varianzas son iguales, compruebe la hipótesis de que la maquina A
está fabricando piezas de mayor diámetro, con un nivel de significancia de 0.05.
𝑯𝒐: 𝝁𝟏 > 𝝁𝟐
𝑯𝒂: 𝝁𝟏 ≤ 𝝁𝟐
𝑷((𝒕 ≥ 𝟏. 𝟕𝟐𝟒𝟕|𝒈𝒍 = 𝟐𝟎)) = 𝟎. 𝟎𝟓
(𝒏𝟏 − 𝟏)𝑺𝟏 𝟐 + (𝒏𝟐 − 𝟏)𝑺𝟐 𝟐 (𝟏𝟐 − 𝟏)(𝟎. 𝟎𝟎𝟎𝟒𝟒𝟐) + (𝟏𝟎 − 𝟏)(𝟎. 𝟎𝟎𝟎𝟐𝟐𝟖)
𝑺𝒄 𝟐 = =
𝒏𝟏 + 𝒏𝟐 − 𝟐 𝟏𝟐 + 𝟏𝟎 − 𝟐
= 𝟎. 𝟎𝟎𝟎𝟑𝟒𝟕
𝑺𝒄 𝟐 𝑺𝒄 𝟐 𝟎. 𝟎𝟎𝟎𝟑𝟒𝟓𝟕 𝟎. 𝟎𝟎𝟎𝟑𝟒𝟕
𝑺𝒙𝟏 −𝒙𝟐 =√ + =√ + = 𝟎. 𝟎𝟎𝟕𝟗𝟔
𝒏𝟏 𝒏𝟐 𝟏𝟐 𝟏𝟎
̅ 𝟏 −𝑿
(𝑿 ̅ 𝟐 ) (𝟏. 𝟎𝟔𝟏 − 𝟏. 𝟎𝟑𝟖)
𝒕= = = 𝟐. 𝟖𝟗
𝑺𝒙𝟏 −𝒙𝟐 𝟎. 𝟎𝟎𝟕𝟗𝟔
8
Así que como el valor calculado de t, 2.89 es mayor que el valor critico determinado según el
nivel de significancia, 1.7247 se rechaza la hipótesis nula para concluir que, efectivamente, la
maquina A está fabricando piezas con mayor diámetro que las producidas por la maquina B.
3. En 2 ciudades en las que existen refinerías se tomó una muestra a cada persona de un grupo
de 35, y se midió el nivel de plomo en la sangre. En la ciudad A s encontró que en promedio el
nivel de plomo es de 74.9 microgramos con una desviación estándar de 8. En la ciudad B, el
promedio es de 78 microgramos con una desviación estándar de 1. ¿Existe diferencia en el nivel
de plomo en la sangre de los habitantes de cada ciudad, a un nivel de significancia de 0.01?
𝑯𝒐: 𝝁𝟏 = 𝝁𝟐
𝑯𝒂: 𝝁𝟏 ≠ 𝝁𝟐
̅𝟏 − 𝑿
(𝑿 ̅ 𝟐 ) − (𝝁𝟏 − 𝝁𝟐 ) 𝟕𝟒. 𝟗 − 𝟕𝟖
𝒛= = = 𝟏. 𝟎𝟐𝟕𝟑
𝒔𝑿𝟏−𝑿𝟐 𝟏. 𝟑𝟔𝟐𝟕
4. Para la fabricación de una pieza específica se emplean dos máquinas. Se toma una muestra
40 piezas elaboradas por ambos aparatos y se encuentra que las piezas que produjo la maquina
A tienen una longitud promedio de 83mm con una desviación estándar de 5mm, mientras que
las de la maquina B una longitud promedio de 82 mm con una desviación estándar de 2mm.
Determine si existe diferencia entre la longitud de las piezas fabricadas por cada máquina, con
un nivel de significancia de 5%.
𝑯𝒐: 𝝁𝟏 ≤ 𝝁𝟐
𝑯𝒂: 𝝁𝟏 > 𝝁𝟐
𝑷((𝒕 ≥ 𝟏. 𝟔𝟖𝟒|𝒈𝒍 = 𝟑𝟗)) = 𝟎. 𝟎𝟓
(𝒏𝟏 − 𝟏)𝑺𝟏 𝟐 + (𝒏𝟐 − 𝟏)𝑺𝟐 𝟐 (𝟒𝟎 − 𝟏)(𝟎. 𝟎𝟎𝟎𝟐𝟓) + (𝟒𝟎 − 𝟏)(𝟎. 𝟎𝟎𝟔𝟕𝟐𝟒)
𝑺𝒄 𝟐 = =
𝒏𝟏 + 𝒏𝟐 − 𝟐 𝟒𝟎 + 𝟒𝟎 − 𝟐
= 𝟎. 𝟎𝟎𝟑𝟑𝟕𝟒𝟓
𝑺𝒄 𝟐 𝑺𝒄 𝟐 𝟎. 𝟎𝟎𝟑𝟑𝟕𝟒𝟓 𝟎. 𝟎𝟎𝟑𝟑𝟕𝟒𝟓
𝑺𝒙𝟏 −𝒙𝟐 =√ + =√ + = 𝟎. 𝟎𝟏𝟐𝟗
𝒏𝟏 𝒏𝟐 𝟒𝟎 𝟒𝟎
9
̅ 𝟏 −𝑿
(𝑿 ̅ 𝟐 ) (𝟎. 𝟎𝟖𝟑 − 𝟎. 𝟎𝟖𝟐)
𝒕= = = 𝟎. 𝟕𝟕𝟓𝟏
𝑺𝒙𝟏 −𝒙𝟐 𝟎. 𝟎𝟏𝟐𝟗
̅ 𝟏 −𝑿
(𝑿 ̅ 𝟐 ) (𝟐𝟕 − 𝟐𝟑)
𝒕= = = 𝟏𝟑. 𝟒𝟒𝟎𝟖
𝑺𝒙𝟏 −𝒙𝟐 𝟎. 𝟐𝟗𝟕𝟔
El valor calculado de Z cae dentro de la región de rechazo por lo que se rechaza la hipótesis nula
y se concluye que existe una diferencia entre el promedio de veces que los alumnos de
administración han consultado algún libro en la biblioteca y el promedio de los alumnos de
contaduría.
6. Para probar la velocidad de combustión de 2 tipos de aceite automotriz se tomó una muestra
de 50 botellas de dos marcas distintas. En la marca A se encontró que el tiempo promedio de
combustión es de 47.5 seg con una desviación estándar de 3.2 seg y la marca B el tiempo
promedio es de 49.4 seg con una desviación estándar de 3.7 seg. Compruebe si existe diferencia
entre el tiempo de combustión de las dos marcas de aceite con un nivel de significancia de 0.01.
𝑯𝒐: 𝝁𝟏 = 𝝁𝟐
𝑯𝒂: 𝝁𝟏 ≠ 𝝁𝟐
̅𝟏 − 𝑿
(𝑿 ̅ 𝟐 ) − (𝝁𝟏 − 𝝁𝟐 ) 𝟒𝟕. 𝟓 − 𝟒𝟗. 𝟒
𝒛= = = −𝟑. 𝟎𝟎𝟕𝟐
𝒔𝑿𝟏−𝑿𝟐 𝟎. 𝟔𝟑𝟏𝟖
10
7. Una compañía telefónica brinda dos tipos de servicios, plan y prepago, y desea saber si existe
diferencia entre el número de minutos utilizados mensualmente en cada servicio. En el caso de
los usuarios del servicio de plan se tomó una muestra de 36 personas y se encontró que en
promedio de minutos fue de 237 con una desviación estándar de 8.7. De los usuarios de prepago
se tomó una muestra de 41 y en promedio fue de 248 con una desviación estándar de 10.4.
Compruebe la hipótesis con un nivel de significancia de 0.01.
Se desea probar si el salario medio mensual de los empleados oficinistas de 2 empresas del
ramo de servicios turísticos son iguales o no, con un nivel de significancia de 1%. Para ello, se
toman muestras de ambas y los datos correspondientes se resumen en el siguiente cuadro:
Muestra Muestra
empresa 1 empresa 2
Tamaño n 𝑛1 = 50 𝑛2 = 60
Media 𝑋̅1 =6000 𝑋̅2 =5850
2Desv. Estándar 𝑆1 =300 𝑆2 =214
𝑯𝒐: 𝝁𝟏 = 𝝁𝟐
𝑯𝒂: 𝝁𝟏 ≠ 𝝁𝟐
̅𝟏 − 𝑿
(𝑿 ̅ 𝟐 ) − (𝝁𝟏 − 𝝁𝟐 ) 𝟔𝟎𝟎𝟎 − 𝟓𝟖𝟓𝟎
𝒛= = = 𝟐. 𝟒𝟒𝟐𝟑
𝒔𝑿𝟏−𝑿𝟐 𝟔𝟏. 𝟒𝟏𝟕𝟓
8. En una muestra aleatoria de n1=10 focos el promedio de vida de los focos es 𝑿 ̅ 𝟏 =4000 horas,
con una desviación de S1=200 horas. Para otra marca de focos de cuya vida útil también se
presume que sigue una distribución normal, una muestra aleatoria de n2= 8 focos tiene una
media muestral de 𝑿 ̅ 𝟐 =4300 horas y una desviación estándar muestral de S2 = 250, pruebe la
hipótesis de que no existe ninguna diferencia entre el ciclo medio de vida útil de las 2 marcas de
focos con un nivel de significancia del 1%
𝑯𝒐: 𝝁𝟏 = 𝝁𝟐
𝑯𝒂: 𝝁𝟏 ≠ 𝝁𝟐
𝑷((𝒕 ≥ 𝟐. 𝟓𝟕𝟓|𝒈𝒍 = 𝟒𝟏)) = 𝟎. 𝟎1
11
(𝒏𝟏 − 𝟏)𝑺𝟏 𝟐 + (𝒏𝟐 − 𝟏)𝑺𝟐 𝟐 (𝟏𝟎 − 𝟏)(𝟐𝟎𝟎𝟐 ) + (𝟖 − 𝟏)(𝟐𝟓𝟎𝟐 )
𝑺𝒄 𝟐 = = = 𝟒𝟗𝟖𝟒𝟑. 𝟕𝟓
𝒏𝟏 + 𝒏𝟐 − 𝟐 𝟏𝟎 + 𝟖 − 𝟐
𝑺𝒄 𝟐 𝑺𝒄 𝟐 𝟒𝟗𝟖𝟒𝟑. 𝟕𝟓 𝟒𝟗𝟖𝟒𝟑. 𝟕𝟓
𝑺𝒙𝟏 −𝒙𝟐 =√ + =√ + = 𝟏𝟎𝟓. 𝟗𝟎
𝒏𝟏 𝒏𝟐 𝟏𝟎 𝟖
̅ 𝟏 −𝑿
(𝑿 ̅ 𝟐 ) (𝟒𝟎𝟎𝟎 − 𝟒𝟑𝟎𝟎)
𝒕= = = −𝟐. 𝟖𝟑
𝑺𝒙𝟏 −𝒙𝟐 𝟏𝟎𝟓. 𝟗𝟎
Como cae en la zona de aceptación se acepta con un nivel de significancia del 0.01, la hipótesis
nula de que no existe diferencia entre las dos marcas de focos.
9. Un desarrollador considera dos ubicaciones alternativas para un centro comercial regional dado
que el ingreso domestico de la comunidad es una consideración importante en la selección del sitio,
él desea probar la hipótesis nula de que no existe ninguna diferencia entre los montos de ingreso
domestico medio de las dos comunidades. Se supone que la desviación estándar del ingreso
domestico también es igual en las dos comunidades. En una muestra de 𝑛1=30 hogares de la
primera comunidad el ingreso anual promedio es de 𝑥1̅ =45,500 con una desviación estándar
𝑆1=1,800. En una muestra de 𝑛2=40 hogares de la segunda comunidad 𝑥2̅ =44,600 y 𝑆2=2,400.
Pruebe la hipótesis nula al nivel de significancia de 5%.
𝑯𝒐: 𝝁𝟏 = 𝝁𝟐
𝑯𝒂: 𝝁𝟏 ≠ 𝝁𝟐
𝑷((𝒕 ≥ 𝟐. 𝟓𝟕𝟓|𝒈𝒍 = 𝟒𝟏)) = 𝟎. 𝟎1
̅ 𝟏 −𝑿
(𝑿 ̅ 𝟐 ) (𝟒𝟓𝟓𝟎𝟎 − 𝟒𝟒𝟔𝟎𝟎)
𝒕= = = 𝟏. 𝟓𝟑𝟒𝟐
𝑺𝒙𝟏 −𝒙𝟐 𝟓𝟖𝟔. 𝟔𝟏𝟓𝟒
10. Una muestra aleatoria de 𝑛1=12 estudiantes de Contaduría tiene un promedio de calificación
media de 2.70 (donde A=4) con una desviación estándar de .40 en el caso de los estudiantes de
ingeniería en sistemas una muestra aleatoria de n2 = 10 estudiantes tiene un promedio de
calificación media de 2.90 con una desviación estándar de .30 se supone que los valores de
calificación sigue una distribución normal ,pruebe la hipótesis nula de que el promedio de
calificación de las 2 categorías de estimación no es diferente con un nivel de significancia de 5%
𝑯𝒐: 𝝁𝟏 = 𝝁𝟐
12
𝑯𝒂: 𝝁𝟏 ≠ 𝝁𝟐
𝑷((𝒕 ≥ 𝟐. 𝟗𝟐𝟏|𝒈𝒍 = 𝟒𝟏)) = 𝟎. 𝟎5
(𝒏𝟏 − 𝟏)𝑺𝟏 𝟐 + (𝒏𝟐 − 𝟏)𝑺𝟐 𝟐 (𝟏𝟐 − 𝟏)(. 𝟒𝟎𝟐 ) + (𝟏𝟎 − 𝟏)(. 𝟑𝟎𝟐 )
𝑺𝒄 𝟐 = = = 𝟎. 𝟏𝟐𝟖𝟓
𝒏𝟏 + 𝒏𝟐 − 𝟐 𝟏𝟐 + 𝟏𝟎 − 𝟐
𝑺𝒄 𝟐 𝑺𝒄 𝟐 𝟎. 𝟏𝟐𝟖𝟓 𝟎. 𝟏𝟐𝟖𝟓
𝑺𝒙𝟏 −𝒙𝟐 =√ + =√ + = 𝟎. 𝟏𝟓𝟑𝟒
𝒏𝟏 𝒏𝟐 𝟏𝟐 𝟏𝟎
̅ 𝟏 −𝑿
(𝑿 ̅ 𝟐 ) (𝟒𝟓𝟓𝟎𝟎 − 𝟒𝟒𝟔𝟎𝟎)
𝒕= = = 𝟓𝟖𝟔𝟕. 𝟎𝟏
𝑺𝒙𝟏 −𝒙𝟐 𝟎. 𝟏𝟓𝟑𝟒
11. El salario medio diario de una muestra de n1=30 empleados de una gran empresa
manufacturera es 𝑋1=280, por una distribución estándar de 14 pesos. En otra gran empresa
una muestra aleatoria n2=40 empleados tiene un salario medio de 𝑋2 =270 pesos, con una
desviación estándar de 10 pesos. Pruebe la hipótesis de que no existe diferencia entre los
montos salariales semanales medio de las dos empresas con un nivel de significancia del 5%.
𝑯𝒐: 𝝁𝟏 = 𝝁𝟐
𝑯𝒂: 𝝁𝟏 ≠ 𝝁𝟐
𝑷((𝒕 ≥ 𝟐. 𝟗𝟐𝟏|𝒈𝒍 = 𝟒𝟏)) = 𝟎. 𝟎5
̅ 𝟏 −𝑿
(𝑿 ̅ 𝟐 ) (𝟐𝟖𝟎 − 𝟐𝟕𝟎)
𝒕= = = 𝟑. 𝟒𝟖𝟕𝟔
𝑺𝒙𝟏 −𝒙𝟐 𝟐. 𝟖𝟔𝟕𝟑
12. La altura promedio de 50 palmas que tomaron parte de un ensayo es de 78 cm. con una
desviación estándar de 2.5 cm.; mientras que otras 50 palmas que no forman parte tienen media y
desviación estándar igual a 77.3 y desviación estándar poblacional de2.8 cm. Se desea probar la
hipótesis de que las palmas que participan en el ensayo son más altas que las otras. Con un nivel de
significancia del 0.05
𝑯𝒐: 𝝁𝟏 = 𝝁𝟐
𝑯𝒂: 𝝁𝟏 ≠ 𝝁𝟐
𝑷((𝒕 ≥ 𝟐. 𝟗𝟐𝟏|𝒈𝒍 = 𝟒𝟏)) = 𝟎. 𝟎5
13
(𝒏𝟏 − 𝟏)𝑺𝟏 𝟐 + (𝒏𝟐 − 𝟏)𝑺𝟐 𝟐 (𝟓𝟎 − 𝟏)(𝟐. 𝟓𝟐 ) + (𝟓𝟎 − 𝟏)(𝟐. 𝟖𝟐 )
𝑺𝒄 𝟐 = = = 𝟕. 𝟎𝟒𝟓
𝒏𝟏 + 𝒏𝟐 − 𝟐 𝟓𝟎 + 𝟓𝟎 − 𝟐
𝑺𝒄 𝟐 𝑺𝒄 𝟐 𝟕. 𝟎𝟒𝟓 𝟕. 𝟎𝟒𝟓
𝑺𝒙𝟏 −𝒙𝟐 =√ + =√ + = 𝟎. 𝟓𝟑𝟎𝟖
𝒏𝟏 𝒏𝟐 𝟓𝟎 𝟓𝟎
̅ 𝟏 −𝑿
(𝑿 ̅ 𝟐 ) (𝟕𝟖 − 𝟕𝟕. 𝟑)
𝒕= = = 𝟏. 𝟑𝟏𝟖𝟕
𝑺𝒙𝟏 −𝒙𝟐 𝟎. 𝟓𝟑𝟎𝟖
13. Para una muestra aleatoria de n1=10 lámparas de gas, se encuentra que la vida promedio es
x1=6000 horas con s1=200. Para otra marca de lámparas, para los cuales se supone también que
tiene una vida útil con distribución normal, una muestra aleatoria de n2=15 lámparas de gas tiene
una media muestral de x2 =5600 horas y una desviación estándar muestral de s2=250. Pruebe la
hipótesis de que no existe diferencia entre la vida útil promedio de las dos marcas de lámparas de
gas, utilizando un nivel de significancia del 1%
𝑯𝒐: 𝝁𝟏 = 𝝁𝟐
𝑯𝒂: 𝝁𝟏 ≠ 𝝁𝟐
𝑷((𝒕 ≥ 𝟐. 𝟒𝟕𝟓|𝒈𝒍 = 𝟒𝟏)) = 𝟎. 𝟎5
̅ 𝟏 −𝑿
(𝑿 ̅ 𝟐 ) (𝟔𝟎𝟎𝟎 − 𝟓𝟔𝟎𝟎)
𝒕= = = 𝟒. 𝟐𝟐𝟖𝟑
𝑺𝒙𝟏 −𝒙𝟐 𝟗𝟒. 𝟔𝟎𝟎𝟔
14
4.5 Prueba de Fisher para varianzas y de
igualdad de las varianzas de dos poblaciones
normales
Para probar si existe o no la diferencia entre las varianzas de dos poblaciones puede utilizarse
como estadístico de prueba de F de la distribución de F de Fisher, llamada así en honor del
destacado estadístico Ronald Aylmer Fisher, que se calcula como el cociente de las varianzas de
dos poblaciones:
𝝈𝟐 𝟏
𝑭= 𝟐
𝝈 𝟐
Que sería la expresión teoría de F. Y el valor calculado de F a partir de las varianzas muestrales:
𝑭 𝑺 𝟐
𝒄𝒂𝒍= 𝟏 𝟐
𝑺𝟐
La prueba se lleva a cabo sobre la diferencia hipotética entre dos varianzas poblacionales:
𝑯𝒐 = 𝝈𝟏 𝟐 − 𝝈𝟐 𝟐 = 𝟎; para realizarla se obtienen las varianzas de dos muestras tomadas de
dos poblaciones diferentes. En otras palabras, esta prueba se realiza para las poblaciones
independientes, las que suele identificarse como 1 y 2.
Las dos varianzas muestrales son las que se utilizan como base para hacer inferencias sobre sus
correspondientes parámetros.
Si puede asumirse que las dos varianzas poblacionales son iguales, 𝝈𝟐 𝟏 = 𝝈𝟐 𝟐 , entonces se
utiliza como estadístico de prueba, la distribución F con 𝒏𝟏 − 𝟏 grados de libertad para el
numerador y 𝒏𝟏 − 𝟏 grados de libertad para el denominador; ya que el estadístico de prueba se
calcula con los datos muestrales se construye un cociente.
Tal como puede apreciarse, al tratarse de una distribución asimétrica, la tabla de distribución F
no muestra valores de probabilidad para el lado izquierdo y estos se requieren cuando la
prueba que se está realizando es de dos extremos (≠) o cuando es de un extremo y la región de
rechazo está en el lado izquierdo.
En estos casos para determinar los valores no mostrados, lo que se hace es utilizar el inverso
del valor correspondiente de las talas, invirtiendo el orden de los grados de libertad en
símbolos:
𝑭 𝟏
𝟏−𝒂,𝒈𝒍𝟐, 𝒈𝒍𝟏 =
𝑭𝟏−𝒂,𝒈𝒍𝟐,𝒈𝒍𝟏
Ejercicios
1. Se desea el grado de aprendizaje en matemáticas en 2 escuelas del mismo nivel que utilizan
métodos de enseñanza diferentes. Para aplicar la prueba t para la diferencia entre dos medias,
debe ser posible suponer que ambas poblaciones tienen la misma varianza. Por ello, antes de
realizar la prueba sobre las medias, es conveniente realizar una prueba sobre igualdad de
varianzas de las 2 poblaciones. Al hacer esta prueba, se toma una muestra aleatoria de 21
estudiantes en cada una de las 2 escuelas y se obtienen los siguientes resultados:
Escuela 1 Escuela 2
𝒏𝟏 =21 𝒏𝟏 =21
𝑯𝒐 = 𝝈𝟏 𝟐 − 𝝈𝟐 𝟐 ̅
𝑿 = 𝟕. 𝟗 ̅
𝑿 = 𝟖. 𝟑
=𝟎 𝑆1 = 1.1 𝑆1 = 1.21
𝑯𝒐 = 𝝈𝟏 𝟐 − 𝝈𝟐 𝟐
=𝟎
𝑭 𝑺 𝟐 𝟏.𝟏𝟐
𝒄𝒂𝒍= 𝟏 𝟐 = =𝟎.𝟖𝟑
𝑺𝟐 𝟏.𝟐𝟏𝟐
̅𝟏 − 𝑿
𝑯𝒐: 𝑿 ̅𝟐 = 𝟎
̅ ̅𝟐 ≠ 𝟎
𝑯𝒂: 𝑿𝟏 − 𝑿
16
𝑺𝒄 𝟐 𝑺𝒄 𝟐 𝟏. 𝟒𝟔𝟒𝟏 𝟏. 𝟒𝟔𝟒𝟏
𝑺𝒙𝟏 −𝒙𝟐 =√ + =√ + = 𝟎. 𝟏𝟑𝟗𝟒
𝒏𝟏 𝒏𝟐 𝟐𝟏 𝟐𝟏
̅ 𝟏 −𝑿
(𝑿 ̅ 𝟐 ) (𝟕. 𝟗 − 𝟖. 𝟑)
𝒕= = = −𝟐. 𝟖𝟕
𝑺𝒙𝟏 −𝒙𝟐 𝟎. 𝟏𝟑𝟗𝟒𝟔
𝑷((−𝟐. 𝟎𝟐𝟏 ≤ 𝒕 ≤ 𝟐. 𝟎𝟐𝟏|𝒈𝒍 = 𝟒𝟎)) = 𝟐. 𝟎𝟐𝟏 Se rechaza la hipótesis nula y se concluye que
la diferencia entre las dos medias muestrales es diferente de 0.
𝝈𝟐 𝟏 𝐒𝟏 𝟐 𝟓𝟎
𝑭= 𝟐 = = = 𝟏. 𝟎𝟕𝟑𝟖
𝝈 𝟐 𝐅𝐬𝟐 𝟐 (𝟏. 𝟗𝟒)(𝟐𝟒)
S1 2
Con un nivel de confianza del 90% se sabe que la relación de varianzas esta entre 1.07 y
S2 2
3.93. Esto supondría que la varianza de la población 1 es mayor a la varianza de la población 2
entre 1.07 y 3.93.
𝝈𝟐 𝟏 𝐒𝟏 𝟐 (𝟐. 𝟓𝟏)(𝟒. 𝟕𝟐 )
𝑭= 𝟐 = = = 𝟐. 𝟏𝟑𝟏𝟕
𝝈 𝟐 𝐅𝐬𝟐 𝟐 𝟓. 𝟏𝟐
Estos resultados los podemos interpretar de la siguiente manera:
17
Puesto que este intervalo de confianza incluye a la unidad, no es posible afirmar que las
desviaciones estándar de la rugosidad de la superficie de los dos procesos sean diferentes con
un nivel de confianza del 90%.
Se analizó el caso de una prueba para la diferencia entre 2 medias provenientes de poblaciones
independientes. Aquí se analizará el caso de la diferencia entre 2 medias provenientes de
poblaciones pareadas o relacionadas. Es importante tener presentes las circunstancias de estos
casos:
• Se trata de muestras pareadas.
• Los tamaños de muestras son pequeños.
• La variable se distribuye de forma normal en la población.
En este caso, la prueba se convierte en una prueba sobre la diferencia entre las observaciones,
ya que se calculan las diferencias entre:
1. Dos individuos de la misma especie sometidos a tratamientos diferentes (pareamiento
de individuos según una característica de interés).
2. Dos mediciones hechas a los mismos individuos.
̅ )𝟐
∑𝒏𝒊=𝟏(𝑫𝒊 − 𝑫
𝑺=√
𝒏−𝟏
18
̅
𝑫
𝒕𝒏−𝟏 =
𝑺𝑫
Con n-1 grados de libertad. Nótese que aquí cambian los grados de libertad, al tratarse de
muestras pareadas.
Ejercicios
1. Un fabricante de automóviles recolecta datos sobre millaje de 𝒏=𝟏𝟎 autos de diversas
categorías de peso usando gasolina de calidad estándar con y sin cierto aditivo. Por supuesto,
los motores 94 fueron ajustados a las mismas especificaciones antes de cada corrida, y los
mismos conductores sirvieron para los dos casos de gasolina (aunque no se les hizo saber que
gasolina se usaba en una corrida en particular). Dados los datos de millaje en la tabla,
probamos la hipótesis de que no existe diferencia entre el millaje medio obtenido con y sin el
aditivo, empleando el nivel de significancia del 5%
𝟐𝟕𝟔.𝟖
Promedio con aditivo =
𝟏𝟎
𝟐𝟕. 𝟔𝟖 𝒎𝒑𝒈
𝟐𝟕𝟓.𝟏
Promedio sin aditivo =
𝟏𝟎
𝟐𝟕. 𝟓𝟏 𝒎𝒑𝒈
𝑯𝒐: 𝝁𝒅 = 𝟎
𝑯𝒂: 𝝁𝒅 ≠ 𝟎
𝒕 𝒄𝒓𝒊𝒕𝒊𝒄𝒂(𝒈𝒍 = 𝟗, 𝜶 = 𝟎. 𝟎𝟓)
= 𝟐. 𝟐𝟔𝟐
̅ = 𝜮 𝑫𝒊 =𝟏.𝟕=0.17
𝑫 𝒏 𝟏𝟎
̅ )𝟐
∑𝒏𝒊=𝟏(𝑫𝒊 − 𝑫 𝟏. 𝟑𝟏 − 𝟏𝟎(𝟎. 𝟏𝟕𝟐 )
𝑺=√ =√
𝒏−𝟏 𝟏𝟎 − 𝟏
= 𝟎. 𝟑𝟑𝟔𝟖
̅
𝑫 𝟎. 𝟏𝟕
𝑺𝑫 = = = 𝟎. 𝟎𝟓𝟑𝟕
√𝒏 √𝟏𝟎
̅
𝑫 𝟎.𝟏𝟕
𝒕𝒏−𝟏 = 𝑺 =𝟎.𝟑𝟑𝟔𝟖 = 𝟎. 𝟓𝟎𝟒𝟕
𝑫
19
2. El director de la capacitación de una compañía desea comparar un nuevo método de
capacitación técnica, que supone la combinación de diskettes instructivos de cómputo y
resolución de problemas en el laboratorio con el método tradicional de impartición de clases. Se
asocian así doce pares de aprendices de acuerdo con sus antecedentes y desempeño académico,
en tanto que uno de los miembros de cada par asignado al curso tradicional y el otro al nuevo
método. Al final del curso se determina el nivel de aprendizaje por medio de un examen sobre
información básica y la capacidad de aplicarla. Dado que el director de capacitación desea
conceder el beneficio de la duda ala sistema de instrucción establecido, se formula la hipótesis
nula de que el desempeño medio del sistema establecido es igual o mayor que el nivel medio de
desempeño del nuevo sistema. Pruebe esta hipótesis al nivel de significancia de 5%. Los datos
muéstrales de desempeño se presentan en las tres primeras columnas de la siguiente tabla:
̅ )𝟐
∑𝒏𝒊=𝟏(𝑫𝒊 − 𝑫 𝟗𝟕. 𝟔𝟔𝟏𝟓
𝑺=√ =√ = 𝟐. 𝟗𝟕𝟗𝟔
𝒏−𝟏 𝟏𝟐 − 𝟏
20
̅
𝑫 𝟒. 𝟖𝟑𝟑𝟑
𝑺𝑫 = = = 𝟏. 𝟑𝟗𝟓𝟐
√𝒏 √𝟏𝟐
̅ 𝟒.𝟖𝟑𝟑𝟑
𝑫
𝒕𝒏−𝟏 = 𝑺 = 𝟏.𝟑𝟗𝟓𝟐 = 𝟑. 𝟒𝟔𝟒𝟐
𝑫
̅𝟏 − 𝑿
(𝑿 ̅ 𝟐 ) − (𝝁𝟏 − 𝝁𝟐 )
𝒛=
𝝈𝟏 𝟐 𝝈𝟐 𝟐
√ +
𝒏𝟏 𝒏𝟐
Suponemos que 𝒏𝟏 y 𝒏𝟐 son suficientemente grandes, por lo que se aplica el teorema del
limite central. Por supuesto, si las dos poblaciones son normales, el estadístico anterior tiene
una distribución normal estándar aun para 𝒏𝟏 y 𝒏𝟐 pequeñas. Evidentemente, si podemos
suponer que 𝝈𝟏 = 𝝈𝟐 = 𝝈, el estadístico anterior se reduce a
̅𝟏 − 𝑿
(𝑿 ̅ 𝟐 ) − (𝝁𝟏 − 𝝁𝟐 )
𝒛=
𝟏 𝟏
𝝈√𝒏 + 𝒏
𝟏 𝟐
Los dos estadísticos anteriores sirven como base para el desarrollo de los procedimientos de
prueba que incluyen dos medias. La equivalencia con el intervalo de confianza y facilidad de la
transcicion del caso de pruebas sobre una sola media hacen que esto sea sencillo.
La hipótesis bilateral sobre dos medias se escribe con bastante generalidad como
𝑯𝒐 = 𝝁𝟏 − 𝝁𝟐 = 𝒅𝒐
En efecto, la alternativa puede ser bilateral o unilateral. De nuevo, la distribución que se utiliza
̅𝟏 𝒚 ̅
es la distribución del estadístico de prueba bajo 𝑯𝒐 . Se calculan los valores 𝑿 𝑿𝟐 y para 𝝈𝟏 𝟐 y
𝝈𝟐 𝟐 conocidas, el estadístico de prueba dado por una región critica de dos colas en el caso de la
alternativa bilateral.
21
̅𝟏 − 𝑿
(𝑿 ̅ 𝟐 ) − 𝒅𝒐
𝒛=
𝝈𝟏 𝟐 𝝈𝟐 𝟐
√ +
𝒏𝟏 𝒏𝟐
Ejercicios
1. Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan con
métodos diferentes. El primer grupo realiza largos recorridos a ritmo pausado, el segundo
grupo realiza series cortas de alta intensidad y el tercero trabaja en el gimnasio con pesas y se
ejercita en el pedaleo de alta frecuencia. Después de un mes de entrenamiento se realiza un
test de rendimiento consistente en un recorrido cronometrado de 9 Km. Los tiempos
empleados fueron los siguientes:
A un nivel de confianza del 95% ¿Puede considerarse que los tres métodos producen resultados
equivalentes? O por el contrario ¿Hay algún método superior a los demás?
Solución: Comenzamos calculando los totales y los cuadrados de los totales divididos por el
número de observaciones:
El valor de la F teórica con 2 y 12 grados de libertad, a un nivel de confianza del 95% es 3,89.
Por consiguiente se rechaza la hipótesis nula y se concluye que los tres métodos de
entrenamiento producen diferencias significativas.
2. Una lista de palabras sin sentido se presenta en la pantalla del ordenador con cuatro
procedimientos diferentes, asignados al azar a un grupo de sujetos. Posteriormente se les
realiza una prueba de recuerdo de dichas palabras, obteniéndose los siguientes resultados:
¿Qué conclusiones pueden sacarse acerca de las cuatro formas de presentación, con un nivel de
significación del 5%?
Solución: Comenzamos calculando los totales y los cuadrados de los totales divididos por el
número de observaciones:
23
A partir de estas cantidades básicas calculamos las Sumas de Cuadrados:
SC(total) = 988 – 819,8 = 168,2
SC(intra) = 988 – 902 = 86
SC(entre) = 902 – 819,8 = 82,2
Los cuadrados medios serán:
CM(entre) = 82,2/3 = 27,4
CM(intra) = 86/22 = 3,9
3. Una lista de palabras sin sentido se presenta en la pantalla del ordenador con cuatro
procedimientos diferentes, asignados al azar a un grupo de sujetos. Posteriormente se les
realiza una prueba de recuerdo de dichas palabras, obteniéndose los siguientes resultados:
¿Qué conclusiones pueden sacarse acerca de las cuatro formas de presentación, con un nivel de
significación del 5%?
Solución: Comenzamos calculando los totales y los cuadrados de los totales divididos por el
número de observaciones:
24
A partir de estas cantidades básicas calculamos las Sumas de Cuadrados:
SC(total) = 988 – 819,8 = 168,2
SC(intra) = 988 – 902 = 86
SC(entre) = 902 – 819,8 = 82,2
Los cuadrados medios serán:
c) Qué supuestos debería verificar el investigador, escriba las hipótesis asociadas a ellos.
Respuesta: El investigador antes de comparar las medias, debe verificar los supuestos de
Normalidad y de Homogeneidad de las varianzas (el supuesto de independencia se comprueba
en el diseño, dividió a 8 estudiantes por cada método).
Si ordenamos los promedios vemos que en Curicó se obtiene el promedio más bajo de ozono,
luego está Maule, Talca y Linares. Llama la atención que en Linares se den promedio mayores
que en Talca que es una ciudad mayor.
Segundo, verificamos los supuestos, primero el supuesto de independencia se cumple ya que
los datos son de distintas ciudades, hay independencia; seguimos con el de Normalidad
(usaremos el Test de Kolmogorov-Smirnov):
H0: la distribución de ozono de Curicó NO es normal
H1: la distribución de ozono de Curicó es normal
Estadístico de KS= 0,214, valor-p=0,2 mayor que 0,05 por lo tanto acepto normalidad
H0: la distribución de ozono de Talca NO es normal
H1: la distribución de ozono de Talca es normal
Estadístico de KS= 0,285, valor-p=0,138 mayor que 0,05 por lo tanto acepto normalidad
H0: la distribución de ozono de Linares NO es normal
H1: la distribución de ozono de Linares es normal
Estadístico de KS= 0,102, valor-p=0,2 mayor que 0,05 por lo tanto acepto normalidad
H0: la distribución de ozono de Maule NO es normal
H1: la distribución de ozono de Maule es normal
Estadístico de KS= 0,190, valor-p=0,2 mayor que 0,05 por lo tanto acepto normalidad.
Conclusión general, podemos aceptar el supuesto de Normalidad de estos datos en todas las
ciudades.
Continuamos con el supuesto de homocedasticidad, realizamos el test de Levene para la
hipótesis:
Donde:
1=Curicó, 2=Talca, 3=Linares y 4=Maule
Resultado según tabla:
Estadístico= 1,081, valor-p=0,38, es mayor que 0,05, por lo tanto acepto la hipótesis nula y
podemos concluir que las varianzas son homogéneas. Se cumple el supuesto de
homocedasticidad.
26
En vista que se cumplen todos los supuestos ANOVA, procedemos a comparar las medias de las
mediciones de ozono en las 4 ciudades con el test de ANOVA, la hipótesis es:
H1: 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4
H0: al menos dos medias no son iguales.
Según la tabla el F observado es 9,418 y el valor-p es menor que 0,001, por lo tanto rechazamos
la hipótesis nula, y concluimos que existen diferencias significativas entre los promedios de
ozono en estas ciudades.
Ahora nos interesa saber qué promedios son diferentes. Para eso hacemos test de
comparaciones múltiples de Tukey, que controla la tasa de error tipo I. Mirando la tabla de la
salida de SPSS podemos construir la siguiente tabla con los promedios ordenados de menor a
mayor:
Después de estudiar los datos, podemos llegar a una conclusión global de que Curicó, Maule y
Talca tienen promedios similares de ozono, en cambio Linares aparece con niveles
significativamente superiores (al 5%).
Como F0,05(4,20) =2,87 y 11,24>2,87 rechazamos la hipótesis nula y concluimos que los
resultados de los tratamientos son diferentes.
27
4.8 Selección del tamaño de muestra para
estimar la diferencia de dos medias
Se puede utilizar un procedimiento similar para determinar el tamaño de la muestra 𝒏 = 𝒏𝟏 =
𝒏𝟐 que se requiere para una potencia específica de la prueba en que se comparan dos medias
poblacionales. Por ejemplo, suponga que deseamos probar la hipótesis cuando se conocen
𝝈𝟏 𝟐 y 𝝈𝟐 𝟐
𝑯𝟎 : 𝝁𝟏 − 𝝁𝟐 = 𝒅𝒐,
𝑯𝒂 : 𝝁𝟏 − 𝝁𝟐 ≠ 𝒅𝒐,
̅𝟏 − 𝑿
𝟏 − 𝜷 = 𝑷(|𝑿 ̅ 𝟐 | > 𝜶 𝒄𝒖𝒂𝒏𝒅𝒐 𝝁𝟏 − 𝝁𝟐 = 𝒅𝒐 + 𝜹
Por lo tanto,
𝟐
(𝒛𝜶 + 𝒛𝜷 ) (𝝈𝟏 𝟐 + 𝝈𝟐 𝟐 )
𝟐
𝒏≈
𝜹𝟐
28
Para la prueba de una sola cola, la expresión para el tamaño requerido de la muestra cuando
𝒏 = 𝒏𝟏 = 𝒏𝟐 es
𝟐
(𝒁𝒂 +𝒁𝜷 ) +(𝝈𝟏 𝟐 + 𝝈𝟐 𝟐 )
Elección del tamaño de la muestra: 𝒏 =
𝜹𝟐
Cuando se desconoce la varianza poblacional (o varianzas en la situación de dos muestra), la
elección del tamaño de la muestra no es directa. Al probar la hipótesis 𝝁 = 𝝁𝟎 + 𝜹, el
estadistco
̅ − (𝝁𝟎 + 𝜹)
𝑿
𝑺/√𝒏
no sigue una distribución t, como podría esperarse, sino que más bien sigue la distribución t no
central para determinar el tamaño adecuado de la muestra, si dispone de alguna estimación de
𝝈 o si 𝜹 es un múltiplo de 𝝈.
|𝜹| |𝝁 − 𝝁𝟎 |
∆= =
𝝈 𝝈
1. De una población de 1,176 adolescentes de una ciudad se desea conocer la aceptación por los
programas humorísticos televisivos y para ello se desea tomar una muestra por lo que se
necesita saber la cantidad de adolescentes que deben entrevistar para tener para tener una
información adecuada con error estándar menor de 0.015 al 90% de confiabilidad.
Solución:
Es decir, para realizar una investigación se necesita una muestra de al menos 298 adolescentes.
29
Conclusión
En esta investigación se estudió la metodología básica necesaria al realizar pruebas de hipótesis
para las medias correspondientes a 2 poblaciones y se revisaron las pruebas para la diferencia
entre 2 medias en diversas circunstancias:
Con muestras grandes e independientes, cuando se conocen y cuando no se conocen las
varianzas correspondientes a las 2 poblaciones. Además se explican 2 casos para esta última
circunstancia, cuando no se conocen las varianzas; podemos asumir que son iguales, y no puede
asumirse que lo sean.
Las pruebas para 2 poblaciones con muestras pequeñas e independientes, variables distribuidas
normalmente, cuando no se conocen las varianzas de las correspondientes poblaciones pueden
asumirse que sean iguales, y no puede asegurarse que lo sean.
30
Bibliografía
Díaz Mata, A. (2013). Estadística Aplicada a la Administración y la Economía. México,
D.F: The McGraw Hill.
http://dta.utalca.cl/estadistica/ejercicios/interpretar/Metodos/resuelto%20anova.pdf
http://www.hrc.es/bioest/Anova_4.html
http://www.ugr.es/~jsalinas/weproble/T14res.PDF
31