Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ALUMNO:
MINAYA AGUIRRE, ALEXIS RAUL
LIMA-2017
~1~
ÍNDICE
Contenido
ÍNDICE .............................................................................................................................................................................2
INTRODUCCIÓN ..............................................................................................................................................................3
PARTE I: DISEÑO MUESTRAL ........................................................................................... ¡Error! Marcador no definido.
A. ENCUESTA PILOTO ............................................................................................................................................5
B. ENCUESTA DEFINITIVA Y CÁLCULO DEL TAMAÑO DE MUESTRA ....................... ¡Error! Marcador no definido.
PARTE II: ANÁLISIS ESTADÍSTICO ..................................................................................... ¡Error! Marcador no definido.
1. ESTIMACIÓN Y PRUEBA DE HIPÓTESIS DE LA MEDIA .............................................. ¡Error! Marcador no definido.
1.1 ESTIMACIÓN PUNTUAL .................................................................................... ¡Error! Marcador no definido.
1.2 ESTIMACIÓN POR INTERVALOS DE CONFIANZA ............................................... ¡Error! Marcador no definido.
1.3 PRUEBA DE HIPÓTESIS DE LA MEDIA ............................................................... ¡Error! Marcador no definido.
2. ESTIMACIÓN Y PRUEBA DE HIPÓTESIS DE LA DIFERENCIA DE MEDIAS ................... ¡Error! Marcador no definido.
2.1 ESTIMACIÓN PUNTUAL .................................................................................... ¡Error! Marcador no definido.
2.2 ESTIMACIÓN POR INTERVALOS DE CONFIANZA ............................................... ¡Error! Marcador no definido.
2.3 PRUEBA DE HIPÓTESIS DE LA DIFERENCIA DE MEDIAS .................................... ¡Error! Marcador no definido.
3. ESTIMACIÓN Y PRUEBA DE HIPÓTESIS DE LA PROPORCIÓN ................................... ¡Error! Marcador no definido.
3.1 ESTIMACIÓN PUNTUAL .................................................................................................................................20
3.2 ESTIMACIÓN POR INTERVALOS DE CONFIANZA ............................................... ¡Error! Marcador no definido.
3.3 PUEBA DE HIPÓTESIS PARA LA PROPORCIÓN…………………………………………………………………………………………… 20
6. PRUEBA DE INDEPENDENCIA…………………………………………………………………………………………………………………………… 28
7. PRUEBA DE HOMOGENEIDAD………………………………………………………………………………………………………………………….. 30
8. ANÁLISIS DE VARIANZA……………………………………………………………………………………………………………………………………. 33
~2~
~3~
INTRODUCCIÓN
información recopilada en la facultad de Química e Ingeniería Química. Esta información pudo obtenerse al
aplicar una encuesta a dicha facultad, dando como resultado la elaboración de este trabajo, el cual ha sido
La Parte I, comprende todo lo relacionado con el Diseño Muestral, el cual se llevó a cabo usando la variable
La Parte II se refiere al Análisis Estadístico, el cual se presenta a través del planteamiento de un ejercicio y su
respectiva solución aplicando todos los temas que se desarrollaron durante el curso de Estadística II y
apoyando la resolución de los mismos con los datos obtenidos de la encuesta y presentados en los diversos
anexos.
~4~
PARTE I
DISEÑO MUESTRAL
Contiene:
Encuesta Piloto
Encuesta Definitiva y Cálculo del Tamaño de Muestra
~5~
a) ENCUESTA PILOTO:
De una población de 1172 alumnos matriculados en el Semestre Académico 2017-I, para la encuesta piloto se
ha tomado una muestra de 119 estudiantes, y, al consultarles la pregunta 6 del cuestionario, se recopilaron los
siguientes datos:
~6~
b) ENCUESTA DEFINITIVA Y CÁLCULO DEL TAMAÑO DE MUESTRA:
Siendo la población: N = 1172, procedemos a calcular el Error Absoluto Máximo Permisible (e):
Ahora, para poder estimar un tamaño de muestra adecuado para realizar la encuesta (ni) definitiva,
construimos una matriz con diferentes niveles de confianza y errores relativos:
Nivel de Confianza
Error Relativo
Máximo
Permisible 90% 95% 98%
5% n1 n2 n3
7% n4 n5 n6
10% n7 n8 n9
Y, procedemos a calcular los diferentes ni para encontrar el tamaño de muestra adecuado; siendo:
𝑛0
𝑛≥ 𝑛
1 + 𝑁0
𝑍2𝑆 2
Siendo además: 𝑛0 =
𝑒2
~7~
Para n1 : (error del 5% y confianza al 90%)
Siendo: 𝑒 = 5%𝑥̅ ⇒ 𝑒 = 5%(392.1849) ⇒ 𝒆 = 𝟏𝟗. 𝟔𝟎𝟗
y 𝑺𝟐 = 𝟓𝟗𝟎𝟖𝟏. 𝟔𝟐𝟔𝟓
2 2 2 (59081.6265)
Hallamos 𝑛0 = 𝑍𝑒2𝑆 ⇒ 𝑛0 = (1.64) 2 ⇒ 𝑛0 = 413.2552
(19.609)
𝑛0 413.2552
Y, reemplazando finalmente en: 𝑛1 ≥ 𝑛 ⇒ 𝑛1 ≥ 413.3552
1+ 𝑁0 1+
1172
y 𝑺𝟐 = 𝟓𝟗𝟎𝟖𝟏. 𝟔𝟐𝟔𝟓
2 2 2 (59081.6265)
Hallamos 𝑛0 = 𝑍𝑒2𝑆 ⇒ 𝑛0 = (1.96) 2 ⇒ 𝑛0 = 590.2740
(19.609)
𝑛0 590.2740
Y, reemplazando finalmente en: 𝑛1 ≥ 𝑛 ⇒ 𝑛1 ≥ 590.2740
1+ 𝑁0 1+ 1172
~8~
Para n3 : (error del 5% y confianza al 98%)
Siendo: 𝑒 = 5%𝑥̅ ⇒ 𝑒 = 5%(392.1849) ⇒ 𝒆 = 𝟏𝟗. 𝟔𝟎𝟗
y 𝑺𝟐 = 𝟓𝟗𝟎𝟖𝟏. 𝟔𝟐𝟔𝟓
2 2 2 (59081.6265)
Hallamos 𝑛0 = 𝑍𝑒2𝑆 ⇒ 𝑛0 = (2.33) 2 ⇒ 𝑛0 = 834.1677
(19.609)
𝑛0 834.1677
Y, reemplazando finalmente en: 𝑛3 ≥ 𝑛 ⇒ 𝑛3 ≥ 834.1677
1+ 0 1+ 1172
𝑁
y 𝑺𝟐 = 𝟓𝟗𝟎𝟖𝟏. 𝟔𝟐𝟔𝟓
2 2 2 (59081.6265)
Hallamos 𝑛0 = 𝑍𝑒2𝑆 ⇒ 𝑛0 = (1.64) 2 ⇒ 𝑛0 = 210.8436
(27.453)
𝑛0 210.8436
Y, reemplazando finalmente en: 𝑛4 ≥ 𝑛 ⇒ 𝑛4 ≥ 210.8436
1+ 𝑁0 1+ 1172
~9~
Para n5: (error del 7% y confianza al 95%)
Siendo: 𝑒 = 7%𝑥̅ ⇒ 𝑒 = 7%(392.1849) ⇒ 𝒆 = 𝟐𝟕. 𝟒𝟓𝟑
y 𝑺𝟐 = 𝟓𝟗𝟎𝟖𝟏. 𝟔𝟐𝟔𝟓
2 2 2 (59081.6265)
Hallamos 𝑛0 = 𝑍𝑒2𝑆 ⇒ 𝑛0 = (1.96) 2 ⇒ 𝑛0 = 301.1514
(27.453)
𝑛0 301.1514
Y, reemplazando finalmente en: 𝑛5 ≥ 𝑛 ⇒ 𝑛5 ≥ 301.1514
1+ 𝑁0 1+ 1172
y 𝑺𝟐 = 𝟓𝟗𝟎𝟖𝟏. 𝟔𝟐𝟔𝟓
2 2 2 (59081.6265)
Hallamos 𝑛0 = 𝑍𝑒2𝑆 ⇒ 𝑛0 = (2.33) 2 ⇒ 𝑛0 = 425.5833
(27.453)
𝑛0 425.5833
Y, reemplazando finalmente en: 𝑛6 ≥ 𝑛 ⇒ 𝑛6 ≥ 425.5833
1+ 𝑁0 1+ 1172
~ 10 ~
Para n7: (error del 10% y confianza al 90%)
Siendo: 𝑒 = 10%𝑥̅ ⇒ 𝑒 = 10%(392.1849) ⇒ 𝒆 = 𝟑𝟗. 𝟐𝟏𝟖𝟒𝟗
y 𝑺𝟐 = 𝟓𝟗𝟎𝟖𝟏. 𝟔𝟐𝟔𝟓
2 2 2 (59081.6265)
Hallamos 𝑛0 = 𝑍𝑒2𝑆 ⇒ 𝑛0 = (1.64) 2 ⇒ 𝑛0 = 103.3138
(39.21849)
𝑛0 103.3138
Y, reemplazando finalmente en: 𝑛7 ≥ 𝑛 ⇒ 𝑛7 ≥ 103.3138
1+ 𝑁0 1+
1172
De donde: 𝑛7 ≥ 94.942 ⇒ 𝑛7 ≈ 95
y 𝑺𝟐 = 𝟓𝟗𝟎𝟖𝟏. 𝟔𝟐𝟔𝟓
2 2 2 (59081.6265)
Hallamos 𝑛0 = 𝑍𝑒2𝑆 ⇒ 𝑛0 = (1.96) 2 ⇒ 𝑛0 = 147.5648
(39.21849)
𝑛0 147.5648
Y, reemplazando finalmente en: 𝑛8 ≥ 𝑛 ⇒ 𝑛8 ≥ 147.5648
1+ 0 1+ 1172
𝑁
y 𝑺𝟐 = 𝟓𝟗𝟎𝟖𝟏. 𝟔𝟐𝟔𝟓
2 2 2 (59081.6265)
Hallamos 𝑛0 = 𝑍𝑒2𝑆 ⇒ 𝑛0 = (2.33) 2 ⇒ 𝑛0 = 208.5367
(39.21849)
𝑛0 208.5367
Y, reemplazando finalmente en: 𝑛9 ≥ 𝑛 ⇒ 𝑛9 ≥ 208.5367
1+ 𝑁0 1+ 1172
De donde, ya podemos seleccionar el tamaño de muestra adecuado para poder realizar la Encuesta Definitiva a la
Facultad de Química y el posterior Análisis Estadístico a las diferentes variables recopiladas. Como se puede apreciar,
se seleccionó n =132, aunque, por motivos didácticos, para poder trabajar con un tamaño de muestra que pueda ser
repartido equitativamente entre cada miembro del grupo, tomaremos n= 135.
~ 12 ~
PARTE II
ANÁLISIS ESTADÍSTICO
Casos:
~ 13 ~
a) Estimación y prueba de hipótesis para la media:
Se desea conocer el gasto promedio diario de los estudiantes de la facultad de Química e Ingeniería Química
de la UNMSM. Para ello se realizó una encuesta a 135 alumnos, obteniéndose los siguientes resultados:
b) Siendo el total de alumnos de la facultad de Química e Ingeniería Química 1172, halle los intervalos
de confianza para la media, con un nivel de significancia del 5%.
c) Si de dicha encuesta, un investigador plantea que el gasto diario promedio de los estudiantes es de
13 soles, con un nivel de significancia del 5%, ¿se puede concluir que la afirmación del investigador
es correcta?
~ 14 ~
Solución:
a) Estimación Puntual:
135
𝑥𝑖
𝑋̅ = ∑ = 11,92
135
𝑖=1
135
2
(𝑥𝑖 − 11.92)2
𝑆 =∑ = 34.613
134
𝑖=1
b) Intervalos de confianza:
̅
Formulamos: 𝑷[𝒂 ≤ 𝝁 ≤ 𝒃] = 𝟏 − 𝜶 ; siendo: Parámetro: µ y Estimador: 𝒙
Ahora, formulamos la Función Pivotal: Puesto que “n” es grande y desconocemos la varianza
̅ −𝝁)
(𝑿
poblacional, entonces: 𝒁= 𝝈 ↝ 𝑨𝒑𝒓𝒐𝒙. 𝑵(𝟎, 𝟏)
√𝒏
Y, con esto ya podemos formular nuestros límites de confianza: (Usaremos el Factor de corrección
para la población finita, puesto que conocemos N, y, además n/N > 5% )
c) Prueba de Hipótesis:
Planteamos las hipótesis:
- H0: µ = 13
- H1: µ ≠ 13
Ahora, formulamos la Función Pivotal: Puesto que tenemos una población no normal, con n=135 y 𝑠̂
=𝜎 = 5.883, por el Teorema Central del Límite:
~ 15 ~
̅−𝝁
𝑿
𝒁= 𝝈 ↝ 𝑨𝒑𝒓𝒐𝒙. 𝑵 (𝟎; 𝟏)
√𝒏
Asumiendo que H0 es verdadera, tenemos que: µ =13, además, 𝑠̂ =𝜎 = 5.883. Con estos valores,
procedemos a hallar un Z0:
̅ −𝝁
𝑿 11.92 − 13
𝒁𝟎 = = = −2.27
𝝈 √𝑵 − 𝒏 5.883 √1172 − 135
√𝒏 √𝑵 − 𝟏 √135 √1171
Por lo tanto, podemos concluir que no es correcta la afirmación del investigador, sino más bien se
puede decir que el gasto promedio diario de los estudiantes de la Facultad de Química es menor a
13 soles.
~ 16 ~
b) Estimación y prueba de hipótesis para la diferencia de medias
Un investigador desea comparar las medias de las edades de los estudiantes de 2 facultades, con el objetivo
de conocer cuál de estas posee la población más joven. Para esto, selecciona una muestra aleatoria de 135
alumnos de la Facultad de Química y otra muestra de 181 alumnos de la Facultad de Administración. Los
resultados se muestran a continuación:
~ 17 ~
Solución:
a) Estimación Puntual:
Para el caso de la Facultad de Química:
135
𝑥𝑖
̅𝟏 = ∑
̂𝟏 = 𝒙
𝝁 ; 𝑐𝑜𝑚𝑜 𝑛1 = 135 ⇒ ̅̅̅
𝒙𝟏 = 𝟐𝟏. 𝟔𝟏
𝑛1
𝑖=1
∑135(𝑥𝑖 − ̅̅̅)
𝑥1 2
𝝈𝟏 = 𝒔̂𝟏 = √ 𝑖=1 = 𝟐. 𝟓𝟖 ⇒ 𝒔̂𝟏 𝟐 = 𝟔. 𝟔𝟓𝟔
𝑛1 − 1
∑181(𝑥𝑖 − ̅̅̅)
𝑥2 2
𝝈𝟐 = 𝒔̂𝟐 = √ 𝑖=1 = 𝟐. 𝟏𝟑𝟓 ⇒ 𝒔̂𝟐 𝟐 = 𝟒. 𝟓𝟓𝟕
𝑛2 − 1
b) Intervalos de confianza:
̅𝟏 − 𝒙
Formulamos: 𝑷[𝒂 ≤ 𝝁𝟏 − 𝝁𝟐 ≤ 𝒃] = 𝟏 − 𝜶 ; siendo: Parámetro: 𝝁𝟏 − 𝝁𝟐 y Estimador: 𝒙 ̅𝟐
Ahora, formulamos la Función Pivotal: Dado que las muestras son grandes ( 𝑛1 > 30 𝑦 𝑛2 > 30);
además que desconocemos ambas varianzas poblacionales, entonces:
(𝒙̅𝟏 − 𝒙̅𝟐 ) − ( 𝝁𝟏 − 𝝁𝟐 )
𝒁= ↝ 𝑨𝒑𝒓𝒐𝒙. 𝑵(𝟎, 𝟏)
𝟐 𝟐
√𝒔̂ 𝟏 + 𝒔̂ 𝟐
𝒏 𝟏 𝒏𝟐
Puesto que se construye un intervalo de confianza al 99%, entonces al hallar el valor de z, tenemos:
~ 18 ~
c) Prueba de Hipótesis:
Planteamos las hipótesis respectivas:
- H0: 𝝁𝟏 = 𝝁𝟐
- H1: 𝝁𝟏 < 𝝁𝟐
(𝒙 ̅𝟐 )
̅𝟏 − 𝒙 21.61 − 20.57
𝒛0 = = = 𝟑. 𝟖𝟏
𝟐 𝟐 6.656 4.557
√𝒔̂𝟏 𝒔̂𝟐 +
𝒏𝟏 + 𝒏𝟐
√
135 181
z = la
Y, finalmente, podemos realizar -1.64
Toma de decisión:
Por lo tanto, podemos concluir que no es correcta la afirmación del investigador, sino más bien se
puede decir que no existe diferencia significativa entre las edades de los estudiantes de ambas
facultades, con una confianza del 95%.
~ 19 ~
c) Estimación y prueba de hipótesis para la proporción
Un trabajo asignado a un grupo de estudiantes consiste en realizar una encuesta para estimarla proporción
de estudiantes de la facultad de Administración que trabajan y estudian. Para esto, se realizó una encuesta a
181 alumnos, siendo sus respuestas las siguientes:
a) Con los datos obtenidos, estimar puntualmente la proporción de estudiantes que trabajan y estudian
en dicha facultad, y construya un intervalo de confianza al 99%.
b) Si los que realizan el trabajo afirman que dicha proporción es mayor a 0.4; con un nivel de significancia
del 1%, ¿se puede aceptar dicha afirmación?
~ 20 ~
Solución:
a) Estimación Puntual:
Sea:
𝑋 68
X: nro de estudiantes que trabajan = 68 ⇒ 𝑝̂ = = = 0.38
𝑛 181
n: tamaño de muestra =181
b) Intervalos de Confianza:
Formulamos: 𝑷[𝒂 ≤ 𝝁 ≤ 𝒃] = 𝟏 − 𝜶 ; siendo: Parámetro: p y Estimador: 𝑝̂
Y, con esto ya podemos formular nuestros límites de confianza: (Usaremos el Factor de corrección
para la población finita, puesto que conocemos N, y, además n/N > 5% )
c) Prueba de Hipótesis:
Planteamos las hipótesis teniendo en cuanta lo afirmado por el grupo de estudio:
- H0: 𝒑 = 0.4
- H1: 𝒑 > 0.4
~ 21 ~
̂−𝒑
𝒑
𝒁= ↝ 𝑨𝒑𝒓𝒐𝒙. 𝑵 (𝟎; 𝟏)
√𝒑(𝟏 − 𝒑)
√𝒏
Asumiendo que H0 es verdadera, tenemos que: p =0.4. Con este valor, procedemos a hallar un Z0:
̂−𝒑
𝒑 0.38 − 0.4
𝒁𝟎 = = = −0.0007
√𝒑(𝟏 − 𝒑) √𝑵 − 𝒏 √0.6(0.4) √2438 − 181
√𝒏 √𝑵 − 𝟏 √181 √𝟐𝟒𝟑𝟕
Por lo tanto, podemos concluir que no es correcta la afirmación del grupo de estudiantes de que, el
promedio de personas que trabajan y estudian es mayor a 0.4.
~ 22 ~
d) Estimación y prueba de hipótesis para la diferencia de proporciones:
Un grupo de estudios realiza una investigación para comparar las opiniones a favor acerca de la
obligatoriedad de un aporte en las facultades de Química y Administración de la UNMSM. Para ello, se
realizó una encuesta a 135 estudiantes de la facultad de Química y a 181 estudiantes de la facultad de
Administración, encontrándose los siguientes resultados.
a) Después de estimar puntualmente las proporciones, se pide hallar un intervalo de confianza al 98% de
confianza.
b) Finalmente, el grupo plantea que es más factible el establecer un aporte obligatorio en la facultad de
Administración que en Química. Con un nivel de significación de 1%, ¿Se puede aceptar dicho
planteamiento?
~ 23 ~
Solución:
a) Estimación Puntual:
Para el caso de la Facultad de Química:
Sea:
𝑋 39
X: nro de estudiantes a favor de un aporte obligatorio = 39 ⇒ 𝑝̂1 = = = 0.289
𝑛1 135
𝑛1 : Tamaño de muestra =135
b) Intervalo de Confianza:
̂𝟏 − 𝒑
Formulamos: 𝑷[𝒂 ≤ 𝒑𝟏 − 𝒑𝟐 ≤ 𝒃] = 𝟏 − 𝜶 ; siendo: Parámetro: 𝒑𝟏 − 𝒑𝟐 y Estimador: 𝒑 ̂𝟐
𝒑
̂ (𝟏 − 𝒑
̂ ) 𝒑
𝟏 + 𝟐 (𝟏 − 𝒑𝟐 ) = (0.289 − 0.365) + (2.33)√0.289(0.711) + 0.365(1 − 0.365) = 0.047
̂ ̂
𝒃 = (𝒑 ̂ 𝟐 ) + 𝒛√ 𝟏
̂𝟏 − 𝒑
𝒏𝟏 𝒏𝟐 135 181
̂𝟏 − 𝒑
Finalmente, el intervalo de confianza al 98% de confianza es: −0.199 ≤ 𝒑 ̂ 𝟐 ≤ 0.047
c) Prueba de Hipótesis:
Planteamos las hipótesis teniendo en cuanta lo afirmado por el grupo de estudio:
- H0: 𝒑𝟏 = 𝒑𝟐
- H1: 𝒑𝟏 < 𝒑𝟐
~ 24 ~
(𝒑̂ 𝟏 − 𝒑̂ 𝟐 ) − (𝒑𝟏 − 𝒑𝟐 )
𝒁= ↝ 𝑨𝒑𝒓𝒐𝒙. 𝑵(𝟎, 𝟏)
𝒑 (𝟏 − 𝒑𝟏 ) 𝒑𝟐 (𝟏 − 𝒑𝟐 )
√ 𝟏 +
𝒏𝟏 𝒏𝟐
Asumiendo que H0 es verdadera, tenemos que: 𝒑𝟏 = 𝒑𝟐 .
̂ 𝟏 + 𝒏𝟐 𝒑
𝒏𝟏 𝒑 ̂𝟐 𝟑𝟗 + 𝟔𝟔
̂=
⇒ 𝒑𝟏 = 𝒑𝟐 = 𝒑 ⇒ 𝒑 = ̂ = 𝟎. 𝟑𝟑𝟐
⇒𝒑=𝒑
𝒏𝟏 + 𝒏𝟐 𝟏𝟑𝟓 + 𝟏𝟖𝟏
𝑍0 = −1.435
Por lo tanto, podemos concluir que no es correcta la afirmación del grupo de estudios, por el contrario, ya
que la diferencia entre las proporciones de estudiantes a favor de un aporte obligatorio entre las facultades
de Química y Administración no es significativa, con un nivel de confianza de 99%; por lo que, sería igual
de factible el establecerlo en cualquiera de estas.
~ 25 ~
e) Prueba Ji-Cuadrado de la bondad de ajuste:
Se realizó una encuesta a 135 estudiantes de la Facultad de Química para conocer cuál era el importe de su
presupuesto mensual. Los resultados fueron los siguientes:
¿Se puede concluir, con el nivel de significación del 1%, que los presupuestos mensuales se ajustan a una
distribución normal?
~ 26 ~
Solución:
Sea X la variable que denota el presupuesto mensual. Como deseamos saber si la distribución de los
datos es normal con media µ y varianza 𝜎 2 , debemos estimar primero estos parámetros, sabiendo que
la estimación puntual de µ es 𝑥̅ y de 𝜎 es 𝑠̂ :
Ahora, construiremos una Tabla de frecuencias esperadas. Para esto, tenemos que las frecuencias
esperadas en cada intervalo son: 𝑒𝑖 = 𝑛𝑝𝑖 = 135𝑝𝑖
𝐿𝑖 −𝜇 𝑈𝑖 −𝜇
𝑆𝑖𝑒𝑛𝑑𝑜 𝑝𝑖 = 𝑃[𝐿𝑖 ≤ 𝑋 < 𝑈𝑖 ] = 𝑃 [ ≤𝑍< ], donde Li y Ui son los límites inferior y superior del
𝜎 𝜎
intervalo, respectivamente.
Así, si construimos la siguiente tabla de frecuencias observadas (Oi) y esperadas (𝑒𝑖 ), tendremos:
𝑘
(𝑜𝑖 − 𝑒𝑖 )2 2
𝒬= ∑ ↝ 𝑋(k−m−1) ; 𝑺𝒊𝒆𝒏𝒅𝒐 𝒌: 𝒏𝒓𝒐 𝒅𝒆 𝒄𝒍𝒂𝒔𝒆𝒔; 𝒎: 𝒏𝒓𝒐 𝒅𝒆 𝒑𝒂𝒓á𝒎𝒆𝒕𝒓𝒐𝒔 𝒂 𝒆𝒔𝒕𝒊𝒎𝒂𝒓
𝑒𝑖
𝑖=1
~ 27 ~
Veamos ahora el Nivel de significancia: α = 0.01, además k= 6 y m = 2
2
⇒ P(𝑋(k−m−1) > 𝑋) = P(𝑋32 > 𝑋) = 0,01
∴ 𝑋 = 11.3
Determinamos ahora la Región Crítica o de Rechazo (RR) y la Región de Aceptación (RA):
Ya que: Q = 86.24 > 11.3 , entonces Q ∈ RR. De ahí que rechazamos H0.
Por lo tanto, podemos concluir que los datos recopilados acerca de los presupuestos mensuales de los
estudiantes de la Facultad de Química no se ajustan a una distribución normal
~ 28 ~
f) Prueba de Independencia:
Se realiza una investigación en la facultad de Administración, la cual busca determinar si existe algún tipo de
relación entre la disponibilidad a invertir por parte de los alumnos en esa facultad, y el género al cuál
pertenecen. Con un nivel de significancia del 5%, ¿se puede afirmar estadísticamente que dicha relación
entre ambas variables existe?
¿ESTARÍAS DISPUESTO A
INVERTIR PARA QUE TU
FACULTAD MEJORE? Total
SI NO
MASCULINO 59 37 96
GÉNERO
FEMENINO 55 30 85
Total 114 67 181
Solución:
2. Función Pivotal:
𝑘
(𝑜𝑖 − 𝑒𝑖 )2 2
𝒬= ∑ ↝ 𝑋(F−1)(C−1)
𝑒𝑖
𝑖=1
Siendo:
- F = Número de filas
- C = Número de columnas
¿ESTARÍAS DISPUESTO A
INVERTIR PARA QUE TU
FACULTAD MEJORE? Total
SI NO
MASCULINO 60.46 35.54 96
GÉNERO
FEMENINO 53.54 31.46 85
Total 114 67 181
~ 29 ~
𝑘
(𝑜𝑖 − 𝑒𝑖 )2 (59 − 60.46)2 (55 − 53.54)2 (37 − 35.54)2 (30 − 31.46)2
Q= ∑ = + + + ⇒ 𝑄 = 0.2028
𝑒𝑖 60.46 53.54 35.54 31.46
𝑖=1
6. Toma de decisiones:
Como: Q = 0.2028 < 3.84 → Q ∈ RA. De ahí, aceptamos Ho.
Podemos afirmar entonces que, el género y la disponibilidad a invertir son variables independientes.
~ 30 ~
g) Prueba de Homogeneidad:
Se realizó un estudio en tres facultades de la UNMSM: Química, Administración y Sociales, para conocer sus
opiniones acerca del porqué considerarían que un estudiante podría negarse a aportar o invertir en su
facultad. Una muestra aleatoria de 431 estudiantes arrojó los siguientes resultados:
FACULTADES
Total
QUÍMICA ADMINISTRACIÓN SOCIALES
Poca
disponibilidad 50 56 39 145
¿Porque de dinero
crees que las Corrupción por
personas se parte de las 62 89 53 204
podrían autoridades
negar a
aportar? Es obligación
del gobierno
19 32 11 62
Otros 4 4 12 20
Total 135 181 115 431
Con los datos recopilados, y con un nivel de significación del 1%, ¿es posible determinar si las 3 facultades
son homogéneas con respecto a sus opiniones acerca de porqué una persona se negaría a aportar?
~ 31 ~
Solución:
2. Función Pivotal:
𝑘
(𝑜𝑖 − 𝑒𝑖 )2 2
𝒬= ∑ ↝ 𝑋(F−1)(C−1)
𝑒𝑖
𝑖=1
Siendo:
- F = Número de filas
- C = Número de columnas
~ 32 ~
𝑘
(𝑜𝑖 − 𝑒𝑖 )2 (50 − 45.42)2 (56 − 60.9)2 (39 − 38.68)2 (12 − 5.35)2
Q= ∑ = + + +⋯ + ⇒ 𝑄 = 15.689
𝑒𝑖 45.42 60.9 38.68 5.35
𝑖=1
6. Toma de decisiones:
Como: Q = 15.689 < 16.8 → Q ∈ RA. De ahí, aceptamos Ho.
Podemos afirmar entonces que, las 3 facultades son homogéneas respecto a su opinión acerca de la negación al
aporte.
~ 33 ~
h) Análisis de Varianza:
Se realizó una encuesta por muestreo a un total 390 estudiantes de las facultades de Química, Sociales y
Biología de la UNMSM. Con un nivel de significancia del 5%, se pide probar la hipótesis de que no existen
diferencias significativas entre las 3 facultades con respecto al tiempo de estudio en promedio que los
estudiantes dedican por su cuenta. Los resultados son los siguientes:
~ 34 ~
Solución:
c) Cálculos preliminares:
̅𝟐𝒊
𝒏𝒊 𝒙 37966.4415 34617.5875 38671.416 ∑ 𝑛𝑖 𝑥̅𝑖2 = 111255.445
𝑖=1
∑𝒌𝒊=𝟏 ∑𝒏𝒋=𝟏
𝒊
𝒙𝟐𝒊𝒋 =165162 : Suma de los cuadrados de todos los datos.
̅𝟐𝒊 = 111255.445
∑ 𝒏𝒊 𝒙
𝑖=1
̅𝟐 = 390(16.88712 ) = 111218.96
𝒏𝒙
Ahora, ya podemos calcular los siguientes valores necesarios para construir la tabla ANAVA:
𝒏
-) 𝑺𝑪𝑻 = ∑𝒌𝒊=𝟏 ∑𝒋=𝟏
𝒊
𝒙𝟐𝒊𝒋 − 𝒏𝒙
̅𝟐 = 𝟏65162 − 111218.96 ⇒ 𝑺𝑪𝑻 = 53943.04
-) 𝑺𝑪𝑪 = ∑𝟑𝒊=𝟏 𝒏𝒊 𝒙
̅𝟐𝒊 − 𝒏𝒙
̅𝟐 = 111255.445 − 111218.96 ⇒ 𝑺𝑪𝑪 = 36.485
~ 35 ~
d) Construcción de la Tabla ANOVA:
Fuente de Grados de
Suma de Cuadrados Cuadrado Medio Razón Ho
Variación Libertad
Entre
𝑺𝑪𝑪 𝑪𝑴𝑪
tratamientos 𝑺𝑪𝑪 = 36.485 k–1=2 𝑪𝑴𝑪 = = 18.2425 𝑭= = 0.131 𝜇𝐼 = 𝜇
(columnas) 𝒌−𝟏 𝑪𝑴𝑬
Dentro de los
𝑺𝑪𝑬
tratamientos 𝑺𝑪𝑬 = 𝑺𝑪𝑻 − 𝑺𝑪𝑪 =53906.555 n – k = 387 𝑪𝑴𝑬 = = 139.2934
(error) 𝒏−𝒌
Total 𝑺𝑪𝑻 = 53943.04 n – 1 = 389
e) Nivel de significancia:
Siendo α = 5% ⇒ 𝑭𝟏−𝜶(𝒌−𝟏;𝒏−𝒌) = 𝑭0.95(2;387) = 𝟑
F = 0.131 𝑭0.95(2;387) = 𝟑
g) Toma de decisiones:
Podemos concluir entonces que no existen diferencias significativas en las 3 facultades respecto al tiempo
promedio que emplean sus alumnos para estudiar por su cuenta, con un nivel de significancia de 5%.
~ 36 ~
ANEXOS
~ 37 ~
ANEXO 1: Formato de la Encuesta:
~ 38 ~
~ 39 ~
ANEXO 2: Estadísticos e Histograma – Facultad de Química; Variable: Gasto diario:
ESTADÍSTICOS
¿De cuánto es el importe de tu gasto
diario en la universidad?
N Válido 135
Perdidos 0
Media 11,92
Error estándar de la media ,506
Mediana 10,00
Moda 10
Desviación estándar 5,883
Varianza 34,613
Rango 28
Mínimo 2
Máximo 30
~ 40 ~
Anexo 3: Estadísticos e Histograma – Facultades de Química y Administración; Variable: Edad:
~ 41 ~
ANEXO 4: Tabla de frecuencias – Facultad de Administración; Variable: ¿Además de estudiar, trabaja?:
~ 42 ~
ANEXO 6: Tabla de frecuencias e intervalos – Facultad de Química; Variable: Presupuesto Mensual:
Si No
Masculino 59 37 96
GÉNERO
Femenino 55 30 85
Total 114 67 181
~ 43 ~
¿POR QUÉ CREES QUE LAS PERSONAS SE NEGARÍAN A APORTAR? – FAC.
ADMINISTRACIÓN
Porcentaje Porcentaje
Frecuencia Porcentaje
válido acumulado
Poca disponibilidad de
56 30,9 30,9 30,9
dinero
ESTADÍSTICOS - QUÍMICA
¿Cuantas horas a la semana le
dedicas a estudiar por tu cuenta?
Válido 135
N
Perdidos 0
Media 16,77
Mediana 15,00
Moda 8a
Desviación estándar 11,909
Varianza 141,820
Rango 55
Mínimo 1
Máximo 56
~ 44 ~
ESTADÍSTICOS - ADMINISTRACIÓN
Válido 181
N
Perdidos 0
Media 15,91
Mediana 14,00
Moda 20
Desviación estándar 11,715
Varianza 137,237
Rango 68
Mínimo 2
Máximo 70
ESTADÍSTICOS - SOCIALES
¿Cuántas horas a la semana dedicas a
estudiar por tu cuenta?
Válido 115
N
Perdidos 0
Media 17,35
Error estándar de la media ,740
Mediana 15,00
Moda 15
Desviación estándar 7,931
Varianza 62,895
Rango 44
Mínimo 6
Máximo 50
~ 45 ~