Está en la página 1de 45

DISEÑO MUESTRAL Y ANÁLISIS ESTADÍSTICO

ENCUESTA APLICADA EN LA FACULTAD DE


QUÍMICA E INGENIERÍA QUÍMICA

FACULTAD : CIENCIAS ECONÓMICAS


EAP : ECONOMÍA
CURSO : ESTADÍSTICA II
GRUPO : 3-A
SALÓN : 212
PROFESOR : LÁZARO ARANDA, ISABEL

ALUMNO:
 MINAYA AGUIRRE, ALEXIS RAUL

LIMA-2017

~1~
ÍNDICE

Contenido
ÍNDICE .............................................................................................................................................................................2
INTRODUCCIÓN ..............................................................................................................................................................3
PARTE I: DISEÑO MUESTRAL ........................................................................................... ¡Error! Marcador no definido.
A. ENCUESTA PILOTO ............................................................................................................................................5
B. ENCUESTA DEFINITIVA Y CÁLCULO DEL TAMAÑO DE MUESTRA ....................... ¡Error! Marcador no definido.
PARTE II: ANÁLISIS ESTADÍSTICO ..................................................................................... ¡Error! Marcador no definido.
1. ESTIMACIÓN Y PRUEBA DE HIPÓTESIS DE LA MEDIA .............................................. ¡Error! Marcador no definido.
1.1 ESTIMACIÓN PUNTUAL .................................................................................... ¡Error! Marcador no definido.
1.2 ESTIMACIÓN POR INTERVALOS DE CONFIANZA ............................................... ¡Error! Marcador no definido.
1.3 PRUEBA DE HIPÓTESIS DE LA MEDIA ............................................................... ¡Error! Marcador no definido.
2. ESTIMACIÓN Y PRUEBA DE HIPÓTESIS DE LA DIFERENCIA DE MEDIAS ................... ¡Error! Marcador no definido.
2.1 ESTIMACIÓN PUNTUAL .................................................................................... ¡Error! Marcador no definido.
2.2 ESTIMACIÓN POR INTERVALOS DE CONFIANZA ............................................... ¡Error! Marcador no definido.
2.3 PRUEBA DE HIPÓTESIS DE LA DIFERENCIA DE MEDIAS .................................... ¡Error! Marcador no definido.
3. ESTIMACIÓN Y PRUEBA DE HIPÓTESIS DE LA PROPORCIÓN ................................... ¡Error! Marcador no definido.
3.1 ESTIMACIÓN PUNTUAL .................................................................................................................................20
3.2 ESTIMACIÓN POR INTERVALOS DE CONFIANZA ............................................... ¡Error! Marcador no definido.
3.3 PUEBA DE HIPÓTESIS PARA LA PROPORCIÓN…………………………………………………………………………………………… 20

4. ESTIMACIÓN Y PRUEBA DE HIPÓTESIS DE LA DEFERENCIA DE PROPORCIONES………………………………………………… 22

4.1 ESTIMACIÓN PUNTUAL……………………………………………………………………………………………………………………………. 23

4.2 ESTIMACIÓN POR INTERVALOS DE CONFIANZA……………………………………………………………………………………..... 23

4.3 PRUEBA DE HIPÓTESIS DE LA DIFERENCIA DE PORPORCIONES………………………………………………………………… 23

5. PRUEBA JI - CUADRADO PARA LA BONDAD DE AJUSTE……………………………………………………..…………………………….. 25

6. PRUEBA DE INDEPENDENCIA…………………………………………………………………………………………………………………………… 28

7. PRUEBA DE HOMOGENEIDAD………………………………………………………………………………………………………………………….. 30

8. ANÁLISIS DE VARIANZA……………………………………………………………………………………………………………………………………. 33

ANEXOS........................................................................................................................ ¡Error! Marcador no definido.36


ANEXO 01: FORMATO DE LA ENCUESTA ................................................................ ¡Error! Marcador no definido.37
ANEXO 02: ESTADÍSTICOS E HISTOGRAMA –VARIABLE: GASTO DIARIO ................ ¡Error! Marcador no definido.39
ANEXO 03: ESTADÍSTICOS E HISTOGRAMA – VARIABLE: EDAD .............................. ¡Error! Marcador no definido.40
ANEXO 04: TABLA DE FRECUENCIAS – VARIABLE: ¿ADEMÁS DE ESTUDIAR, TRABAJA¡Error! Marcador no definido.41
ANEXO 05:TABLA DE FRECUENCIAS – VARIABLE: ¿CONSIDERAS QUE EL APORTE DEBERÍA SER OBLIGATORIO?:¡Error! Marcador no
definido.41
ANEXO 06: TABLA DE FRECUENCIAS E INTERVALOS – VARIABLE: PRESUPUESTO MENSUAL…………………………….....42
ANEXO 07: TABLA CRUZADA PARA LA PRUEBA DE INDEPENDENCIA …………………………………………………………………. 42
ANEXO 08: TABLAS DE FRECUENCIAS PARA LA PRUEBA DE HOMOGENEIDAD……………………………………………………. 42
ANEXO 09: ESTADÍSTICOS E HISTOGRAMA – VARIABLE: HORAS DE ESTUDIO……………………………………………………. 43

~2~
~3~
INTRODUCCIÓN

El presente trabajo presenta la información recolectada en 3 facultades, el cual utiliza principalmente la

información recopilada en la facultad de Química e Ingeniería Química. Esta información pudo obtenerse al

aplicar una encuesta a dicha facultad, dando como resultado la elaboración de este trabajo, el cual ha sido

dividido en dos partes, para una mayor apreciación de lo desarrollado en estas:

La Parte I, comprende todo lo relacionado con el Diseño Muestral, el cual se llevó a cabo usando la variable

Presupuesto Mensual, realizándose para ello una encuesta piloto.

La Parte II se refiere al Análisis Estadístico, el cual se presenta a través del planteamiento de un ejercicio y su

respectiva solución aplicando todos los temas que se desarrollaron durante el curso de Estadística II y

apoyando la resolución de los mismos con los datos obtenidos de la encuesta y presentados en los diversos

anexos.

~4~
PARTE I
DISEÑO MUESTRAL
Contiene:

 Encuesta Piloto
 Encuesta Definitiva y Cálculo del Tamaño de Muestra

~5~
a) ENCUESTA PILOTO:
De una población de 1172 alumnos matriculados en el Semestre Académico 2017-I, para la encuesta piloto se
ha tomado una muestra de 119 estudiantes, y, al consultarles la pregunta 6 del cuestionario, se recopilaron los
siguientes datos:

400 300 290


300 250 480
200 900 390
180 320 1500
400 150 900
200 280 360
450 170 480
200 300 400
400 120 200
200 250 290
200 250 400
100 250 150
200 100 450
300 250 400
150 300 240
400 250 520
300 320 240 De donde:
400 380 300 N = 1172
500 600 270
1000 400 650 n = 10%N = 117,2 ≈ 119 aprox.
500 1800 400 119
400 500 520 𝑥𝑖
170 200 400 𝑋̅ = ∑ = 392.1849
400 200 450 𝑛
𝑖=1
300 250 500
119
100 300 480 2
(𝑥𝑖 − 𝑥̅ )2
𝑆 =∑ = 59081.6265
300 300 350 𝑛−1
𝑖=1
800 240 200
600 400 490
300 350 300
200 280 500
600 300 750
550 760 850
200 600 360
500 350 470
300 380 500
350 600 550
500 350 200
200 600 450
100 290

~6~
b) ENCUESTA DEFINITIVA Y CÁLCULO DEL TAMAÑO DE MUESTRA:

Siendo la población: N = 1172, procedemos a calcular el Error Absoluto Máximo Permisible (e):

𝑒 = 3% 𝑥̅ ⇒ 𝑒 = 3%(392.1849); 𝑑𝑒 𝑑𝑜𝑛𝑑𝑒: 𝑒 = 11.765547

Ahora, para poder estimar un tamaño de muestra adecuado para realizar la encuesta (ni) definitiva,
construimos una matriz con diferentes niveles de confianza y errores relativos:

Nivel de Confianza
Error Relativo
Máximo
Permisible 90% 95% 98%

5% n1 n2 n3
7% n4 n5 n6
10% n7 n8 n9

Y, procedemos a calcular los diferentes ni para encontrar el tamaño de muestra adecuado; siendo:

𝑛0
𝑛≥ 𝑛
1 + 𝑁0

𝑍2𝑆 2
Siendo además: 𝑛0 =
𝑒2

~7~
Para n1 : (error del 5% y confianza al 90%)
Siendo: 𝑒 = 5%𝑥̅ ⇒ 𝑒 = 5%(392.1849) ⇒ 𝒆 = 𝟏𝟗. 𝟔𝟎𝟗

y 𝑺𝟐 = 𝟓𝟗𝟎𝟖𝟏. 𝟔𝟐𝟔𝟓

Como hay confianza es del 90%, entonces: 𝒁 = 𝟏. 𝟔𝟒

2 2 2 (59081.6265)
Hallamos 𝑛0 = 𝑍𝑒2𝑆 ⇒ 𝑛0 = (1.64) 2 ⇒ 𝑛0 = 413.2552
(19.609)

𝑛0 413.2552
Y, reemplazando finalmente en: 𝑛1 ≥ 𝑛 ⇒ 𝑛1 ≥ 413.3552
1+ 𝑁0 1+
1172

De donde: 𝑛1 ≥ 305.57 ⇒ 𝑛1 ≈ 306

Para n2 : (error del 5% y confianza al 95%)


Siendo: 𝑒 = 5%𝑥̅ ⇒ 𝑒 = 5%(392.1849) ⇒ 𝒆 = 𝟏𝟗. 𝟔𝟎𝟗

y 𝑺𝟐 = 𝟓𝟗𝟎𝟖𝟏. 𝟔𝟐𝟔𝟓

Como hay confianza es del 90%, entonces: 𝒁 = 𝟏. 𝟗𝟔

2 2 2 (59081.6265)
Hallamos 𝑛0 = 𝑍𝑒2𝑆 ⇒ 𝑛0 = (1.96) 2 ⇒ 𝑛0 = 590.2740
(19.609)

𝑛0 590.2740
Y, reemplazando finalmente en: 𝑛1 ≥ 𝑛 ⇒ 𝑛1 ≥ 590.2740
1+ 𝑁0 1+ 1172

De donde: 𝑛2 ≥ 392.561 ⇒ 𝑛2 ≈ 393

~8~
Para n3 : (error del 5% y confianza al 98%)
Siendo: 𝑒 = 5%𝑥̅ ⇒ 𝑒 = 5%(392.1849) ⇒ 𝒆 = 𝟏𝟗. 𝟔𝟎𝟗

y 𝑺𝟐 = 𝟓𝟗𝟎𝟖𝟏. 𝟔𝟐𝟔𝟓

Como hay confianza es del 90%, entonces: 𝒁 = 𝟐. 𝟑𝟑

2 2 2 (59081.6265)
Hallamos 𝑛0 = 𝑍𝑒2𝑆 ⇒ 𝑛0 = (2.33) 2 ⇒ 𝑛0 = 834.1677
(19.609)

𝑛0 834.1677
Y, reemplazando finalmente en: 𝑛3 ≥ 𝑛 ⇒ 𝑛3 ≥ 834.1677
1+ 0 1+ 1172
𝑁

De donde: 𝑛3 ≥ 487.319 ⇒ 𝑛3 ≈ 488

Para n4 : (error del 7% y confianza al 90%)


Siendo: 𝑒 = 7%𝑥̅ ⇒ 𝑒 = 7%(392.1849) ⇒ 𝒆 = 𝟐𝟕. 𝟒𝟓𝟑

y 𝑺𝟐 = 𝟓𝟗𝟎𝟖𝟏. 𝟔𝟐𝟔𝟓

Como hay confianza es del 90%, entonces: 𝒁 = 𝟏. 𝟔𝟒

2 2 2 (59081.6265)
Hallamos 𝑛0 = 𝑍𝑒2𝑆 ⇒ 𝑛0 = (1.64) 2 ⇒ 𝑛0 = 210.8436
(27.453)

𝑛0 210.8436
Y, reemplazando finalmente en: 𝑛4 ≥ 𝑛 ⇒ 𝑛4 ≥ 210.8436
1+ 𝑁0 1+ 1172

De donde: 𝑛4 ≥ 178.696 ⇒ 𝑛4 ≈ 179

~9~
Para n5: (error del 7% y confianza al 95%)
Siendo: 𝑒 = 7%𝑥̅ ⇒ 𝑒 = 7%(392.1849) ⇒ 𝒆 = 𝟐𝟕. 𝟒𝟓𝟑

y 𝑺𝟐 = 𝟓𝟗𝟎𝟖𝟏. 𝟔𝟐𝟔𝟓

Como hay confianza es del 95%, entonces: 𝒁 = 𝟏. 𝟗𝟔

2 2 2 (59081.6265)
Hallamos 𝑛0 = 𝑍𝑒2𝑆 ⇒ 𝑛0 = (1.96) 2 ⇒ 𝑛0 = 301.1514
(27.453)

𝑛0 301.1514
Y, reemplazando finalmente en: 𝑛5 ≥ 𝑛 ⇒ 𝑛5 ≥ 301.1514
1+ 𝑁0 1+ 1172

De donde: 𝑛5 ≥ 239.588 ⇒ 𝑛5 ≈ 240

Para n6: (error del 7% y confianza al 98%)


Siendo: 𝑒 = 7%𝑥̅ ⇒ 𝑒 = 7%(392.1849) ⇒ 𝒆 = 𝟐𝟕. 𝟒𝟓𝟑

y 𝑺𝟐 = 𝟓𝟗𝟎𝟖𝟏. 𝟔𝟐𝟔𝟓

Como hay confianza es del 98%, entonces: 𝒁 = 𝟐. 𝟑𝟑

2 2 2 (59081.6265)
Hallamos 𝑛0 = 𝑍𝑒2𝑆 ⇒ 𝑛0 = (2.33) 2 ⇒ 𝑛0 = 425.5833
(27.453)

𝑛0 425.5833
Y, reemplazando finalmente en: 𝑛6 ≥ 𝑛 ⇒ 𝑛6 ≥ 425.5833
1+ 𝑁0 1+ 1172

De donde: 𝑛6 ≥ 312.21 ⇒ 𝑛6 ≈ 313

~ 10 ~
Para n7: (error del 10% y confianza al 90%)
Siendo: 𝑒 = 10%𝑥̅ ⇒ 𝑒 = 10%(392.1849) ⇒ 𝒆 = 𝟑𝟗. 𝟐𝟏𝟖𝟒𝟗

y 𝑺𝟐 = 𝟓𝟗𝟎𝟖𝟏. 𝟔𝟐𝟔𝟓

Como hay confianza es del 90%, entonces: 𝒁 = 𝟏. 𝟔𝟒

2 2 2 (59081.6265)
Hallamos 𝑛0 = 𝑍𝑒2𝑆 ⇒ 𝑛0 = (1.64) 2 ⇒ 𝑛0 = 103.3138
(39.21849)

𝑛0 103.3138
Y, reemplazando finalmente en: 𝑛7 ≥ 𝑛 ⇒ 𝑛7 ≥ 103.3138
1+ 𝑁0 1+
1172

De donde: 𝑛7 ≥ 94.942 ⇒ 𝑛7 ≈ 95

Para n8: (error del 10% y confianza al 95%)


Siendo: 𝑒 = 10%𝑥̅ ⇒ 𝑒 = 10%(392.1849) ⇒ 𝒆 = 𝟑𝟗. 𝟐𝟏𝟖𝟒𝟗

y 𝑺𝟐 = 𝟓𝟗𝟎𝟖𝟏. 𝟔𝟐𝟔𝟓

Como hay confianza es del 95%, entonces: 𝒁 = 𝟏. 𝟗𝟔

2 2 2 (59081.6265)
Hallamos 𝑛0 = 𝑍𝑒2𝑆 ⇒ 𝑛0 = (1.96) 2 ⇒ 𝑛0 = 147.5648
(39.21849)

𝑛0 147.5648
Y, reemplazando finalmente en: 𝑛8 ≥ 𝑛 ⇒ 𝑛8 ≥ 147.5648
1+ 0 1+ 1172
𝑁

De donde: 𝑛8 ≥ 131.062 ⇒ 𝑛8 ≈ 132


~ 11 ~
Para n9: (error del 10% y confianza al 98%)
Siendo: 𝑒 = 10%𝑥̅ ⇒ 𝑒 = 10%(392.1849) ⇒ 𝒆 = 𝟑𝟗. 𝟐𝟏𝟖𝟒𝟗

y 𝑺𝟐 = 𝟓𝟗𝟎𝟖𝟏. 𝟔𝟐𝟔𝟓

Como hay confianza es del 98%, entonces: 𝒁 = 𝟐. 𝟑𝟑

2 2 2 (59081.6265)
Hallamos 𝑛0 = 𝑍𝑒2𝑆 ⇒ 𝑛0 = (2.33) 2 ⇒ 𝑛0 = 208.5367
(39.21849)

𝑛0 208.5367
Y, reemplazando finalmente en: 𝑛9 ≥ 𝑛 ⇒ 𝑛9 ≥ 208.5367
1+ 𝑁0 1+ 1172

De donde: 𝑛9 ≥ 177.036 ⇒ 𝑛9 ≈ 178

Y ya teniendo cada valor de ni, podemos completar la matriz:

Error Relativo Nivel de Confianza


Máximo Permisible
90% 95% 98%
5% n1 =306 n2 =393 n3 = 488
7% n4 =179 n5 =240 n6 =313
10% n7 =95 n8 =132 n9 = 178

De donde, ya podemos seleccionar el tamaño de muestra adecuado para poder realizar la Encuesta Definitiva a la
Facultad de Química y el posterior Análisis Estadístico a las diferentes variables recopiladas. Como se puede apreciar,
se seleccionó n =132, aunque, por motivos didácticos, para poder trabajar con un tamaño de muestra que pueda ser
repartido equitativamente entre cada miembro del grupo, tomaremos n= 135.

~ 12 ~
PARTE II
ANÁLISIS ESTADÍSTICO
Casos:

 Estimación y prueba de hipótesis para la media


 Estimación y prueba de hipótesis para la diferencia de
medias
 Estimación y prueba de hipótesis para la proporción
 Estimación y prueba de hipótesis para la diferencia de
proporciones:
 Prueba Ji-Cuadrado de la bondad de ajuste
 Prueba de Independencia
 Prueba de Homogeneidad
 Análisis de Varianza

~ 13 ~
a) Estimación y prueba de hipótesis para la media:

Se desea conocer el gasto promedio diario de los estudiantes de la facultad de Química e Ingeniería Química
de la UNMSM. Para ello se realizó una encuesta a 135 alumnos, obteniéndose los siguientes resultados:

Facultad de Química – Gasto diario


20 11 10 25 11
15 6 12 15 8
10 5 15 15 12
20 5 8 10 8
10 10 10 20 15
15 10 10 12 8
15 25 10 10 15
8 5 15 25 20
30 5 14 15 7
12 7 15 30 12
10 10 5 15 5
7 10 20 15 15
10 18 10 7 6
10 10 7 5 10
30 4 3 10 6
15 7 15 30 7
10 3 10 12 15
6 10 15 10 10
10 5 15 15 7
8 7 11 5 12
10 10 7 15 15
15 15 7 8 10
7 15 2 10 30
10 15 8 10 20
5 25 7 15 15
10 10 10 15 10
7 20 15 12 10

a) Estimar puntualmente la media y la varianza.

b) Siendo el total de alumnos de la facultad de Química e Ingeniería Química 1172, halle los intervalos
de confianza para la media, con un nivel de significancia del 5%.

c) Si de dicha encuesta, un investigador plantea que el gasto diario promedio de los estudiantes es de
13 soles, con un nivel de significancia del 5%, ¿se puede concluir que la afirmación del investigador
es correcta?

~ 14 ~
Solución:
a) Estimación Puntual:

135
𝑥𝑖
𝑋̅ = ∑ = 11,92
135
𝑖=1

135
2
(𝑥𝑖 − 11.92)2
𝑆 =∑ = 34.613
134
𝑖=1

b) Intervalos de confianza:
̅
Formulamos: 𝑷[𝒂 ≤ 𝝁 ≤ 𝒃] = 𝟏 − 𝜶 ; siendo: Parámetro: µ y Estimador: 𝒙

Ahora, formulamos la Función Pivotal: Puesto que “n” es grande y desconocemos la varianza
̅ −𝝁)
(𝑿
poblacional, entonces: 𝒁= 𝝈 ↝ 𝑨𝒑𝒓𝒐𝒙. 𝑵(𝟎, 𝟏)
√𝒏

Dado que α = 5% , entonces, al hallar z, tenemos:

Y, con esto ya podemos formular nuestros límites de confianza: (Usaremos el Factor de corrección
para la población finita, puesto que conocemos N, y, además n/N > 5% )

𝒔 √𝑵−𝒏 5.883 √1172−135


𝒂 = 𝒙̅ − 𝒛. = 11.92 − 1.96. ( )( ) = 10.986
√𝒏 √𝑵−𝟏 √135 √1171

𝒔 √𝑵−𝒏 5.883 √1172−135


𝒃 = 𝒙̅ + 𝒛. = 11.92 + 1.96. ( )( ) = 12.854
√𝒏 √𝑵−𝟏 √135 √1171

Finalmente, el intervalo de confianza al 95% de confianza es: 10.986 ≤ 𝜇 ≤ 12.854

c) Prueba de Hipótesis:
Planteamos las hipótesis:
- H0: µ = 13
- H1: µ ≠ 13

Ahora, formulamos la Función Pivotal: Puesto que tenemos una población no normal, con n=135 y 𝑠̂
=𝜎 = 5.883, por el Teorema Central del Límite:

~ 15 ~
̅−𝝁
𝑿
𝒁= 𝝈 ↝ 𝑨𝒑𝒓𝒐𝒙. 𝑵 (𝟎; 𝟏)
√𝒏

Asumiendo que H0 es verdadera, tenemos que: µ =13, además, 𝑠̂ =𝜎 = 5.883. Con estos valores,
procedemos a hallar un Z0:
̅ −𝝁
𝑿 11.92 − 13
𝒁𝟎 = = = −2.27
𝝈 √𝑵 − 𝒏 5.883 √1172 − 135
√𝒏 √𝑵 − 𝟏 √135 √1171

Nota: Aplicamos el Factor de corrección para las


𝑛
poblaciones finitas, puesto que: ( ) 100% > 5%
𝑁

Especificamos ahora el nivel de significación: Siendo α = 0.05 :

Ahora, establecemos la Región Crítica o de Rechazo (RR) y la Región de Aceptación (RA):

Y, finalmente, podemos realizar la Toma de decisión:

Dado que Z0 = -2.27 < -1.96 → Z0 ∈ RR. Entonces rechazamos H0.

Por lo tanto, podemos concluir que no es correcta la afirmación del investigador, sino más bien se
puede decir que el gasto promedio diario de los estudiantes de la Facultad de Química es menor a
13 soles.

~ 16 ~
b) Estimación y prueba de hipótesis para la diferencia de medias

Un investigador desea comparar las medias de las edades de los estudiantes de 2 facultades, con el objetivo
de conocer cuál de estas posee la población más joven. Para esto, selecciona una muestra aleatoria de 135
alumnos de la Facultad de Química y otra muestra de 181 alumnos de la Facultad de Administración. Los
resultados se muestran a continuación:

Facultad de Química - Edades Facultad de Administración - Edades


21 18 23 26 22 19 20 19 23 22 20 20
20 21 18 23 22 20 21 20 22 19 20 19
20 24 24 21 23 21 21 20 21 20 21 20
25 22 21 23 20 19 21 21 20 21 21 20
20 24 21 21 20 18 18 20 20 19 21 18
19 24 22 25 23 23 19 20 25 18 18 19
20 22 21 26 24 21 20 25 20 23 19 18
24 18 27 21 25 24 21 20 19 21 20 20
31 18 24 21 24 19 22 19 20 24 21 22
19 22 25 20 31 22 18 20 24 19 22 20
18 20 24 22 20 23 22 24 31 22 18 20
19 22 23 22 17 18 20 31 19 23 22 18
20 19 21 19 17 19 19 19 18 18 20 19
25 22 22 24 19 18 22 18 19 19 19
26 22 23 21 20 20 20 19 20 18 22
20 27 20 23 22 23 22 20 25 20 20
22 20 21 22 23 21 19 25 26 23 22
22 23 21 20 21 19 22 26 20 21 19
24 22 21 20 21 19 22 20 22 19 22
21 22 24 18 29 25 18 22 22 19 22
18 21 18 20 25 21 22 22 24 25 18
21 24 19 18 27 20 19 24 21 21 22
20 21 21 19 20 19 20 21 18 20 19
19 21 22 18 22 19 21 18 21 19 20
20 19 22 17 20 20 19 21 20 19 21
23 23 21 19 19 19 20 20 19 20 19
22 23 20 21 20 18 22 19 20 19 20
20 20 20 23 18 22

a) Estime puntualmente ambas medias y varianzas, y construya un intervalo de confianza al 99%.


b) Si el investigador afirma que en la Facultad de Química los alumnos son más jóvenes que en la Facultad
de Administración, con un nivel de significancia del 5%, ¿se podría tomar como cierta dicha afirmación?

~ 17 ~
Solución:
a) Estimación Puntual:
Para el caso de la Facultad de Química:
135
𝑥𝑖
̅𝟏 = ∑
̂𝟏 = 𝒙
𝝁 ; 𝑐𝑜𝑚𝑜 𝑛1 = 135 ⇒ ̅̅̅
𝒙𝟏 = 𝟐𝟏. 𝟔𝟏
𝑛1
𝑖=1

∑135(𝑥𝑖 − ̅̅̅)
𝑥1 2
𝝈𝟏 = 𝒔̂𝟏 = √ 𝑖=1 = 𝟐. 𝟓𝟖 ⇒ 𝒔̂𝟏 𝟐 = 𝟔. 𝟔𝟓𝟔
𝑛1 − 1

Y, para el caso de la Facultad de Administración:


181
𝑥𝑖
̅𝟐 = ∑
̂𝟐 = 𝒙
𝝁 ; 𝑐𝑜𝑚𝑜 𝑛2 = 181 ⇒ ̅̅̅
𝒙𝟐 = 𝟐𝟎. 𝟓𝟕
𝑛2
𝑖=1

∑181(𝑥𝑖 − ̅̅̅)
𝑥2 2
𝝈𝟐 = 𝒔̂𝟐 = √ 𝑖=1 = 𝟐. 𝟏𝟑𝟓 ⇒ 𝒔̂𝟐 𝟐 = 𝟒. 𝟓𝟓𝟕
𝑛2 − 1

b) Intervalos de confianza:
̅𝟏 − 𝒙
Formulamos: 𝑷[𝒂 ≤ 𝝁𝟏 − 𝝁𝟐 ≤ 𝒃] = 𝟏 − 𝜶 ; siendo: Parámetro: 𝝁𝟏 − 𝝁𝟐 y Estimador: 𝒙 ̅𝟐

Ahora, formulamos la Función Pivotal: Dado que las muestras son grandes ( 𝑛1 > 30 𝑦 𝑛2 > 30);
además que desconocemos ambas varianzas poblacionales, entonces:

(𝒙̅𝟏 − 𝒙̅𝟐 ) − ( 𝝁𝟏 − 𝝁𝟐 )
𝒁= ↝ 𝑨𝒑𝒓𝒐𝒙. 𝑵(𝟎, 𝟏)
𝟐 𝟐
√𝒔̂ 𝟏 + 𝒔̂ 𝟐
𝒏 𝟏 𝒏𝟐

Puesto que se construye un intervalo de confianza al 99%, entonces al hallar el valor de z, tenemos:

Y, con esto ya podemos formular nuestros límites de confianza:


𝒔̂𝟏 𝟐 𝒔̂𝟐 𝟐 6.656 4.557
𝒂 = (𝒙 ̅𝟐 ) − 𝒛
̅𝟏 − 𝒙 √
𝒏𝟏
+
𝒏𝟐
= (21.61 − 20.57) − (2.58)√ + = 𝟎. 𝟑𝟑𝟔
135 181

𝒔̂𝟏 𝟐 𝒔̂𝟐 𝟐 6.656 4.557


𝒃 = (𝒙 ̅𝟐 ) + 𝒛
̅𝟏 − 𝒙 √
𝒏𝟏
+
𝒏𝟐
= (21.61 − 20.57) + (2.58)√ + = 𝟏. 𝟕𝟒𝟒
135 181
Finalmente, el intervalo de confianza al 99% de confianza es: 0.336 ≤ 𝝁𝟏 − 𝝁𝟐 ≤ 1.744

~ 18 ~
c) Prueba de Hipótesis:
Planteamos las hipótesis respectivas:
- H0: 𝝁𝟏 = 𝝁𝟐
- H1: 𝝁𝟏 < 𝝁𝟐

Ahora, formulamos la Función Pivotal:


(𝒙̅𝟏 − 𝒙̅𝟐 ) − ( 𝝁𝟏 − 𝝁𝟐 )
𝒁= ↝ 𝑨𝒑𝒓𝒐𝒙. 𝑵(𝟎, 𝟏)
𝟐 𝟐
√𝒔̂ 𝟏 + 𝒔̂ 𝟐
𝒏 𝟏 𝒏𝟐

Si asumimos que H0: 𝝁𝟏 = 𝝁𝟐 es verdadera, al momento de hallar 𝒛0 tenemos:

(𝒙 ̅𝟐 )
̅𝟏 − 𝒙 21.61 − 20.57
𝒛0 = = = 𝟑. 𝟖𝟏
𝟐 𝟐 6.656 4.557
√𝒔̂𝟏 𝒔̂𝟐 +
𝒏𝟏 + 𝒏𝟐

135 181

Especificamos ahora el nivel de significación: Siendo α = 0.05 :

Ahora, establecemos la Región Crítica o de Rechazo (RR) y la Región de Aceptación (RA):

z = la
Y, finalmente, podemos realizar -1.64
Toma de decisión:

Dado que Z0 = 3.81 > -1.64 → Z0 ∈ RA. Entonces aceptamos H0.

Por lo tanto, podemos concluir que no es correcta la afirmación del investigador, sino más bien se
puede decir que no existe diferencia significativa entre las edades de los estudiantes de ambas
facultades, con una confianza del 95%.

~ 19 ~
c) Estimación y prueba de hipótesis para la proporción
Un trabajo asignado a un grupo de estudiantes consiste en realizar una encuesta para estimarla proporción
de estudiantes de la facultad de Administración que trabajan y estudian. Para esto, se realizó una encuesta a
181 alumnos, siendo sus respuestas las siguientes:

Facultad de Administración – Respuestas a si trabajan y


estudian
Si No No No Si No
No No No Si No Si
No No Si No No Si
Si No No No No No
Si No Si Si Si No
No No No No No Si
Si No No No Si Si
Si No Si No No No
No Si No No No Si
No Si No No No No
No No No Si No No
Si No No No Si No
No Si No No Si Si
Si Si Si No Si No
No No No Si No Si
Si Si No No Si Si
No No No No Si Si
No No Si No No No
Si No No Si No Si
Si Si No No No No
Si No No No Si No
No Si Si Si Si No
Si Si No No No No
Si Si No No No No
No No No No No No
No Si No No No Si
No No Si Si No Si
Si No No Si No Si
Si No No No No No
No Si Si Si No Si
Si

a) Con los datos obtenidos, estimar puntualmente la proporción de estudiantes que trabajan y estudian
en dicha facultad, y construya un intervalo de confianza al 99%.
b) Si los que realizan el trabajo afirman que dicha proporción es mayor a 0.4; con un nivel de significancia
del 1%, ¿se puede aceptar dicha afirmación?

~ 20 ~
Solución:

a) Estimación Puntual:
Sea:
𝑋 68
X: nro de estudiantes que trabajan = 68 ⇒ 𝑝̂ = = = 0.38
𝑛 181
n: tamaño de muestra =181

b) Intervalos de Confianza:
Formulamos: 𝑷[𝒂 ≤ 𝝁 ≤ 𝒃] = 𝟏 − 𝜶 ; siendo: Parámetro: p y Estimador: 𝑝̂

Formulamos ahora la Función Pivotal:


(𝒑
̂ − 𝒑)
𝒁= ↝ 𝑨𝒑𝒓𝒐𝒙. 𝑵(𝟎, 𝟏)
√𝒑(𝟏 − 𝒑)
𝒏

Dado que α = 0.01, entonces al hallar el valor de z, tenemos:

Y, con esto ya podemos formular nuestros límites de confianza: (Usaremos el Factor de corrección
para la población finita, puesto que conocemos N, y, además n/N > 5% )

√𝒑(𝟏−𝒑) √𝑵−𝒏 √(0.38)(0.62) √2438−181


̂ − 𝒛.
𝒂 = 𝒑 = 0.38 − 2.58. ( ) ( 2437 ) = 0.2904
√𝒏 √𝑵−𝟏 √181 √

√𝒑(𝟏−𝒑) √𝑵−𝒏 √(0.38)(0.62) √2438−181


̂ + 𝒛.
𝒃 = 𝒑 = 0.38 + 2.58. ( ) ( 2437 ) = 0.4696
√𝒏 √𝑵−𝟏 √181 √

Finalmente, el intervalo de confianza al 99% de confianza es: 0.2904 ≤ 𝑝̂ ≤ 0.4696

c) Prueba de Hipótesis:
Planteamos las hipótesis teniendo en cuanta lo afirmado por el grupo de estudio:
- H0: 𝒑 = 0.4
- H1: 𝒑 > 0.4

Ahora, formulamos la Función Pivotal:

~ 21 ~
̂−𝒑
𝒑
𝒁= ↝ 𝑨𝒑𝒓𝒐𝒙. 𝑵 (𝟎; 𝟏)
√𝒑(𝟏 − 𝒑)
√𝒏
Asumiendo que H0 es verdadera, tenemos que: p =0.4. Con este valor, procedemos a hallar un Z0:
̂−𝒑
𝒑 0.38 − 0.4
𝒁𝟎 = = = −0.0007
√𝒑(𝟏 − 𝒑) √𝑵 − 𝒏 √0.6(0.4) √2438 − 181
√𝒏 √𝑵 − 𝟏 √181 √𝟐𝟒𝟑𝟕

Nota: Aplicamos el Factor de corrección para las


𝑛
poblaciones finitas, puesto que: ( ) 100% > 5%
𝑁

Especificamos ahora el nivel de significación: Siendo α = 0.01 :

Ahora, establecemos la Región Crítica o de Rechazo (RR) y la Región de Aceptación (RA):

Y, finalmente, podemos realizar la Toma de decisión:

Dado que Z0 = 0.0007 < 2.33 → Z0 ∈ RA. Entonces Aceptamos H0.

Por lo tanto, podemos concluir que no es correcta la afirmación del grupo de estudiantes de que, el
promedio de personas que trabajan y estudian es mayor a 0.4.

~ 22 ~
d) Estimación y prueba de hipótesis para la diferencia de proporciones:
Un grupo de estudios realiza una investigación para comparar las opiniones a favor acerca de la
obligatoriedad de un aporte en las facultades de Química y Administración de la UNMSM. Para ello, se
realizó una encuesta a 135 estudiantes de la facultad de Química y a 181 estudiantes de la facultad de
Administración, encontrándose los siguientes resultados.

Facultad de Química Facultad de Administración


Sí Sí Sí Sí No Si No No No No Si Si
Sí No No No No Si No Si No Si No No
No Sí No Sí Sí Si No No Si Si No Si
Sí Sí No No No Si No Si Si Si No No
No No No No No No Si Si No Si No No
No No No No No No Si No Si No Si No
No Sí No Sí No No No Si No No Si Si
No Sí No No Sí Si No No No No No Si
No No No No No No No No No Si No Si
No Sí No No No No No No No No No No
No No No Sí No Si No No No No No No
No No No Sí No Si Si No No Si No Si
No No No No No Si Si No No Si Si No
No No No No No No Si No No Si Si
No Sí No No No Si Si No No No Si
Sí No No Sí No No No No No Si Si
No No Sí No No Si No No No No No
No No Sí No No No Si No Si Si No
No No No Sí Sí No Si Si No No Si
No Sí Sí No No Si No No No No Si
No Sí Sí No Sí Si No No No Si No
Sí Sí Sí No No No No No No Si No
Sí Sí No Sí No No No No No No No
No Sí No No No No No No Si No No
No No No No No No Si Si Si No No
No Sí No No Sí No Si Si No No Si
No Sí No No No No No No No No Si
Si Si No No No No

a) Después de estimar puntualmente las proporciones, se pide hallar un intervalo de confianza al 98% de
confianza.
b) Finalmente, el grupo plantea que es más factible el establecer un aporte obligatorio en la facultad de
Administración que en Química. Con un nivel de significación de 1%, ¿Se puede aceptar dicho
planteamiento?

~ 23 ~
Solución:

a) Estimación Puntual:
Para el caso de la Facultad de Química:
Sea:
𝑋 39
X: nro de estudiantes a favor de un aporte obligatorio = 39 ⇒ 𝑝̂1 = = = 0.289
𝑛1 135
𝑛1 : Tamaño de muestra =135

Para el caso de la Facultad de Administración:


Sea:
𝑌 66
Y: nro de estudiantes a favor de un aporte obligatorio = 66 ⇒ 𝑝̂ 2 = = = 0.365
𝑛2 181
𝑛2 : Tamaño de muestra =181

b) Intervalo de Confianza:
̂𝟏 − 𝒑
Formulamos: 𝑷[𝒂 ≤ 𝒑𝟏 − 𝒑𝟐 ≤ 𝒃] = 𝟏 − 𝜶 ; siendo: Parámetro: 𝒑𝟏 − 𝒑𝟐 y Estimador: 𝒑 ̂𝟐

Formulamos ahora la Función Pivotal:


(𝒑̂ 𝟏 − 𝒑̂ 𝟐 ) − (𝒑𝟏 − 𝒑𝟐 )
𝒁= ↝ 𝑨𝒑𝒓𝒐𝒙. 𝑵(𝟎, 𝟏)
𝒑 (𝟏 − 𝒑𝟏 ) 𝒑𝟐 (𝟏 − 𝒑𝟐 )
√ 𝟏 +
𝒏𝟏 𝒏𝟐

Dado que α = 0.02, entonces al hallar el valor de z, tenemos:

Y, con esto ya podemos formular nuestros límites de confianza:


𝒑
̂ (𝟏 − 𝒑
̂ ) 𝒑
𝟏 + 𝟐 (𝟏 − 𝒑𝟐 ) = (0.289 − 0.365) − (2.33)√0.289(0.711) + 0.365(1 − 0.365) = −0.199
̂ ̂
𝒂 = (𝒑 ̂ 𝟐 ) − 𝒛√ 𝟏
̂𝟏 − 𝒑
𝒏𝟏 𝒏𝟐 135 181

𝒑
̂ (𝟏 − 𝒑
̂ ) 𝒑
𝟏 + 𝟐 (𝟏 − 𝒑𝟐 ) = (0.289 − 0.365) + (2.33)√0.289(0.711) + 0.365(1 − 0.365) = 0.047
̂ ̂
𝒃 = (𝒑 ̂ 𝟐 ) + 𝒛√ 𝟏
̂𝟏 − 𝒑
𝒏𝟏 𝒏𝟐 135 181

̂𝟏 − 𝒑
Finalmente, el intervalo de confianza al 98% de confianza es: −0.199 ≤ 𝒑 ̂ 𝟐 ≤ 0.047

c) Prueba de Hipótesis:
Planteamos las hipótesis teniendo en cuanta lo afirmado por el grupo de estudio:
- H0: 𝒑𝟏 = 𝒑𝟐
- H1: 𝒑𝟏 < 𝒑𝟐

Ahora, formulamos la Función Pivotal:

~ 24 ~
(𝒑̂ 𝟏 − 𝒑̂ 𝟐 ) − (𝒑𝟏 − 𝒑𝟐 )
𝒁= ↝ 𝑨𝒑𝒓𝒐𝒙. 𝑵(𝟎, 𝟏)
𝒑 (𝟏 − 𝒑𝟏 ) 𝒑𝟐 (𝟏 − 𝒑𝟐 )
√ 𝟏 +
𝒏𝟏 𝒏𝟐
Asumiendo que H0 es verdadera, tenemos que: 𝒑𝟏 = 𝒑𝟐 .
̂ 𝟏 + 𝒏𝟐 𝒑
𝒏𝟏 𝒑 ̂𝟐 𝟑𝟗 + 𝟔𝟔
̂=
⇒ 𝒑𝟏 = 𝒑𝟐 = 𝒑 ⇒ 𝒑 = ̂ = 𝟎. 𝟑𝟑𝟐
⇒𝒑=𝒑
𝒏𝟏 + 𝒏𝟐 𝟏𝟑𝟓 + 𝟏𝟖𝟏

Con estos valores, procedemos a hallar un Z0:

(𝒑̂ 𝟏 − 𝒑̂ 𝟐 ) (𝒑̂ 𝟏 − 𝒑̂ 𝟐 ) (0.289 − 0.365)


𝑍0 = = = = −1.435
̂(𝟏 − 𝒑
𝒑 ̂) 𝒑̂(𝟏 − 𝒑
̂) 𝟏 𝟏
√ + √𝒑(𝟏 − 𝒑) ( + ) √(0.332)(0.668) ( 1 + 1 )
𝒏𝟏 𝒏𝟐 𝒏𝟏 𝒏𝟐 135 181

Especificamos ahora el nivel de significación: Siendo α = 0.01

Ahora, establecemos la Región Crítica o de Rechazo (RR) y la Región de Aceptación (RA):

𝑍0 = −1.435

Y, finalmente, podemos realizar la Toma de decisión:

Dado que Z0 = -1.435 > -2.33 → Z0 ∈ RA. Entonces Aceptamos H0.

Por lo tanto, podemos concluir que no es correcta la afirmación del grupo de estudios, por el contrario, ya
que la diferencia entre las proporciones de estudiantes a favor de un aporte obligatorio entre las facultades
de Química y Administración no es significativa, con un nivel de confianza de 99%; por lo que, sería igual
de factible el establecerlo en cualquiera de estas.

~ 25 ~
e) Prueba Ji-Cuadrado de la bondad de ajuste:
Se realizó una encuesta a 135 estudiantes de la Facultad de Química para conocer cuál era el importe de su
presupuesto mensual. Los resultados fueron los siguientes:

PRESUPUESTO MENSUAL – FACULTAD DE QUÍMICA


400 250 1500 500 360
500 600 350 450 300
210 200 1500 300 72
1800 350 250 300 270
200 180 300 800 480
870 500 300 320 300
300 160 100 400 70
160 250 500 800 300
1000 300 360 360 144
260 200 400 900 850
200 100 900 700 400
156 1400 300 1000 250
260 200 250 250 120
250 450 400 300 250
800 300 60 150 130
500 320 450 900 420
250 2500 280 240 700
200 1400 400 300 200
350 140 700 300 300
200 400 350 150 300
300 450 150 750 200
100 1000 200 250 1200
200 480 80 320 200
130 300 450 320 1200
200 250 210 250 1000
500 400 280 200 300
200 350 380 500 100

¿Se puede concluir, con el nivel de significación del 1%, que los presupuestos mensuales se ajustan a una
distribución normal?

~ 26 ~
Solución:

Sea X la variable que denota el presupuesto mensual. Como deseamos saber si la distribución de los
datos es normal con media µ y varianza 𝜎 2 , debemos estimar primero estos parámetros, sabiendo que
la estimación puntual de µ es 𝑥̅ y de 𝜎 es 𝑠̂ :

De los datos, se obtiene: 𝑥̅ = 427.79 𝑦 𝑠̂ = 370.918

Ahora, construiremos una Tabla de frecuencias esperadas. Para esto, tenemos que las frecuencias
esperadas en cada intervalo son: 𝑒𝑖 = 𝑛𝑝𝑖 = 135𝑝𝑖
𝐿𝑖 −𝜇 𝑈𝑖 −𝜇
𝑆𝑖𝑒𝑛𝑑𝑜 𝑝𝑖 = 𝑃[𝐿𝑖 ≤ 𝑋 < 𝑈𝑖 ] = 𝑃 [ ≤𝑍< ], donde Li y Ui son los límites inferior y superior del
𝜎 𝜎
intervalo, respectivamente.

Así, si construimos la siguiente tabla de frecuencias observadas (Oi) y esperadas (𝑒𝑖 ), tendremos:

Intervalos Frecuencias Oi 𝒑𝒊 𝒆𝒊 = 𝒏𝒑𝒊 = 𝟏𝟑𝟓𝒑𝒊


[60 – 200> 35 35 0.10984 14.83
[200 – 400> 60 60 0.19719 26.62
[400 – 600> 16 16 0.20912 28.23
[600 – 800> 7 7 0.1641 22.15
[800 – 1000> 9 9 0.09688 13.08
[1000 – 2500] 8 8 0.06178 8.34
Total 135 135

Cálculo de 𝒑𝒊 : En el primer intervalo (i =1) se tiene:

𝑝1 = 𝑃⌈60 ≤ 𝑋 < 200⌉


60 − 427.79 200 − 427.79
𝑝𝟏 = 𝑃 ⌈ ≤𝑍< ⌉
370.918 370.918
𝑝1 = 𝑃⌈−0.99 ≤ 𝑍 < −0.61⌉ = 0.10984

Y así análogamente para cada intervalo.

Procedemos ahora a plantear las hipótesis:


- H0: La distribución de los datos se ajusta a una distribución normal.
- H1: La distribución de los datos no se ajusta a una distribución normal.

Formulamos la Función Pivotal:

𝑘
(𝑜𝑖 − 𝑒𝑖 )2 2
𝒬= ∑ ↝ 𝑋(k−m−1) ; 𝑺𝒊𝒆𝒏𝒅𝒐 𝒌: 𝒏𝒓𝒐 𝒅𝒆 𝒄𝒍𝒂𝒔𝒆𝒔; 𝒎: 𝒏𝒓𝒐 𝒅𝒆 𝒑𝒂𝒓á𝒎𝒆𝒕𝒓𝒐𝒔 𝒂 𝒆𝒔𝒕𝒊𝒎𝒂𝒓
𝑒𝑖
𝑖=1

Con los datos de la tabla anterior, procedemos con el Cálculo de Q:

(𝑜𝑖 −𝑒𝑖 )2 (35−14.83)2 (60−26.62)2 (8−8.34)2


𝒬 = ∑𝑘𝑖=1 = + + ⋯+ =86.24
𝑒𝑖 14.83 26.62 8.34

~ 27 ~
Veamos ahora el Nivel de significancia: α = 0.01, además k= 6 y m = 2
2
⇒ P(𝑋(k−m−1) > 𝑋) = P(𝑋32 > 𝑋) = 0,01
∴ 𝑋 = 11.3
Determinamos ahora la Región Crítica o de Rechazo (RR) y la Región de Aceptación (RA):

Y finalmente, procedemos con la Toma de decisión:

Ya que: Q = 86.24 > 11.3 , entonces Q ∈ RR. De ahí que rechazamos H0.

Por lo tanto, podemos concluir que los datos recopilados acerca de los presupuestos mensuales de los
estudiantes de la Facultad de Química no se ajustan a una distribución normal

~ 28 ~
f) Prueba de Independencia:
Se realiza una investigación en la facultad de Administración, la cual busca determinar si existe algún tipo de
relación entre la disponibilidad a invertir por parte de los alumnos en esa facultad, y el género al cuál
pertenecen. Con un nivel de significancia del 5%, ¿se puede afirmar estadísticamente que dicha relación
entre ambas variables existe?

¿ESTARÍAS DISPUESTO A
INVERTIR PARA QUE TU
FACULTAD MEJORE? Total
SI NO
MASCULINO 59 37 96
GÉNERO
FEMENINO 55 30 85
Total 114 67 181

Solución:

1. Planteamiento de las hipótesis:


- H0: La disponibilidad a invertir y el género son variables independientes, no poseen relación alguna
- H1: Sí existe relación entre el género y la disponibilidad a invertir, no son independientes.

2. Función Pivotal:
𝑘
(𝑜𝑖 − 𝑒𝑖 )2 2
𝒬= ∑ ↝ 𝑋(F−1)(C−1)
𝑒𝑖
𝑖=1
Siendo:
- F = Número de filas
- C = Número de columnas

3. Nivel de significancia: Como 𝛼 = 5%; además F = 2 y C = 2


2
⇒ P(𝑋(F−1)(C−1) > 𝑋) = P(𝑋12 > 𝑋) = 0,05
∴ 𝑋 = 3.84
4. Tabla de Frecuencias Esperadas:
Para completar la tabla de frecuencias esperadas, solo seguimos el siguiente procedimiento:
Para el primer valor:
114 114 67
𝑥1,1 = (181) 96 = 60.46 , 𝑥2,1 = (181) 85 = 53.54, 𝑥1,2 = (181) 96 = 35.54 ….

Y así análogamente para los demás valores, teniendo al final:

¿ESTARÍAS DISPUESTO A
INVERTIR PARA QUE TU
FACULTAD MEJORE? Total
SI NO
MASCULINO 60.46 35.54 96
GÉNERO
FEMENINO 53.54 31.46 85
Total 114 67 181

Y ya con estos valores, procedemos a hallar Q:

~ 29 ~
𝑘
(𝑜𝑖 − 𝑒𝑖 )2 (59 − 60.46)2 (55 − 53.54)2 (37 − 35.54)2 (30 − 31.46)2
Q= ∑ = + + + ⇒ 𝑄 = 0.2028
𝑒𝑖 60.46 53.54 35.54 31.46
𝑖=1

5. Región Crítica o de Rechazo (RR) y Región de Aceptación (RA):


Teniendo ya los valores del nivel de significancia y de “Q”, ya podemos establecer RR y RA:

6. Toma de decisiones:
Como: Q = 0.2028 < 3.84 → Q ∈ RA. De ahí, aceptamos Ho.

Podemos afirmar entonces que, el género y la disponibilidad a invertir son variables independientes.

~ 30 ~
g) Prueba de Homogeneidad:
Se realizó un estudio en tres facultades de la UNMSM: Química, Administración y Sociales, para conocer sus
opiniones acerca del porqué considerarían que un estudiante podría negarse a aportar o invertir en su
facultad. Una muestra aleatoria de 431 estudiantes arrojó los siguientes resultados:

FACULTADES
Total
QUÍMICA ADMINISTRACIÓN SOCIALES
Poca
disponibilidad 50 56 39 145
¿Porque de dinero
crees que las Corrupción por
personas se parte de las 62 89 53 204
podrían autoridades
negar a
aportar? Es obligación
del gobierno
19 32 11 62

Otros 4 4 12 20
Total 135 181 115 431

Con los datos recopilados, y con un nivel de significación del 1%, ¿es posible determinar si las 3 facultades
son homogéneas con respecto a sus opiniones acerca de porqué una persona se negaría a aportar?

~ 31 ~
Solución:

1. Planteamiento de las hipótesis:


- H0: Las 3 facultades son homogéneas respecto a sus opiniones acerca de la negación al aporte.
- H1: Las 3 facultades no son homogéneas respecto a sus opiniones acerca de la negación al aporte.

2. Función Pivotal:
𝑘
(𝑜𝑖 − 𝑒𝑖 )2 2
𝒬= ∑ ↝ 𝑋(F−1)(C−1)
𝑒𝑖
𝑖=1
Siendo:
- F = Número de filas
- C = Número de columnas

3. Nivel de significancia: Como 𝛼 = 1%; además F = 4 y C = 3


2
⇒ P(𝑋(F−1)(C−1) > 𝑋) = P(𝑋62 > 𝑋) = 0,01
∴ 𝑋 = 16.8
4. Tabla de Frecuencias Esperadas:
Para completar la tabla de frecuencias esperadas, solo seguimos el siguiente procedimiento:
Para el primer valor:
135 135 181
𝑥1,1 = (431) 145 = 45.42 , 𝑥2,1 = (431) 204 = 63.9, 𝑥1,2 = (431) 145 = 60.9 ….

Y así análogamente para los demás valores, teniendo al final:


FACULTADES
Total
QUÍMICA ADMINISTRACIÓN SOCIALES
Poca
disponibilidad de 𝑥1,1 =45.42 𝑥1,2 = 60.9 38.68 145
¿Porque dinero
crees que las Corrupción por
personas se parte de las 𝑥2,1 =63.9 85.67 54.43 204
podrían negar autoridades
a aportar? Es obligación
19.42 26.04 16.54 62
del gobierno
Otros 6.26 8.39 5.35 20
Total 135 181 115 431

Y ya con estos valores, procedemos a hallar Q:

~ 32 ~
𝑘
(𝑜𝑖 − 𝑒𝑖 )2 (50 − 45.42)2 (56 − 60.9)2 (39 − 38.68)2 (12 − 5.35)2
Q= ∑ = + + +⋯ + ⇒ 𝑄 = 15.689
𝑒𝑖 45.42 60.9 38.68 5.35
𝑖=1

5. Región Crítica o de Rechazo (RR) y Región de Aceptación (RA):


Teniendo ya los valores del nivel de significancia y de “Q”, ya podemos establecer RR y RA:

6. Toma de decisiones:
Como: Q = 15.689 < 16.8 → Q ∈ RA. De ahí, aceptamos Ho.

Podemos afirmar entonces que, las 3 facultades son homogéneas respecto a su opinión acerca de la negación al
aporte.

~ 33 ~
h) Análisis de Varianza:
Se realizó una encuesta por muestreo a un total 390 estudiantes de las facultades de Química, Sociales y
Biología de la UNMSM. Con un nivel de significancia del 5%, se pide probar la hipótesis de que no existen
diferencias significativas entre las 3 facultades con respecto al tiempo de estudio en promedio que los
estudiantes dedican por su cuenta. Los resultados son los siguientes:

Facultad de Química Facultad de Sociales Facultad de Biología


12 8 25 12 18 15 12 2 4 15
38 36 5 15 19 14 36 8 42 3
17 40 3 14 15 13 30 25 21 14
20 15 20 10 15 16 25 10 21 13
8 32 8 15 40 13 12 18 25 14
2 35 5 15 24 11 24 1 15
25 3 30 12 25 16 30 1 24
40 25 6 16 26 8 28 10 6
6 8 5 30 14 11 6 12 6
8 4 9 25 6 10 12 2 28
3 6 36 30 20 30 63 72 4
9 18 10 15 13 14 28 6 14
40 7 21 13 13 12 40 9 7
20 8 20 12 12 15 16 24 21
18 8 18 15 18 16 3 2 7
56 20 7 13 16 20 5 6 6
5 15 24 24 16 8 8 4 15
12 6 15 15 15 18 8 3 6
2 5 16 15 10 20 12 15 24
20 48 12 17 7 20 12 16 19
25 30 15 16 15 16 24 5 7
25 42 21 18 30 12 12 4 12
30 20 10 17 16 6 8 24 15
5 30 10 20 12 14 16 16 18
20 18 26 14 10 20 24 20 8
6 30 10 40 20 15 20 12
25 35 6 30 15 18 20 24
34 24 10 15 20 6 64 22
20 6 15 25 25 3 28 12
40 8 3 25 9 24 30 19
6 6 4 50 10 10 3 9
21 20 8 20 12 6 19 14
9 4 28 15 15 6 10 8
8 38 15 25 12 18 16 12
25 25 13 40 13 15 5 7
35 30 6 30 8 30 20 10
10 42 10 24 11 15 3 7
28 3 20 25 8 12 4 8
15 10 18 25 10 3 24 20
5 30 8 12 9 20 24 14
10 30 8 10 12 35 84 15
10 10 20 40 12 35 84 8
14 4 1 28 11 18 12 14
1 7 14 14 14 15 18 21
2 30 1 30 15 12 20 4

~ 34 ~
Solución:

a) Planteamiento de las Hipótesis:


Siendo:
𝜇1 : 𝑇𝑖𝑒𝑚𝑝𝑜 𝑑𝑒 𝑒𝑠𝑡𝑢𝑑𝑖𝑜 𝑒𝑛 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑞𝑢𝑒 𝑙𝑜𝑠 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠 𝑑𝑒 𝑄𝑢í𝑚𝑖𝑐𝑎 𝑑𝑒𝑑𝑖𝑐𝑎𝑛 𝑝𝑜𝑟 𝑠𝑢 𝑐𝑢𝑒𝑛𝑡𝑎.
𝜇2 : 𝑇𝑖𝑒𝑚𝑝𝑜 𝑑𝑒 𝑒𝑠𝑡𝑢𝑑𝑖𝑜 𝑒𝑛 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑞𝑢𝑒 𝑙𝑜𝑠 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠 𝑑𝑒 𝑆𝑜𝑐𝑖𝑎𝑙𝑒𝑠 𝑑𝑒𝑑𝑖𝑐𝑎𝑛 𝑝𝑜𝑟 𝑠𝑢 𝑐𝑢𝑒𝑛𝑡𝑎.
𝜇3 : 𝑇𝑖𝑒𝑚𝑝𝑜 𝑑𝑒 𝑒𝑠𝑡𝑢𝑑𝑖𝑜 𝑒𝑛 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑞𝑢𝑒 𝑙𝑜𝑠 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠 𝑑𝑒 𝐵𝑖𝑜𝑙𝑜𝑔í𝑎 𝑑𝑒𝑑𝑖𝑐𝑎𝑛 𝑝𝑜𝑟 𝑠𝑢 𝑐𝑢𝑒𝑛𝑡𝑎.

Podemos plantear entonces:


- H0: 𝜇1 = 𝜇2 = 𝜇3
- H1: No todas las µ son iguales.

b) Función Pivotal: Suponemos poblaciones normales y homocedásticas.


2
𝑋(𝑘−1)⁄
𝐹= 2 𝑛−1 ↝𝐹
(𝑘−1;𝑛−𝑘)
𝑋(𝑛−𝑘)⁄
𝑛−𝑘

c) Cálculos preliminares:

Química Sociales Biología Total Facultades


Total 2264 1995 2327 6586
𝒏𝒊 135 115 140 n = 390
̅𝒊
𝒙 16.77 17.35 16.62 𝑥̅ =16.8871
3

̅𝟐𝒊
𝒏𝒊 𝒙 37966.4415 34617.5875 38671.416 ∑ 𝑛𝑖 𝑥̅𝑖2 = 111255.445
𝑖=1

Además, necesitamos saber:

∑𝒌𝒊=𝟏 ∑𝒏𝒋=𝟏
𝒊
𝒙𝟐𝒊𝒋 =165162 : Suma de los cuadrados de todos los datos.

̅𝟐𝒊 = 111255.445
∑ 𝒏𝒊 𝒙
𝑖=1

̅𝟐 = 390(16.88712 ) = 111218.96
𝒏𝒙

Ahora, ya podemos calcular los siguientes valores necesarios para construir la tabla ANAVA:

𝒏
-) 𝑺𝑪𝑻 = ∑𝒌𝒊=𝟏 ∑𝒋=𝟏
𝒊
𝒙𝟐𝒊𝒋 − 𝒏𝒙
̅𝟐 = 𝟏65162 − 111218.96 ⇒ 𝑺𝑪𝑻 = 53943.04

-) 𝑺𝑪𝑪 = ∑𝟑𝒊=𝟏 𝒏𝒊 𝒙
̅𝟐𝒊 − 𝒏𝒙
̅𝟐 = 111255.445 − 111218.96 ⇒ 𝑺𝑪𝑪 = 36.485

-) 𝑺𝑪𝑬 = 𝑺𝑪𝑻 − 𝑺𝑪𝑪 = 53943 − 36.485 = 53906.555

~ 35 ~
d) Construcción de la Tabla ANOVA:

Fuente de Grados de
Suma de Cuadrados Cuadrado Medio Razón Ho
Variación Libertad
Entre
𝑺𝑪𝑪 𝑪𝑴𝑪
tratamientos 𝑺𝑪𝑪 = 36.485 k–1=2 𝑪𝑴𝑪 = = 18.2425 𝑭= = 0.131 𝜇𝐼 = 𝜇
(columnas) 𝒌−𝟏 𝑪𝑴𝑬
Dentro de los
𝑺𝑪𝑬
tratamientos 𝑺𝑪𝑬 = 𝑺𝑪𝑻 − 𝑺𝑪𝑪 =53906.555 n – k = 387 𝑪𝑴𝑬 = = 139.2934
(error) 𝒏−𝒌
Total 𝑺𝑪𝑻 = 53943.04 n – 1 = 389

De donde ya tenemos el valor de F = 0.131 que compararemos con el nivel de significancia.

e) Nivel de significancia:
Siendo α = 5% ⇒ 𝑭𝟏−𝜶(𝒌−𝟏;𝒏−𝒌) = 𝑭0.95(2;387) = 𝟑

f) Región Crítica (RR) y Región de Aceptación (RA):

F = 0.131 𝑭0.95(2;387) = 𝟑

g) Toma de decisiones:

Como F = 0.131 < 𝐹0.95(2;387) = 3 ⇒ 𝐹 ∈ 𝑅𝐴; Entonces aceptamos Ho.

Podemos concluir entonces que no existen diferencias significativas en las 3 facultades respecto al tiempo
promedio que emplean sus alumnos para estudiar por su cuenta, con un nivel de significancia de 5%.

~ 36 ~
ANEXOS

~ 37 ~
ANEXO 1: Formato de la Encuesta:

~ 38 ~
~ 39 ~
ANEXO 2: Estadísticos e Histograma – Facultad de Química; Variable: Gasto diario:

ESTADÍSTICOS
¿De cuánto es el importe de tu gasto
diario en la universidad?
N Válido 135
Perdidos 0
Media 11,92
Error estándar de la media ,506
Mediana 10,00
Moda 10
Desviación estándar 5,883
Varianza 34,613
Rango 28
Mínimo 2
Máximo 30

~ 40 ~
Anexo 3: Estadísticos e Histograma – Facultades de Química y Administración; Variable: Edad:

ESTADÍSTICOS - QUÍMICA ESTADÍSTICOS - ADMINISTRACIÓN


EDAD (Años cumplidos) EDAD (Años cumplidos)
Válido 135 Válido 181
N N
Perdidos 0 Perdidos 0
Media 21,61 Media 20,57
Error estándar de la media ,222 Error estándar de la media ,159
Mediana 21,00 Mediana 20,00
Moda 21 Moda 20
Desviación estándar 2,580 Desviación estándar 2,135
Varianza 6,656 Varianza 4,557
Rango 14 Rango 13
Mínimo 17 Mínimo 18
Máximo 31 Máximo 31

~ 41 ~
ANEXO 4: Tabla de frecuencias – Facultad de Administración; Variable: ¿Además de estudiar, trabaja?:

¿ADEMAS DE ESTUDIAR, TRABAJA?- FAC. ADMINISTRACIÓN


Porcentaje Porcentaje
Frecuencia Porcentaje
válido acumulado
Si 68 37,6 37,6 37,6
Válido No 113 62,4 62,4 100,0
Total 181 100,0 100,0

ANEXO 5: Tabla de frecuencias – Facultades de Administración y Química; Variable: ¿Consideras que el


aporte debería ser obligatorio?:

¿CONSIDERAS QUE EL APORTE DEBERÍA SER OBLIGATORIO? –


FAC. ADMINISTRACIÓN
Porcentaje Porcentaje
Frecuencia Porcentaje
válido acumulado

Si 66 36,5 36,5 36,5

Válido No 115 63,5 63,5 100,0

Total 181 100,0 100,0

¿CONSIDERAS QUE EL APORTE DEBERÍA SER OBLIGATORIO? –


FAC. QUÍMICA
Porcentaje Porcentaje
Frecuencia Porcentaje
válido acumulado

Sí 39 28,9 28,9 28,9

Válido No 96 71,1 71,1 100,0

Total 135 100,0 100,0

~ 42 ~
ANEXO 6: Tabla de frecuencias e intervalos – Facultad de Química; Variable: Presupuesto Mensual:

PRESUPUESTO MENSUAL – FAC. QUÍMICA


Porcentaje
Frecuencia Porcentaje Porcentaje válido
acumulado
Hasta 200 35 25,9 25,9 25,9
201 hasta 400 60 44,4 44,4 70,4
401 hasta 600 16 11,9 11,9 82,2
Válido 601 hasta 800 7 5,2 5,2 87,4
801 hasta 1000 9 6,7 6,7 94,1
1000 a más 8 5,9 5,9 100,0
Total 135 100,0 100,0

ANEXO 7: Tabla Cruzada para la Prueba de Independencia – Facultad de Administración:

TABLA CRUZADA: GÉNERO*¿ESTARÍAS DISPUESTO A INVERTIR


PARA QUE TU FACULTAD MEJORE? – FAC. ADMINISTRACIÓN
Recuento

¿ESTARÍAS DISPUESTO A INVERTIR


PARA QUE TU FACULTAD MEJORE? Total

Si No
Masculino 59 37 96
GÉNERO
Femenino 55 30 85
Total 114 67 181

ANEXO 8: Tablas de frecuencias para la Prueba de Homogeneidad – Facultades de Química,


Administración y Sociales:

¿PORQUE CREES QUE LAS PERSONAS SE PODRÍAN NEGAR A APORTAR? –


FAC. QUÍMICA
Porcentaje Porcentaje
Frecuencia Porcentaje
válido acumulado
Poca disponibilidad de
50 37,0 37,0 37,0
dinero
Corrupción por parte de
62 45,9 45,9 83,0
Válido las autoridades
Es obligación del gobierno 19 14,1 14,1 97,0
Otros 4 3,0 3,0 100,0
Total 135 100,0 100,0

~ 43 ~
¿POR QUÉ CREES QUE LAS PERSONAS SE NEGARÍAN A APORTAR? – FAC.
ADMINISTRACIÓN
Porcentaje Porcentaje
Frecuencia Porcentaje
válido acumulado
Poca disponibilidad de
56 30,9 30,9 30,9
dinero

Corrupción por parte de las


89 49,2 49,2 80,1
Válido autoridades de la facultad

Es obligación del gobierno 32 17,7 17,7 97,8


Otros 4 2,2 2,2 100,0
Total 181 100,0 100,0

¿POR QUÉ CREES QUE LAS PERSONAS SE PODRÍAN NEGAR A APORTAR? –


FAC. SOCIALES
Porcentaje Porcentaje
Frecuencia Porcentaje
válido acumulado
Poca disponibilidad de
39 33,9 33,9 33,9
dinero

Corrupción por parte de las


53 46,1 46,1 80,0
Válido autoridades de la facultad

Es obligación del gobierno 11 9,6 9,6 89,6


Otros 12 10,4 10,4 100,0
Total 115 100,0 100,0

ANEXO 9: Estadísticos e Histograma – Facultades de Química, Administración y Sociales; Variable: Horas de


Estudio:

ESTADÍSTICOS - QUÍMICA
¿Cuantas horas a la semana le
dedicas a estudiar por tu cuenta?
Válido 135
N
Perdidos 0
Media 16,77
Mediana 15,00
Moda 8a
Desviación estándar 11,909
Varianza 141,820
Rango 55
Mínimo 1
Máximo 56

~ 44 ~
ESTADÍSTICOS - ADMINISTRACIÓN

¿Cuantas horas a la semana le dedicas a


estudiar por tu cuenta?

Válido 181
N
Perdidos 0
Media 15,91
Mediana 14,00
Moda 20
Desviación estándar 11,715
Varianza 137,237
Rango 68
Mínimo 2
Máximo 70

ESTADÍSTICOS - SOCIALES
¿Cuántas horas a la semana dedicas a
estudiar por tu cuenta?
Válido 115
N
Perdidos 0
Media 17,35
Error estándar de la media ,740
Mediana 15,00
Moda 15
Desviación estándar 7,931
Varianza 62,895
Rango 44
Mínimo 6
Máximo 50

~ 45 ~

También podría gustarte