Está en la página 1de 28

“AÑO DEL DIÁLOGO Y RECONCILIACIÓN NACIONAL”

TRABAJO FINAL

CURSO:
ESTADÍSTICA INFERENCIAL

DOCENTE:
BOCANEGRA COLLAZOS, Robert

INTEGRANTES:
CUEVA CUEVA, Neycer Ranuldo
GUTIÉRREZ ORTIZ, Dennys Gianfranco
PRÍNCIPE MOSQUERA, Jack Robinson
TENAZOA PISFIL, Friter Agusto

Lima 10 de julio del 2018

1
ÍNDICE

Introducción 03
Objetivos 03

1. Presentación de problemas y desarrollo en base a la 03


investigación estadística inferencial
1.1 Intervalo de confianza para la media poblacional 04
1.2 Intervalo de confianza para las medias de dos poblaciones 05
1.3 Prueba de hipótesis para la media de una población 06
1.4 Prueba de hipótesis para dos medias poblacionales 07
1.5 Intervalo de confianza para la proporción de una población 09
1.6 Intervalo de confianza para las proporciones de dos poblaciones 11
1.7 Prueba de hipótesis para la proporción de una población 13
1.8 Intervalo de confianza para la diferencia de dos medias con varianza desconocida 15
1.9 Intervalo de confianza para la razón de dos varianzas poblacionales 18
1.10 Prueba de hipótesis para la varianza de una población 20
1.11 Prueba de hipótesis para la media de una población con varianza desconocida 22
1.12 Prueba de bondad de ajuste 23
1.13 Prueba de independencia 26
2. Conclusiones .28
3. Bibliografía 28

2
INTRODUCCIÓN
Se utilizará la estadística inferencial y los conocimientos desarrollados en clase para
deducir(inferir) propiedades, características y cualidades de la población en estudio a parir
de una muestra significativa de 50 estudiantes universitarios de la sede Lima Norte
(Universidad Tecnológica Del Perú). De esta manera se describe una primera etapa que
consiste en el análisis y recolección de información. Esto se dará utilizando un sistema de
encuestas por los ambientes de la universidad. Posteriormente se procedió a ordenar la
información en tablas de frecuencia para ordenar la información, analizar las respuestas de
cada encuestado, aplicar la estadística inferencial a los datos y elaborar una conclusión con
los resultados.

OBJETIVOS

Identificar a través de la estadística inferencial las probabilidades de situaciones relacionadas


con el entorno del estudiante universitario, así como su carrera horas de estudio, si guardan
relación con las otras carreras universitarias, así como también poner en practica nuestros
conocimientos aprendidos y desarrollados con clase con la ayuda de nuestro docente

3
1. PRESENTACIÓN DE PROBLEMAS Y DESARROLLO EN BASE A LA
INVESTIGACIÓN ESTADÍSTICA INFERENCIAL

1.1 INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL


Se ha realizado una encuesta a 50 alumnos para saber cuál era su promedio ponderado. El
resultado muestra que solo 36 alumnos aprobaron con un promedio mayor a 14, con una
desviación estándar de 1.85. Obtenga el intervalo de confianza de las notas para la media de
alumnos aprobados con notas a partir de 15 con un nivel de confianza de 95%.

Desarrollo:
Población Muestra
μ =? n= 36
σ = 1.85 𝑥̅= 15.6

confianza:
1 – α = 0.95 α = 0.05 α /2 = 0.025
Z 0.025 = - 1.96
15.6 – 1.96 x1.85/√36 ≤μ≤ 15.6 + 1.96 x1.85/√36
IC = 14.99 < μ < 16.20

INTERPRETACIÓN:
El promedio de los estudiantes con un 95 % de confianza se encuentran entre 14.99 a
16.20.

4
1.2 INTERVALO DE CONFIANZA PARA LAS MEDIAS DE DOS POBLACIONES
Se tiene dos muestras de las horas de estudio semanal de los alumnos del turno mañana y
tarde de la UTP, la primera muestra tiene una media de 18.2 y varianza poblacional de 256 y
la segunda tiene un media de 16.4 y varianza poblacional de 225. Hallar la diferencia de
medias entre las horas de estudio de los alumnos del turno mañana y tarde. Considere un
intervalo de confianza al 98% para esta diferencia.

Desarrollo

Confianza (1-α) = 98%

Riesgo (α) = 2%

α= 2% = 0,02

Z 0.01 = 2.33

256 256
(18.2 − 16.4) − 2.33 𝑥 √ 5𝑂 ≤ 𝜇1 − 𝜇2 ≤ (18.2 − 16.4) + 2.33 𝑥 √ 5𝑂 -

5.423 ≤ μ1-μ2 ≤9.023

=0.01

= 2.33

INTERPRETACIÓN:
Con un 98% de intervalo de confianza la diferencia de medias de horas de estudio se
encuentra en un rango de -5.432 y 9.023.

5
1.3 PRUEBA DE HIPÓTESIS PARA LA MEDIA DE UNA POBLACIÓN
Se analiza las horas de estudio semanal de los alumnos del tarde de la UTP. Se escoge dos
muestras aleatorias independientes de 50 alumnos. Al final de la encuesta, resultó una media
de 18.2 horas y desviación estándar de 16 horas para el turno mañana. Esta presenta una
varianza de 256. ¿Muestran los datos suficiente evidencia para decir que las horas de estudio
han cambiado? Use un nivel de significancia del 5%.

Desarrollo:

a. Planteo de hipótesis
𝐻0 : 𝜇 = 18.2 ℎ𝑜𝑟𝑎𝑠
𝐻𝑎 : 𝜇 ≠ 18.2 ℎ𝑜𝑟𝑎𝑠
b. Nivel de significancia
α=0.05
c. Estadístico de prueba
(𝑥̅ − 𝑢)
𝑧=
𝜎/√𝑛
d. Región critica

e. Calculo de estadístico de prueba


(18.2 − 16)
𝑧= = 0.97 𝑐𝑎𝑒 𝑒𝑛 𝑧𝑜𝑛𝑎 𝑑𝑒 𝑎𝑐𝑒𝑝𝑡𝑎𝑐𝑖𝑜𝑛
√256
50
f. Conclusión
Aceptamos la nula.

g. interpretación:
Es decir, con un nivel de significancia del 5% se demuestra que los alumnos del turno
mañana estudian 18.2 horas y que las horas de estudio no han cambiado

6
1.4 PRUEBA DE HIPOTESIS PARA DOS MEDIAS POBLACIONALES

Se analiza las horas de estudio semanal de los alumnos del turno mañana y tarde de la UTP.
Se escoge dos muestras aleatorias independientes de 50 alumnos. Al final de la encuesta,
resultó las medias 16.4 y 18.2 para el turno tarde y mañana respectivamente. Ambas
poblaciones presentan varianzas de 256 para los de la mañana y 225 para el turno tarde. Con
un nivel de significancia del 5%. ¿Demuestran estos resultados evidencia confiable para
indicar que los alumnos del turno mañana estudian las mismas horas que los de la tarde?

turno tarde:
15 10 2 12 5 5 9 25 5 6
Desarrollo
6 28 48 8 10 5 24 14 4 28
3 50 9 5 12 1 0 30 8 35 T. MAÑANA T. TARDE
50 8 4 24 24 7 18 14 18 8
15 30 25 3 18 2 25 17 20 30 𝑛1=50 𝑛2=50
𝑥̅1 = 18.2 𝑥̅2 = 16.4

turno mañana: 𝜎1 2 = 256 𝜎2 2 = 225

10 20 6 18 40 17 10 30 4 18
0 15 26 30 19 13 2 26 45 30 a. Planteo de hipótesis
14 14 15 24 9 7 10 14 33 25
44 19 18 22 16 10 11 12 4 20 𝐻0 : 𝜇1 = 𝜇2
30 15 18 3 4 28 12 25 26 31 𝐻𝑎 : 𝜇1 ≠ 𝜇2

d. Región critica b. Nivel de significancia

α = 0.05

c. Estadístico de prueba

𝑥1 − 𝑥
(̅ ̅2 ) − (𝜇1 − 𝜇2 )
𝑧=
𝜎1 2 𝜎1 2

𝑛1 + 𝑛2
e. Calculo del estadístico de prueba
(18.2 − 16.4) − (0)
𝑧= = 0.58 … 𝑐𝑎𝑒 𝑒𝑛 𝑧𝑜𝑛𝑎 𝑑𝑒 𝑎𝑐𝑒𝑝𝑡𝑎𝑐𝑖𝑜𝑛
d.
√256 + 225
50 50
f. Conclusión
Aceptamos la nula
g. Interpretación
Es decir, con un nivel de significancia del 5% se demuestra que los alumnos del
turno mañana estudian las mismas horas que los del turno tarde.

7
El director de la UTP está seguro de que los alumnos de la mañana aspiran a un mayor sueldo
que los del turno tarde una vez que egresen. Se toman dos muestras aleatorias; la muestra 1
corresponde a los alumnos del turno mañana y la muestra 2 a los de la tarde. De esto se sabe
que la desviación estándar del sueldo es 12 soles para el turno mañana y 13 para la tarde. Se
toman 50 alumnos con la muestra 1 y otros 50 con la muestra 2. ¿A qué conclusión puede
llegar el director de la universidad sobre la aspiración de sueldo de los alumnos, al nivel de
significancia 0,01?

turno mañana:
2000 3000 1800 2000 2500 2000 4000 1000 4500 600
5000 3000 2500 2000 4300 2000 2300 2500 1200 5000
5000 3000 3000 1200 5000 2200 2200 2900 2000 2100
1500 3000 2000 3000 3000 2000 4000 1500 2500 5000
3000 2000 5000 5000 1400 2000 5000 5000 5000 4000

turno tarde:
2900 2800 3700 1300 2900 2200 2900 2800 2800 3200
3100 2900 2700 3200 4200 1000 3000 2600 2500 2800
5000 3000 4000 1800 3700 3000 2900 5000 2900 2700
3200 1000 2000 3500 3000 3000 3100 3000 3000 3000
3100 3000 3300 2500 3600 3000 2700 3000 3000 3000

Desarrollo d. Región critica


T. MAÑANA T. TARDE
𝑛1=50 𝑛2=50
α=0.01
𝑥̅1 = 2934 𝑥̅2 = 2950
𝜎1 2 = 144 𝜎2 2 = 169
Z=2.33
a. Planteo de hipótesis
e. Calculo del estadístico de prueba
(2934 − 2950) − (0)
𝐻0 : 𝜇1≤ 𝜇2 𝑧= = −6.39 𝑐𝑎𝑒 𝑧. 𝐴
𝐻𝑎 : 𝜇1 > 𝜇2 √144 + 169
50 50

b. Nivel de significancia: α=0.01 f. Conclusión

Aceptamos la nula
c. Estadístico de prueba
g. Interpretación
𝑥1 − ̅
(̅ 𝑥2 ) − (𝜇1 − 𝜇2 )
𝑧= Es decir, el director no estaba en lo correcto,
𝜎2 𝜎2
√ 1 + 1 ya que el resultado muestra que los
𝑛1 𝑛2
estudiantes del turno mañana aspiran a
ganar un sueldo igual o menor que los del
turno tarde, pero no mayor.
8
1.5 INTERVALO DE CONFIANZA PARA LA PROPORCIÓN DE UNA POBLACIÓN
En una encuesta realizada en la Universidad Tecnológica del Perú sede Norte, para dar su
último promedio ponderado se utilizó una muestra aleatoria de 50 alumnos. Si el informe
muestra que solo 36 alumnos aprobaron con un promedio a partir de 15. Obtenga el intervalo
de confianza del porcentaje de alumnos aprobados con notas a partir de 15 con un nivel de
confianza de 95%.

16 13 15 15 14.5 15 16 18 15.3 14
16 16 18 15 19 16.5 16.75 14.3 14 15
17 14 15 17.6 16 17 14 17 15.6 15
19 16 17 15 15 18 14 16 16 17
15.5 14 14 13 12 16 12 14 20 18

Desarrollo

Datos: n=50

significancia α=5%=0.05

36 𝑝(1 − 𝑝)
𝑝= = 0.72 𝑃(𝑝) = 𝑝 ± 𝑍∝/2 . √
50 𝑛

0.72(1 − 0.72)
𝑃(𝑝) = 0.72 ± 1.96. √ 𝑃(𝑝) = 0.72 ± 0.124
50

Es decir:

0.596 ≤ 𝑃(𝑝) ≤ 0.844

interpretación:

Con un nivel de confianza del 95%, el porcentaje de alumnos aprobados con notas a partir
de 15 se ubica en el intervalo de 0.596 y 0.844.

9
Se requiere obtener la información de los montos de las pensiones de los alumnos de la UTP.
Tomando al azar una muestra de 50 estudiantes, se encontró que 13 de ellos tenían una
pensión mensual menor a 600. Calcular con un nivel de confianza del 90%, el intervalo en el
que se encuentra la verdadera proporción de alumnos con esa pensión.

400 460 480 720 760 750 660 630 500 433
560 660 570 760 580 720 600 650 620 600
510 650 520 720 530 750 550 660 530 660
610 650 660 680 650 680 660 680 610 630
650 620 699 680 620 627 680 660 650 620

Desarrollo

Datos:

n=50

α=10%=0.1

13 𝑝(1 − 𝑝)
𝑝= = 0.26 𝑃(𝑝) = 𝑝 ± 𝑍∝/2 . √
50 𝑛

0.26(1 − 0.26)
𝑃(𝑝) = 0.26 ± 1.64. √ 𝑃(𝑝) = 0.26 ± 0.102
50

Es decir:

0.158 ≤ 𝑃(𝑝) ≤ 0.362

INTERPRETACIÓN:

Con un nivel de confianza del 90%, la proporción de alumnos, los cuales tienen una
pensión menor a 600 soles se encuentra en el intervalo entre 15.8% y 36.2%.

10
1.6 INTERVALO DE CONFIANZA PARA LAS PROPORCIONES DE DOS POBLACIONES

En la UTP se actualizó el plan de estudio, y con ello el decano afirman que varios de los
estudiantes les satisface esta actualización. Se escoge una muestra de 50 alumnos de
pregrado, a los cuales se les acaba de encuestar en un intervalo de tiempo de las 9 de la
mañana y las 5 de la tarde; acerca de la actualización del plan de estudios y si se encuentran
satisfechos o insatisfechos. Siendo estos 18 y 22 individuos respectivamente. Con un
intervalo de confianza del 98% ¿podemos inferir que el decano tiene razón?

Desarrollo
satisfecho insatisfecho
n1 = 50 n2 = 50
𝑥̅1 = 18 𝑥̅2 = 22
P1= 18/50=0.36 P2=0.44

Nivel de significancia

α = 0.98 => 1- α = 0.02


Nos piden: P1 - P2 > 0

𝑃1(1−𝑃1) 𝑃2(1−𝑃2)
e = 𝑧∝𝑥 √ 𝑛1
+ 𝑛2
2

e= 2.33x0.098= 0.23

(P1 - P2) +− e

-0.31 ≤ 𝜋1 − 𝜋2 ≤ 0.15

INTERPRETACIÓN:
Con una confianza del 98% podemos negar lo que dijo el decano, ya que en el intervalo
se encuentra el 0 significa que 𝜋1 − 𝜋2 = 0 ; indicando esto que el número de satisfechos
e insatisfechos son iguales.

11
En una encuesta para la mejora en los métodos de estudio de los estudiantes de la UTP, se
debate entre el uso de internet y el uso de libros, puesto que advierten que se está perdiendo
la costumbre del uso de libros. Se encuestó a 50 alumnos elegidos aleatoriamente. Las
muestras revelan que 37 están con el uso del internet y 11 con los libros. Con una confianza
del 95% para la diferencia de proporciones de los estudiantes ¿se puede afirmar la advertencia
propuesta?
Desarrollo

internet Libros
n1=50 n2=50
𝑥 = 37 𝑦 = 11
P1 = 0.74 P2 = 0.22

Nivel de significancia
α = 0.95 => 1 - α = 0.05
Nos piden: P1 > P2

𝑃1(1−𝑃1) 𝑃2(1−𝑃2)
e = 𝑧∝𝑥 √ +
2 𝑛1 𝑛2

e= 0.17
+
(P1 – P2) − e

0.52 ≤ 𝜋1 − 𝜋2 ≤ 0.69
INTERPRETACIÓN:
Con una confianza del 95% se afirma la advertencia propuesta, ya que el intervalo no toma
a cero, no podemos decir que sean iguales, y como podemos observar los valores son
positivos, los cuales indican que P1 > P2.

12
1.7 PRUEBA DE HIPÓTESIS PARA LA PROPORCIÓN DE UNA POBLACIÓN

Se está realizando una investigación sobre los métodos de estudio de los estudiantes para
mejorar su desempeño académico. Se ha tomado una muestra de 50 estudiantes de la
Universidad Tecnológica del Perú y se ha encontrado que 37 de ellos prefieren el uso del
internet. Contrastar la hipótesis de que el porcentaje de jóvenes que usan el internet como
medio de mejora en su desempeño es diferente de 40% utilizando α=0,01.

Desarrollo

DATOS:
37
n = 50 π = 0.4 x = 37 P = 50 = 0.74

a. Planteo de hipótesis
𝐻𝑜 : π = 0.4
𝐻𝑎 : π ≠ 0.4
b. Nivel de significancia
α = 0.01
c. Estadístico de prueba
𝑃−𝜋
𝑍=
√𝜋(1 − 𝜋)
𝑛

d. Región critica

e. Calculo del estadístico de prueba

0.74 − 0.4
𝑍= = 4.91
√ 0.4(1 − 0.4)
50
f. Interpretación
Con una significancia del 1% podemos concluir que la cantidad de alumnos que usas
el internet como método de mejora para su desempeño difiere del 40%

13
En una reciente encuesta dirigidas a los alumnos de la UTP, acerca de cuan frecuente retiran
libros de la biblioteca. En una investigación a 50 alumnos de la universidad, se encontró que
16 de estos alumnos sacan solo un libro por mes. Por ello, ¿Puede concluirse en el nivel de
significancia 0,02, que el uso de los libros en la universidad es menos del 10%?

Desarrollo

DATOS:
16
n = 50 π = 0.1 x = 16 P = 50 = 0.32

a. Planteo de hipótesis
𝐻𝑜 : π ≥ 0.1
𝐻𝑎 : π < 0.1
b. Nivel de significancia
α = 0.02
c. Estadístico de prueba
𝑃−𝜋
𝑍=
√𝜋(1 − 𝜋)
𝑛
d. . Región crítica

e. Cálculo del estadístico de prueba


0.32 − 0.1
𝑍= = 5.18
√0.1(1 − 0.1)
50
f. Toma de decisión
Cae en zona de aceptación y con una significancia del 2%, con lo cual se acepta la
nula, indicando así que el uso de los libros en la universidad es mayor al 10 %

14
1.8 INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE DOS MEDIAS
CON VARIANZA DESCONOCIDA
Un profesor de la UTP quiere determinar si existe diferencia entre el promedio de horas que
estudian los alumnos del turno tarde y los del turno mañana. Para ello se recogió dos muestras
al azar de 50 alumnos del turno mañana y 50 alumnos del turno mañana con media de 16.64
y 18 respectivamente. Se desea estimar la diferencia de medias sabiendo que las varianzas
172.64 y 176.5. Considere un intervalo de confianza de 95%.

Desarrollo

Turno tarde Turno mañana


𝑥̅1 = 16.64 𝑥̅1 = 18
𝜎1 2 = 172.64 𝜎2 2 = 176.5
n=50 n=50

Nivel de confianza

Confianza: 1 –α= 0.95 α= 0.05α/2 = 0.025 𝑧0.025 = -1.96

176.5 172.64 176.5 172.64


IC: 1.36-1.96x√ + < (𝜇1 − 𝜇2 )<1.36+1.96x√ +
5𝑂 5𝑂 5𝑂 5𝑂

IC: -3.82< (𝜇1 − 𝜇2 ) <6.54

15
La UTP afirma que el promedio de pensiones del turno noche es superado en 60 soles por el
promedio de pensiones del turno mañana. Una muestra aleatoria de 50 alumnos del turno
noche tienen una media de 587.44 soles y una muestra aleatoria de 50 alumnos del turno
mañana tiene una media de 620 soles. Se sabe que las dos poblaciones tienen varianza
conocida de 9200 y 9600 respectivamente. Utilizando un intervalo de confianza de 96% para
la diferencia de medias. ¿Es válida la afirmación de la UTP?
Desarrollo
Turno noche Turno mañana
𝑥̅1 = 587.44 𝑥̅ 2 = 620
𝜎1 2 = 9200 𝜎2 2 = 9600
𝑛 = 50 𝑛 = 50

Nivel de significancia
Confianza: 1 –α= 0.98 ∝= 0.02

∝/2 = 0.01

𝑍0.01 = -2.33

6760 6800 6760 6800


IC: (628-587.44)-2.33x√ + < (𝜇1 − 𝜇2 ) < (628-587.44) + 2.33x√ +
5𝑂 5𝑂 5𝑂 5𝑂

IC: 2.19 < (𝜇1 − 𝜇2 ) < 78.93

INTERPRETACIÓN:
Podemos concluir que la afirmación de la UTP es válida.

16
PRUEBA DE HIPÓTESIS PARA LA MEDIA DE UNA POBLACIÓN CON
VARIANZA CONOCIDA

La UTP afirma que el promedio de horas semanales que los alumnos estudian es a lo máximo
15 horas con una desviación estándar de 5 horas. Si una muestra aleatoria de 50 alumnos de
la UTP da como resultado una media de 16.64 horas. Pruebe la afirmación de la UTP con un
nivel de significancia de 0.04.
Desarrollo
𝑋=16.64 S=13.15

a. Planteo de hipótesis
H0: μ ≤ 15
H1: μ > 15

b. Nivel de significancia
∝ =0.04

c. Estadístico de prueba

e. Cálculo del estadístico de prueba

d. Región crítica

16.64−15
𝑍= 10
√50
𝑍 =2.32

17
1.9 INTERVALO DE CONFIANZA PARA LA RAZÓN DE DOS VARIANZAS
POBLACIONALES
Un grupo de jóvenes desean comparar la variabilidad de libros utilizados diariamente entre
los varones y las mujeres en la biblioteca UTP. Se sabe se sabe que los libros utilizados por
varones y mujeres se distribuyen normalmente. Dos muestras aleatorias de préstamo de libros
por varones y mujeres: una de 10 días para los varones y la otra de 8 días para las mujeres
revelaron la siguiente cantidad de libros utilizados.

Muestra de varones 12 20 17 16 14 19 21 15 17 18
Muestra de mujeres 12 15 14 13 16 14 12 11
Utilice un intervalo de confianza del 95% para la razón de dos varianzas, determinar si son
iguales o no las varianzas de las dos poblaciones de libros prestados diariamente por varones
y mujeres

Desarrollo
Sea X, Y las variables aleatorias que representan la cantidad de libros utilizados por varones
y mujeres. Se supone que las distribuciones X, Y son normales.
Con α=0.05% y grado de libertad 𝑟1 = 𝑛1 − 1 = 9 𝑟2 = 𝑛2 − 1 = 7
En la tabla F se encuentran:
𝑓(1−𝛼,𝑟2 ,𝑟1 ) = 𝑓(0.975,7,9) = 4,20
1 1 1
𝑓(𝛼,𝑟,𝑟 )
= = = = 0.204
2 2 1 𝑓(1−𝛼/2,𝑟1 ,𝑟2 ) 𝑓(0.975,9,7) 4.90

α/2 =0.025
α/2 =0.025

1-α

𝑓(0.025,9,7) 𝑓(0.975,7,9)

18
De los datos de la muestra resultan:

𝑠̂12 = 7.66 𝑠̂22 = 3.07

𝜎2
Los límites de confianza del 95% para 𝜎12 inferior y superior son respectivamente:
2

𝑠̂ 21 7.66
𝑓(𝛼,𝑟 = (0.204) = 0.5090
𝑠̂ 22 2 2 ,𝑟1 ) 3.07

𝑠̂ 21 7.66
𝑓(1−𝛼/2,𝑟1,𝑟2) = (4.20) = 10.4794
𝑠̂ 22 3.07

𝜎2
Por lo tanto, el intervalo de confianza del 95% para la varianza 𝜎12 es:
2

𝜎2
0.5090 ≤𝜎12 ≤ 10.4794
2

Dado que el intervalo contiene la a la unidad, es decir:

𝜎12
= 1 ∈ [0.5090 , 10.4794]
𝜎22

Debería inferir con un nivel de confianza del 95% que las dos varianzas poblacionales
con iguales ya que contienen a 1.

19
1.10 PRUEBA DE HIPÓTESIS PARA LA VARIANZA DE UNA POBLACIÓN
La fotocopiadora de la UTP reemplazará el sistema actual de producción de fotocopias que
tiene una media de 4.5 segundos y una varianza de 0.06 segundos. Solo si el nuevo sistema
resulta más estable en variabilidad que el actual. Para tomar una decisión escogió una muestra
al azar de 10 tiempos del nuevo sistema de producción y obtuvo las siguientes mediciones en
segundos.

Nuevo tiempo 4.55 4.30 4.45 4.48 4.59 4.53 4.36 5.10 4.40 4.38

¿Se debería reemplazar el sistema actual por el nuevo? Usando un nivel de significancia de
α= 0.05 y asuma que el tiempo que utilice el nuevo sistema se distribuye según el modelo de
probabilidad normal.

Desarrollo

Sea X la variable que define a la población de tiempos empleados en el proceso de producción


de fotocopias del nuevo sistema. Se asume que esta población se distribuye según el modelo
de la población normal.

De la muestra se obtiene 𝑛 = 10 𝑠 2 = 0.0507

1: hipótesis:

Probaremos, 𝐻0 : 𝜎 2 = 0.06

contra 𝐻𝑎 : 𝜎 2 < 0.06

2: estadística y región critica:

α=0.05

1-α

2
𝑥(0.5;9) =3.33

20
Si la hipótesis nula es: 𝐻0 : 𝜎 2 = 4 es supuestamente verdadera, el estadístico de prueba es:

2
(𝑛 − 1)𝑠 2 2
𝑥 = ~𝑥 (9)
0.06

En la distribución a nivel de significación α=0.05, se obtiene el valor critico de

2 2
𝑥(𝛼;𝑛−1) = 𝑥(0.5;9) = 3.33

Por lo tanto, la región critica viene a ser:

𝑅𝐶 = {𝑋 2 (9) < 3.33}

3: Decisión:

2 (𝑛−1)𝑥𝑠2
De la muestra se obtiene 𝑥(𝑐𝑎𝑙) = = 7.065
0.06

2
Como 𝑥(𝑐𝑎𝑙) = 7.065 ∉ 𝑅𝐶 no se debería rechazar la 𝐻0 y concluimos que la varianza del
nuevo sistema es igual a la del antiguo sistema. Esto es, el nuevo sistema para fotocopias no
es más estable en variabilidad que la antigua. La fotocopiadora no debe cambiar su sistema
de producción para sus fotocopias.

La probabilidad P de la prueba es P = 𝑃[𝑋 2 (9) < 7.605] = 0.42561 > 𝛼 = 0.05 por lo que
se decide no rechazar la hipótesis nula.

21
1.11 PRUEBA DE HIPÓTESIS PARA LA MEDIA DE UNA POBLACIÓN CON
VARIANZA DESCONOCIDA

En estudios previos se ha determinado que la media de los promedios ponderados de los


jóvenes universitarios de la UTP es al menos 16. Sin embargo, los alumnos de la UTP piensan
que en realidad el promedio es más bajo y para probar su afirmación usan la siguiente
muestra:
16 13 15 15 14,5 15 16 18 15,3 14
16 16 18 15 19 16,5 16,75 14,3 14 15
17 14 15 17,6 16 17 14 17 15,6 15
19 16 17 15 15 18 14 16 16 17
15,5 14 14 13 12 16 12 14 20 18

¿Habrá suficiente muestra estadística para apoyar la afirmación de los alumnos? Justificar la
respuesta con un nivel de significancia de 5%.
Desarrollo
e. Cálculo del estadístico
X=15.64 S=1.74
15.64−16
a. Planteo de hipótesis 𝑍= 1.74 ≈-1.46
√50
H0: μ >= 16 f. Toma de decisión
H1: μ < 16

b. Nivel de significancia
α =0.05
c. Estadístico de prueba

𝑧𝑐𝑎𝑙 cae en zona de aceptación

d. Región crítica
g. interpretación:
A un nivel de significancia de 0.05, se puede
concluir que no existe suficiente evidencia
estadística para apoyar la afirmación de los
alumnos

22
1.12 PRUEBA DE BONDAD DE AJUSTE
Las horas que dedican los estudiantes de la UTP tienden a ser iguales todas las semanas.
Con una significancia de 0.05 determinar si las horas siguen una distribución uniforme.
Para cada semana se tomó una muestra de 50 alumnos.
15 10 2 12 5 5 9 25 5 6
6 28 48 8 10 5 24 14 4 28
3 50 9 5 12 1 0 30 8 35
50 8 4 24 24 7 18 14 18 8
15 30 25 3 18 2 25 17 20 30

Desarrollo:

DATOS:
N=50 G.L= K-1 = 49 Media= 782/50= 15.64
a. Planteo de hipótesis
𝑀𝑜 = 𝐿𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑑𝑒 ℎ𝑜𝑟𝑎𝑠 𝑒𝑠 𝑢𝑛𝑖𝑓𝑜𝑟𝑚𝑒 𝑟𝑒𝑠𝑝𝑒𝑐𝑡𝑜 𝑎 𝑙𝑎𝑠 𝑠𝑒𝑚𝑎𝑛𝑎𝑠.
𝑀𝑎 = 𝐿𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑑𝑒 ℎ𝑜𝑟𝑎𝑠 𝑛𝑜 𝑒𝑠 𝑢𝑛𝑖𝑓𝑜𝑟𝑚𝑒 𝑟𝑒𝑠𝑝𝑒𝑐𝑡𝑜 𝑎𝑙 𝑙𝑎𝑠 𝑠𝑒𝑚𝑎𝑛𝑎𝑠.
b. Nivel de significancia
α = 0.05
e. Cálculo del estadístico de prueba
c. Estadístico de prueba
(15 − 15.64)2 (10 − 15.64)2 (2 − 15.64)2
(𝑜−𝑒)2 𝑋2 = + + +⋯
𝑋 2 = ∑𝑖 15.64 15.64 15.64
2
𝑒 (30 − 15.64)
+
15.64
d. Región crítica
𝑋 2 = 504.0613

G.L=49 f. Toma de decisión


Cae en zona de no aceptación de la nula, por lo
tanto, se acepta la alterna. Con la cual concluimos
con 5% de significancia que la distribución de horas
por semana no es uniforme.
=66.34

23
Se elaboró una encuesta en la cual consiste en las veces que los alumnos de la UTP
sacan libros de la biblioteca en el mes de setiembre:

numero de retiros 0 1 2 3 4 5
alumnos 8 17 9 7 5 4

¿se puede ajustar los datos obtenidos a una distribución de poisson, con un nivel de
significación del 5%?
Desarrollo
a. Planteo de hipótesis
𝑀𝑜 = 𝐿𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑠𝑒 𝑎𝑗𝑢𝑠𝑡𝑎 𝑎 𝑙𝑎 𝑑𝑒 𝑝𝑜𝑖𝑠𝑠𝑜𝑛

𝑀𝑎 = 𝐿𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜 𝑠𝑒 𝑎𝑗𝑢𝑠𝑡𝑎 𝑎 𝑙𝑎 𝑑𝑒 𝑝𝑜𝑖𝑠𝑠𝑜𝑛

numero de retiros alumnos Xi*Ni P(Xi=Pi)


0 8 0 0.14660
1 17 17 0.20148
2 9 18 0.17022
3 7 21 0.17294
4 5 20 0.08301
5 4 20 0.03187
50 96

b. Nivel de significancia
α= 0.05

c. Estadístico de prueba
(𝑜 − 𝑒)2
𝑋2 = ∑
𝑒
𝑖

d. Región crítica

G.L=3

=7.815

24
e. Cálculo de la tabla esperada
∑ 𝑋∗𝑛
𝑋= 𝜆= = 96/50= 1.92
𝑛

λ =1.92
𝑃(𝑥 = 𝑘) = (1.92^k*e^- λ)/k! k=0,1,2,3,4,5
Esperado(e)= n*Pi
G.L = 5-1-1=3
numero de retiros 0 1 2 3 4 5
alumnos obsv 8 17 9 7 5 4
esperados 7.33 14.07 13.51 8.64 4.15 1.59

4 y 5 sus frecuencias son menor que 5 :

numero de retiros 0 1 2 3 4 y5
alumnos obsv 8 17 9 7 9
esperados 7.33 14.07 13.51 8.64 5.74

f. Cálculo del estadístico de prueba


(8 − 7.33)2 (17 − 14.074)2 (9 − 13.511)2 (7 − 8.647)2 (39 − 5.744)2
𝑋2 = + + + +
7.33 14.074 13.511 8.647 5.744
𝑋 2 = 195.0314

g. Conclusión:

Cae en la zona de no aceptación, por ello se acepta la alterna

h. Interpretación:

Con 0.05 de significancia que la distribución no se puede ajustar a una


distribución de poisson.

25
1.13 PRUEBA DE INDEPENDENCIA
En la universidad Tecnológica del Perú los alumnos del curso de estadística inferencial
del ciclo 2018-I queremos determinar si existe similitud entre el promedio de notas de los
estudiantes de ingeniería y la carrera de ingeniería a la cual pertenecen de nuestra sede
Lima Norte. Para ello se tomó una muestra de 50 estudiantes y se los clasifico por 2
criterios, promedio ponderado y carrera a la cual pertenecen en ingeniería. Las
frecuencias observadas se muestran registradas en la siguiente tabla.

CARRERA DE PROMEDIOS
INGENIERIA menos de 14 de 14 a 16 de 17 a 20
Ing. Civil 8 5 2
Ing. Industrial 10 6 4
Ing. Mecánica 9 4 2
¿Se puede concluir con un nivel de significancia de 0.05% que el promedio de notas es
dependiente de la carrera del estudiante universitario?

SOLUCION:

a. Planteo de hipótesis

H0: el promedio de notas de los estudiantes depende de la carrera elegida.

Ha: el promedio de notas de los estudiantes no depende de la carrera elegida.

b. Nivel de significancia

α: 0.05

c. Estadístico de prueba

(𝒐𝒊 − 𝒆𝒊 )𝟐

𝒆𝒊
𝒊

Se distribuye aproximadamente como un chi-cuadrado con grado de libertad

𝑣 = (𝑟 − 1)(𝑐 − 1) = (3 − 1)(3 − 1) = 4 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑

26
d. Región critica

nivel de significación del α: 0.05 y 4 grados de libertad el valor critico es: 𝑥0.95,4
2
=
9.49 se rechazará la hipótesis nula si el valor calculado del chi-cuadrado sea mayor a 9.49

1−𝛼

2
𝑥0.95,4 = 9.49

e. cálculos
Solo se necesita calcular las frecuencias esperadas de 4 celdas las otras frecuencias
esperadas se encuentran por sustracción debido a que la suma de frecuencias
esperadas en cualquier fila o columna debe dar el total marginal. Las frecuencias
observadas y esperadas (en paréntesis) se muestran en la siguiente tabla.

CARRERA DE PROMEDIOS
TOTAL
INGENIERIA menos de 14 de 14 a 16 de 17 a 20
Ing. Civil 8 (8.1) 5 (4.5) 2 (2.4) 15
Ing. Industrial 10 (10.8) 6 (6) 4 (3.2) 20
Ing. Mecánica 9 (8.1) 4 (4.5) 2 (2.4) 15
TOTAL 27 15 8 50

Luego

2
(𝒐𝒊 − 𝒆𝒊 )𝟐 (8 − 8.1)2 (5 − 4.5)2 (2 − 2.4)2
𝑋𝑐𝑎𝑙 =∑ = + + ⋯+
𝒆𝒊 8.1 4.5 2.4
𝒊

2
10 7 2
𝑋𝑐𝑎𝑙 = + + = 0.604
81 27 9

27
f. Decisión

2
𝑋𝑐𝑎𝑙 = 0.604

1−𝛼

2
𝑥0.95,4 = 9.49

Dado que 0.604<9.49 y cae en zona de aceptación se acepta la hipótesis nula. por
lo tanto el promedio de estudiantes dependerá de la carrera que elijan.

2 CONCLUSIONES
A través del estudio de los datos recolectados en las encuestas realizadas y llevadas
al estudio de la estadística inferencial se encontró similitudes así como en otros
diferencias entre un grupo y otro al ser estudiados. También aprendimos que nada esta
especificado hasta ponerlo a prueba en la estadística inferencial ya que puede parecer
que un grupo de estudio no guarde relación con otro pero al someterlo a la prueba de
estadística esta te da una respuesta la cual en muchos casos es diferente a lo observado
a simple vista.
3 BIBLIOGRAFIA
LEVIN, Richard y David Rubín (2010) Estadística para Administración y Economía.
7ª ed. Pearson. México. Cap.1: Introducción.1-5págs

CORDOVA, Manuel (2006) estadística inferencial. Segunda edición. Moshera S.R.L


lima-Perú

28