Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Final Estadística
Final Estadística
Final Estadística
CURSO:
ESTADISTICA INFERENCIAL
ESTUDIANTES:
2023
ÍNDICE
1. INTRODUCCIÓN
2. OBJETIVO DEL TRABAJO
3. PLANTEAMIENTO DEL PROBLEMA
4. CARACTERÍSTICA DE LA BASE DE DATOS
5. ELABORACIÓN DE TABLAS DE FRECUENCIA PARA CADA VARIABLE DE
ESTUDIO
6. MEDIDAS DE TENDENCIA CENTRAL
7. MEDIDAS DE DISPERSIÓN
8. CON LA INFORMACIÓN OBTENIDA SE DEBERÁN HACER LOS SIGUIENTES
CÁLCULOS
1. Intervalo de confianza para la media de una población
2. Intervalo de confianza para la media de dos poblaciones
3. Prueba de hipótesis para media de una población
4. Prueba de hipótesis para dos medias poblacionales
5. Intervalo de confianza para proporción de una población
6. Intervalo de confianza para proporción de dos poblaciones
7. Prueba de hipótesis para la proporción de una población
8. Prueba de hipótesis para dos medias poblacionales
9. Intervalo de confianza para la varianza de una población
RESUMEN
Este informe se centra en investigar las clases virtuales de los alumnos de las
Universidades Tecnológicas del Perú (UTP) en la sede Lima Sur durante el período de
marzo a julio de 2023, en el contexto de la nueva normalidad postpandemia. La
educación en línea ha ganado relevancia en instituciones públicas y privadas, y
comprender cómo los estudiantes se adaptan a esta modalidad es crucial. La
investigación se justifica por su importancia educativa y social, al analizar los análisis y
desafíos de las clases virtuales. Se busca mejorar el proceso de enseñanza-
aprendizaje, identificar necesidades específicas de los alumnos y aplicar fórmulas
estadísticas para obtener conclusiones sólidas. Los resultados pueden mejorar la
calidad de la educación en línea y brindar apoyo a los estudiantes, además de fomentar
la integración práctica de conocimientos estadísticos en el ámbito educativo.
ABSTRACT
This report focuses on investigating virtual classes of students from the Technological
Universities of Peru (UTP) at the Lima Sur campus during the period from March to July
2023, in the context of the post-pandemic new normal. Online education has gained
relevance in both public and private institutions, and understanding how students adapt
to this modality is crucial. The research is justified by its educational and social
significance, as it analyzes the analysis and challenges of virtual classes. The aim is to
enhance the teaching-learning process, identify specific student needs, and apply
statistical formulas to derive robust conclusions. The findings have the potential to
improve the quality of online education and provide support to students, while also
encouraging the practical integration of statistical knowledge in the educational setting.
INTRODUCCIÓN
Las clases virtuales y remotas se han vuelto un reto para el alumnado al tener que
con la presencia física del profesor y el alumnado que acompañan la educación, hay
cierto relajo al escuchar la clase desde una sala, un dormitorio e incluso en una cama
entre las sábanas. Por ello, nos hacemos las siguientes preguntas ¿Es consecuente el
alumno de la UTP al estudiar? ¿Qué grado de satisfacción tiene el alumno hacia las
clases virtuales? ¿De qué manera han afectado las clases virtuales en la educación?
3. JUSTIFICACIÓN DE LA INVESTIGACIÓN
4. OBJETIVO GENERAL
Identificar los análisis sobre las clases virtuales de los alumnos de las UTP de la sede
Lima Sur entre los meses de marzo y julio del 2023.
4.1. ¿Cuántas horas al día estudias las asignaturas de la universidad por tu cuenta?
Horas de estudio
40
37
35
35
30
25
19 20
20
16
15 13
10
7
5 3
0
[0.5-1.2> [1.2-1.9> [1.9-2.6> [2.6-3.3> [3.3-4> [4-4.7> [4.7-5.4> [5.4-6.1>
[6-8> 7 9 9 6 6
[10-12> 11 43 75 28.66666667 50
mediana 12
moda 10.90909091
mediana 12.12
25 24
20
15
10
5 3
1
0
0
[0.1-0.2> [0.2-0.3> [0.3-0.4> [0.4-0.5> [0.5-0.6> [0.6-0.7> [0.7-0.8> [0.8-0.9>
Media: 2.6
Varianza: 2.57
Cv: 61%
4.5. ¿Cuál es la velocidad de descarga de tu internet?
Media: 51.9
Varianza: 405
Desviación estándar: 20.1
Cv: 39%
x f Fi hi% Hi%
1 30 30 20 20
2 50 80 33.33333333 53.33333333
3 40 120 26.66666667 80
Media: 2.6
Varianza: 1.58
Desviación estándar: 1.26
Cv: 48%
x f Fi hi% Hi%
1 19 19 12.66666667 12.66666667
2 31 50 20.66666667 33.33333333
3 38 88 25.33333333 58.66666667
5 24 137 16 91.33333333
6 10 147 6.666666667 98
7 3 150 2 100
4.8. ¿Cuántas veces en promedio te paras de tu asiento mientras estás conectado
al zoom de clases?
4.9. ¿Cuántos cursos llevas en la universidad?
4.10. ¿Cuántas veces en promedio desbloqueas tu celular para distraerte estando
en clase?
4.11. ¿Cuál es el grado con el que captas las clases virtuales?
x fi FI hi% Hi%
x fi FI hi hi%
Ejercicio 1
Se sabe que la distribución de las horas de clase por semana sigue una distribución normal con
una desviación estándar de 3 horas. Se toma una muestra de 64 alumnos de la UTP siendo la
media de 13 horas. ¿Cuál es la probabilidad de que la media de horas de clase por semana
esté por encima de 14 horas?
n=64
u=25
σ =3
x −μ
Z=
σ
√n
14−13
Z=
3
√ 64
Z=2.667
La probabilidad de que la media de horas de clase por semana esté por encima de 26 horas es
aproximadamente 0.0038 o 0.38%.
Según la encuesta realizada a los estudiantes de la UTP arroja que el tiempo de estudio fuera
de los horarios de clase de los alumnos tiene una distribución normal, cuyo promedio es de
20.5 horas a la semana ¿Cuál es la probabilidad de que la media de una muestra de tamaño de
25 alumnos sea menor a 21 horas, sabiendo que la varianza muestral es de 8 horas?
n=25
x=21
u=20.5
S2=8
S=2.828
x−μ
T=
s
√n
21−20.5
T=
2.828
√25
T =0.884
P (t 24 < 0.884 )
Según las estadísticas demuestran que la probabilidad de que la media de la muestra sea
menor a 21 horas es de 0.8 o 80%.
Ejercicio 3
Se tiene la siguiente información sobre la asistencia de los estudiantes en un curso en línea:
n 2=64
u 2=2.5
2
σ 2=1.2
n 1=81
u 1=3
2
σ 1=1.5
u 1−u 2=0.5
x 1−x 2=1
(u ¿ ¿ 1−u 2)
Z=( x 1−x 2 )− ¿
√ σ 21 σ22
+
n1 n2
√
2 2
σ 1 σ 2
+ =0.1932
n1 n2
1−0.5
Z=
0.1932
Z=2.59
0.0048 es la probabilidad de que la media de horas de ausencia de los hombres respecto a las
mujeres sea al menos 1.
d) Distribución muestral para la diferencia de medias con varianza desconocida iguales
Ejercicio 4
Se desea calcular la probabilidad de que la media muestral de los días de estudio de los
hombres sea al menos 0.5 días mayor que la media muestral de las mujeres. Considere
varianzas poblacionales iguales.
um =3.8
uh =4.2
sm2=1.4
2
sh =1.2
n m=13
n h=15
2
s p =1.29
( x h−x m )−( uh−u m )
T=
√ s p2 (
1 1
+ )
nh nm
0.1
T=
0.43
T =0.23
gl=15+13−2
gl=26
La probabilidad de que la media muestral de los días de estudio de los hombres sea al menos
0.5 días de las mujeres es 0.25 o 25%.
Ejercicio 5
Se desea determinar si existe una diferencia significativa en los hábitos de estudio entre
mujeres y hombres en la universidad.
[ ]
2 2
S1 S2
+
n1 n2
=21.73 22
[ ] []
2 2
S21 S 22
n1 n2
+
n 1−1 n2−1
X 1 −X 2
T= =1.054
√
2 2
S1 S 2
+
n 1 n2
La probabilidad de que la media muestral de días de estudios de las mujeres sea al menos 0.5
días mayor a la media de los hombre es de 15.17%
pregunta 6
El 90% de los estudiantes utiliza sus celulares para conectarse a las clases virtuales, mientras
que el 10% restante utiliza una computadora. Se pide calcular la probabilidad de que al menos
8 de 50 estudiantes utilicen sus celulares para conectarse a las clases virtuales.
Ejercicio 7
La proporción de los estudiantes que probaron un nuevo plan de Internet identifican una
velocidad efectiva de 0.7, mientras que los planes usados actualmente son efectivos al 60%. A
una muestra aleatoria de 100 personas se les implementó el nuevo plan de internet, mientras
que el plan de internet antiguo fue utilizado en una muestra de 150.¿Cuál es la probabilidad de
observar un valor p1-p2 menor al 5%?
Solución:
Sea x los planes efectivos en el plan antiguo de un total de 150. Y los planes efectivos en el plan actual
de un total de 100
→ Y BINOMIAL(n2=100 , P 2=0,6)
P=1−P ¿
P=1−P [ Z ≤ 2.43 ]
P=1−0.9925
P=0.0075
6. INTERVALOS DE CONFIANZA
Ejercicio 8
Se toma una muestra aleatoria de 25 estudiantes y se registra el número de horas que estudian
al día. Los datos obtenidos muestran un promedio de 3.5 horas de estudio al día, con una
desviación estándar poblacional de 1.2 horas. Se quiere encontrar el intervalo de confianza del
95% para la media de horas de estudio al día de todos los estudiantes universitarios en la UTP.
n = 25
x=3.5
σ =1.2
Con un nivel de confianza de 95%,
Z α =Z 0.05 =Z(0.975)=¿ 1.96
(1− ) (1− )
2 2
z∗σ z∗σ
x− ≤u ≤ x+
√n √n
1.96∗1.2 1.96∗1.2
3.5− ≤ u ≤3.5+
√25 √25
3.0296 ≤ u≤ 3.9704
Podemos estar 95% seguros de que el verdadero promedio de horas de estudio al día se
encuentra dentro de 3.0296 a 3.9704 horas.
Ejercicio 9
T∗S T∗S
x− ≤u≤x+
√n √n
2.131∗1.2 2.131∗1.2
2.5− ≤u ≤ 2.5+
√16 √ 16
1.8607 ≤ u≤ 3.1393
Podemos estar 95% seguros de que el verdadero promedio de horas de ausencia se encuentra
dentro del intervalo de 1.8607 y 3.1393 horas.
Ejercicio 10
Al realizar una muestra de 120 estudiantes universitarios de la UTP Lima Sur, donde se
requiere determinar cuántas horas están conectados en las clases virtuales, se obtiene como
resultado una media de 4.3 horas con desviación estándar de 1.01. Luego, se procede a
calcular un intervalo de confianza del 95% que determine el verdadero valor de la cantidad de
horas que pasan los estudiantes en las clases virtuales.
N=120
=4,3S
=1,011-X=0,95
X=0,05
dividiendo la desviación estándar muestral (s) por la raíz cuadrada de la muestra (n).
SE = s / √n
SE = 1.01 / √120
SE ≈ 0.0924
Margen de error = z * SE
Interpretación: Podemos estar 95% seguros de que el promedio de horas que pasan los
estudiantes de la UTP Lima Sur en las clases virtuales se encuentra en el intervalo de (4.1189,
4.4811) horas
Ejercicio 11
Supongamos que deseamos encontrar un intervalo de confianza del 90% para la media de
horas que los alumnos de la UTP se ausentan en sus clases virtuales que en promedio es de 2
horas.
S
x±T 0.1 ×
(1−
2
,20−1) √n
1.2
2.5 ±T ( 0.95,19) ×
√ 20
1.2
2.5 ±1.729 ×
√ 20
2.036 ≤ u≤ 2.96
Con una confianza de 90% el promedio de horas estará entre 2.036 a 2.96.
Ejercicio 12
Al realizar una muestra de 120 estudiantes universitarios de la UTP Lima Sur, donde se
requiere determinar en qué ciclo de la universidad se encuentran, se obtiene como resultado
una media de 5.6 con una desviación estándar de 2.54. Luego, se procede a calcular un
intervalo desconfianza del 95% que determine en qué ciclo se encuentran los estudiantes
universitarios
Se calcula dividiendo la desviación estándar muestral (s) por la raíz cuadrada de (n).
SE = s / √n
SE = 2.54 / √120
SE ≈ 2.54 / 10.954 ≈ 0.2318
Margen de error = z * SE
Margen de error ≈ 1.96 * 0.2318
Margen de error ≈ 0.4541
Interpretación: Podemos estar 95% seguros de que la media real del ciclo en el que se
encuentran los estudiantes universitarios de la UTP Arequipa se encuentra en el intervalo de
(5.1459, 6.0541).
Ejercicio 13
df = n1 + n2 - 2
df = 120 + 120 - 2 = 238
Interpretación: Podemos estar 95% seguros de que la diferencia entre las horas medias que
realizan los estudiantes universitarios en las clases virtuales entre ambas muestras se
encuentra en el intervalo de (0.9199, 1.0801) horas.
Ejercicio 14
Grupo A: 3, 2, 1, 4, 2, 3
Grupo B: 2, 1, 2, 3, 2, 4
Encuentra un intervalo de confianza del 95% para la diferencia de las medias de ausencias en
clases virtuales entre los dos grupos.
d) Intervalo de confianza para la diferencia de medias con varianza desconocida iguales
Ejercicio 15
Se seleccionó una muestra de 15 alumnos del grupo A y una muestra de 12 alumnos del grupo
B.
Para el grupo A, se obtuvo un promedio de 12 horas de clases semanales con una desviación
estándar muestral de 2 horas. Para el grupo B, se obtuvo un promedio de 10 horas de clases
semanales con una desviación estándar muestral de 1.5 horas.
Se desea encontrar un intervalo de confianza del 90% para la diferencia entre las medias
poblacionales de horas de clases semanales de ambos grupos, asumiendo que las poblaciones
se distribuyen aproximadamente en forma normal y tienen varianzas iguales.
2
S p =¿ ¿
2
S p =¿ ¿
S p2=3.23
( x 1−x 2)± T α
(1− ,)
2 √ 2
× sp (
1 1
+ )
n1 n2
√
(12−10) ±1.708 × 3.23 ×(
1 1
+ )
15 12
Ejercicio 16
Quieres encontrar un intervalo de confianza del 95% para la diferencia en el tiempo promedio
de uso entre los estudiantes que utilizan laptops y aquellos que utilizan celulares.
Para llevar a cabo el estudio, seleccionas una muestra aleatoria de estudiantes de la UTP y
registras el tiempo diario de uso de dispositivos electrónicos para cada estudiante. A
continuación, obtienes los siguientes resultados suponiendo que tienen poblaciones normales
con varianzas diferentes:
Laptops:
Celulares:
s 12 s 22 2
+ ( )
n1 n2
V= 2 2 2 2
s1 s2
( ) ( )
n1 n2
+
n1−1 n 2−1
V =29
Con un nivel de confianza del 95% la verdadera diferencia de horas que se utilizan laptops y
celulares está entre 0.1 a 1.5 horas.
Ejercicio 17
En una muestra aleatoria de 500 estudiantes se encuentra que 380 de ellos prefieren usar
laptops.
Calcular un intervalo de confianza del 95% para la proporción verdadera de alumnos que
prefieren usar laptops.
380
p= =0.76
500
IC=0.76 ± 1.96 ×
√ 0.76× 0.24
500
0.72 ≤ π ≤ 0.797
Con un nivel de confianza la proporción verdadera de quienes prefieren utilizar laptops está
entre 72% y 79.7%.
Ejercicio 18
A una muestra de 120 estudiantes universitarios de la UTP Lima sur se le pregunto cuántas
horas estaban conectados en las clases virtuales y resulto que el 33% de ellos pasan 5 horas
en clases virtuales. Interprete un intervalo de confianza del 95% para la proporción verdadera
de estudiantes que pasan 5 horas en clases virtuales
p̂ es la proporción muestral (en este caso, el 33%, que se expresa como 0.33).
Z es el valor crítico de la distribución normal estándar correspondiente al nivel de confianza
deseado. Para un nivel de confianza del 95%, Z es aproximadamente 1.96.
n es el tamaño de la muestra (en este caso, 120 estudiantes).
SE = √(p̂ * (1 - p̂) / n)
SE = √(0.33 * (1 - 0.33) / 120)
SE ≈ √(0.2211 / 120)
SE ≈ √0.0018425
SE ≈ 0.0429
Intervalo de confianza = p̂ ± Z * SE
Intervalo de confianza = 0.33 ± 1.96 * 0.0429
Intervalo de confianza ≈ 0.33 ± 0.0841
Intervalo de confianza ≈ (0.2459, 0.4141)
Ejercicio 19
A los alumnos de la universidad UTP los dividimos en grupos, en A y grupo B. Realizamos una
muestra aleatoria de 400 alumnos de cada grupo, y obtienes los siguientes resultados:
A:
B:
P1=280/400=0.70
P2=320/400=0.8
Z =1.96
(1− 0.052 )
0.8−0.7 ± 1.96×
√ 0.7 × 0.3 0.8 × 0.2
400
+
400
0.04 ≤ π ≤ 0.1596
Ejercicio 20
n1 = n2 = 120
Interpretación: Podemos estar 95% seguros de que la diferencia de proporciones entre las
dos muestras de estudiantes universitarios de la UTP Lima sur que suelen pasar 3 horas en
clases virtuales se encuentra en el intervalo de (-0.317, -0.103)
Ejercicio 21
Un estudiante universitarios de la UTP Lima Sur sabe que la las horas de clases virtuales varia
pues hay múltiples factores que influyen en las horas de clases. A fin de estimar la variabilidad
de las horas de clases virtuales, se escoge al azar 120 estudiantes universitarios
y se les pregunta por las horas en promedio que pasan en las clases virtuales que es 4.12
horas, con desviación estándar de 1,01. Teniendo en cuenta lo antes mencionado
se establecerá un intervalo de confianza del 95% para averiguar la variación de las horas
que pasan conectados en las clases virtuales
Para un nivel de confianza del 95% y n-1 grados de libertad (119 en este caso), podemos
encontrar los valores críticos de la distribución chi-cuadrado en tablas o mediante calculadoras
en línea. Para este caso, χ^2α/2, n-1 ≈ 88.379 y χ^21-α/2, n-1 ≈ 135.807.
Intervalo de confianza = (s) * √((n - 1) / χ^2α/2, n-1), (s) * √((n - 1) / χ^21-α/2, n-1)
Intervalo de confianza = 1.01 * √(119 / 88.379), 1.01 * √(119 / 135.807)
Intervalo de confianza ≈ 1.01 * 1.0543, 1.01 * 0.9554 ≈ (1.0643, 0.9649)
Interpretación: Podemos estar 95% seguros de que la variabilidad real de las horas de clases
virtuales en la población de estudiantes universitarios de la UTP Lima Sur se encuentra en el
intervalo de (0.9649, 1.0643) horas.
CAPÍTULO 3
Ejercicio 22
En la UTP, las clases virtuales están diseñadas para tener una duración promedio de 60
minutos. El departamento de educación a distancia se preocupa de que las clases no estén
cumpliendo con esta duración y desea tomar una decisión sobre si es necesario ajustar el
contenido de las clases. Para investigar esto, se toma una muestra aleatoria de 50 clases
virtuales y se registra la duración de cada una en minutos. Los datos muestran un promedio de
duración de 58 minutos y una desviación estándar de 5 minutos.
Ejercicio 23
Se afirma que el tiempo promedio de duración de cada clase es de 75 minutos. Sin embargo,
un grupo de estudiantes cree que las clases virtuales son más largas en realidad. Para probar
su afirmación, toman una muestra aleatoria de 30 clases virtuales y registran la duración de
cada una en minutos. Los datos muestran un promedio de duración de 70 minutos y una
desviación estándar de 6 minutos.
Solución:
Hipótesis nula (H0): El tiempo promedio de duración de las clases virtuales es igual a 75
minutos. (µ = 75)
Hipótesis alternativa (H1): El tiempo promedio de duración de las clases virtuales es menor que
75 minutos. (µ > 75)
x −u
T c=
s
√n
70−75
T c=
6
√ 30
T c =−4.56
T c <T 0.95,29 ¿ ¿
No se rechaza la h0, con un nivel de significancia de 5% existe evidencia que las clases en
promedio duran 75 minutos.
√
2 2
σ1 σ2
+
n1 n2
85−80−(0)
Z c=
√
2 2
10 12
+
100 80
Z c =2.988
√ s 12 s 22
+
n1 n2
85−78−( 0 ) hip
Tcal= =4.32
√
2 2
4 3.5
+
10 12
2 22
s1 s2
( + )
n1 n2
V= =18
s 12 2 s 2 2 2
( ) ( )
n1 n2
+
n1−1 n 2−1
T (0.025 ,18)=−2.1
Se rechaza la hipótesis nula, es decir, con un nivel de significancia del 5% existe evidencia que
existe una diferencia significativa entre el promedio de calificaciones de los 2 grupos.
√ π (1−π)
n
p=100/200=0.5
0.5−0.4
Z c= =2.887
√ 0.4( 0.6)
200
Z( 0.05)=−1.645
Z( 0.05) < Z c
Donde:
x1
• p1= es la proporción muestral de estudiantes que aceptan las clases virtuales en la
n1
primera muestra (x1 es el número de estudiantes que aceptan, y n1 es el tamaño de la primera
muestra).
x2
• p2= es la proporción muestral de estudiantes que aceptan las clases virtuales en la
n2
segunda muestra (x2 es el número de estudiantes que aceptan, y n2 es el tamaño de la
segunda muestra).
• P es la proporción combinada de estudiantes que aceptan las clases virtuales, calculada
x 1+ x 2
como P= .
n 1+n 2
p^2=76/100 ≈0.76
χ² = (n - 1) * s^2 / σ^2
Donde:
n = 36 (tamaño de la muestra)
s^2 = 12 horas^2 (varianza muestral)
σ^2 = 16 horas^2 (varianza histórica)
χ² = (36 - 1) * 12 / 16 ≈ 26.25
Como el valor del estadístico de prueba es mayor que el valor crítico, no podemos rechazar la
hipótesis nula. En otras palabras, no hay evidencia suficiente para afirmar que la varianza
actual sea menor que la varianza histórica. No podemos concluir que haya habido una
disminución significativa en la variabilidad de las horas de ausencia de los alumnos de clases.
CAPÍTULO 4
Se quiere determinar la relación entre el tiempo de uso (en años) de las laptops que
usan los estudiantes de la UTP y las eficiencias de las mismas (%). Los datos se dan a
continuación:
Uso en
años eficiencia
3 75
5 35
4 39
1 80
6 54
5 × 960−19 × 283
B1= =−7.78
5 ×87−192
283− (−7.78× 19 )
B 0= =22.67
19
y=22.67−7.78 x
Si x=5
Y=7.11
En promedio de la eficiencia de una laptop que tiene 2 años es de 7.11.
RECOMENDACIONES
CONCLUSIONES
La universidad debería dar apoyo a los estudiantes que presentan un bajo nivel
académico. Como se sabe esta nueva modalidad virtual ha afectado a los estudiantes
de la UTP ,como así mismo, la Universidad debería comprometerse más en el
aprendizaje del alumno.
Mediante un seguimiento longitudinal de los estudiantes a lo largo de los ciclos
académicos, se observó que el logro y perfil de cada estudiante están fuertemente
influenciados por su participación y desempeño en las clases virtuales. Aquellos
estudiantes que demuestran una mayor adaptabilidad y participación activa en el
entorno virtual tienden a tener un mejor desempeño general en sus estudios.
Aprendimos la importancia de la toma de decisiones informadas.Al aplicar las fórmulas
adecuadas, se pueden obtener conclusiones significativas y basadas en evidencia. Esto
permite tomar decisiones informadas y fundamentadas en datos objetivos, lo que es
esencial en campos como la medicina, la investigación científica y la toma de decisiones
empresariales.
Logramos la dentificación de patrones y tendencias. Las fórmulas estadísticas permiten
identificar patrones, tendencias y relaciones entre variables. Esto ayuda a comprender
mejor el comportamiento de los datos y proporciona información valiosa para
comprender fenómenos complejos.