Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CUANTITATIVOS
POR:
AGELGY HURTA
LISKA AR
SHERIKA SAN
HIRAM GONZA
DAVID
TEMAS:
AGELGY HURTADO,
LISKA ARAUZ,
SHERIKA SANTOS,
HIRAM GONZALEZ,
DAVID DIAZ
PARTE - 1
PTIVA - MEDIDAS DE
AL Y DE DISPERSION
Experiencia Laboral (años) Número de Trabajadores de seguridad (f)
0a3 4
4a7 12
8 a 11 24
12 a 15 16
16 a 19 10
20 a 23 3
69
4
16
40 En esta fila se encuentra la mediana
56
66
69
Me
Li me
Cme
fme
n/2
Fme -1
Interpretación:
La mitad del personal de seguridad que labora en este hospital tienen una experiencia
laboral igual o menor a 10 años 3 meses. La otra mitad de este personal tiene una
experiencia laboral igual o mayor a 10 años y 3 meses.
n/2 34.5
mediana
Limite inferior de la clase mediana
Amplitud del intervalo de clase de la mediana 11 menos 8
Frecuencia del numero de trabajadores
Esta arriba calculada
Frecuencia acumulada anterior a la calculada 40 no es
Valores Escogidos
8
3
24
34.5
16
Se ha observado la variable X= “Saldo (en Euros)” de 400
cuentas corrientes en una entidad bancaria correspondientes a
clientes con edades comprendidas entre 18 y 25 años. La
distribución de frecuencias de esta variable es la siguiente:
Saldo en Euros
a. Elaborar una tabla de frecuencia que contenga frecuencia absoluta, 50 - 70
frecuencia absoluta acumulada, frecuencia relativa, frecuencias
relativas acumuladas y los porcentajes acumulados; 70 - 90
b. Calcule e interprete las medidas de posición central. Indique y 90 - 110
justifique la más adecuada; 110 - 130
c. Calcule e interprete las medidas de dispersión;
d. Indique cuál es el saldo mínimo de una cuenta para estar entre el 130 - 150
25% de las de mayor saldo. 150 - 170
e. Indique cuál es el saldo máximo de una cuenta para estar entre el
15% de las de menor saldo. 170 - 190
f. Indique cuál es el saldo mínimo de una cuenta para estar entre el Total
40% de las de mayor saldo
a Tabla de Fre
Limite Marca de Frecuencia
# de cuentas Limite inferior Superior Clase(M) absoluta(f)
72 50 70 60 72
16 70 90 80 16
96 90 110 100 96
104 110 130 120 104
56 130 150 140 56
16 150 170 160 16
40 170 190 180 40
400 400
200 Da 8
C 20 Db 48
b Medidas de posición central
Media 113.2 El promedio obtenido entre todos los saldos es de 113. 2
Mediana 113.08 El valor obtenido de la mediana es de 113.08, este valor representa el punto m
Moda 112.86 El valor que se repite entre todos los rangos de saldos en euros es de 112.86
c Medidas de dispersión
Varianza 1244.87218 La varianza permite determinar si las diferencias que existen entre todas las m
Desviación estandar 35.28 La desviación estandar nos permite saber cuanto pueden alejarse los saldos r
Coeficiente de Vari 31.17% El coeficiente de variación toma en consideración el tamaño de la media cont
r si las diferencias que existen entre todas las medias exponen las diferencias que se lleguen a encontrar en los valores medios.
rmite saber cuanto pueden alejarse los saldos respecto a la media de 113.2. Es decir, pueden alejarse 35.28 por arriba o por debajo
a en consideración el tamaño de la media contra la variabilidad de la variable
fM²
259200
102400
960000
1497600
1097600
409600
1296000
5622400
ntar los valores de la población entre los que son mayores o menores al punto central (referencia)
os valores medios.
por arriba o por debajo
B/. 313.59 100.00
287.00
11. El Sr. Bissey también guarda registros de las
cuentas personales de ahorro. De las 40 nuevas B/. 527.18 470.53
cuentas abiertas del mes anterior, los saldos 602.02
corrientes son: B/. 740.77 712.10
793.10
B/. 954.36 1,009.10
1,175.00
B/. 1,167.94 1,273.01
1,422.03
B/. 1,381.53
B/. 1,595.11
Se está trabajando con valores continuos ya que estos pueden adoptar cualquier valor entre los ra
Como estamos tratando valores monetarios, podemos tener valores intermedios o decimales.
112.17 179.80 217.00 Tabla de Distribución de Frecuencia
293.00 352.00 415.00 Clase Limites
501.01 510.52 579.00 1 [100 313.59)
666.66 695.00 711.11 2 [313.59 527.18)
780.00 783.00 783.00 3 [527.18 740.77)
890.00 937.01 952.51 4 [740.77 954.36)
1,101.00 1,112.52 1,150.00 5 [954.36 1167.94)
1,200.00 1,202.00 1,212.43 6 [1167.94 1381.53)
1,312.52 1,390.00 1,394.05 7 [1381.53 1595.11)
1,482.00 1,555.10 1,595.10
0.0805
0.0786
3.89
3.81
0.83
0.74
Número de empleados ausentes
Frecuencia Frecuencia
Intervalos Marca
absoluta acumulada xf
20 29 24.5 5 5 122.50 -34.39 1182.67
30 39 34.5 9 14 310.50 -24.39 595.06
40 49 44.5 8 22 356.00 -14.39 207.19
50 59 54.5 10 32 545.00 -4.39 19.31
60 69 64.5 12 44 774.00 5.61 31.43
70 79 74.5 11 55 819.50 15.61 243.55
80 89 84.5 8 63 676.00 25.61 655.67
90 99 94.5 3 66 283.50 35.61 1267.79
Total 66 3887.00 4202.67
Interpretación
El promedio de empleados que estuvieron ausente fue de 58.8 mas alto que el año anterior y su desviación estandar fue de 8.04 lo que quieres decir que aun el ause
que quieres decir que aun el ausentismo diario es alto
a) Lp25 12.75 El primer cuartil se encuentra en termino o lugar 12,75. Se debe interpolar entre las 20 y 21 acciones transadas
P25 20.75 El 25% de las acciones transadas están por debajo de 20,75 y el 75% restante por encima del 20,75.
Lp75 38.25 El tercer cuartil se encuentra en termino o lugar 38,25. Se debe interpolar entre las 62 y 63 acciones transadas
P75 62.25 El 75% de las acciones transadas están por debajo de 62,25; eso quiere decir que entre 20,25 y 62,25 se encuentra el 50%
Rango Intercuartil 41.50 El rango intercuartílico es 41,50 acciones transadas aproximadamente
c) Lp50 25.50 El persentil 50 se encuentra en termino o lugar 25,50, ya que la posiciones 25 y 26 son iguales el persentil es 3
P25 38 El 50% de las acciones transadas están por debajo o por encima de 38.
d) Lp70 35.70 El persentil 70 se encuentra en termino o lugar 35,70, ya que la posiciones 35 y 36 son iguales el persentil es 5
P70 56 El 70% de las acciones transadas están por debajo de 56.
e) D3 15.30 El tercer decil se encuentra en termino o lugar 15,30, ya que las posiciones 15 y 16 son igual el tercer persentil
d3 27 El 30% de las acciones transadas están por debajo de 27.
0 y 21 acciones transadas; que representa las posiciones 12 y 13.
d
Empresa Precios en octavos Precio
Wall Mart 27 3/8 27.375
Disney 42 5/8 42.625
Mobil 69 7/8 69.875
General Motors 39 1/2 39.500
General Mills 69 7/8 69.875
Toy R Us 38 5/8 38.625
Dow Jones 29 1/4 29.250
Varianza 312.020 La varianza permite determinar si las diferencias que existen entre todas las
Desviación estandar 17.664 La desviación estandar nos permite saber cuanto pueden alejarse los precio
Cálcule el percentil 40
38.8 Dado que el percentil 40 corresponde a 38,8 esto indica que en la población más del 40% tendrá u
omedio de un conjunto de datos
todas las acciones y permite saber el punto central que pueden tomar las acciones
nes que más se repite en el conjunto de datos
as que existen entre todas las medias exponen las diferencias que se lleguen a encontrar en los valores medios.
nto pueden alejarse los precios de las acciones respecto a la media calculada.
ngo representa la diferencia entre el valor máximo y mínimo de las acciones es posible utilizarlo para determinar la diferencia existente en
Media:
53,850.00 1,077.00
50
Moda:
Moda:
Mediana:
50
2 -20
=790+ (20) = 800
10
21,177,800.00 432,200.00
S2= 49
S= 657.42
Edad= 9.992
De acuerdo a los datos los salarios están mucho más dispersos que la edad
De acuerdo a los datos los salarios están mucho más dispersos que la edad
F.M2
632025 632,025
4160475
9312250
13833800
11088900
12180675
27966125
79174250
Horarios de Ronnie
12 15 37 42 48 48 52 54
d) Q1 31.50 El 25% de las horas trabajadas por Ronnie están por debajo de 31 horas con 30 minutos y el 75% restante
Q3 49 El 75% de las horas trabajadas por Ronnie están por debajo de 49 horas; Eso quiere decir que entre 31 hor
a) IQR 17.50 El rango intercuartílico de horas trabajadas por Ronnie es de 17 horas y 30 minutos aproximada
b) Varianza 267.43
c) Mediana 45 Se puede decir que la media de las horas trabajadas por Ronnie cada semana en los últimos dos
Desviación Estándar 16.35 de 45 horas, con una tendecia a variar por enciama o por debajo de 16 horas y 21 minutos.
uiere decir que entre 31 horas con 30 minutos y 49 horas se encuentra el 50% de las horas trabajadas por Ronnie.
y 30 minutos aproximadamete.
60 min = 100%
x = 50%
100% * x = 35% * 60 min
emana en los últimos dos meses es x = 2,100 /100 min
horas y 21 minutos. x = 21 min
PARTE - 2
MAL ESTANDARIZADA
1.- El tiempo promedio que recorre una persona para llegar de su casa al trabajo es de 24 min con
¿Cuál es la probabilidad de que llegue en al menos 32 min?
Si la oficina la abren a las 9:00 am y sale de su casa a las 8:45am, ¿Qué porcentaje de las veces no
Si sale a las 8:35am de su casa, y el café lo sirven de 8:50am a 9:00am, ¿Qué porcentaje de las vec
¿El 75% de las ocasiones, en que intervalo de tiempo llega?
a) µ 24 min
σ 3.8 min
X 32 min
Z= (32−24)/3.8 =
2.11
Z 2.11 0.4826
R) La probabilidad de que llegue en al menos 32 minutos es de 48%.
b) X 15 min
Z= (15−24)/3.8 =
-2.37
Z -2.37 0.4911
R) En el 49% de las veces que sale de su casa a las 8:45 no llega a tiempo a su trabajo.
Z1= (15−24)/3.8
= -2.37
Z -2.37 0.4911
Z2= (25−24)/3.8
= 0.26
Z 0.26 0.1026
0.3885
R) De las veces que sale de su casa a las 8:35 am el 38% de estas se pierde el café porque l
d) 𝜇±2∙𝜎=24 ±2∙3.88
empo a su trabajo.
96%
Z=(x-Media)/Desviación Estandar
X valor Z
35000 0.5
ado que el 19.15% obtenido corresponde a un z de 0,5 lo cual es la mitad del área
jo la curva, es necesario restarle el 19,15% al 50% (mitad) para poder obtener el
tal de más de 35000
X1 X2
33500 35500
Valor Z1 Valor Z2
-0.25 0.75
La probabilidad de elegir una persona que gane entre 33,500 y 35,500 dlls es de 37,21%
X1 X2
34500 35600
Valor Z1 Valor Z2
0.25 0.8
el porcentaje de las personas que ganan entre 34,500 y 35,600 dlls es de 18,94%
Para 96% es necesario dividirlo entre 2 para así obtener el porcentaje exacto para cada lado de la curva
0.4800
se busca en la tabla, el valor Z correspondiente a 0,4800 y se obtiene un Z de 2,06
Utilizando la fórmula se obtiene el siguiente rango para valores de +- 2,06
X1 X2
38120 29880
obabilidad total
obabilidad total
un Z de 2,06
3.- Una máquina expendedora de refrescos, rellena vasos de 200ml con una desviación estándar d
a) ¿Cuál es el porcentaje de los vasos que se rellenan con menos de 190ml?
b) ¿En una remesa de 1000 vasos de 230ml, cuántos se derraman?
c) ¿Cuál es la probabilidad de que se rellenen entre 195 y 210ml?
d) ¿En qué intervalo de mililitros se rellena el 95% de los vasos?
a) µ 200 ml
σ 5 ml
X 190 ml
Z= (190−200)/5
= -2
Z -2.00 0.4772
R) El porcentaje de vasos que se rellenan con menos de 190 ml es de 48%.
b) X 230 ml
Z= (230−200)/5 = 6
Z 6.00 1.0000
R) De los 1000 vasos de 230 ml ninguno se derrama ya que la maquina está preparada para r
c) X 195 ml X 210 ml
14%
intervalo 1 185 ml
intervalo 2 215 ml
R) En el intervalo de 185 y 215 ml se rellenan el 95% los vasos.
una desviación estándar de 5ml.
ml?
aquina está preparada para rellenar vasos de 200 ml con una desviación estándar muy baja de 5ml.
4
Las estaturas y pesos de 10 jugadores de baloncesto de un
equipo son:
Estatura (X) Pesos (Y)
186 85 Estatura (X)
189 85 186
190 86 189
192 90
193 87 190
193 91 192
198 93
201 103 193
203 100 193
205 101 198
Calcular:
a) La recta de regresión de Y sobre X. ¿Es el modelo ajustado a 201
los datos el adecuado? 203
b) El coeficiente de correlación. Interpretar. 205
c) El peso estimado de un jugador que mide 208 cm.
Coeficiente de Correlación
0.944225420910846
a
b
c
120
87
91 40
93
103 20
100
101 0
185 190 195 200 205 210
Tal como se observa en el gráfico la recta de la regresión es Y= 1,0217x - 107,14. El modelo ajustado de datos para este caso e
El coeficiente de correlación resultante es de 0,94 lo cual al tener un valor cercano a 1, corresponde a la existencia de una corr
El peso estimado correspondiente a un jugador que mide 208cm es de 105,37kg
5 210
o ajustado de datos para este caso es el adecuado dado a que no existe mucha disperción entre los puntos.
rresponde a la existencia de una correlación lineal y directa
Z X-u/o
a.
Z -0.63 daría un área de 0.2357 0.50-0.2357 26.43
b.
Z -0.63 daría un área de 0.2357 0.50+0.2357 73.57
c.
Z -0.89 daría un área de 0.3133
1.53 daría un área de 0.4370 0.3133+0.4370 75.03
d.
Z 1.84 daría un área de 0.4671
2.68 daría un área de 0.4963 0.4671+0.4963 50.10
%
%
u= 50
g= 5.2
x= probabilidiad de que las bolsas pesen mas de 60 lbs
z 1.92
usando la tabla nos indica que 1.92 es igual a 0.4726 es decir 47.26%
𝜇±1∙𝜎
B/. 32,900.00
Sí, se debería ejecutar la actualización de la computadoras ya que el valor excedido proye
e el valor excedido proyectado al 34% es de 9,400 y en la ultima actualización propuesta fue de 25,000.
5,000.
36. El promedio de los salarios en los bancos comerciales en Illinois
es de US$22.87 por hora, con una desviación estandar de US$ 5.87.
Cuál debe ser su salario por hora si desea ganar:
a. ¿Más que el 80% de todos los empleados?
b. ¿Más que el 30% de todos los empleados?
c. ¿Menos que el 20% de todos los empleados?
d. ¿Más que el 50% de todos los empleados? a
b
c
d
Media Desviación Estándar Z=(x-Media)/Desviación Estandar
22.87 5.87
INTRODUCCION A LA REGRESIO
SIMPLE Y CORRELACIÓN
E-3
REGRESION LINEAL
RRELACIÓN
1. Cinco niños de 2, 3, 5, 7 y 8 años de edad pesan, respectivamente, 14, 20, 32, 42 y 44 kilos.
Hallar la ecuación de la recta de regresión de la edad sobre el peso. ¿Es el modelo ajustado a los datos el adecuad
¿Cuál sería el peso aproximado de un niño de seis años?
Promedio x= 5
Promedio y= 30.4
oxy= 26.8
ox= 12.46
oy= 32.84
La recta de regresión de la edad sobre el peso es aquella que pasa por el punto (x,y) y tiene pendiente oxy/oy
Chart Title
50
45
f(x) = 5.15384615384615 x + 4.63076923076924
40
35
30
25
20
15
10
f(x) = 5.15384615384615 x + 4.63076923076924
40
35
30
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9
Para encontrar el peso aproximado de un niño de seis años, sustituimos {x=6} en la ecuación de regresión y obtene
y=5.1538x +4.6308
y= 35.55
Coefficients
Intercept 4.6307692
X Variable 15.1538462
Covarianza
desviación estandar
Coeficiente de correlación lineal
promedio x
promedio y
La recta de regresión de los clientes sobre la distancia, es aquella que pasa por el punto y tiene pendiente
x-4.67= 0.28(y-26)
7.38636363636 12.0530303030303
Despejamos y obtenemos la recta de regresión
x= -0.28y +12.05
c)Si desea recibir a 5 clientes, ¿a qué distancia del núcleo de población debe situarse?
y= 0.28x - 12.05
y- 26 =-3.18(x-4.67)
y=-3.18x+40.85
Y 24.9601694915254 de distancia
que se sitúe de un núcleo de población, acuden los clientes, en cientos, que figuran en la tabla:
debe situarse?
y2
225
361
625
529
1156 0.9
1600
4496
2.56
8.56
luta entre las dos variables ( en sentido inverso): Existe una relación funcional perfecta entre ambas(una relación lin
iene pendiente
situarse?
guran en la tabla:
x y
Matemáticas Química
6 6.5
4 4.5
8 7
5 5
3.5 4
26.5 27
x=7.5
y = 0.6953x + 1.7148
y = 0.6953(7.5) + 1.7148
6.9
Interpretación
El estudiante que pose una nota de 7
Existe asociación o dependencia ent
nota de química varia con respecto a
materia que la otra Ejemplo si estud
viceversa.
Resumen El intercepto es 1.71 e indica una pe
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.961053623459263
Coeficiente de determinación R^2 0.923624067164179
R^2 ajustado 0.898165422885572
Error típico 0.413004741699979
Observaciones 5
ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados
Regresión 1 6.18828125
Residuos 3 0.51171875
Total 4 6.7
ímica para un alumno que tiene 7.5 en Matemáticas. ¿Es el modelo ajustado a los datos el adecuado?
Regresión lineal
8
5
Química
0
3 4 5 6 7 8 9
Matemáticas
nterpretación
estudiante que pose una nota de 7.5 en matemáticas según la proyesion puede obter un 6.9 en química.
iste asociación o dependencia entre las materias de matemática y química (R2=0,92). El R2 establece que el 92% de la
ota de química varia con respecto a matemática esto quiere decir que los estudiantes dedican más tiempo a estudiar una
ateria que la otra Ejemplo si estudian más matemática la nota es más alta en esta asignatura y más baja en química y
ceversa.
intercepto es 1.71 e indica una pendiente positiva.
Promedio de los cuadrados F Valor crítico de F
6.18828125 36.279389313 0.009172356653865
0.170572916666667
0.4
0.2
0
-0.2 3 4 5 6 7 8 9
-0.4
Variable X 1
2
0
3 4 5 6 7 8 9
Variable X 1
el 92% de la
a estudiar una
n química y Gráfico de probabilidad normal
8
6
4
Y
2
0
0 10 20 30 40 50 60 70 80 90 100
Muestra percentil
Inferior 95.0% Superior 95.0%
-0.3190411748 3.748728674761
0.3279361983 1.062688801703
residuales
7 8 9
ón ajustada
Y
Pronóstico para Y
normal
70 80 90 100
4.- El peso promedio de ratas de laboratorio, utilizadas para experimentos, es de 189grs, con una desviación e
a) ¿Qué porcentaje de los animales pesan más de 200grs?
b) ¿Qué porcentaje pesan entre 195 y 205 grs?
c) ¿Qué porcentaje pesan al menos 175grs?
d) ¿En qué intervalo de pesos se encuentra el 95% de los animales?
95%
rimentos, es de 189grs, con una desviación estándar de 5.7grs.
X valor Z
200 1.93
como el 47.32% obtenido corresponde a un z de 1,93 lo cual es la mitad del área bajo la curva,
es necesario restarle el 47.32% al 50% (mitad) para poder obtener el total de más de 200grs.
Valor Z1 Valor Z2
1.05 1.93
Probabilidad 1 Probabilidad 2
Porcentaje según la tabla 35.31% 47.32%
X valor Z
175 -2.46
como el 49.31% obtenido corresponde a un z de -2.46 lo cual es la mitad del área bajo la curva,
es necesario restarle el 49.31% al 50% (mitad) para poder obtener el total al menos 175 grs
como el 49.31% obtenido corresponde a un z de -2.46 lo cual es la mitad del área bajo la curva,
es necesario restarle el 49.31% al 50% (mitad) para poder obtener el total al menos 175 grs
0.48
se busca en la tabla, el valor Z correspondiente a 0,4800 y se obtiene un Z de 2,06
Probabilidad total
82.63%
R 0.96
Seria correlación positiva perfecta lo que quiere decir absoluta relación entre las dos variables (en sentido directo), existe una
y -57.83= 1.77(x-36.55)
y=1.77x-6.78 remplazando 47 en el test las ventas serian de
y 76.41
El modelo parece ser el adecuado ya que toca varios puntos en la recta y los demas puntos premanecen cerca
1.77
en sentido directo), existe una relación lineal perfecta con pendiente positiva.
emanecen cerca
a Y es igual 40 unidades mas un aumento de 3 veces x1 menos 4 aumento el valor de x2
b 15
ento el valor de x2
46. Los datos que aparecen aquí se recolectaron para y
explicar los niveles salariales para los trabajadores en una Salario (US1000)
planta local. 1 42.2
a. Calcule el modelo de regresión utilizando un computador. 2 58.9
b. ¿Existe evidencia de la determinación de sexo en cuanto 3 98.8
a los niveles salariales? 4 23.5
c. ¿La educación es útil para explicar el salario?
5 12.5
6 67.8
7 51.9
8 81.6
9 61
SUMMARY OUTPUT
Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations
ANOVA
Regression
Residual
Total
Intercept
X Variable 1
RESIDUAL OUTPUT
Observation
1
2
3
4
5
6
7
8
9
X 120
Años de Educación Sexo
8 M 100
12 M f(x) = 7.31412133891214 x − 21.8490585774059
16 M R² = 0.977742277252028
80
6 F
5 M
60
12 M
10 F
40
14 F
12 F
20
ARY OUTPUT
0
4 6 8 10 12 14 16 18
Regression Statistics
0.988808513945966
0.977742277252029 Respuestas Análisis
0.974562602573747 R2 obtenido de 98.00% indica que al existe una dependencia entre el total de años respec
salario que devenga.
4.29881741199387 El intercepto obtenido de -21.84 nos indica la existencia de una pendiente negativa. Se ob
9 también que por cada unidad de X (Años de educación) el salario aumentará en 7.31
aproximadamente.
df SS MS F Significance F
1 5682.503404 5682.503404 307.4975827 4.82958E-07
7 129.358818 18.47983114
8 5811.862222
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0%
-21.8490585774059 4.630051548 -4.71896659 0.00216015 -32.7973908 -10.9007264 -32.7973908
7.31412133891214 0.417101074 17.53560899 4.82958E-07 6.327834025 8.300408653 6.327834025
40
20
0
4 6 8 10 12 14 16 18
Upper 95.0% X Variable 1
-10.9007264
8.300408653
100
Y
50
0
0 10 20 30 40 50 60 70 80 90 100
Sample Percentile
150
100
Y
50
0
0 10 20 30 40 50 60 70 80 90 100
Sample Percentile
6 18
Y
Predicted Y
90 100
90 100