Está en la página 1de 100

METODOS

CUANTITATIVOS
POR:
AGELGY HURTA
LISKA AR
SHERIKA SAN
HIRAM GONZA
DAVID

TEMAS:
AGELGY HURTADO,
LISKA ARAUZ,
SHERIKA SANTOS,
HIRAM GONZALEZ,
DAVID DIAZ
PARTE - 1

ESTADISTICA DESCRIPTIVA - MED


TENDENCIA CENTRAL Y DE DISP
E-1

PTIVA - MEDIDAS DE
AL Y DE DISPERSION
Experiencia Laboral (años) Número de Trabajadores de seguridad (f)

0a3 4
4a7 12
8 a 11 24
12 a 15 16
16 a 19 10
20 a 23 3
69

Vamos a calcular el valor de la mediana

Me= Li me + Cme/fme (n/2- Fme-1)


Resp: 10.3
frecuencia acumulada (F)

4
16
40 En esta fila se encuentra la mediana
56
66
69

Me
Li me
Cme
fme
n/2
Fme -1

Interpretación:
La mitad del personal de seguridad que labora en este hospital tienen una experiencia
laboral igual o menor a 10 años 3 meses. La otra mitad de este personal tiene una
experiencia laboral igual o mayor a 10 años y 3 meses.
n/2 34.5

mediana
Limite inferior de la clase mediana
Amplitud del intervalo de clase de la mediana 11 menos 8
Frecuencia del numero de trabajadores
Esta arriba calculada
Frecuencia acumulada anterior a la calculada 40 no es

dad que labora en este hospital tienen una experiencia


os 3 meses. La otra mitad de este personal tiene una
or a 10 años y 3 meses.
Este valor lo vemos en la frecuencia acumulada

Valores Escogidos
8
3
24
34.5
16
Se ha observado la variable X= “Saldo (en Euros)” de 400
cuentas corrientes en una entidad bancaria correspondientes a
clientes con edades comprendidas entre 18 y 25 años. La
distribución de frecuencias de esta variable es la siguiente:
Saldo en Euros
a. Elaborar una tabla de frecuencia que contenga frecuencia absoluta, 50 - 70
frecuencia absoluta acumulada, frecuencia relativa, frecuencias
relativas acumuladas y los porcentajes acumulados; 70 - 90
b. Calcule e interprete las medidas de posición central. Indique y 90 - 110
justifique la más adecuada; 110 - 130
c. Calcule e interprete las medidas de dispersión;
d. Indique cuál es el saldo mínimo de una cuenta para estar entre el 130 - 150
25% de las de mayor saldo. 150 - 170
e. Indique cuál es el saldo máximo de una cuenta para estar entre el
15% de las de menor saldo. 170 - 190
f. Indique cuál es el saldo mínimo de una cuenta para estar entre el Total
40% de las de mayor saldo
a Tabla de Fre
Limite Marca de Frecuencia
# de cuentas Limite inferior Superior Clase(M) absoluta(f)
72 50 70 60 72
16 70 90 80 16
96 90 110 100 96
104 110 130 120 104
56 130 150 140 56
16 150 170 160 16
40 170 190 180 40
400 400

200 Da 8
C 20 Db 48
b Medidas de posición central
Media 113.2 El promedio obtenido entre todos los saldos es de 113. 2
Mediana 113.08 El valor obtenido de la mediana es de 113.08, este valor representa el punto m
Moda 112.86 El valor que se repite entre todos los rangos de saldos en euros es de 112.86

c Medidas de dispersión
Varianza 1244.87218 La varianza permite determinar si las diferencias que existen entre todas las m
Desviación estandar 35.28 La desviación estandar nos permite saber cuanto pueden alejarse los saldos r
Coeficiente de Vari 31.17% El coeficiente de variación toma en consideración el tamaño de la media cont

d Hay que estimar el Q3 con lo siguiente:


Q3 134.28571428572
75%
300 Valor máximo

e Hay que estimar el P15


P15 66.67
15%
60 Valor máximo

f Hay que estimar el D6


D6 120.77
60%
240 Valor máximo
Tabla de Frecuencia
Frecuencia
Frecuencia Frecuencia Relativa Porcentaje
Acumulada(F) Relativa(r) Acumulada(R) acumulados f*M M²
72 0.18 0.18 18% 4320 3600
88 0.04 0.22 22% 1280 6400
184 0.24 0.46 46% 9600 10000
288 0.26 0.72 72% 12480 14400
344 0.14 0.86 86% 7840 19600
360 0.04 0.9 90% 2560 25600
400 0.1 1 100% 7200 32400
1 45280

dos los saldos es de 113. 2


a es de 113.08, este valor representa el punto medio entre toda la población, y es posible desde aquí segmentar los valores de la población
os los rangos de saldos en euros es de 112.86

r si las diferencias que existen entre todas las medias exponen las diferencias que se lleguen a encontrar en los valores medios.
rmite saber cuanto pueden alejarse los saldos respecto a la media de 113.2. Es decir, pueden alejarse 35.28 por arriba o por debajo
a en consideración el tamaño de la media contra la variabilidad de la variable
fM²
259200
102400
960000
1497600
1097600
409600
1296000
5622400

ntar los valores de la población entre los que son mayores o menores al punto central (referencia)

os valores medios.
por arriba o por debajo
B/. 313.59 100.00
287.00
11. El Sr. Bissey también guarda registros de las
cuentas personales de ahorro. De las 40 nuevas B/. 527.18 470.53
cuentas abiertas del mes anterior, los saldos 602.02
corrientes son: B/. 740.77 712.10
793.10
B/. 954.36 1,009.10
1,175.00
B/. 1,167.94 1,273.01
1,422.03
B/. 1,381.53

B/. 1,595.11

Número de clases "k" = 1 + 3.32 Log

Rango: 1595.10 - 100.00 =

Intervalo de clases : 1495.10/7 =

Se está trabajando con valores continuos ya que estos pueden adoptar cualquier valor entre los ra
Como estamos tratando valores monetarios, podemos tener valores intermedios o decimales.
112.17 179.80 217.00 Tabla de Distribución de Frecuencia
293.00 352.00 415.00 Clase Limites
501.01 510.52 579.00 1 [100 313.59)
666.66 695.00 711.11 2 [313.59 527.18)
780.00 783.00 783.00 3 [527.18 740.77)
890.00 937.01 952.51 4 [740.77 954.36)
1,101.00 1,112.52 1,150.00 5 [954.36 1167.94)
1,200.00 1,202.00 1,212.43 6 [1167.94 1381.53)
1,312.52 1,390.00 1,394.05 7 [1381.53 1595.11)
1,482.00 1,555.10 1,595.10

mero de clases "k" = 1 + 3.32 Log10 (40) = 6.31= 7

ngo: 1595.10 - 100.00 = B/. 1,495.10

ervalo de clases : 1495.10/7 = B/. 213.59

doptar cualquier valor entre los rangos establecidos.


ores intermedios o decimales.
de Frecuencia
mi fi fr fa fra mi*fi mi2
206.79 6 0.15 6 0.15 1,240.76 256,579.71
420.38 5 0.125 11 0.275 2,101.90 883,599.72
633.97 6 0.15 17 0.425 3,803.82 2,411,513.20
847.56 7 0.175 24 0.6 5,932.93 5,028,514.15
1,061.15 4 0.1 28 0.7 4,244.59 4,504,145.16
1,274.73 6 0.15 34 0.85 7,648.41 9,749,685.00
1,488.32 6 0.15 40 1 8,929.92 13,290,578.53
40 1
Proceso 1 Proceso 2
3.41 3.22 3.81 3.26
3.74 3.06 3.26 3.79
3.89 3.65 3.07 3.14
3.65 3.33 3.35 3.51

Media Proceso 1: 3.49 Varianza Simple Proceso 1:


Media Proceso 2: 3.40 Varianza Simple Proceso 2:

Mediana Proceso 1: 3.06 3.22 3.33 3.65


Mediana Proceso 2: 3.81 3.26 3.07 3.14

Minimo Proceso 1: 3.06 Maximo Proceso 1:


Minimo Proceso 2: 3.07 Maximo Proceso 2:

Desviacion Estandar Proceso 1: Rango Proceso 1:


0.2837 Rango Proceso 2:
Desviacion Estandar Proceso 2:
0.2623
Explicacion:
- La variancia mide cuanto se alejan del valor
medio los valores que toma X.

- La desviacion estandar mide cuanto se separan


los datos, es decir el grado de dispercion o
variabilidad.

- Se ha estimado que la media en el Proceso 1 es


de 3,49 con una tendencia a variar por encima o
por debajo de 0.,2804. Por lo que se aconseja
utilizar el Proceso 2 para la produccion de discos.

0.0805
0.0786

3.65 3.89 3.74 3.41


3.26 3.35 3.51 3.79

3.89
3.81

0.83
0.74
Número de empleados ausentes
Frecuencia Frecuencia
Intervalos Marca
absoluta acumulada xf
20 29 24.5 5 5 122.50 -34.39 1182.67
30 39 34.5 9 14 310.50 -24.39 595.06
40 49 44.5 8 22 356.00 -14.39 207.19
50 59 54.5 10 32 545.00 -4.39 19.31
60 69 64.5 12 44 774.00 5.61 31.43
70 79 74.5 11 55 819.50 15.61 243.55
80 89 84.5 8 63 676.00 25.61 655.67
90 99 94.5 3 66 283.50 35.61 1267.79
Total 66 3887.00 4202.67

Media 58.89 Moda 66.67


Mediana 60.83
Lmd (inferior) 60 Varianza 64.66
n 66 Desv. Estandar 8.04
F 32
fmd 12
C 10

Interpretación
El promedio de empleados que estuvieron ausente fue de 58.8 mas alto que el año anterior y su desviación estandar fue de 8.04 lo que quieres decir que aun el ause
que quieres decir que aun el ausentismo diario es alto
a) Lp25 12.75 El primer cuartil se encuentra en termino o lugar 12,75. Se debe interpolar entre las 20 y 21 acciones transadas
P25 20.75 El 25% de las acciones transadas están por debajo de 20,75 y el 75% restante por encima del 20,75.
Lp75 38.25 El tercer cuartil se encuentra en termino o lugar 38,25. Se debe interpolar entre las 62 y 63 acciones transadas
P75 62.25 El 75% de las acciones transadas están por debajo de 62,25; eso quiere decir que entre 20,25 y 62,25 se encuentra el 50%
Rango Intercuartil 41.50 El rango intercuartílico es 41,50 acciones transadas aproximadamente

b) e la Mediana 25.50 La mediana se encuentra entre la posicion 25 y 26.


Mediana 38 La mitad de las acciones de la bolsa de valores de Nueva York manejan 38 o más transacciones. Las otras acci

c) Lp50 25.50 El persentil 50 se encuentra en termino o lugar 25,50, ya que la posiciones 25 y 26 son iguales el persentil es 3
P25 38 El 50% de las acciones transadas están por debajo o por encima de 38.

d) Lp70 35.70 El persentil 70 se encuentra en termino o lugar 35,70, ya que la posiciones 35 y 36 son iguales el persentil es 5
P70 56 El 70% de las acciones transadas están por debajo de 56.

e) D3 15.30 El tercer decil se encuentra en termino o lugar 15,30, ya que las posiciones 15 y 16 son igual el tercer persentil
d3 27 El 30% de las acciones transadas están por debajo de 27.
0 y 21 acciones transadas; que representa las posiciones 12 y 13.

y 63 acciones transadas; que representa las posiciones 38 y 39.


y 62,25 se encuentra el 50% de las acciones transadas.

nsacciones. Las otras acciones están por debajo de 38 o menos transacciones.

n iguales el persentil es 38.

n iguales el persentil es 56.

n igual el tercer persentil es 27.


18. Los precios de las acciones están cotizados en octavos de dólar de manera que por
ejemplo, 5 1/8 es US$ 5125, 5 ¼ es US$ 5.25, 5 3/8 es US$5,375 y asi sucesivamente
hasta 5 7/8, que es US$5,875. A continuación se da una muestra de siete precios de
cierre de las acciones tomadas The Wall Street Journal de octubre 8 de 1997.
a. Calcule la media, la mediana, la moda. Interprete cada estadístico. ¿Qué le dice
cada una? ¿ Por qué son diferentes si todas son promedios?
b. Calcule e interprete la varianza y la desviación estandar.
c. Calcule e interprete el rango o recorrido cuartílico.
d. Calcule e interprete el percentil cuarenta.

d
Empresa Precios en octavos Precio
Wall Mart 27 3/8 27.375
Disney 42 5/8 42.625
Mobil 69 7/8 69.875
General Motors 39 1/2 39.500
General Mills 69 7/8 69.875
Toy R Us 38 5/8 38.625
Dow Jones 29 1/4 29.250

Precios en octavos Precio


Media 45 2/7 45.304 La media representa el valor promedio de un conjunto de dat
Mediana 39 1/2 39.500 Corresponde al valor central de todas las acciones y permite s
Moda 69 7/8 69.875 Representa el valor de las acciones que más se repite en el co

¿Qué nos dice cada una?


Media Se puede utilizar el valor promedio independientemente de si se quiere vender o comprar accione
Mediana Es posible utilizar la mediana, como punto base(central) y establecer cuando una acción va a subir
Moda Se utiliza la Moda para saber el valor más común que exista en el mercado.

¿Por qué son diferentes?


Son diferentes aunque sean promedios, dado a que existen variaciones entre el precio de cada acción por cada empresa que e

Varianza 312.020 La varianza permite determinar si las diferencias que existen entre todas las
Desviación estandar 17.664 La desviación estandar nos permite saber cuanto pueden alejarse los precio

Valor Máximo Valor Mínimo Rango


Recorrido Cuartílico 69.875 27 3/8 42.500 Dado a que el rango representa la diferencia en

Cálcule el percentil 40
38.8 Dado que el percentil 40 corresponde a 38,8 esto indica que en la población más del 40% tendrá u
omedio de un conjunto de datos
todas las acciones y permite saber el punto central que pueden tomar las acciones
nes que más se repite en el conjunto de datos

ere vender o comprar acciones a un precio de tendencia


r cuando una acción va a subir o a bajar

acción por cada empresa que existe

as que existen entre todas las medias exponen las diferencias que se lleguen a encontrar en los valores medios.
nto pueden alejarse los precios de las acciones respecto a la media calculada.

ngo representa la diferencia entre el valor máximo y mínimo de las acciones es posible utilizarlo para determinar la diferencia existente en

oblación más del 40% tendrá un precio de acción mayor a 38,8


a diferencia existente entre las acciones del mercado
Xi valores ordenados
7.1 1 6.5 0.16 0.026
7.3 2 6.6 0.36 0.13
7 3 6.85 0.06 0.004
6.9 4 6.9 -0.04 0.002
6.6 5 6.9 -0.34 0.115
6.9 6 7 -0.04 0.002
6.5 7 7.1 -0.44 0.193
7.3 8 7.3 0.36 0.13
6.85 9 7.3 -0.09 0.008

Calcule e interprete la media, la mediana y la moda


n 9
Media 6.93
Pos. Mediana 5 valor mediana 6.9
Moda 6.9
7.3

P(coeficiente de Pearson) 0.37 P > 0, esta sesgada a la derecha

Calcule e interpreta la varianza y desviacion estandar


Varianza 0.07625
Desv. Estandar 0.27613402543
Interpretación
Esto quiere decir que la tasa de interés para esta institución seria de 6.9% es bimodal ya que sus valores estan entre 6.9 y 7.3 y estos interes pueden variar entre 0.27
s pueden variar entre 0.27%
Salario (en miles de dólares) Frecuencia Frec. Acum. M F.M. M2

90 y menos de 440 9 9 265 2,385 70,225


440 y menos de 790 11 20 615 6,765 378,225
790 y menos de 1140 10 30 965 9,650 931,225
1140 y menos de 1490 8 38 1315 10,520 1,729,225
1490 y menos de 1840 4 42 1665 6,660 2,772,225
1840 y menos de 2190 3 45 2015 6,045 4,060,225
2190 y menos de 2540 5 50 2365 11,825 5,593,225
Total 50 53,850.00

a. Calcule la media, la mediana y la moda. Iterprete sus respuestas.:

Media:

53,850.00 1,077.00
50

Moda:
Moda:

=790+ 10-11 (20) = 700


(10-8) + (10-11)

Mediana:
50
2 -20
=790+ (20) = 800
10

b. ¿Los salarios están tan dispersos como el problema anterior?

21,177,800.00 432,200.00
S2= 49

S= 657.42

CV= 61.0417 Salario

Edad= 9.992

De acuerdo a los datos los salarios están mucho más dispersos que la edad
De acuerdo a los datos los salarios están mucho más dispersos que la edad
F.M2

632025 632,025
4160475
9312250
13833800
11088900
12180675
27966125
79174250
Horarios de Ronnie
12 15 37 42 48 48 52 54

d) Q1 31.50 El 25% de las horas trabajadas por Ronnie están por debajo de 31 horas con 30 minutos y el 75% restante

Q3 49 El 75% de las horas trabajadas por Ronnie están por debajo de 49 horas; Eso quiere decir que entre 31 hor
a) IQR 17.50 El rango intercuartílico de horas trabajadas por Ronnie es de 17 horas y 30 minutos aproximada

b) Varianza 267.43

c) Mediana 45 Se puede decir que la media de las horas trabajadas por Ronnie cada semana en los últimos dos
Desviación Estándar 16.35 de 45 horas, con una tendecia a variar por enciama o por debajo de 16 horas y 21 minutos.

e) p25 31.50 El primer cuartil es igual el percentil 25.


60 min = 100%
x = 50%
100% * x = 50% * 60 min
x = 3,000 /100 min
x = 30 min

minutos y el 75% restante por encima de 31 horas con 30 minutos.

uiere decir que entre 31 horas con 30 minutos y 49 horas se encuentra el 50% de las horas trabajadas por Ronnie.
y 30 minutos aproximadamete.

60 min = 100%
x = 50%
100% * x = 35% * 60 min
emana en los últimos dos meses es x = 2,100 /100 min
horas y 21 minutos. x = 21 min
PARTE - 2

DISTRIBUCION NORMAL ESTAND


E-2

MAL ESTANDARIZADA
1.- El tiempo promedio que recorre una persona para llegar de su casa al trabajo es de 24 min con
¿Cuál es la probabilidad de que llegue en al menos 32 min?
Si la oficina la abren a las 9:00 am y sale de su casa a las 8:45am, ¿Qué porcentaje de las veces no
Si sale a las 8:35am de su casa, y el café lo sirven de 8:50am a 9:00am, ¿Qué porcentaje de las vec
¿El 75% de las ocasiones, en que intervalo de tiempo llega?

a) µ 24 min
σ 3.8 min
X 32 min

Z= (32−24)/3.8 =
2.11

Z 2.11 0.4826
R) La probabilidad de que llegue en al menos 32 minutos es de 48%.

b) X 15 min

Z= (15−24)/3.8 =
-2.37

Z -2.37 0.4911
R) En el 49% de las veces que sale de su casa a las 8:45 no llega a tiempo a su trabajo.

c) P(15 <𝑥 <25)

Z1= (15−24)/3.8
= -2.37

Z -2.37 0.4911

Z2= (25−24)/3.8
= 0.26

Z 0.26 0.1026
0.3885
R) De las veces que sale de su casa a las 8:35 am el 38% de estas se pierde el café porque l
d) 𝜇±2∙𝜎=24 ±2∙3.88

intervalo 1 16.4 min


intervalo 2 31.6 min
R) El 75% de la veces llega entre 16.4 minutos y 31.6 minutos.
ajo es de 24 min con una desviación estándar de 3.8 min.

ntaje de las veces no llega a tiempo a su trabajo?


porcentaje de las veces se pierde el café?

empo a su trabajo.

e pierde el café porque llega después de las 9:00 am.


2.- El promedio de ingresos anuales de un profesionista
especializado en determinada empresa es de 34,000 dlls, con
una desviación estándar de 2,000 dlls.

a) ¿Cuál es el porcentaje de las personas que ganan más de


35,000 dlls?
b) ¿Cuál es la probabilidad de elegir una persona, que gane
entre 33,500 y 35,500 dlls?
c) ¿Qué porcentaje de las personas ganan entre 34,500 y
35,600 dlls? a
d) ¿En qué intervalo de ingresos se encuentra el 96% de los
profesionistas?
 

dado que el 19.15% obtenido correspon


bajo la curva, es necesario restarle el 19,
total de más de 35000

96%
Z=(x-Media)/Desviación Estandar

Media Desviación Estandar


34000 2000

X valor Z
35000 0.5

Probabilidad según la tabla 19.15% Porcentaje de las personas que ganan


30.85%

ado que el 19.15% obtenido corresponde a un z de 0,5 lo cual es la mitad del área
jo la curva, es necesario restarle el 19,15% al 50% (mitad) para poder obtener el
tal de más de 35000

X1 X2
33500 35500

Valor Z1 Valor Z2
-0.25 0.75

Porcentaje según la Probabilidad 1 Probabilidad 2 Probabilidad total


tabla 9.87% 27.34% 37.21%

La probabilidad de elegir una persona que gane entre 33,500 y 35,500 dlls es de 37,21%

X1 X2
34500 35600

Valor Z1 Valor Z2
0.25 0.8

Porcentaje según la Probabilidad 1 Probabilidad 2 Probabilidad total


tabla 9.87% 28.81% 18.94%

el porcentaje de las personas que ganan entre 34,500 y 35,600 dlls es de 18,94%

Para 96% es necesario dividirlo entre 2 para así obtener el porcentaje exacto para cada lado de la curva

0.4800
se busca en la tabla, el valor Z correspondiente a 0,4800 y se obtiene un Z de 2,06
Utilizando la fórmula se obtiene el siguiente rango para valores de +- 2,06
X1 X2
38120 29880

Respuesta: El intervalo del 96% estará entre 38120 y 29880


rcentaje de las personas que ganan más de 35000

obabilidad total

obabilidad total

ada lado de la curva

un Z de 2,06
3.- Una máquina expendedora de refrescos, rellena vasos de 200ml con una desviación estándar d
a) ¿Cuál es el porcentaje de los vasos que se rellenan con menos de 190ml?
b) ¿En una remesa de 1000 vasos de 230ml, cuántos se derraman?
c) ¿Cuál es la probabilidad de que se rellenen entre 195 y 210ml?
d) ¿En qué intervalo de mililitros se rellena el 95% de los vasos?

a) µ 200 ml
σ 5 ml
X 190 ml

Z= (190−200)/5
= -2

Z -2.00 0.4772
R) El porcentaje de vasos que se rellenan con menos de 190 ml es de 48%.

b) X 230 ml

Z= (230−200)/5 = 6

Z 6.00 1.0000
R) De los 1000 vasos de 230 ml ninguno se derrama ya que la maquina está preparada para r

c) X 195 ml X 210 ml

P(195 <𝑥 <210)

Z1= (195−200)/5 = Z2= (210−200)/5 =


-1.00 0.26

Z1 -1.00 0.3413 Z2 2.00 0.4772

14%

R) El 14% de los vasos entre 195 y 210 ml se derraman.


d) 𝜇±3∙𝜎=200 ±3∙5

intervalo 1 185 ml
intervalo 2 215 ml
R) En el intervalo de 185 y 215 ml se rellenan el 95% los vasos.
una desviación estándar de 5ml.
ml?

aquina está preparada para rellenar vasos de 200 ml con una desviación estándar muy baja de 5ml.
4
Las estaturas y pesos de 10 jugadores de baloncesto de un
equipo son:
Estatura (X) Pesos (Y)
186 85 Estatura (X)
189 85 186
190 86 189
192 90
193 87 190
193 91 192
198 93
201 103 193
203 100 193
205 101 198
Calcular:
a) La recta de regresión de Y sobre X. ¿Es el modelo ajustado a 201
los datos el adecuado? 203
b) El coeficiente de correlación. Interpretar. 205
c) El peso estimado de un jugador que mide 208 cm.

Coeficiente de Correlación
0.944225420910846

a
b
c
120

100 f(x) = 1.02173913043478 x − 107.139130434782


Pesos (Y)
R² = 0.891561645494264
85
80
85
86
90 60

87
91 40
93
103 20
100
101 0
185 190 195 200 205 210

Coeficiente de Correlación Peso estimado


0.944225420910846 105.3736

Tal como se observa en el gráfico la recta de la regresión es Y= 1,0217x - 107,14. El modelo ajustado de datos para este caso e
El coeficiente de correlación resultante es de 0,94 lo cual al tener un valor cercano a 1, corresponde a la existencia de una corr
El peso estimado correspondiente a un jugador que mide 208cm es de 105,37kg
5 210

o ajustado de datos para este caso es el adecuado dado a que no existe mucha disperción entre los puntos.
rresponde a la existencia de una correlación lineal y directa
Z X-u/o
a.
Z -0.63 daría un área de 0.2357 0.50-0.2357 26.43
b.
Z -0.63 daría un área de 0.2357 0.50+0.2357 73.57
c.
Z -0.89 daría un área de 0.3133
1.53 daría un área de 0.4370 0.3133+0.4370 75.03
d.
Z 1.84 daría un área de 0.4671
2.68 daría un área de 0.4963 0.4671+0.4963 50.10
%

%
u= 50
g= 5.2
x= probabilidiad de que las bolsas pesen mas de 60 lbs

z 1.92

usando la tabla nos indica que 1.92 es igual a 0.4726 es decir 47.26%

es decir que 0.50+0.4726 0.9726


No deberia cargar ninguna de estas bolsas ya que la probabilidad de que estas pesen mas de 60 lbs es de 97.26%
60 lbs es de 97.26%
µ B/. 23,500.00
σ B/. 9,400.00
34%

𝜇±1∙𝜎

B/. 32,900.00
Sí, se debería ejecutar la actualización de la computadoras ya que el valor excedido proye
e el valor excedido proyectado al 34% es de 9,400 y en la ultima actualización propuesta fue de 25,000.
5,000.
36. El promedio de los salarios en los bancos comerciales en Illinois
es de US$22.87 por hora, con una desviación estandar de US$ 5.87.
Cuál debe ser su salario por hora si desea ganar:
a. ¿Más que el 80% de todos los empleados?
b. ¿Más que el 30% de todos los empleados?
c. ¿Menos que el 20% de todos los empleados?
d. ¿Más que el 50% de todos los empleados? a
b
c
d
Media Desviación Estándar Z=(x-Media)/Desviación Estandar
22.87 5.87

Probabilidad Valor Z según tabla Salario por Hora


80% 0.84 27.80
30% -0.52 19.82
20% 0.84 27.80 Dado a que el salario por hora debe ser "Menor" al 20% esto
50% 0.00 22.87
debe ser "Menor" al 20% esto correspondería a una probabilidad del 80%
PARTE - 3

INTRODUCCION A LA REGRESIO
SIMPLE Y CORRELACIÓN
E-3

REGRESION LINEAL
RRELACIÓN
1. Cinco niños de 2, 3, 5, 7 y 8 años de edad pesan, respectivamente, 14, 20, 32, 42 y 44 kilos.
Hallar la ecuación de la recta de regresión de la edad sobre el peso. ¿Es el modelo ajustado a los datos el adecuad
¿Cuál sería el peso aproximado de un niño de seis años?

x y x*y x^2 y^2 x- x promedio y - y promedio


2 14 28 4 196 -3 -16.4
3 20 60 9 400 3 20
5 32 160 25 1024 -25.4 32
7 42 294 49 1764 7 42
8 44 352 64 1936 8 44
25 152 894 151 5320

Calculamos los promedios :

Promedio x= 5

Promedio y= 30.4

Calculamos la covarianza y la varianza de y

oxy= 26.8
ox= 12.46
oy= 32.84

La recta de regresión de la edad sobre el peso es aquella que pasa por el punto (x,y) y tiene pendiente oxy/oy

Chart Title
50
45
f(x) = 5.15384615384615 x + 4.63076923076924
40
35
30
25
20
15
10
f(x) = 5.15384615384615 x + 4.63076923076924
40
35
30
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9

Para encontrar el peso aproximado de un niño de seis años, sustituimos {x=6} en la ecuación de regresión y obtene

y=5.1538x +4.6308

y= 35.55

El peso aproximado de un niño de 6 años es de 35.55 kg.


32, 42 y 44 kilos.
delo ajustado a los datos el adecuado?

x-x promedio ^2 y-y promedio ^2


9 268.96
9 400
645.16 1024
49 1764
64 1936
776.16 5392.96

Coefficients
Intercept 4.6307692
X Variable 15.1538462

(x,y) y tiene pendiente oxy/oy


n la ecuación de regresión y obtenemos:
Standard Error t Stat P-value Lower 95% Upper 95%Lower 95.0%
Upper 95.0%
1.8231256 2.5400166 0.0846783 -1.17123 10.432769 -1.17123 10.432769
0.3317517 15.535253 0.0005795 4.0980643 6.209628 4.0980643 6.209628
2
Un centro comercial sabe en función de la distancia, en kilómetros, a la que se sitúe de un n
Nº de Clientes (X) Distancia (Y)
8 15
7 19
6 25
4 23
2 34
1 40
a)Calcular el coeficiente de correlación lineal. Interpretar.
b)Si el centro comercial se sitúa a 2 km, ¿cuántos clientes puede esperar?
c)Si desea recibir a 5 clientes, ¿a qué distancia del núcleo de población debe situarse?

Nº de Clientes (X) Distancia (Y) X*Y x2


8 15 120 64
7 19 133 49
6 25 150 36
4 23 92 16
2 34 68 4
1 40 40 1
28 156 603 170

Covarianza
desviación estandar
Coeficiente de correlación lineal
promedio x
promedio y

Calculamos la covarianza, las varianza y las desviaciones estándares


oxy= -20.83
ox^2 6.56 ox
oy2 73.33 oy

El coeficiente de correlación está dado por


r -0.95
a) Se tiene una correlación negativa muy fuerte.
hablaremos de correlación negativa perfecta lo que supone una determinación absoluta entre las dos vari

La recta de regresión de los clientes sobre la distancia, es aquella que pasa por el punto y tiene pendiente
x-4.67= 0.28(y-26)
7.38636363636 12.0530303030303
Despejamos y obtenemos la recta de regresión
x= -0.28y +12.05

b)Si el centro comercial se sitúa a 2 km, ¿cuántos clientes puede esperar?


X 11.49 seria igual a 12 clientes

c)Si desea recibir a 5 clientes, ¿a qué distancia del núcleo de población debe situarse?
y= 0.28x - 12.05

y- 26 =-3.18(x-4.67)

y=-3.18x+40.85
Y 24.9601694915254 de distancia
que se sitúe de un núcleo de población, acuden los clientes, en cientos, que figuran en la tabla:

debe situarse?

y2
225
361
625
529
1156 0.9
1600
4496

-20.8333333333 -0.28 -3.18


12.95
-0.95
4.666666666667
26

2.56
8.56

luta entre las dos variables ( en sentido inverso): Existe una relación funcional perfecta entre ambas(una relación lin

iene pendiente
situarse?
guran en la tabla:

re ambas(una relación lineal de pendiente negativa).


3 Las notas obtenidas por cinco alumnos en Matemáticas y Química son:
Matemáticas Química
6 6.5
4 4.5
8 7
5 5
3.5 4
Determinar las rectas de regresión y calcular la nota esperada en Química para un alumno que

x y
Matemáticas Química
6 6.5
4 4.5
8 7
5 5
3.5 4
26.5 27

x=7.5
y = 0.6953x + 1.7148
y = 0.6953(7.5) + 1.7148
6.9

Interpretación
El estudiante que pose una nota de 7
Existe asociación o dependencia ent
nota de química varia con respecto a
materia que la otra Ejemplo si estud
viceversa.
Resumen El intercepto es 1.71 e indica una pe

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.961053623459263
Coeficiente de determinación R^2 0.923624067164179
R^2 ajustado 0.898165422885572
Error típico 0.413004741699979
Observaciones 5

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados
Regresión 1 6.18828125
Residuos 3 0.51171875
Total 4 6.7

Coeficientes Error típico


Intercepción 1.71484375 0.639094812498098
Variable X 1 0.6953125 0.115438334683862

Análisis de los residuales

Observación Pronóstico para Y Residuos


1 5.88671875 0.613281249999999
2 4.49609375 0.00390625
3 7.27734375 -0.277343750000001
4 5.19140625 -0.19140625
5 4.1484375 -0.1484375
son:

ímica para un alumno que tiene 7.5 en Matemáticas. ¿Es el modelo ajustado a los datos el adecuado?

Regresión lineal
8

7 f(x) = 0.6953125 x + 1.71484375


R² = 0.923624067164179
6

5
Química

0
3 4 5 6 7 8 9

Matemáticas

nterpretación
estudiante que pose una nota de 7.5 en matemáticas según la proyesion puede obter un 6.9 en química.
iste asociación o dependencia entre las materias de matemática y química (R2=0,92). El R2 establece que el 92% de la
ota de química varia con respecto a matemática esto quiere decir que los estudiantes dedican más tiempo a estudiar una
ateria que la otra Ejemplo si estudian más matemática la nota es más alta en esta asignatura y más baja en química y
ceversa.
intercepto es 1.71 e indica una pendiente positiva.
Promedio de los cuadrados F Valor crítico de F
6.18828125 36.279389313 0.009172356653865
0.170572916666667

Estadístico t Probabilidad Inferior 95% Superior 95%


2.68323841230538 0.0748426253 -0.319041174760558 3.7487286748
6.02323744451247 0.0091723567 0.327936198297239 1.0626888017

Resultados de datos de probabilidad

Residuos estándares Percentil Y


1.71464421119729 10 4
0.010921300708263 30 4.5
-0.775412350286674 50 5
-0.535143734704886 70 6.5
-0.415009426913993 90 7
datos el adecuado?

Variable X 1 Gráfico de los residuales


0.8
0.6
Residuos

0.4
0.2
0
-0.2 3 4 5 6 7 8 9
-0.4
Variable X 1

Variable X 1 Curva de regresión ajustada


8
6
9 Y
4
Pronóstico para Y
Y

2
0
3 4 5 6 7 8 9
Variable X 1

el 92% de la
a estudiar una
n química y Gráfico de probabilidad normal
8
6
4
Y

2
0
0 10 20 30 40 50 60 70 80 90 100
Muestra percentil
Inferior 95.0% Superior 95.0%
-0.3190411748 3.748728674761
0.3279361983 1.062688801703
residuales

7 8 9

ón ajustada

Y
Pronóstico para Y

normal

70 80 90 100
4.- El peso promedio de ratas de laboratorio, utilizadas para experimentos, es de 189grs, con una desviación e
a) ¿Qué porcentaje de los animales pesan más de 200grs?
b) ¿Qué porcentaje pesan entre 195 y 205 grs?
c) ¿Qué porcentaje pesan al menos 175grs?
d) ¿En qué intervalo de pesos se encuentra el 95% de los animales?

como el 47.32% obtenido corresponde a un


es necesario restarle el 47.32% al 50% (mita

como el 49.31% obtenido corresponde a un


es necesario restarle el 49.31% al 50% (mita
como el 49.31% obtenido corresponde a un
es necesario restarle el 49.31% al 50% (mita

95%
rimentos, es de 189grs, con una desviación estándar de 5.7grs.

¿Qué porcentaje de los animales pesan más de 200grs?


Z=(x-Media)/Desviación Estandar

Media Desviación Estandar


189 5.7

X valor Z
200 1.93

Probabilidad según la tabla 47%

como el 47.32% obtenido corresponde a un z de 1,93 lo cual es la mitad del área bajo la curva,
es necesario restarle el 47.32% al 50% (mitad) para poder obtener el total de más de 200grs.

¿Qué porcentaje pesan entre195 y 205grs?


X1 X2
195 200

Valor Z1 Valor Z2
1.05 1.93

Probabilidad 1 Probabilidad 2
Porcentaje según la tabla 35.31% 47.32%

¿Qué porcentaje pesan al menos 175grs?


Media Desviación Estandar
189 5.7

X valor Z
175 -2.46

Probabilidad según la tabla 49.31%

como el 49.31% obtenido corresponde a un z de -2.46 lo cual es la mitad del área bajo la curva,
es necesario restarle el 49.31% al 50% (mitad) para poder obtener el total al menos 175 grs
como el 49.31% obtenido corresponde a un z de -2.46 lo cual es la mitad del área bajo la curva,
es necesario restarle el 49.31% al 50% (mitad) para poder obtener el total al menos 175 grs

¿En qué intervalo de pesos se encuentra el 95% de los animales?

0.48
se busca en la tabla, el valor Z correspondiente a 0,4800 y se obtiene un Z de 2,06

Utilizando la fórmula se obtiene el siguiente rango para valores de +- 2,06


X1 X2
200.742 177.258

Respuesta: El intervalo del 96% estará entre 38120 y 29880


Porcentaje de animales que pesan más de 200grs
2.68%

Probabilidad total
82.63%

Porcentaje de animales que pesan más de 200grs


0.69%
se obtiene un Z de 2,06
X Y X*Y X^2 y^2
25 42 1050 625 1764
42 72 3024 1764 5184
33 50 1650 1089 2500
54 90 4860 2916 8100
29 45 1305 841 2025
36 48 1728 1296 2304
219 347 13617 8531 21877

media x 36.5 covarianza 158.58


media y 57.83

ox^2 89.58 ox 9.464847243


oy^2 301.47 oy 17.36295545759
Oxy 158.58

R 0.96
Seria correlación positiva perfecta lo que quiere decir absoluta relación entre las dos variables (en sentido directo), existe una

y -57.83= 1.77(x-36.55)
y=1.77x-6.78 remplazando 47 en el test las ventas serian de
y 76.41
El modelo parece ser el adecuado ya que toca varios puntos en la recta y los demas puntos premanecen cerca
1.77

en sentido directo), existe una relación lineal perfecta con pendiente positiva.

emanecen cerca
a Y es igual 40 unidades mas un aumento de 3 veces x1 menos 4 aumento el valor de x2
b 15
ento el valor de x2
46. Los datos que aparecen aquí se recolectaron para y
explicar los niveles salariales para los trabajadores en una Salario (US1000)
planta local. 1 42.2
a. Calcule el modelo de regresión utilizando un computador. 2 58.9
b. ¿Existe evidencia de la determinación de sexo en cuanto 3 98.8
a los niveles salariales? 4 23.5
c. ¿La educación es útil para explicar el salario?
5 12.5
6 67.8
7 51.9
8 81.6
9 61

SUMMARY OUTPUT

Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations

ANOVA

Regression
Residual
Total

Intercept
X Variable 1

RESIDUAL OUTPUT

Observation
1
2
3
4
5
6
7
8
9
X 120
Años de Educación Sexo
8 M 100
12 M f(x) = 7.31412133891214 x − 21.8490585774059
16 M R² = 0.977742277252028
80
6 F
5 M
60
12 M
10 F
40
14 F
12 F
20

ARY OUTPUT
0
4 6 8 10 12 14 16 18
Regression Statistics
0.988808513945966
0.977742277252029 Respuestas Análisis
0.974562602573747 R2 obtenido de 98.00% indica que al existe una dependencia entre el total de años respec
salario que devenga.
4.29881741199387 El intercepto obtenido de -21.84 nos indica la existencia de una pendiente negativa. Se ob
9 también que por cada unidad de X (Años de educación) el salario aumentará en 7.31
aproximadamente.

b. No se puede determinar si el sexo influye en cuanto a los niveles salariales en la muestr


estudiado dado a que, la media para ambos sexos está entre 54% y 56%. Por lo cual para u
mejor estimación se necesaría una muestra más grande.
c. Observando el R2 obtenido el cual corresponde a 0.9777 el mismo es cercano a 1 por lo
modelo de regresión se puede asumir como correcto.

df SS MS F Significance F
1 5682.503404 5682.503404 307.4975827 4.82958E-07
7 129.358818 18.47983114
8 5811.862222

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0%
-21.8490585774059 4.630051548 -4.71896659 0.00216015 -32.7973908 -10.9007264 -32.7973908
7.31412133891214 0.417101074 17.53560899 4.82958E-07 6.327834025 8.300408653 6.327834025

UAL OUTPUT PROBABILITY OUTPUT

Predicted Y ResidualsStandard Residuals Percentile Y


36.6639121338912 5.536087866 1.376733717 5.555555556 12.5
65.9203974895397 -7.02039749 -1.74585703 16.66666667 23.5
95.1768828451883 3.623117155 0.901009462 27.77777778 42.2
22.0356694560669 1.464330544 0.364154847 38.88888889 51.9
14.7215481171548 -2.22154812 -0.55246237 50 58.9
65.9203974895397 1.87960251 0.467426134 61.11111111 61
51.2921548117155 0.607845188 0.15116107 72.22222222 67.8
80.548640167364 1.051359833 0.261455845 83.33333333 81.6
65.9203974895397 -4.92039749 -1.22362168 94.44444444 98.8
14 16 18

X Variable 1 Residual Plot


ia entre el total de años respecto al
10
una pendiente negativa. Se observa 5
Residuals

alario aumentará en 7.31


0
4 6 8 10 12 14 16 18
-5
niveles salariales en la muestra
e 54% y 56%. Por lo cual para una -10

el mismo es cercano a 1 por lo cual el X Variable 1

X Variable 1 Line Fit Plot


120
100
80
60 Y
Predicted Y
Y

40
20
0
4 6 8 10 12 14 16 18
Upper 95.0% X Variable 1
-10.9007264
8.300408653

Normal Probability Plot


150

100
Y

50

0
0 10 20 30 40 50 60 70 80 90 100
Sample Percentile
150

100

Y
50

0
0 10 20 30 40 50 60 70 80 90 100
Sample Percentile
6 18

Y
Predicted Y

90 100
90 100

También podría gustarte