Está en la página 1de 12

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

(DECANA DE AMÉRICA)

FACULTAD DE INGENIERÍA DE SISTEMAS E INFORMÁTICA

ESCUELA PROFESIONAL DE INGENIERÍA DE SOFTWARE

PRÁCTICA N°6, N°7


GRUPO: 3
Curso: Estadística
Semana: 13
Preguntas designadas: Preg3,
Docente: Jacinto Pedro Mendoza Solis
Responsable del grupo:
Torres Talaverano, Luz Elena
Integrantes:
Pichilingue Pimentel, Nathaly Nicole
Ramos Rivas, Kevin Keyler
Reyes De la Cruz, Andrés Eduardo
Torre Arteaga, Alexander
Torres Talaverano, Luz Elena
Fecha de entrega:
8 de setiembre
LIMA – PERÚ
2020
1. PRÁCTICA N°6

GRUPO 3
PREGUNTAS 3-8

2. PRÁCTICA N° 7

GRUPO PREGUNTAS
3 8 12

Práctica N° 6:

8. Al estudiar el comportamiento de dos variables, aparecieron 100 pares de valores tales,


que, efectuados los cálculos aritméticos correspondientes, se obtuvieron los siguientes
resultados;

∑ 𝑋=12500, ∑ 𝑌=8000, ∑ 𝑋𝑌 =1000425, ∑ 𝑋2 =1585000, ∑ 𝑌 2 =648000

Hallar la V (X+Y) y V (X – Y).

Solución:

• Sacamos la media aritmética (de X y Y):

∑𝑃𝑖=1 𝑥𝑖 𝑓𝑖
𝑀(𝑋) =
𝑛
125000
= = 125
100

∑𝑃𝑖=1 𝑦𝑖 𝑓𝑖
𝑀(𝑌) =
𝑛
8000
= = 80
100
• Ahora, sacamos la varianza de X y de Y:
∑𝑃𝑖=1(𝑥𝑖 − 𝑥̅ )2 𝑓𝑖
𝑉(𝑋) =
𝑛−1

∑ 𝑥 2 − 2𝑋̅ ∑ 𝑋 + 𝑋̅2
=
𝑛−1

1585000 − 2 (125)(12500) + (125)2 (100)


=
100 − 1
22500
= = 227,2727273
99
∑𝑃𝑖=1(𝑦𝑖 − 𝑦̅)2 𝑓𝑖
𝑉(𝑌) =
𝑛−1

∑ 𝑌 2 − 2𝑌̅ ∑ 𝑌 + 𝑌̅ 2
=
𝑛−1

648000 − 2(80)(8000) + (80)2 (100)


=
100 − 1

8000
= = 80,80808081
99
• Luego, sacamos la covarianza de xy:

∑ℎ𝑖=1 ∑ℎ𝑖=1 𝑥𝑖 𝑦𝑗
𝐶𝑜𝑣 (𝑥, 𝑦) = − 𝑥̅ 𝑦̅
𝑛

∑ 𝑥𝑦 1000425
= − 𝑥̅ 𝑦̅ = − (125)(80)
𝑛 100

= 4,25
• Por último, hallamos V (X + Y) y V (X – Y)
o Primero, V (X + Y)

𝑉 (𝑋 + 𝑌) = 𝑉(𝑋) + 𝑉(𝑌) + 2𝐶𝑜𝑣(𝑋𝑌)


= 227,2727273 + 80,80808081 + 2(4,25)

= 316,5808081 → 𝑅𝑒𝑑𝑜𝑛𝑑𝑒𝑜: 316,6


o Finalmente, V (X – Y)
𝑉 (𝑋 − 𝑌) = 𝑉(𝑋) + 𝑉(𝑌) − 2𝐶𝑜𝑣(𝑋𝑌)
= 227,2727273 + 80,80808081 − 2(4,25)
= 299,5808081 → 𝑅𝑒𝑑𝑜𝑛𝑑𝑒𝑜: 299,6
3. La siguiente distribución bidimensional es de 200 trabajadores con respecto a su edad ( X :
años ) e ingresos ( Y : en Soles ).

a) Construir una tabla de distribución de frecuencias bidimensionales.

b) Determine el porcentaje de trabajadores que tienen como mínimo 25 años y al mismo


tiempo sus ingresos no superan los 200 soles.

c) ¿Qué porcentaje de trabajadores tienen ingresos menores de 300 soles?

d) Si los trabajadores tienen 25 años, ¿cuál es su ingreso promedio?


e) ¿Cuál de las dos variables determinar una distribución más homogénea? ¿Por qué?

f) Calcular e interpretar la covarianza.

Solución:

a) Construimos la tabla de distribución de frecuencias bidimensionales:

DISTRIBUCIÓN DE 200 TRABAJADORES CON ESPECTO A SU EDAD E INGRESO

Ingresos

Frecuencia
Edad
100 200 300 400 Marginal fi
20 10 20 0 10 40
25 10 40 30 0 80
30 10 40 0 10 60
35 10 0 10 0 20
Frecuencia
Marginal fj 40 100 40 20

b) Determinando el porcentaje de trabajadores que tienen como mínimo 25 años y al mismo


tiempo sus ingresos no superan los 200 soles:

Sumamos: 10+40+10+40+10+0=110

Obteniendo el porcentaje:
110
𝑥100 = 55% (Porcentaje de trabajadores que tienen como mínimo 25 años y al mismo
200
tiempo sus ingresos no superan los S/. 200)

c) Determinando el porcentaje de trabajadores tienen ingresos menores de 300 soles:

Para ello calculamos F42

Sumamos: 10+20+10+40+10+40+10+0 = 140

Obteniendo el porcentaje:
140
𝑥100 = 70% (Porcentaje de trabajadores tienen ingresos menores de S/. 300)
200
d) A continuación, realizaremos la distribución de Y condicionada a que X = 25

Ingresos

Frecuencia
Edad
100 200 300 400 Marginal fi
25 10 40 30 0 80
1000 8000 9000 0 18000

𝑌 18000
𝑀 ( = 𝑋𝑖 ) = = 225
𝑋 80

El ingreso promedio de los trabajadores con 25 años es 225.

e)Calculamos el coeficiente de variación de cada variable

Calculamos la media marginal de X y Y

Edad Fi XiFi Ingresos Fi YiFi

100 40 4000
20 40 800
25 80 2000 200 100 20000
30 60 1800 300 40 12000
35 20 700 400 20 8000
Total 200 5300 Total 200 44000

∑𝑝𝑖=1 𝑋𝑖 𝑓𝑖 5300 ∑𝑝𝑖=1 𝑋𝑖 𝑓𝑖 44000


𝑀(𝑋) = = = 26.5 𝑀(𝑌) = = = 220
𝑛 200 𝑛 200

Hallamos la varianza marginal de cada variable:

Para la variable X:

(20 − 26.5)2 40 + (25 − 26.5)2 80 + (30 − 26.5)2 60 + (35 − 26.5)2 20


𝑆𝑥2 = = 20.351
200 − 1
Para la variable Y:

(100 − 220)2 40 + (200 − 220)2 100 + (300 − 220)2 40 + (400 − 220)2 20


𝑆𝑥2 =
200 − 1
= 7638.190
Hallamos el coeficiente de variación de cada variable

Para la variable X:
𝑆𝑥 4.51
𝐶𝑉𝑥 = = 𝑋100 = 17.01%
𝑀(𝑋) 26.5
Para la variable Y:
𝑆𝑌 87.39
𝐶𝑉𝑦 = = 𝑋100 = 39.72%
𝑀(𝑌) 220
Podemos apreciar que la variable X tiene menor coeficiente de variación por lo que podemos
decir que la variable X tiene una distribución más homogénea.

f) Cálculo de la Covarianza

Edad Ingresos
100 200 300 400 XYfij
20 20000 80000 0 80000 180000
25 25000 200000 225000 0 450000
30 30000 240000 0 120000 390000
35 35000 0 105000 0 140000
fj 40 100 40 20 1160000

𝑝
𝑞
∑ ∑ 𝑋𝑖 𝑌𝑖 𝑓𝑖𝑗
𝑗=1 1160000
𝐶𝑜𝑣(𝑥, 𝑦) = 𝑖=1
− 𝑋̅𝑌̅ 𝐶𝑜𝑣(𝑥, 𝑦) = − (26.5)(220) = −30
𝑛 200

Interpretación:

Por lo tanto, en el grupo de 200 trabajadores los que tienen mayor edad reciben los sueldos más
bajos.

Practica Nº 7

8. El número de vendedores que emplea un comerciante de coches varía, el valor más bajo, a
ocho, el valor más alto. ¿Depende el número de nuevos coches vendidos Y, del número de
vendedores X? Para aclarar esta cuestión, el gerente de ventas examinó los registros de las
ventas para los últimos cuatro meses y localizó un período de ocho semanas durante el cual
no se utilizaron programas de estímulos especiales. El número de coches vendidos
semanalmente Y, y el número de vendedores X, se muestran en la siguiente Tabla.

a) Encuentre la recta de mínimos cuadrados para los datos. Graficar


A continuación, para obtener los mínimos cuadrados, realizamos una tabla con las dos
variables proporcionadas en el problema:
SEMANA X Y X^2 XY
1 5 10 25 50
2 6 20 36 120
3 5 18 25 90
4 4 10 16 40
5 5 21 25 105
6 6 15 36 90
7 7 13 49 91
8 8 22 64 176
SUMA: 46 129 276 762

Reemplazando los datos:


8a + 46 b = 129 ….................. (Ec. I)
46 a + 276 b = 762 …............. (Ec. II)
-----------------------------------------------------------------------------------
Resolviendo obtenemos los valores de a y b:
• a= 5,999= 6
• b= 1,761

Gráfica de los datos de la tabla y valores de a y b obtenemos la regresión lineal:


Y y = 1.7609x + 6

25

20

15

10

0
0 1 2 3 4 5 6 7 8 9

Entonces, el resumen de modelo y estimaciones de parámetro de los datos obtenidos sería lo


siguiente:

Resumen de modelo y estimaciones de parámetro


Variable dependiente: Y

Resumen del modelo Estimaciones de parámetro

Constante
Ecuación R cuadrado F gl1 gl2 Sig. (a) b1

Lineal 0,219 1,682 1 6 0,242 6,000 1,761

La variable independiente es X.

Con una gráfica lineal mostrada a continuación:


Cuya ecuación de la recta de los mínimos cuadrados es Y = 1

b) Utilice la recta de mínimos cuadrados para estimar el número promedio de coches


vendidos semanalmente si el comerciante emplea a 6 vendedores.
Utilizamos la recta de mínimos que hallamos: y= 1.761x + 6
Estimaciones:
Si el comerciante emplea a 6 vendedores
X=6 -> Y=1.761(6) + 6 = 16.566
Aproximadamente se venderán 16 coches
c) ¿Qué tan confiable es la estimación obtenida en (b)? Justificar su respuesta.
Luego de obtener la estimación en la parte b) se compara el resultado con la semana 2 y la
semana 6 en la cual también había 6 vendedores cuyo resultado obtenido fue 20 y 15
respectivamente, notamos que hay cierto margen de error, observamos que para el primer error
de la semana 2 (e=20-16.566=3.434), y el error de la semana 6 (e=15-16.566= -1.566). Por lo
tanto, se requiere conocer el error para que la estimación sea más cercana al valor real.
Por lo cual esta estimación no es tan confiabble ya que se encuentra un tanto alejada de los
valores reales.que se obtendrían si tuviéramos 6 vendedores.

12. Para diferentes compañías, los valores X en la siguiente tabla corresponden a las
inversiones en investigación, en millones de soles, mientras que los valores de Y corresponden
a los beneficios obtenidos, en millones de dólares.

a) Hallar la gráfica de los pares (x,y) en un sistema de coordenados cartesianos X-Y.


b) Ajustar los datos a una curva de la forma 𝑌 = 𝑎𝑏 𝑥
c) Hallar el coeficiente de determinación y hacer 2 estimaciones para el modelo.

Solución:
a. Realizamos la gráfica de los pares (x,y) en el sistema de coordenadas cartesianas.

b. Ajustar los datos a una curva de la forma Y=ab^x


A continuación, realizaremos la respectiva gráfica:

• Tabla de valores:
X Y X^2 log Y X logY (log Y)^2
2 150 4 2.17609126 4.35218252 4.73537317
3 200 9 2.30103 6.90308999 5.29473904
4.5 580 20.25 2.76342799 12.435426 7.63653428
6 1130 36 3.05307844 18.3184707 9.32128798
15.5 2060 69.25 10.2936277 42.0091691 26.9879345

• Ecuaciones normales del modelo Y=ab^x

10.2936277 = 4 log a + 15.5 log b


42.0091691 = 15.5 log a + 69.25 log b

Resolviendo las ecuaciones obtenemos lo siguiente:


a= 47.718
b= 1.702

• Y=ab^x
Reemplazando los valores de a y b obtenido:
Y= 47.718 (1.702) ^x, Modelo Exponencial o compuesto

c. Determinar el coeficiente de determinación y hacer dos estimaciones para el modelo

• Coeficiente de determinación:

Por lo tanto, podemos decir que el 98.3% de la variación de los beneficios obtenidos en millones
de dólares se debe a las inversiones en investigación en millones de soles y el 1.7% se debe a
otros factores.

A continuación, mostraremos un resumen de modelo y estimaciones de parámetro, la cual


podemos observar el resultado de R cuadrado y las estimaciones de parámetro.
• Estimaciones:
a. X = 4, sabiendo que el Modelo Exponencial o compuesto está determinado
por:
Y= 47.718 (1.702) ^x, reemplazamos para dicho valor:
Y= 47.718 (1.702) ^4 ---> Y = 400.4243284

b. X = 3, sabiendo que el Modelo Exponencial o compuesto está determinado


por:
Y= 47.718 (1.702) ^x, reemplazamos para dicho valor:
Y= 47.718 (1.702) ^3 ---> Y = 235.2669379
Entonces: e = 200 - 235.2669379 = - 35.2669379

También podría gustarte