Está en la página 1de 30

PRACTICO IV´

Nombre: Jose Maria Coca Pereira

Carrera: Ing. Telecomunicaciones

DISTRIBUCION BIDIMENSIONAL
1. Se han obtenido las siguientes edades de los padres de los nacidos en una maternidad:
E. P 37 31 26 27 32 17 25 23 24 33 17 22 33 26 36 23 39 38 24 35

E.M 36 26 26 29 30 16 17 18 27 37 28 17 31 27 22 27 23 21 30 17

ni 2 7 8 2 4 1 4 6 3 1 2 9 10 2 12 2 10 12 1 2

a) Clasifique estos datos formando la correspondiente tabla bidimensional de


frecuencias, con los siguientes intervalos de edades: [15,20[, [20,25[, [25,30[, [30,35[,
[35,40[

𝐸𝑃
[15-20[ [20-25[ [25-30[ [30-35[ [35-40[
𝐸𝑀
[15-20[ 1 2
[20-25[ 6 9 3+2=5 1
[25-30[ 4 8+2+2=12
[30-35[ 7 4+10=14 1
[35-40[ 2 12+10+12=34 2

b) Confeccione una lista de las marcas de clase de cada variable.

𝐸𝑃
[15-20[ [20-25[ [25-30[ [30-35[ [35-40[ Xi
𝐸𝑀
[15-20[ 1 2 17.5
[20-25[ 6 9 3+2=5 1 22.5
[25-30[ 4 8+2+2=12 27.5
[30-35[ 7 4+10=14 1 32.5
[35-40[ 2 12+10+12=34 2 37.5
yi 17.5 22.5 27.5 32.5 37.5
c) Calcule las frecuencias absolutas marginales.

EM fi EP fi

[15-20[ 3 [15-20[ 13
[20-25[ 21 [20-25[ 43
[25-30[ 16 [25-30[ 26
[30-35[ 22 [30-35[ 15
[35-40[ 38 [35-40[ 3
TOTAL 100 TOTAL 100

d) Las medias y varianzas marginales para ambas variables.

3 × 17.5 + 21 × 22.5 + 16 × 27.5 + 22 × 32.5 + 38 × 37.5


𝑥= = 31.05
100

13 × 17.5 + 43 × 22.5 + 26 × 27.5 + 15 × 32.5 + 3 × 37.5


𝑦= = 25.1
100

Varianzas

𝑆𝑥2
3(17.5 − 31,05)2 + 21(22.5 − 31.05)2 + 16(27.5 − 31.05)2 + 22(32.5 − 32.5 − 31.05)2 + 38(37.5 − 31.05)2
=
100

𝑆𝑥2 = 39.1

13(17.5 − 22.1)2 + 43(22.5 − 25.1)2 + 26(27.5 − 25.1)2 + 15(32.5 − 25.1)2 + 3(37.5 − 25.1)2
𝑆𝑦2 =
100

𝑆𝑥2 = 24.7
e) La covarianza.

1
𝑐𝑜𝑣 = 𝑥71993.75 − (31.059)(25.1) = −59.4
100

f) Calcular el promedio condicional M(y/x3); M(x/y2)

4 × 17.5 + 0 × 22.5 + 12 × 27.5 + 32.5 + 0 × 37.5


𝑀(𝑦/𝑥3 ) = = 25
16

0 × 17.5 + 9 × 22.5 + 0 × 27.5 + 0 × 32.5 + 34 × 37.5


𝑀(𝑥/𝑦3 ) = = 34.3
43

2. De acuerdo a una encuesta realizada a 20 personas se registró los siguientes datos

Donde: F= Femenino M= Masculino C= Casado S= Soltero D= Divorciado

En base a estos datos realice los cuadros bidimensionales y gráficos


bidimensionales.
a) Genero con Estado Civil

y
𝑥 femenino masculino total
c 3 3 6
s 5 6 11
d 1 2 3
Total 9 11 20

4
f
3 m

0
c s d

b) Edad con Estado Civil

y
𝑥 c s d total
20 2 1 0 3
21 1 1 0 2
22 0 5 0 5
23 1 2 1 4
24 1 1 1 3
25 1 1 1 3
total 6 11 3 20
6

c
3
s
d
2

0
20 21 22 23 24 25

c) Genero con Estado Civil

y
𝑥 femenino masculino total
c 3 3 6
s 5 6 11
d 1 2 3
Total 9 11 20

4
f
3 m

0
c s d
d) Genero con número de hijos

y
𝑥 masculino femenino total
0 4 3 7
1 3 4 7
2 4 0 4
3 0 1 1
4 0 1 1
total 11 9 20

4,5

3,5

2,5
m
2
f
1,5

0,5

0
0 1 2 3 4
e) Edad con número de hijos

y
𝑥 20 21 22 23 24 25 total
0 0 1 3 1 1 1 7
1 2 1 1 1 1 1 7
2 1 0 1 1 1 0 4
3 0 0 0 1 0 0 1
4 0 0 0 0 0 1 1
total 3 2 5 4 3 3 20

3,5

2,5 20
21
2
22
1,5 23
24
1
25
0,5

0
0 1 2 3 4
f) Estado Civil con número de hijos

y
𝑥 casado soltero divorciado total
0 1 6 0 7
1 1 4 2 7
2 2 1 1 4
3 1 0 0 1
4 1 0 0 1
total 6 11 3 20

4 c
s
3
d
2

0
0 1 2 3 4

3. Las calificaciones obtenidas por un grupo de estudiantes de Estadística (E) y


Microeconomía (M)
a) Hallar la tabla de distribución bidimensional

𝑀
4 5 7 8 9 10
𝐸
3 1 1
4 1 1
5 1 4
6 1 1
7 1 2 2
8 1

b) Hallar las distribuciones marginales, media y varianza de las mismas.

distribuciones marginales
E fi M fi
3 2 4 2
4 2 5 4
5 5 7 5
6 2 8 1
7 5 9 2
8 1 10 3
total 17 total 17

Media

3 × 2 + 4 × 2 + 5 × 5 + 6 × 1 + 7 × 2 + 8 × 5 99
𝐸= = = 5.82
17 17

4 × 2 + 5 × 4 + 7 × 5 + 8 × 1 + 9 × 2 + 10 × 3 119
𝑀= = =7
17 17
Varianza

32 × 2 + 42 × 2 + 52 × 5 + 62 × 1 + 72 × 2 + 82 × 5 629
𝑆𝑒2 = = = 5.822 = 3.13
17 17

2
42 × 2 + 52 × 4 + 72 × 5 + 82 × 1 + 92 × 2 + 102 × 3 903
𝑆𝑚 = = = 72 = 4.11
17 17

c) Covarianza e interprete.
739
𝑐𝑜𝑣 = = 43.47
17

𝑐𝑜𝑣 = 43.47 − 40.74

𝑐𝑜𝑣 = 2.73

Los estudiantes han tenido una proporcionalidad directa o positiva en sus exámenes

d) Calcular el promedio condicional M(x/y4); M(y/x2)

1𝑥7
𝑀(𝑥/𝑦4) = =7
1

1𝑥5.85+1𝑥5.82
𝑀(𝑦/𝑥2) = = 5.85
2
4. Un grupo de 10 amigos se ha presentado a una prueba de oposición. Anotaron el
número de horas que dedicaron a estudiar la semana antes del examen y la nota
obtenida en la prueba. La information se recoge en la siguiente tabla:

a) Hallar la tabla de distribución bidimensional


𝑛
ℎ 2 4 5 6 7 8 9
10 1
15 1 1
16 1
18 1
20 1 1
21 1
25 1
30 1

b) Hallar las distribuciones marginales, media y varianza de las mismas.

distribuciones marginales
n 2 4 5 6 7 8 9 TOTAL
Fi 1 1 2 1 2 2 1 10

h 10 15 16 18 20 21 25 30 TOTAL
Fi 1 2 1 1 2 1 1 1 10

Media

2 × 1 + 4 × 1 + 5 × 2 + 6 × 1 + 7 × 2 + 8 × 2 + 9 × 1 61
𝑁= = = 6,1
10 10
10 × 1 + 15 × 2 + 16 × 1 + 18 × 1 + 20 × 2 + 21 × 1 + 25 × 1 + 30 × 1 190
𝐻= = = 19
10 10

Varianza

22 × 1 + 42 × 1 + 52 × 2 + 62 × 1 + 72 × 2 + 82 × 2 + 92 × 1 413
𝑆𝑁2 = = = 6,12 = 4,09
10 10

102 × 1 + 152 × 2 + 162 × 1 + 482 × 1 + 202 × 2 + 212 × 1 + 252 × 1 + 302 × 1


𝑆ℎ2 =
10

3896
𝑆ℎ2 = − 192 = 28,6
10

c) Covarianza e interprete.

−142 − (−32.7)
𝑐𝑜𝑣 = = −10.9
10

El grupo de amigos han obtenido una relación de notas negativa

5. Las notas de 10 alumnos y alumnas de una clase en Matemáticas y en Física han sido
las siguientes:
a) Representa los datos mediante una nube de puntos
12

10

0
0 2 4 6 8 10 12

b) Hallar la tabla de distribución bidimensional

𝑚
𝑓 1 3 4 5 6 7 9 10
1 1
2 1
3 1
5 1
6 1 1
8 1
9 1
10 1 1
c) Hallar las distribuciones marginales, media y varianza de las mismas.
Distribuciones marginales

f fi m fi
1 1 1 1
2 1 3 1
3 1 4 1
5 1 5 1
6 2 6 2
8 1 7 1
9 1 9 1
10 2 10 2
total 10 total 10

Media

1𝑥1 + 2𝑥1 + 3𝑥1 + 5𝑥1 + 6𝑥2 + 8𝑥1 + 9𝑥1 + 10𝑥2 60


𝐹= = =6
10 10

1𝑥1 + 3𝑥1 + 4𝑥1 + 5𝑥1 + 6𝑥2 + 7𝑥1 + 9𝑥1 + 10𝑥2 61


𝑚= = = 6.1
10 10

Varianza
12 × 1 + 22 × 1 + 32 × 1 + 52 × 1 + 62 × 2 + 82 × 1 + 92 × 1 + 102 +× 2
𝑆𝐹2 = =
10

479
𝑆𝐹2 = − 62 = 11,9
10

2
12 × 1 + 32 × 1 + 42 × 1 + 52 × 1 + 62 × 2 + 72 × 1 + 92 × 1 + 102 +× 2
𝑆𝑚 = =
10
453
𝑆𝐹2 = − 6,12 = 8,09
10
d) Covarianza e interprete.

(−38)(−38.8)
𝑐𝑜𝑣 = = 147.4
10

Las notas de los alumnos han sido positivas en la clase de matemática como también en la
clase de física
ANALISIS DE REGRESION Y CORRELACION

1. Parte teorica

a) ¿Qué es el análisis de regresión?

El análisis de la regresión es un proceso estadístico para estimar las relaciones entre


variables.

b) En el análisis de regresión, ¿qué es una ecuación de estimación?

El análisis de regresión se desarrolla una ecuación de estimación, es decir, una fórmula


matemática que relaciona las variables conocidas con las desconocidas. Luego de obtener el
patrón de dicha relación, se aplica el análisis de correlación para determinar el grado de
relación que hay entre las variables.

c) ¿Cuál es el propósito del análisis de correlación?

El análisis de correlación consiste en un procedimiento estadístico para determinar si dos


variables están relacionadas o no. Un signo positivo indica que existe una relación positiva
entre las dos variables; es decir, cuando la magnitud de una incrementa, la otra también.

d) Defina que son las relaciones directas e inversas.

La correlación directa se da cuando al aumentar una de las variables la otra aumenta. La recta
correspondiente a la nube de puntos de la distribución es una recta creciente. La correlación
inversa se da cuando al aumentar una de las variables la otra disminuye.

e) ¿A qué se refiere el termino relación causal?

Una relación causal entre dos eventos existe si la ocurrencia del primero causa el otro.

El primer evento es llamado la causa y el segundo evento es llamado efecto. Una correlación
entre dos variables no implica causalidad.

f) Explique la diferencia entre relaciones lineales y curvilíneas.


En la lineal, cada cambio en X conlleva un cambio constante en Y, mientras que en la
curvilínea el cambio es diferente. La lineal guarda un patrón lineal, mientras que la curvilínea
es de forma exponencial.
g) Explique por qué y cómo se construye un diagrama de dispersión.

El diagrama de dispersión se usa comúnmente para mostrar cómo dos variables se relacionan
entre sí. De este modo, permite estudiar las relaciones que existen entre dos factores,
problemas o causas relacionadas con la calidad, o un problema de calidad y su posible causa.

h) ¿Qué es análisis de regresión múltiple?

El análisis de regresión múltiple permite entender la relación entre dos o más variables.
Implica una variable explicada, la variable dependiente y variables adicionales, que se estima
producen o están asociadas con cambios de la variable dependiente.

i) ¿Que explica el coeficiente de correlación, el coeficiente de determinación y la


covarianza?

La covarianza y la correlación son muy útiles para comprender la relación entre dos variables
continuas. No hay importancia en el valor numérico de covarianza, solo el signo es útil.
Mientras que la correlación explica sobre el cambio en una variable, indica cuánto cambio de
proporción en la segunda variable

2. Un gerente de producción comparo las calificaciones de una prueba de destreza de una


línea de montaje con su productividad por hora. Se obtuvo la siguiente información:

4362−5×14×6,1.2
𝑏= =3
1006−5(14)2

𝑎 = 61.2 − 3(14) = 19.2


3. Utilizando la técnica de mínimos cuadrados estime los componentes de la recta
para el siguiente conjunto de datos:

a) Dibuje un diagrama de dispersión

10

0
0 5 10 15 20

b) Desarrolle la ecuación de estimación que mejor describa los datos


13+16+14+11+17+9+13+17+18+12
𝑥̅ = = 14
10

6.2+8.6+7.2+4.5+9.0+3.5+6.5+9.3+9.5+5.7
𝑦̅ = =
10
𝑦̅ = 7

1035−10(14)(7)
𝑏= 2038−10(14)2
= 0,70

𝑎 = 7 − 0 − 70(14) = −2,8
c) Pronostique Y para X = 10,15,20.

𝑦10 = −2,8 + 0,70(10) = 4,2

𝑦15 = −2,8 + 0,70(15) = 7,7

𝑦20 = −2,8 + 0,70(20) = 11,2

4. A menudo, quienes hacen la contabilidad de costos estiman los gastos generales


con base en el nivel de producción. En Standard Knitting Co. han reunido
información acerca de los gastos generales y las unidades producidas en diferentes
plantas, y ahora desean estimar una ecuación de regresión para predecir los gastos
generales futuros.

a) Desarrolle una ecuación de regresión para contabilidad de costos.


x y xy 𝑥2
40 191 7640 1600
42 170 7140 1764
53 272 14416 2809
35 155 5425 1225
56 280 15680 3136
39 173 6747 1521
48 234 11232 2304
30 116 3480 900
40 178 7120 1600
Total 84541 18228

40 + 42 + 53 + 35 + 56 + 39 + 48 + 30 + 37 + 40
𝑥̅ = =
10
𝑥̅ = 42

191 + 170 + 273 + 155 + 280 + 173 + 234 + 116 + 153 + 178
𝑦̅ = =
10
𝑦̅ = 192,2
84541 − 10(42)(192,2)
𝑏= = 6,4
18228 − 10(42)2

𝑎 = 192,2 − 6,4(42) = −76,6

𝑦 = −76,6 + 6,4𝑥

b) Pronostique los gastos generales cuando se producen 50 unidades.

𝑦 = −76,6 + 6,4(50) = 243.4

c) Calcule el error estándar de la estimación.

385024−6,4×1922−(−76,6)×84541
𝑠ⅇ = √ = 925.2
10−2

5. Durante partidos recientes de tenis, Diane ha observado que sus lanzamientos no


han sido eficaces, pues sus oponentes le han regresado algunos de ellos. Algunas de
las personas con las que juega son bastante altas, así que se pregunta si la estatura
de su contrincante podría explicar el número de lanzamientos no regresados
durante un partido. Los siguiente datos se sacaron de cinco partidos recientes.

a) ¿Cuál es la variable dependiente?


La variable dependiente es los lanzamientos no regresados
b) ¿Cuál es la ecuación de estimación de mínimos cuadrados para estos datos?

x y xy 𝑥2
5 9 45 25
5,5 6 33 30,2
6 3 18 36
6,5 0 0 42,2
5 7 35 25
Total 131 158,4

5.0+5.5+6.0+6.5+5.0
𝑥= 5
= 5.6

9+6+3+0+7
𝑦= =5
5

131−5(5.6)(5)
𝑏 = 158.42 −5(5.6)2 = −5.6

𝑎 = 5 − (−5.6)(5.6) = 36.3

c) ¿Cuál es su mejor estimación del número de lanzamientos no regresados en su


partido de mañana con un oponente de 5.9 pies de estatura?

𝑌 = 36.3 + (−5.6)(5.6) = 4.9

Su mejor estimación del numero de lanzamientos no regresados es 4.9

6. El editor en jefe de un importante periódico metropolitano ha intentado convencer al


dueño para que mejore las condiciones de trabajo en la imprenta. Está convencido de
que, cuando trabajan las prensas, el grado de ruido crea niveles no saludables de
tensión y ansiedad. Recientemente hizo que un psicólogo realizara una prueba durante
la cual situaron a los prensistas en cuartos con niveles variables de ruido y luego les
hicieron otra prueba para medir niveles de humor y ansiedad. La siguiente tabla
muestra el ´índice de su grado de ansiedad o nerviosismo y el nivel de ruido al que se
vieron expuestos (1.0 es bajo y 10.0 es alto).

a) Grafique estos datos.

50

45

40

35

30

25

20

15

10

0
0 1 2 3 4 5 6 7 8

b) Desarrolle una ecuación de estimación que describa los datos.


X Y XY 𝑥2
4 39 156 16
3 38 114 9
1 16 16 1
2 18 36 4
6 41 246 36
7 45 315 49
2 25 50 4
3 38 114 9
TOTAL 1047 128

4+3+1+2+6+7+2+3
𝑥̅ = 8
=
28
𝑥̅ = = 3,5
8

39+38+16+18+41+45+25+38
𝑦̅ = =
8

260
𝑦̅ = = 32,5
8

1047+8(3,5)(32,5)
𝑏= = 4,5
128−𝑛(3,5)2

𝑎 = 32,5 + 4,5(3,5) = 16,7

c) Pronostique el grado de ansiedad que podríamos esperar cuando el nivel de ruido


es 5.

𝑦 = 16,7 + 4,5(5) = 39,2

7. Una compañía fabricante de llantas esta´ interesada en eliminar contaminantes de


los tubos de emisión de su fábrica y el costo es una preocupación. La compañía ha
recolectado datos de otras compañías respecto al monto gastado en medidas
ambientales y la cantidad de contaminantes eliminada que resultó (como
porcentaje de la emisión total).
a) Calcule la ecuación de regresión.

x y xy 𝑥2
8,4 35,9 300,72 70,56
10,2 31,8 325,38 104,04
16,5 24,7 407,55 272,25
21,7 25,2 546,84 470,89
9,4 36,8 345,92 88,36
8,3 35,8 297,14 68,89
11,5 33,4 384,1 132,25
Total 223,6 2607,65 1207,24

8.4+10.2+16.5+21.7+9.4+8.3+11.5
𝑥= = 12.2
7

35.9+31.9+24.7+25.2+36.8+35.8+33.4
𝑦= = 32.2
7

7(2607.65)−(86)(223.6)
𝑏= = −0.92
[7(1207.24)−(86)2 ]

223.6 86
𝑎= − (−0.92) = 43.2
7 7

𝑌 = 43.2 + (−0.92𝑥)

b) Pronostique el porcentaje de contaminantes eliminados si se gastan $20,000 en


medidas de control.

y z yz 𝑧2
35,9 -3 -107,7 9
31,8 -2 -63,6 4
24,7 -1 -24,7 1
25,2 0 0 0
36,8 1 36,8 1
35,8 2 71,6 4
33,4 3 100,2 9
223,6 19,8 28
19.8 28
𝛥= (
7
)( )
2
= 39.6 = 0.39%

c) Calcule el error estándar de la estimación.

y 𝑦2
35,9 1288,81
31,8 1011,24
24,7 610,09
𝑛 7296.62 − 43.2(223.6) − (−0.92)(2607.65)
Se = √𝑥 = = 2.6
7−2
25,2 635,04
36,8 1354,24
35,8 1281,64
33,4 1115,56
total 7296,62

d) Calcule la ecuación de regresión.

X Y XY 𝑥2 𝑦2
18,4 25,4 467,36 338,56 645,16
16,7 31,4 524,38 278,89 985,96
19,3 27,4 528,82 372,49 750,76
28,4 15,8 448,72 806,56 249,64
4,7 31,5 148,05 22,09 992,25
12,3 28,9 355,47 151,29 835,21
Total 160,4 2472,8 1969,88 4458,98

18.4+16.7+19.3+28.4+4.7+12.3
𝑥̅ = = 16,6
6

25,4+31.4+27.4+15.8+31.5+28.9
𝑦̅ = = 26,7
6

6(2472.8)−(99.8)⋅(160.4)
𝑏= [6(1969.88)−(99.8)2]
= −0,63

160.4 99.8
𝑎= − (−0,63) = 37,2
6 6

𝑦 = 37,2 + (−0.63)𝑥
e) Pronostique el porcentaje de contaminantes eliminados si se gastan $20,000 en
medidas de control.

Y Z YZ 𝑧2
25,4 -2 -50,8 4
31,4 -1 -31,4 1
27,4 0 0 0
15,8 1 15,8 1
31,5 2 63 4
28,9 3 86,7 9
Total 83,3 19

83.3 4
𝛥 = ( 19 ) (2) =

𝛥 = 8.76 = 0,08%

f) Calcule el error estándar de la estimación.

4458.98 − 37.2(160.4) − (−0.63)(2472.8)


𝑆ⅇ = √ =
6−2

𝑠ⅇ = 3,5

8. Una muestra de familias se han analizado las variables de ahorro anual Y, y renta anual
X, medidas ambas en miles de bolivianos los datos obtenidos han sido los siguientes:

X 20.5 20.8 21.2 21.7 22.1 22.3 22.2 22.6 23.1 23.5
Renta
Y 1.9 1.8 2.0 2.1 1.9 2.0 2.2 2.3 2.7 3.0
Ahorro
a) Realizar la gráfica de Dispersión
3,5

2,5

1,5

0,5

0
20 20,5 21 21,5 22 22,5 23 23,5 24

b) Calcular el coeficiente de Correlación


𝑟 = 0.8510

c) Calcular el coeficiente de Determinación


𝑅2 = 0.85102
𝑅2 = 0.7242

d) Ajuste a una función lineal


𝑏 = 0.33899
𝑏 = −5.2658
𝑦 = −5.2658 + 0.3389

e) Ajuste a una función parabólica


a = 85.5681
b = 7.9485
c = 0.1887
y = 85.5681 − 7.9485x + 0.1887x 2
f) Ajuste a una función exponencial
a = 0.0868
𝑏 = 1.1574
𝑦 = 0.0868 ∗ 1.1574𝑥

g) Ajuste a una función potencial


a = 0.0001
𝑏 = 3.1742
𝑦 = 0.0001𝑥 3.1742

g) Determine el error cuadrático medio para la función lineal, parabólica, exponencial,


potencial.

función lineal
y y-ŷ
1,9 6,82
1,8 6,72
2 6,92
2,1 7,02 71.1
𝐸𝐶𝑀 = =
1,9 6,82 10

2 6,92
𝐸𝐶𝑀 = 7.11
2,2 7,12
2,3 7,22
2,7 7,62
3 7,92
total 71,1
Parabólica
y y-ŷ
1,9 75,7
1,8 75,8
2 75,6 74.6
𝐸𝐶𝑀 = =
2,1 75,5 10

1,9 75,7
𝐸𝐶𝑀 = 7.46
2 75,6
2,2 75,4
2,3 75,3
2,7 74,9
3 74,6
total 754,1

Exponencial
y y-ŷ
1,9 1,8
1,8 1,7
2 1,9 20.2
𝐸𝐶𝑀 =
2,1 2 10

1,9 1,8
𝐸𝐶𝑀 = 2.02 =
2 1,9
2,2 2,1
2,3 2,2
2,7 2,6
3 2,2
total 20,2
Potencial

y y-ŷ
1,9 0,11
1,8 0,21
2 0,01 2.7
𝐸𝐶𝑀 = =
2,1 0,09 10

1,9 0,11 𝐸𝐶𝑀 = 0.27

2 0,01
2,2 0,19
2,3 0,29
2,7 0,69
3 0,99
total 2,7

También podría gustarte