Está en la página 1de 9

Estadística bivariada

Roberto Pablo Rojas Gutiérrez

Estadística

Instituto IACC

13-05-2019
Desarrollo

1)

De la siguiente tabla

Xi
12 13 14 15 fj yj*fj fj*yj^2
22.5 4 2 1 2 9 202.5 4556.25
Yj 27.5 5 1 3 3 12 330 9075
32.5 2 1 2 1 6 195 6337.5
fi 11 4 6 6 27 727.5 19968.75
Xi*fi 132 52 84 90 358
Fi*Xi^2 1584 676 1176 1350 4786

a) Con las mismas formulas hechas anteriormente completamos la tabla bivariada

analizaremos la variable Y

media Y 26.94444444

varianza Y 13.58024691
desviacion Y 3.685138656

analizaremos la variable X

media X 13.25925926

varianza X 1.451303155
desviacion X 1.204700442
Para la covarianza de los datos

covarianza(x,y)
suma
1080 585 315 675 2655
1650 357.5 1155 1237.5 4400
780 422.5 910 487.5 2600
3510 1365 2380 2400 9655

covarianza(x,y)= 0.32921811

coeficiente de correlacion

r= 0.074156771

b) ¿Cuál es el promedio de edad de los que estudian 14 años?

14años
x y xy
22.5 1 22.5
27.5 3 82.5
32.5 2 65
suma 6 170

media= 28.3333333

Media = 28.333

c) ¿Cuál es la cantidad de años de estudios promedio para quienes tienen a lo más 30

años?
x 22.5 27.5 frecuencia f*X
12 4 5 9 108
13 2 1 3 39
14 1 3 4 56
15 2 3 5 75
21 278

Promedio de años de estudio para quienes tienen más de 30=13.238095


d) ¿Qué grupo de trabajadores presenta la edad más homogénea: los que tienen 12 años de
estudio o 15 años de estudio?

los que tienes 12 años de estudio


x f x*f f*x^2
22.5 4 90 2025
27.5 5 137.5 3781.25
32.5 2 65 2112.5
11 292.5 7918.75

media 26.59090909

varianza 12.80991736
desviacion 3.579094488

CV 13.45984252

los que tienes 15 años de estudio


x f x*f f*x^2
22.5 2 45 1012.5
27.5 3 82.5 2268.75
32.5 1 32.5 1056.25
6 160 4337.5

media 26.6666667

varianza 11.8055556
desviacion 3.43592135

CV 12.8847051
De los dos cuadros analizados podemos decir que los que tienen 15 años de estudio son mas

homogéneos comparados con los que tienen 12 años de estudio.

2) En esa misma empresa del norte, a los trabajadores se les realizó una prueba para poder

determinar el orden jerárquico y así obtener un mejor sueldo, los datos

a) Calcule e interprete la covarianza

Xi
1 3 5 0 fj yj*fj fj*yj^2
22.5 5 15 16 0 36 810 18225
Yj 27.5 23 12 15 0 50 1375 37812.5
32.5 19 5 7 0 31 1007.5 32743.75
fi 47 32 38 0 117 3192.5 88781.25
Xi*fi 47 96 190 0 333
Fi*Xi^2 47 288 950 0 1285

analizaremos la variable Y analizaremos la variable X

media Y 27.2863248 media X 2.846153846

varianza Y 14.2705822 varianza X 2.882314267


desviacion Y 3.77764242 desviacion X 1.697737985
covarianza(x,y)
suma
112.5 1012.5 1800 0 2925
632.5 990 2062.5 0 3685
617.5 487.5 1137.5 0 2242.5
1362.5 2490 5000 0 8852.5

Covarianza(x,y)= -1.99868508

Este resultado nos que no hay una relación directa entre las variables analizadas.

b) Calcule e interprete el coeficiente de correlación

Coeficiente de correlación

r= -0.31163976 vemos que la relación de las variables es en forma negativa es decir mientras uno
aumenta el otro disminuye

3) Continuando con la empresa del norte, el departamento de bienestar está realizando

estudios médicos, por lo que consideró a 9 trabajadores, preguntándoles su estatura (cm)

y peso (kg):

De la tabla de los datos

altura peso
x y X*Y
164 52 8528
157 62 9734
190 78 14820
161 64 10304
174 68 11832
172 62 10664
169 56 9464
179 86 15394
166 70 11620
102360
Regresión lineal
Y - promedio de Y= Covarianza/VarianzaX*(X - promedio x)

Promedio Y 66.44 Covarianza/Varianza


Promedio X 170.22 0.70575221
Covarianza 63.01
Varianza X 89.28
Datos (n) 9
desviacionx 9.4490185
desviaciony 9.96784955
r 0.66901749

nuestra ecuacion de regresion lineal

Y-64.44=0.7057221(x-170.22)

Y=0.7057221X-53.69

Entonces para nuestro análisis vemos que si hay una relación positiva entre las variables ya que

nuestro r= 0.66901

Pero esta relación es muy débil ya que nos permite conocer

Un coeficiente de determinación R^2=0.44 este valor da a entender que el modelo no es muy

bueno para poder predecir.

También podría gustarte