Está en la página 1de 31

Universidad Nacional Mayor de San Marcos

Estadstica
Prctica N5
1. La tabla siguiente presenta el mejoramiento (en la velocidad
de lectura de ocho estudiantes que cursaron un programa de
lectura de velocidad y el nmero de semanas que siguieron el
programa.
X
Y

3
86

5
118

2
49

8
193

8
163

9
232

3
73

4
109

a) Ajustar una recta a estos datos por el mtodo de mnimos


cuadrados.
b) Por cada semana ms de permanencia en el programa en cuantas
palabras incrementan la verdad de lectura
c) Estimar la velocidad de lectura (palabras por minuto) para un
estudiante que ha permanecido en el programa 7 semanas
Solucin:
a) Determinando los datos necesarios para encontrar la relacin de Y
con X:

Pgina 1

Universidad Nacional Mayor de San Marcos


Estadstica

Diagrama de dispersin segn los datos de la tabla

Y=a+
bx

Ecuaciones normales de la recta:

Pgina 2

Universidad Nacional Mayor de San Marcos


Estadstica
N

i=1

i=1

y i=Na+b x i
N

i=1

i=1

i=1

y i xi =a x i+ b x 2i
Remplazando los valores hallados en la ecuacin:

1023=8 a+b ( 42 )
6537=a ( 42 )+ b(272)

Realizando las respectivas operaciones se halla a y b entonces:


a=8.9856
b=22.6456

Remplazando en la ecuacin de regresin de la recta:


y c =8.9856+22.6456 x

b) De la ecuacin de regresin, se tiene:


y c =10+22.45 x
Donde la pendiente es decir 22.45 representa el aumento de velocidad
por cada semana, entonces:
Por cada semana ms de permanencia la velocidad de lectura se
incrementa en 22.45.
c) De la ecuacin de regresin, se tiene:
y c =8.9856+22.6456 ( 7 )

Pgina 3

Universidad Nacional Mayor de San Marcos


Estadstica
y c =167.5048
Un alumno que permanece en el programa por 7 semanas, se puede
decir que su velocidad de lectura ser de 167.5048 (Palabras por
minuto).
2. Con los datos de la tabla que se acompaa, relacionados con
ingresos (X) y consumos (Y) de 5 personas.
X
Y

200
180

300
270

400
320

600
480

900
700

Hallar:
a) La grfica de dispersin de los puntos (X, Y)
b) El ndice de correlacin
c) La recta de ajuste de mnimos cuadrados de Y en X Ajusta
satisfactoriamente esta recta a los datos?
d) Qu porcentaje de la varianza de los valores de Y explica la recta
de regresin?
Solucin:
a) Determinamos los datos necesarios para encontrar la relacin de Y
con X:

Diagrama de dispersin segn los datos de la tabla

Pgina 4

Universidad Nacional Mayor de San Marcos


Estadstica

Y=a+
bx

Ecuaciones normales de la recta:


N

i=1

i=1

y i=Na+b x i
N

i=1

i=1

i=1

y i xi =a x i+ b x i

Remplazando los valores hallados en la ecuacin:

1950=5 a+b ( 2400 )


1163000=a ( 2400 )+ b(1460000)

Realizando las respectivas operaciones se halla a y b entonces:


a=36.24

b=0.737

Pgina 5

Universidad Nacional Mayor de San Marcos


Estadstica
Remplazando en la ecuacin de regresin de la recta:
y c =36.24+ 0.737 x
b) Coeficiente de Correlacin:
N

a Yi+b YiXiN Y 2
i=1

i=1

y 2 N Y 2
i=1

r=

r=

36.24 ( 1950 ) +0.737 ( 1163000 ) 5


9281005

1950
5

1950
5

r=0.998
c) La recta si se ajusta satisfactoriamente a los datos.
d) El porcentaje de la varianza de los valores de Y es 80 %.
3. La siguiente tabla muestra las respectivas estaturas de una
muestra de doce padres (X) y sus hijos mayores (Y):

X (en
pulg)
Y (en
pulg)

65

63

67

64

68

62

70

66

68

67

69

71

68

66

68

65

69

66

68

65

71

67

68

70

a) Construir el diagrama de dispersin


b) Determinar la recta de regresin de Y dado X
c) Hallar el coeficiente de correlacin
Solucin:
Pgina 6

Universidad Nacional Mayor de San Marcos


Estadstica
a) Determinamos los datos necesarios para encontrar la relacin de Y
con X:

Diagrama de dispersin segn los datos de la tabla

Pgina 7

Universidad Nacional Mayor de San Marcos


Estadstica

Ecuaciones normales de la recta:


N

i=1

i=1

y i=Na+b x i
N

i=1

i=1

i=1

y i xi =a x i+ b x 2i
Remplazando los valores hallados en la ecuacin:

811=12 a+ b ( 800 )
54107=800 a+ b(53418)

Realizando las respectivas operaciones se halla a y b entonces:

Pgina 8

Universidad Nacional Mayor de San Marcos


Estadstica
a=35.98

b=0.474
Remplazando en la ecuacin de regresin de la recta:
y c =35.98+0.474 x

b) Coeficiente de Correlacin:
N

a Yi+b YiXiN Y 2
i=1

i=1

y 2 N Y 2
i=1

r=

811
35.98 ( 811 ) +0.474 ( 54107 ) 12
12
r=
2
811
5484912
12

( )

( )

r=0.6415
Por lo tanto la ecuacin de la recta se ajusta a los datos.
4. La siguiente tabla consiga las calificaciones obtenidas por 12
estudiantes en las pruebas parcial y final del curso de
estadstica.
P.
parcial(X)
P. final (Y)

14

10

16

15

12

11

10

13

12

10

13

12

12

11

14

10

11

12

11

14

11

a) Obtener las ecuaciones de regresin de Y sobre X y de X sobre Y.


Pgina 9

Universidad Nacional Mayor de San Marcos


Estadstica
b) Con los resultados de:
i.

Estimar la calificacin de un estudiante en la prueba final si


en la prueba parcial obtuvo 15; y la calificacin de un
estudiante en la prueba parcial si en la prueba final obtuvo
09

c) Con los resultados de:


I.

Calcular e interpretar los coeficientes de correlacin.

Solucin:
a) Determinamos los datos necesarios para obtener la relacin de Y
con X:

Ecuacin de regresin de Y sobre X:


Diagrama de dispersin segn los datos de la tabla.

Pgina 10

Universidad Nacional Mayor de San Marcos


Estadstica

La ecuacin que utilizaremos ser la de la funcin potencial

Y=a.xb

Las ecuaciones de la funcin potencial son:

log Y =loga . N + b log X

Pgina 11

Universidad Nacional Mayor de San Marcos


Estadstica
X
log

log Y . log X =loga . log X + b

Reemplazando valores:
12.7124 = 12 (loga) +b (12.6974)
13.4895 = 12.6974 (loga) + b (13.5275)
Los valores de a y b son:
a= 4.1543
b= 0.4155
Finalmente la ecuacin de Y en X es:

Y = 4.1543. X0.4155

Ecuacin de regresin de X sobre Y:


Diagrama de dispersin segn los datos de la tabla

Pgina 12

Universidad Nacional Mayor de San Marcos


Estadstica
La ecuacin que utilizaremos ser la de la funcin potencial

X=a.yb
Las ecuaciones de la funcin potencial son:

logX =loga. N +b logY


logX . logY =loga logY + b (logY )2
Reemplazando valores:
12.6974 = 12 (loga) +b (12.7124)
13.4895 = 12.7124 (loga) + b (13.5156)
Los valores de a y b son:
a= 1.6661
b= 0.7895
Finalmente la ecuacin de X en Y es:
X = 1.6661. y0.7895
b) Tenemos:
Y = 4.1543 (15 0.4155)
Y = 12.7986
Es decir que si un alumno saco 15 en el examen parcial en el
examen final probablemente su nota sea de 13.
X= 1.661 (9 0.7895)
X= 9.4423
Es decir que si el alumno saca en su examen final 9 en su examen
parcial probablemente haya tenido una nota de 9 tambin.
c) Coeficiente de correlacin:

Pgina 13

Universidad Nacional Mayor de San Marcos


Estadstica
N

a Yi+b YiXiN Y 2
i=1

i=1

y 2 N Y 2
i=1

r=

Correlacin de Y sobre X:

r=

0.6185 (12.7124 ) +0.4155 ( 13.4895 )12

12.7124
12

12.6974
12

13.515612

( 12.7124
12 )

r=0.0923
Correlacin de X sobre Y:

r=

0.2217 ( 12.6974 ) +0.7895 ( 13.4895 )12


13.527512

12.6974
12

r=0.5667

5. Se han estudiado las calificaciones de 200 estudiantes en la


asignaturas de matemtica y estadstica, obtenindose los
siguientes resultados:
X: puntaje en matemtica
Y: puntaje en estadstica
X =13

Y = 12.5

Sx = 2

Pgina 14

Sy = 1.2

r = 0.9

Universidad Nacional Mayor de San Marcos


Estadstica
a) Estimar el puntaje de un estudiante en Estadstica si en
matemtica obtuvo 14
b) Para un estudiante que en Estadstica obtuvo 10, que puntaje se
estima obtendra en matemtica.
Solucin:
A la vez X e Y son medias aritmticas de las calificaciones de los 200
estudiantes.
Se sabe que:
r = SXY__
SXSY
0.9 =

SXY__
2(1.2)

SXY = 2.16
Tambin se sabe que la pendiente de la recta es b:
b=

SXY
SX2

2.16 = 0.54
4
Y = a + bx
12.5 = a + 0.54 (13)
a = 5.48
La ecuacin de regresin es:

Yc = 5.48 + 0.54X

6. Los directivos de una industria desean conocer si el ingreso


personal disponible es un indicador confiable para predecir las
ventas de la industria. Para tal efecto se desea ajustar una
recta a los datos de la tabla (de Y en X). X representa ingreso
personal disponible e Y representa ventas de la industria (X en
Y se tomaron en miles de u. m).

Pgina 15

Universidad Nacional Mayor de San Marcos


Estadstica
X
Y

3
2

5
3

6
5

7
5

8
6

10
7

39
28

a) Realizar el ajuste por el mtodo de los mnimos cuadrados.


b) Estimar e interpretar Y cuando:
I.X = 9
II.

X = 12

Solucin:
a) Determinamos los datos necesarios para obtener la relacin de Y
con X

Diagrama de dispersin segn los datos de la tabla

Pgina 16

Universidad Nacional Mayor de San Marcos


Estadstica

Como es una funcin rectilnea entonces se procede ajustar por el


mtodo de mnimos cuadrado:

Y =aN +b X
Ecuaciones normales de la recta:

Y . X=a X +b X
Sustituyendo informacin de la tabla:
39 = 6a + 28b
204 = 28a + 148b
Entonces los valores de a y b son:

Pgina 17

Universidad Nacional Mayor de San Marcos


Estadstica
a = 0.5769; b = 1.2692
Sustituyendo en la ecuacin de la recta que es de la forma:
Y = a + bx
En conclusin:
Y = 0.5769 + 1.2692x
b) Estimando el valor de Y cuando:
i. X = 9
Reemplazando el valor de X que nos pide en la ecuacin de la recta
Y = 0.5769 + 1.2692 (9)
Y = 11.9997
Interpretacin.- Cuando el ingreso personal es de 9 u.m. entonces las
ventas son de 11.9997 u.m.
ii. X = 12
Reemplazando el valor de X que nos pide en la ecuacin de la recta
Y = 0.5769 + 1.2692 (12)
Y = 15.8073
Interpretacin.- Cuando el ingreso personal es de 12 u.m. entonces las
ventas son de 15.8073 u.m.
7. Se tiene los datos de la siguiente tabla, correspondiente la
informacin sobre ventas (X) en u.m y horas hombre (Y)
ocupadas en la diferentes secciones de 6 tiendas de un
cooperativa. Este estudio servir de base para desarrollar
guas para el nmero de distribucin de personal
X
Y

1
2

3
3

5
7

7
11

9
15

10
17

a) Hallar la ecuacin que relacione las variables.


b) Hallar e interpretar el valor de Y correspondiente al incremento unitario
de X.
Pgina 18

Universidad Nacional Mayor de San Marcos


Estadstica
c) Hallar e interpretar el error estndar de estimacin.
Solucin:
a) Determinamos los datos necesarios para obtener la relacin de Y con X
b)

Diagrama de dispersin segn los datos de la tabla

Pgina 19

Universidad Nacional Mayor de San Marcos


Estadstica

La ecuacin que utilizaremos ser la de la funcin exponencial

Y=a.bx
Las ecuaciones de la funcin potencial son:

logY =loga. N +logb X


X . logY =loga X + logb ( X )2
Reemplazando valores:
5.0712 = 6 (loga) + 35 (logb)
36.1364 = 35 (loga) + 265 (logb)

Entonces los valores de a y b son:


a = 0.1078
b = 1.2817
Sustituyendo en la ecuacin que es de la forma:
Y = abx
En conclusin:

Y = 0.1078 (1.2817)x

Pgina 20

Universidad Nacional Mayor de San Marcos


Estadstica
c) Si incrementa el X en 1 se necesitara menos de 1 hora para realizar
una venta.
8. Ajustar una parbola de segundo grado por el mtodo de los
mnimos cuadrados a los datos de la tabla adjunta que se
refieren a 8 lotes de artculos (X) en miles y costo unitario
promedio (Y) en u. m.
X
Y

1.4
1

2.3
2

2.8
3

3.2
4

4.2
6

8.3
7

9.7
9

1.3
11

a) Estimar el valor de Y cuando X = 10. Interpretar


b) Hallar el error estndar de estimacin

Solucin:
a)

Determinamos los datos necesarios para obtener la relacin de Y con X

Diagrama de dispersin segn los datos de la tabla

Pgina 21

Universidad Nacional Mayor de San Marcos


Estadstica

La ecuacin de la parbola:

Y =a N +b X + c X
Y . X=a X +b X +c X

Y . X =a X +b X +c X

Reemplazando los valores dados:

Pgina 22

Universidad Nacional Mayor de San Marcos


Estadstica
11 = 8a + 33.2b + 207.64c
212.1 = 33.2a + 207.64b + 1630.376c
1530.49 = 207.64a + 1630.37b + 14110.9348c
Entonces los valores de a, b y c son:
a = 6.6730
b = -1.3597
c = 0.1673
Reemplazando los valores de a y b en la ecuacin de la parbola:
Y = a + bx + cx
Y = 6.6730 1.3597 x + 0.1673 x
Para: x = 10
Y = 6.6730 1.3597 (10) + 0.1673 (10)
Y = 9.806 u. m.
Interpretacin.- 8 lotes de 10 artculos cada uno tienen un costo
promedio de 9.806 u. m.
b) El error estndar:
Syc =

Y a Y b Y . X c Y . X
N

Syc =

3176.6730 ( 43 ) (1.3597 ) ( 212.1 )0.1673(1530.49)


8

Syc =2.7929

9. Para una regin de cierto pas se tiene los datos de la tabla:


Aos
X
Y

1993
200
180

1994
220
210

1995
245
230

Pgina 23

1996
270
250

1997
300
280

1998
340
320

Universidad Nacional Mayor de San Marcos


Estadstica
Calcular la elasticidad ingreso del consumo mediante la funcin
adecuada de Y (consumo por habitante) sobre X (ingreso por
habitante en u. m).
Solucin:
Determinamos los datos necesarios para obtener la relacin de Y con X:

Diagrama de dispersin segn los datos de la tabla

Pgina 24

Universidad Nacional Mayor de San Marcos


Estadstica

La ecuacin que utilizaremos ser la de la funcin potencial

Y=a. xb
Las ecuaciones de la funcin potencial son:

log Y =loga. N + b log X


X
log

log Y . log X =loga . log X + b

Reemplazando valores:
14.2895 = 6 (loga) +b (14.4726)
34.5055 = 14.4726 (loga) + b (34.9458)
Los valores de a y b son:
a= 0.7581

b= 1.0374

Finalmente la ecuacin de Y en X es:


Y = 0.7581. X1.0374
10.
a) Calcular el coeficiente de correlacin en los ejercicios: 1, 2, 3,
4, 6 y 7.
Pgina 25

Universidad Nacional Mayor de San Marcos


Estadstica
b) Interprete en cada caso el coeficiente de determinacin
Solucin:
a) Coeficiente de Correlacin:

a Yi+b YiXiN Y 2
i=1

i=1

y 2 N Y 2
i=1

r=

En el ejercicio 1:
Segn los datos obtenidos:

1023
8

1023
8

2
8.9856(1023)+22.6456(6537)8

r =
r=0.9754

Interpretacin.- El coeficiente de correlacin es alto lo que amerita la


buena relacin entre las variables.

En el ejercicio 2:
Segn los datos obtenidos:
Pgina 26

Universidad Nacional Mayor de San Marcos


Estadstica

r=

36.24 ( 1950 ) +0.737 ( 1163000 ) 5


9281005

1950
5

1950
5

r=0.998

Interpretacin.- El coeficiente de correlacin demuestra que la ecuacin


de regresin se ajusta satisfactoriamente a los datos.
En el ejercicio 3:
Segn los datos obtenidos:

811
35.98 ( 811 ) +0.474 ( 54107 ) 12
12
r=
2
811
5484912
12

( )

( )

r=0.6415
Por lo tanto la ecuacin de la recta se ajusta satisfactoriamente a los
datos.
En el ejercicio 4:
Segn los datos obtenidos:
N

a Yi+b YiXiN Y 2
i=1

i=1

y 2 N Y 2
i=1

r=
Correlacin de Y sobre X:

Pgina 27

Universidad Nacional Mayor de San Marcos


Estadstica

12.7124
0.6185 (12.7124 ) +0.4155 ( 13.4895 )12
12
r=
2
12.7124
13.515612
12

r=0.0923

Correlacin de X sobre Y:

r=

0.2217 ( 12.6974 ) +0.7895 ( 13.4895 )12


13.527512

12.6974
12

12.6974
12

r=0.5667

Por lo tanto ambas regresiones se ajusta satisfactoriamente a los datos.

En el ejercicio 6:
Segn los datos obtenidos:

r=

0.5769 ( 28 ) +1.2692 ( 204 )6


2836

39
6

39
6

( )

( )

r=0.8551

Interpretacin.- El coeficiente de correlacin demuestra que la ecuacin


de regresin se ajusta satisfactoriamente a los datos.
En el ejercicio 7:
Segn los datos obtenidos:

Pgina 28

Universidad Nacional Mayor de San Marcos


Estadstica

5.0712
0.2165 (5.0141 ) +0.1078 ( 36.1369 ) 6
6
r=
2
5.0712
5.01416
6

r=0.977

Interpretacin.- El coeficiente de correlacin demuestra que la ecuacin


de regresin se ajusta satisfactoriamente a los datos.
b) Coeficiente de Determinacin (r2):
En el ejercicio 1:
2
r =0.7663
Interpretacin.-El 76.63% de la variabilidad total es explicada por la
ecuacin de regresin.
En el ejercicio 2:
r 2=0.996
Interpretacin.- El 99.6% de la variabilidad total es explicada por la
ecuacin de regresin.
En el ejercicio 3:
r 2=0.4115
Interpretacin.- El 41.15% de la variabilidad total es explicada por la
ecuacin de regresin.
En el ejercicio 4:
Segn la regresin de X sobre Y:
2
r =0.3211
Interpretacin.- El 32.11% de la variabilidad total es explicada por la
ecuacin de regresin.
En el ejercicio 6:

Pgina 29

Universidad Nacional Mayor de San Marcos


Estadstica
2

r =0.7312
Interpretacin.-El 73.12% de la variabilidad total es explicada por la
ecuacin de regresin.
En el ejercicio 7:
r 2=0.9545
Interpretacin.-El 95.45% de la variabilidad total es explicada por la
ecuacin de regresin.
11. Si Sy = 0.2 Sy y se sabe qu r = 0.8. Hallar el coeficiente de
regresin de la recta: y = a + bx
Solucin:
El coeficiente de regresin de la recta es nada ms que la pendiente. b
Entonces:
r=

Sxy
Sx Sy

0.8 =

SXY__
0.2 SX2

0.16 =

SXY
SX2

b = 0.16 Coef. de regresin

Por lo tanto el coeficiente de regresin es 0.16.


12. Demostrar que otra frmula para calcular el coeficiente de
correlacin rectilneo es:
r=

Sxy
Sx Sy

Solucin:

Pgina 30

Universidad Nacional Mayor de San Marcos


Estadstica
La demostracin resulta de las ecuaciones normales de la recta que son
sacados por M.M.C. Mtodos de mnimos cuadrados.
r=

SXY__
SXSY

SXY: Es la covarianza, la cual por frmula es:

Sxy =

( xiX ) ( yiY ) = xi ( yi) XY


N

Pgina 31

También podría gustarte