Está en la página 1de 11

Taller 12.

Probabilidad y estadística
Segundo taller cuarto corte
Docentes: Luz Ayda Muñoz Mamian, Mauricio Alejandro Méndez

1. Una cadena de centros comerciales realiza un estudio acerca de clientes potenciales y han encontrado
que la cantidad de clientes diarios que visitan a un centro comercial depende de la distancia. Los datos
de seis centros comerciales y sus distancias a un barrio muy poblado en cierta ciudad son los siguientes:

a) Hallar la media de cada variable

Solución:

● N° de clientes (en cientos):

8+7+ 6+4 +2+1


x=
6

28
x=
6

x ≈ 4.6

Por tanto, en promedio el número de clientes es de 460.

● Distancia (Km):

15+19+25+23+34 +40
x=
6

156
x=
6

x=26

Por lo tanto, en promedio la distancia es de 26 Km.

b) Hallar el coeficiente de correlación lineal.

Solución:

∑ [ ( xi −x ) . ( y i− y ) ]
r= ❑

Ahora bien, para hallar cada una de las partes de la anterior formula, se construye la siguiente tabla

xi yi x i−x y i− y ( x i−x )2 ( y i− y)2 ( x i−x ) . ( y i− y )


11,111111
8 15 3,33333333 -11 1 121 -36,6666667
5,4444444
7 19 2,33333333 -7 4 49 -16,3333333
1,7777777
6 25 1,33333333 -1 8 1 -1,33333333
0,4444444
4 23 -0,66666667 -3 4 9 2
7,1111111
2 34 -2,66666667 8 1 64 -21,3333333
13,444444
1 40 -3,66666667 14 4 196 -51,3333333
39,333333
28 156     3 440 -125

Teniendo estos valores, se reemplazan en la formula

−125
r=
√❑

−125
r=
√❑

r =−0.95

Por lo tanto, como el coeficiente de correlación posee un valor cercano a -1, indica que
existe una correlación negativa y una dependencia entre ambas variables, es decir, hay una
relación inversa entre las variables, que es cuando una de las variables aumenta, la otra
variable en cambio disminuye (tal cual como se aprecia en la siguiente grafica).

c) Realice una gráfica para representar los datos.

Solución:

2. Se recoge una muestra sobre valores de dos variables X, Y para 8 observaciones y se tiene que:
a. Determinar una recta regresión de Y sobre X explicando el significado de los parámetros
encontrados.

Solución:

Tenemos que la ecuación de la recta es

y=b0 +b1 x

Así que debemos hallar b 0 y b 1

En primer lugar encontramos la pendiente de la recta ya que b 1=pendiente . La ecuación de la


pendiente es

S xy
b 1=
S 2x

xy −x y
b 1=
S2x

24

b 1=
64
8

8
( )
∗40
8
6

−7
b 1=
6

−7
Tenemos que b 1= es la pendiente de la recta, la cual mide la variación de Y cuando X
6
aumenta una unidad, y como la pendiente en este caso es negativa, indica que a medida que
la variable X aumenta, la variable Y disminuye.

Ahora, encontramos el valor de b 0

b 0= y−b1 x

40 −7
b 0=
8
−( )( 248 )
6

40 21
b 0= +
8 6

51
b 0=
6
51 51
Tenemos que b 0=
6 (
es el punto de corte en el eje Y , exactamente en el punto 0 ,
6
. )
Por lo tanto, la ecuación de la recta es

51 7
y= − x
6 6

b. Calcular el coeficiente lineal de Pearson al cuadrado (en este caso es el coeficiente de


determinación). Indicar el porcentaje de variación de Y que no está explicado por el modelo de
regresión lineal.

Solución:
2
S
r = xy( )
SxSy


−7
r= ( )
√❑

r =0.68

Así que, como el coeficiente de determinación es 0.68 esto significa que el porcentaje de variación
de Y en función de la variable X es del 68% y de esta manera queda un 32% de variabilidad que no
es explicada.

c. Si el modelo es adecuado, ¿cuál es la predicción para un valor de x = 4?

Solución:

Tenemos que la ecuación de la recta es

51 7
y= − x
6 6
Así que la predicción para que x=4 es

51 7
y= − (4)
6 6

23
y=
6
Por lo tanto, cuando x=4 la predicción es que y ≈ 3.8

d. Obtener la recta de regresión de X sobre Y.

Solución:

Para este caso se busca la recta


x=b 0+ b1 y

Hallamos el valor de las constantes

S xy −7
b 1= 2
=
S y
12

24 −7
b 0=x−b 1 y=
8

12 ( )( 408 )= 7112
Por lo tanto la ecuación es la recta es

71 7
x= − y
12 12

3. Se ha medido la presión sanguínea para 10 mujeres y los datos recogidos son:

Si X representa la edad y Y la presión:

a) Encontrar cuál es el coeficiente de correlación lineal e interpretar lo que indica.

Solución:

∑ [ ( xi −x ) . ( y i− y ) ]
r= ❑

Ahora bien, para hallar cada una de las partes de la anterior formula, se construye la siguiente tabla

xi yi x i−x y i− y ( x i−x )2 ( y i− y)2 ( x i−x ) . ( y i− y )


56 14,8 6 1,02 36 1,0404 6,12
42 12,6 -8 -1,18 64 1,3924 9,44
72 15,9 22 2,12 484 4,4944 46,64
36 11,8 -14 -1,98 196 3,9204 27,72
63 14,9 13 1,12 169 1,2544 14,56
47 13 -3 -0,78 9 0,6084 2,34
55 15,1 5 1,32 25 1,7424 6,6
49 14,2 -1 0,42 1 0,1764 -0,42
38 11,4 -12 -2,38 144 5,6644 28,56
42 14,1 -8 0,32 64 0,1024 -2,56
50 137,
0 8     1192 20,396 139

Teniendo estos valores, se reemplazan en la formula


139
r=
√❑

r =0.89

Por lo tanto, como el coeficiente de correlación posee un valor cercano a 1, indica que
existe una correlación positiva y una dependencia entre ambas variables, es decir, hay una
relación directa entre las variables, que es cuando una de las variables aumenta, la otra
variable también lo hace.

b) Determinar el modelo de regresión lineal de Y sobre X, para estos datos. Justificando e


interpretando los valores encontrados.

Solución:

El modelo de regresión lineal general es el siguiente

y=b0 +b1 x

En primer lugar encontramos la pendiente de la recta ya que b 1=pendiente . La ecuación de la


pendiente es
❑ ❑ ❑
n ∑ x i y i−∑ xi ∑ y i
m= ❑ ❑ ❑

Realizando los cálculos obtenemos la siguiente tabla

Xi Yi XY X^2
56 14,8 828,8 3136
42 12,6 529,2 1764
72 15,9 1144,8 5184
36 11,8 424,8 1296
63 14,9 938,7 3969
47 13 611 2209
55 15,1 830,5 3025
49 14,2 695,8 2401
38 11,4 433,2 1444
42 14,1 592,2 1764
500 137,8 7029 26192

Ahora bien, reemplazando tales datos en la ecuación de la pendiente, nos queda

( 10 )( 7029 )−(500)(137,8)
b 1= =0.12
( 10 )( 26192 )−(500)2
Este valor es la pendiente de la recta, la cual mide la variación de Y cuando X aumenta una
unidad, y como la pendiente en este caso es positiva, indica que a medida que la variable X
aumenta, la variable Y también aumenta.
Para calcular el valor de la otra constante que representa el punto de corte en eje Y , lo hacemos con
la siguiente ecuación

❑ ❑
∑ y i−b1 ∑ x i
b 0= ❑ ❑

Usamos los datos de la tabla presentada anteriormente y los reemplazamos en la ecuación

137,8−( 0.12)(500)
b 0=
10

b 0=7,78
Por lo tanto, la ecuación de la recta es la siguiente

y=7,78+ 0,12 x

c) Realiza un análisis sobre el modelo del ítem anterior.

Solución:

Tenemos que el modelo encontrado que simula la situación y=7,78+ 0,12 x es bastante
aproximado ya que según el coeficiente de correlación tiene una precisión del 89%, solo queda 11%
de imprecisión.

d) Realiza las predicciones cuando:


1. La presión sanguínea es de una mujer de 51 años.

Solución:

f ( 51 ) =7,78+0,12 (51 ) =13,9

2. La presión sanguínea es de una niña de 10 años.


Solución:

f ( 10 )=7,78+0,12 ( 10 )=8,98

3. La presión sanguínea de una mujer de 23 años.

Solución:

f ( 23 )=7,78+0,12 ( 23 )=10,54

4. La tabla siguiente muestra la cantidad de toneladas de trigo producido X, el precio del kilo de harina Y:

a) Ajustar la regresión adecuada para los datos. Interpreta.


Solución:

El modelo de regresión lineal general es el siguiente

y=b0 +b1 x

En primer lugar encontramos la pendiente de la recta ya que b 1=pendiente . La ecuación de la


pendiente es
❑ ❑ ❑
n ∑ x i y i−∑ xi ∑ y i
m= ❑ ❑ ❑

Realizando los cálculos obtenemos la siguiente tabla

Xi Yi XY X^2
30 25 750 900
28 30 840 784
32 27 864 1024
25 40 1000 625
25 42 1050 625
25 40 1000 625
22 50 1100 484
24 45 1080 576
35 30 1050 1225
40 25 1000 1600
286 354 9734 8468

Ahora bien, reemplazando tales datos en la ecuación de la pendiente, nos queda

( 10 )( 9734 )−(286)(354) −3904


b 1= = =−1.353
( 10 )( 8468 )−( 286)2 2884

Este valor es la pendiente de la recta, la cual mide la variación de Y cuando X aumenta una
unidad, y como la pendiente en este caso es negativa, indica que a medida que la variable X
aumenta, la variable Y disminuye.
Para calcular el valor de la otra constante que representa el punto de corte en eje Y , lo hacemos con
la siguiente ecuación

❑ ❑
∑ y i−b1 ∑ x i
b 0= ❑ ❑

Usamos los datos de la tabla presentada anteriormente y los reemplazamos en la ecuación

354−(−1,353)(286)
b 0=
10
b 0 ≈ 74,1
Por lo tanto, la ecuación de la recta es la siguiente

y=74,1−1,353 x

b) Realizar una gráfica del modelo y los datos en la tabla.

Solución:

5. Un profesor de matemáticas en un colegio para adultos colombiano, quiere estudiar la relación entre el
ausentismo y la edad de sus estudiantes desconociendo otros factores. Realizó observación sobre 10
estudiantes y encontró los datos siguientes:

a) Determinar un modelo que relacione las dos variables.

Solución:

El modelo de regresión lineal general es el siguiente

y=b0 +b1 x

En primer lugar encontramos la pendiente de la recta ya que b 1=pendiente . La ecuación de la


pendiente es
❑ ❑ ❑
n ∑ x i y i−∑ xi ∑ y i
m= ❑ ❑ ❑

Realizando los cálculos obtenemos la siguiente tabla

Xi Yi XY X^2
25 18 450 625
46 12 552 2116
58 8 464 3364
37 15 555 1369
55 10 550 3025
32 13 416 1024
41 7 287 1681
50 9 450 2500
23 16 368 529
60 6 360 3600
427 114 4452 19833

Ahora bien, reemplazando tales datos en la ecuación de la pendiente, nos queda

( 10 )( 4452 ) −(427)(114) −4158


b 1= = =−0,259
( 10 )( 19833 )−(427)2 16001

Este valor es la pendiente de la recta, la cual mide la variación de Y cuando X aumenta una
unidad, y como la pendiente en este caso es negativa, indica que a medida que la variable X
aumenta, la variable Y disminuye.
Para calcular el valor de la otra constante que representa el punto de corte en eje Y , lo
hacemos con la siguiente ecuación

❑ ❑
∑ y i−b1 ∑ x i
b 0= ❑ ❑

Usamos los datos de la tabla presentada anteriormente y los reemplazamos en la ecuación

114 −(−0,259)( 427)


b 0=
10

b 0 ≈ 22,4
Por lo tanto, la ecuación de la recta y modelo que representa la situación es el siguiente

y=22,4−0,259 x

b) Graficar todos los elementos de la situación en mención.

Solución:
c) De acuerdo a lo anterior cuál puede ser una conclusión para el profesor acerca del ausentismo y la edad.

Solución:

La principal conclusión que el profesor puede obtener de este análisis es que a medida que la edad de las
personas aumenta se ausenta menos días al colegio; en otras palabras, entre más jóvenes son los
estudiantes tienden a ausentarse más del colegio que las personas de mayor edad.

También podría gustarte