Está en la página 1de 13

ACTIVIDAD SUMATIVA #4

1. Definir:

a) Que significado tienen 2  variables X y Y cuando la  Correlación entre ellas


vale Cero (0) 

Esto significa que no existe una relación lineal, esto se traduce como incorrelación,
es decir, R=0. Sin embargo, esto no necesariamente implica que exista una
independencia total entre las dos variables, es decir, que la variación de una de ellas
puede influir en el valor que pueda tomar la otra. Logrando que existan relaciones no
lineales entre las dos variables.

b) ¿Entre que valores la correlación tiene un sentido estadístico?

Entre los valores -1 y 1. Cuanto más extremo es r (más se acerca a −1 o a


1), significa que mejor se ajusta el modelo, es decir, existe una correlación perfecta. Si r
es igual -1 la correlación es negativa perfecta y si la r es igual a 1 la correlación es
positiva perfecta. Como se muestra en la imagen a continuación:

Por otra parte, si no hay ninguna relación entre los dos conjuntos de variables, la r
de Pearson es cero. En el siguiente diagrama se resumen la fuerza y la dirección del
coeficiente de correlación:
En resumen, aquí se puede evidenciar las características del coeficiente de
correlación:

1. El coeficiente de correlación de la muestra se identifica con la letra minúscula r.


2. Muestra la dirección y fuerza de la relación lineal (recta) entre dos variables en escala de
intervalo o en escala de razón.
3. Varía de -1 hasta +1, inclusive.
4. Un valor cercano a 0 indica que hay poca asociación entre las variables.
5. Un valor cercano a 1 indica una asociación directa o positiva entre las variables.
6. Un valor cercano a -1 indica una asociación inversa o negativa entre las variables.

c) ¿Para que se utiliza la regresión lineal?

 Identificar que variables independientes (causas) explican una variable dependiente


(resultado).
 Comparar y comprobar modelos explicativos.
 El análisis de la regresión lineal se utiliza para predecir el valor de una variable
según el valor de otra. La variable que desea predecir se denomina variable
dependiente. La variable que está utilizando para predecir el valor de la otra variable
se denomina variable independiente.
 Los modelos de regresión lineal son relativamente sencillos y proporcionan una
fórmula matemática fácil de interpretar que puede generar predicciones. La
regresión lineal puede aplicarse a varias áreas de la empresa y de los estudios
académicos.

2. Dos variables X y Y están relacionadas en calificaciones de la siguiente forma

VARIABLE X (Estadística)    15   18   20   14   16   12   16   17   20   15   20   14   13   15

VARIABLE Y (Matemática)  12   14   16   10   13   15   11   10   13   15   12   14   12   11
Solución

En la tabla 1, se presentan la totalidad de los datos calculados.

Tabla 1.
Tabla de datos de las calificaciones.

X Y XY X^2 Y^2
15 12 180 225 144
18 14 252 324 196
20 16 320 400 256
14 10 140 196 100
16 13 208 256 169
12 15 180 144 225
16 11 176 256 121
17 10 170 289 100
20 13 260 400 169
15 15 225 225 225
20 12 240 400 144
14 14 196 196 196
13 12 156 169 144
15 11 165 225 121
225 178 2868 3705 2310

a) Calcule el valor de la Correlación lineal según Pearson   

Fórmula empleada:

r =n ∑ XY −( ∑ X )¿ ¿

(14 × 2868)−(225 × 178)


r=
√ ( 14 ×3705 )−(225)2 × √ ( 14 ×2310 )−(178)2

(40152)−(40050)
r=
√ ( 51870 )−(50625)× √( 32340 ) −(31684)
102
r=
√ 1245 × √ 656
102
r=
903,7256

r =0,1129(Correlación positiva)

Un valor de r =0,1129quiere decir que existe una correlación positiva débil


entre las 2 variables en estudio. Como se muestra en el siguiente gráfico, los valores
se encuentran alejados de la línea de tendencia (existe dispersión). Así mismo, se
puede comprobar el cálculo de correlación por Pearson realizado anteriormente,
calculando esta misma correlación con los datos que arroja la gráfica de Excel. Si
calculamos la raíz cuadrada √ 0,0127 de la correlación R2 , esta da como resultado
un valor der =0,1127, muy cercano al valor de r =0,1129 calculado por Pearson, por
lo tanto se confirma el resultado realizado a través de la fórmula.

b) Mediante la ecuación de la regresión lineal  Y = a +bX     Calcule los valores de


a, b  y calcule Y para X = 25   

  Fórmula empleada:

y=a+bx

a=¿ ¿

b=n( ∑ XY )−( ∑ X) ¿ ¿

Cálculo de a:
(178 × 3705 )−( 225 ×2868 )
a=
( 14 × 3705 )−(225)2

(659490−645300)
a=
(51870−50625)

14190
a=
1245

a=11,3976
Cálculo de b:

(14 ×2868 )−(225 ×178)


b=
( 14 × 3705 )−(225)2

(40152−40050)
b=
(51870−50625)

102
b=
1245

b=0,0819

Para comprobar los datos calculados a de a y b con la formula, se puede demostrar que son
iguales a los datos arrojados por la ecuación obtenida en el gráfico de éxcel. Como se observa a
continuación:

Ahora, sustituyendo los valores de a y b previamente calculados en la primera ecuación,


se tiene que:
y=11,3976 +0,0819 x

Cálculo de Y para X = 25   

y=11,3976 +0,0819(25)

y=11,3976 +2,0475

y=13,4451

3. La puntuación en un concurso de belleza va de 1 punto hasta 20 puntos, dos jueces 


opinan

JUEZ  I (Y)    10   14   16   14   18   16   15   17   13   15   12   15   10   12   15   12   13  
12   11   14

JUEZ II (X)   12   17   18   16   19   17   18   19   15   17   14   16   14   15   18   16   15  
14   13   16

Solución
En la tabla 2, se presentan la totalidad de los datos calculados.

Tabla 2.
Tabla de datos de las puntuaciones en un concurso de belleza.

X Y XY X^2 Y^2 Rango en X Rango en Y D D^2


12 10 120 144 100 1 1,5 -0,5 0,25
17 14 238 289 196 14 11 3 9
18 16 288 324 256 17 17,5 -0,5 0,25
16 14 224 256 196 10,5 11 -0,5 0,25
19 18 342 361 324 19,5 19 0,5 0,25
17 16 272 289 256 14 17,5 -3,5 12,25
18 15 270 324 225 17 14,5 2,5 6,25
19 17 323 361 289 19,5 19 0,5 0,25
15 13 195 225 169 7 8,5 -1,5 2,25
17 15 255 289 225 14 14,5 -0,5 0,25
14 12 168 196 144 4 5,5 -1,5 2,25
16 15 240 256 225 10,5 14,5 -4 16
14 10 140 196 100 4 1,5 2,5 6,25
15 12 180 225 144 7 5,5 1,5 2,25
18 15 270 324 225 17 14,5 2,5 6,25
16 12 192 256 144 10,5 5,5 5 25
15 13 195 225 169 7 8,5 -1,5 2,25
14 12 168 196 144 4 5,5 -1,5 2,25
13 11 143 169 121 2 3 -1 1
16 14 224 256 196 10,5 11 -0,5 0,25
319 274 4447 5161 3848 95

a) El valor de la correlación lineal según Spearman   

Para calcular el coeficiente de correlación de rangos por Spearman, se clasifican


primero las variables de menor a mayor, comenzando por la variable X. En la primera
variable JUEZ I(X), el menor dato es de 12, a este dato se le asignó el rango 1. El siguiente
dato después de 12, le corresponde al valor de puntuación de 13, por lo que se le dio el
rango 2. Seguidamente, existen tres datos con una puntuación de 14, el empate se resuelve
dando a cada valor un rango de 4, que es el promedio de los rangos 3, 4 y 5 (3+4+5/3). Y
así sucesivamente se le asigna el rango a los demás datos de la variable JUEZ I(X). La
puntuación más alta fue de 19, a este dato se le asignó el rango de 19,5 (19+20/2), ya que
este se encuentra repetido dos veces.

De la misma forma se realiza para la variable Y. En la primera variable JUEZ II (Y), la


menor puntuación es de 10, sin embargo este se encuentra repetido 2 veces, por lo tanto, se
le asigna el rango de 1,5, es decir, el promedio entre el rango 1 y 2 (1+2/2). La puntuación
más alta en Y es de 19, entonces a esta se le asignó el rango de 19.
Fórmula empleada:

6 ∑ D2
ρ=1−
n(n2 −1)

(6 × 95)
ρ=1−
20((20)2−1)

570
ρ=1−
20(400−1)

570
ρ=1−
20(399)

570
ρ=1−
7980

ρ=1−0,0714

ρ=0,9286(Correlación Positiva)

Un valor de correlación por Sperman de ρ=0,9286 se interpreta como una


correlación positiva fuerte. Ahora bien, si comprobamos este dato, de la misma forma que
en el ejercicio anterior, es decir, con los datos tomados del gráfico de Excel que se
encuentra en la siguiente imagen, se tiene que al calcular la raíz cuadrada de R2, de la
siguiente forma: √ 0,8561 esta da como resultado un valor de r =0,9253, aunque no son
iguales, estos datos se encuentran cercanos, pero presentan un pequeño margen de error
debido a la aproximación de los decimales. No obstante, se comprueba el resultado
calculado por fórmula.
a) Mediante la ecuación de la regresión lineal     Y = a + bX  calcule los valores de
a, b y calcule X para Y = 20       

Fórmula empleada:

y=a+bx

a=¿ ¿

b=n( ∑ XY )−( ∑ X) ¿ ¿
Cálculo de a:

( 274 ×5161 )−( 319 × 4447 )


a=
( 20 ×5161 )−(319)2

(1414114−1418593)
a=
(103220−101761)

−4479
a=
1459

a=−3,0699
Cálculo de b:

( 20× 4447 )−(319 ×274 )


b=
( 20 ×5161 )−(319)2

(88940−87406)
b=
(103220−101761)

1534
b=
1459

b=1,0514

Para comprobar los datos calculados a de a y b con la formula, se puede demostrar que son
iguales a los datos arrojados por la ecuación obtenida en el gráfico de éxcel. Como se observa a
continuación:
Ahora, sustituyendo los valores de a y b previamente calculados en la primera ecuación,
se tiene que:

y=−3,0699+ 1,0514 x

Cálculo de X para Y = 20   

20=−3,0699+1,0514 x

20+3,0699=1,0514 x

23,0699
=x
1,0514

x=21,9421

4. Definir

a) ¿En estadística que se conoce como el método de mínimos cuadrados? 

El método de los mínimos cuadrados se utiliza para calcular la recta de


regresión lineal que minimiza los residuos, esto es, las diferencias entre los valores
reales y los estimados por la recta. Este método, que se denomina principio de los
mínimos cuadrados, proporciona lo que comúnmente se conoce como recta del
“mejor ajuste”. El principio de los mínimos cuadrados determina una ecuación de
regresión al minimizar la suma de los cuadrados de las distancias verticales entre los
valores reales de Y y los valores pronosticados de Y.

b) ¿Qué elementos intervienen? 


Los elementos que intervienen en el método de los mínimos cuadrados son la
ecuación de la recta dada por: y=a+bx. Donde b es la pendiente de la recta y a es
el punto de corte de la misma. Estos valores a y b se pueden calcular de la siguiente
forma:

a=¿ ¿

b=n( ∑ XY )−( ∑ X) ¿ ¿

Σ es el símbolo sumatoria de todos los términos, mientas (x, y) son los datos en
estudio y n la cantidad de datos que existen.

c) De un ejemplo numérico      

Ejemplo: Encontrar la recta que mejor se ajusta a los siguientes datos:                  

X Y
7 2
                           1 9
10 2
5 5
4 7
3 11
13 2
10 3
2 14

Para encontrar una recta y=a+bx .Debemos aplicar el método de mínimos


cuadrados. Entonces, primero calcularemos las ∑ X y ∑ Y , luego el valor ( x × y) y su
sumatoria y por último el valor de X 2 con su respectiva sumatoria, como se muestra en la
siguiente tabla:

X Y X*Y X^2
7 2 14 49
1 9 9 1
10 2 20 100
5 5 25 25
4 7 28 16
3 11 33 9
13 2 26 169
10 3 30 100
2 14 28 4
55 55 213 473
Ahora, sustituimos en cada una de las expresiones de a y b:

Fórmula empleada:

y=a+bx

a=¿ ¿

b=n( ∑ XY )−( ∑ X) ¿ ¿

Cálculo de a:

(55 × 473 ) −( 55× 213 )


a=
( 9× 473 )−(55)2

(26015−11715)
a=
( 4257−3025)

14300
a=
1232

a=11,6071
Cálculo de b:

( 9× 213 )−(55 ×55)


b=
( 9 × 473 )−(55)2

(1917−3025)
b=
(4257−3025)

b=−0,8994

Luego de obtenidos los datos de a y b, sustituimos en la ecuación de la recta de la


siguiente forma:

y=11,6071−0,8994 x

Para comprobar los datos calculados a de a y b con la formula, se puede demostrar que son
iguales a los datos arrojados por la ecuación obtenida en el gráfico de éxcel. Como se observa a
continuación:

También podría gustarte