Está en la página 1de 9

ASIGNACIÓN REGRESIÓN Y CORRELACIÓN

1. Calcule las medidas de Tendencia Central de los siguientes datos:


3, 5, 6, 8, 8, 8, 9, 9, 10, 11
Sol.-

 Media (Ma): Llamado también “Promedio Aritmético” ó “Media Aritmética”

Ma = 7.70

 Mediana (Me): El valor mediano o mediana de un conjunto de valores es aquel


que tiene la propiedad de dividir al conjunto en 2 partes igualmente numerosas. Si
el número de elementos fuese impar se tomará el valor central como la mediana;
pero si el número de elementos fuese par hay dos elementos en el centro y como
mediana se tomará el promedio de ellos.

En nuestro caso para el problema el Número de elementos (n) es 10, entonces se


toma los dos números centrales y se promedia.

Me = 8.00

 Moda (Mo): Es el valor que se presenta con mayor frecuencia en un grupo de datos,
a una distribución que tiene una sola moda se le denomina unimodal. Si hubiese
más de dos valores no adyacentes con frecuencias máximas similares la
distribución es multimodal; bimodal, trimodal, etc. En el caso que no exista ningún
valor que se repita se dice que no existe moda, el sistema será amodal.

En nuestro caso para el problema el valor que más se repite es:


Mo = 8.00
2. Calcule las medidas de Dispersión de los datos anteriores:
3, 5, 6, 8, 8, 8, 9, 9, 10, 11
Sol.-

 Rango: Es la diferencia entre el mayor y el menor valor de un conjunto de datos.


Rango = 8.00

 Desviación Media: Se conoce también como promedio de desviación, para una


serie de N valores: ...., puede calcularse a través de la siguiente
expresión:

Desviación media =

Donde:
: media aritmética

: valor absoluto de las desviaciones de los Xj valores,


respecto de la media.
Sabemos: = Ma = 7.70

1.82
D.M. = 1.82

 Varianza: Dado un conjunto de números se define como varianza al cuadro de la


desviación típica.

Sabemos: = Ma = 7.70
S2 = 5.21

 Desviación Estándar: La desviación estándar se representa con “S” y se define


como.

Como tenemos el valor de S2 solo procederemos a sacar raíz cuadrada a la


varianza.
2.283
S = 2.28

 Coeficiente de Variación: A la dispersión relativa se le conoce con el nombre de


coeficiente de variación que se expresa como un porcentaje.

Sabemos: = Ma = 7.70
S = 2.28

V = 29.61
3. Los valores reducidos de lípidos en las heces se relacionan con valores reducidos de
energía. Calcule el coeficiente de correlación del siguiente grupo de datos e interprete su
valor.
Sujeto Lípidos fecales Energía fecal
(gramos/día) (MJ/día)
1 10.0 2.1
2 11.0 1.1
3 9.9 1.1
4 9.8 0.9
5 15.5 0.7
6 5.0 0.4
7 10.7 1.0
8 13.0 1.5
9 13.8 1.2
10 16.7 1.4
11 3.2 1.0
12 4.0 0.5
13 6.0 0.9
14 8.9 0.8
15 9.1 0.6
16 4.1 0.5
17 17.0 1.2
18 22.2 1.1
19 2.9 0.9
20 5.0 1.0
Sol.-
Definición:
En el contexto del análisis de la regresión lineal simple el coeficiente de correlación
establece una medida del grado de asociación lineal entre la variable respuesta y la
variable predictora, concretamente entre la variable respuesta y la recta de regresión
estimada. Se define, a partir de los n pares de observaciones, mediante:

A continuación podremos observar un cuadro del cual obtendremos las sumatorias


pedidas para desarrollar el cálculo del coeficiente de relación.
Lípidos Energía
Xi Yi Xi - x Yi - y (Xi - x)(Yi - y) (Xi - x)² (Yi - y)²
10.0 2.1 0.1 1.1 0.122 0.012 1.221
11.0 1.1 1.1 0.1 0.117 1.232 0.011
9.9 1.1 0.0 0.1 0.001 0.000 0.011
9.8 0.9 -0.1 -0.1 0.009 0.008 0.009
15.5 0.7 5.6 -0.3 -1.655 31.472 0.087
5.0 0.4 -4.9 -0.6 2.910 23.912 0.354
10.7 1.0 0.8 0.0 0.004 0.656 0.000
13.0 1.5 3.1 0.5 1.571 9.672 0.255
13.8 1.2 3.9 0.2 0.802 15.288 0.042
16.7 1.4 6.8 0.4 2.758 46.376 0.164
3.2 1.0 -6.7 0.0 -0.033 44.756 0.000
4.0 0.5 -5.9 -0.5 2.916 34.692 0.245
6.0 0.9 -3.9 -0.1 0.370 15.132 0.009
8.9 0.8 -1.0 -0.2 0.193 0.980 0.038
9.1 0.6 -0.8 -0.4 0.312 0.624 0.156
4.1 0.5 -5.8 -0.5 2.866 33.524 0.245
17.0 1.2 7.1 0.2 1.458 50.552 0.042
22.2 1.1 12.3 0.1 1.293 151.536 0.011
2.9 0.9 -7.0 -0.1 0.664 48.860 0.009
5.0 1.0 -4.9 0.0 -0.024 23.912 0.000
Total 9.9 1.0 16.649 533.198 2.910

Luego ingresamos estos valores en la formula de correlación:

Coeficiente Correlación = 0.423

Interpretación del “r”:


 Valor de r de 0 a 0.25 implica que no existe correlación entre ambas variables.
 Valor de r de 0.25 a 0.50 implica una correlación baja a moderada.
 Valor de r de 0.50 a 0.75 implica correlación moderada a buena.
 Valor de r de 0.75 o mayor, implica una muy buena a excelente correlación.
 Estos rangos de valores se pueden extrapolar a correlaciones negativas también.
Por lo tanto podemos decir que para nuestro caso el Coeficiente de Correlación, “r” = 0.42,
implica una correlación baja (a moderada).
4. Se desea predecir si el puntaje logrado con el examen preliminar (A) puede predecir el
puntaje logrado con un examen final (B). Represente el gráfico de Dispersión respectivo.
Sujeto Examen Preliminar (A) Examen Final (B)
1 28 8
2 25 7
3 24 7
4 28 9
5 25 10
6 25 8
7 24 9
8 21 5
9 25 9
10 29 9
11 27 10
12 18 6
13 24 10
14 29 10
15 27 8
16 21 6
17 27 6
18 17 3
19 28 8
20 20 6

Sol.-
Si utilizamos un sistema de coordenadas cartesianas para representar la distribución
bidimensional, obtendremos un conjunto de puntos conocido con el diagrama de
dispersión, cuyo análisis permite estudiar cualitativamente, la relación entre ambas
variables tal como se ve en el Gráfico 1. El siguiente paso, es la determinación de la
dependencia funcional entre las dos variables x e y que mejor ajusta a la distribución
bidimensional.

El gráfico de Dispersión lo hallaremos mediante el ingreso de los datos a una hoja de


Excel, de donde exportaremos para poder visualizar los datos en el Gráfico Examen A
vs. Examen B.
Gráfico 1.

Gráfico de Dispersión

11

10

7
Examen Final (B)

0
14 16 18 20 22 24 26 28 30
Examen Preliminar (A)

5. Determine el modelo de regresión lineal simple.


Sol.-
Se denomina regresión lineal cuando la función es lineal, es decir, requiere la
determinación de dos parámetros: la pendiente y la ordenada en el origen de la recta de
regresión, y=ax+b. La regresión nos permite además, determinar el grado de dependencia
de las series de valores X e Y, prediciendo el valor “y” estimado que se obtendría para un
valor “x” que no esté en la distribución.

Vamos a determinar la ecuación de la recta que mejor ajusta a los datos representados en el
Gráfico 1. En concreto queremos expresar mediante una relación cómo depende una de
ellas (variable dependiente) de la otra (variable independiente). Normalmente se elige
como “y” la variable dependiente y como “x” la independiente
Luego procesando los datos podemos obtener las sumatorias respectivas para el cálculo de
“a” y “b”, con “n = 20”.
Exam. A Exam. B
Xi Yi Xi * Yi Xi²
28 8 224 784
25 7 175 625
24 7 168 576
28 9 252 784
25 10 250 625
25 8 200 625
24 9 216 576
21 5 105 441
25 9 225 625
29 9 261 841
27 10 270 729
18 6 108 324
24 10 240 576
29 10 290 841
27 8 216 729
21 6 126 441
27 6 162 729
17 3 51 289
28 8 224 784
20 6 120 400
492 154 3883 12344

Por lo tanto el modelo de Regresión Lineal es:

6. Como interpreta el coeficiente alfa (a)


Sol.-
El Coeficiente Alfa (a) indica la pendiente de la Recta de Regresión Lineal, la cual se
define como la división entre el Examen Final (B) y el Examen Preliminar (A); esta
pendiente es baja y positiva.

7. Como interpreta el coeficiente beta (b)


Sol.-
El Coeficiente Beta (b) indica el valor de la ordenada en el origen, es decir cuando “x”
(Examen Preliminar A) es cero (0).

8. Cual sería el puntaje probable de un alumno en el examen final (B) si en el examen de tipo
(A) obtuvo 25.
Sol.-
Como la fórmula de regresión lineal es: y sabiendo que “y”
(Examen A) es la variable dependiente de “x” (Examen B) procedemos a reemplazar el
valor de 25 en “x” para hallar el Examen Final (B):
7.8582

También podría gustarte