Está en la página 1de 13

Actividad 2. Definición de Conceptos.

Descripción de la Actividad:

Definir brevemente los conceptos básicos asociados a Regresión y


Correlación como:

-Diagrama de dispersión.
-Correlación lineal simple.
-Coeficiente de determinación R2
-Correlación positiva y correlación negativa
-¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

Diagrama de dispersión
También conocido como gráfico de burbujas es un tipo de
diagrama matemático que utiliza las coordenadas cartesianas para
mostrar los valores de dos variables para un conjunto de datos.
El diagrama de dispersión permite analizar si existe algún tipo de
relación entre dos variables. Por ejemplo, puede ocurrir que dos
variables estén relacionadas de manera que, al aumentar el valor de
una, se incremente el de la otra. En este caso hablaríamos de la
existencia de una correlación positiva.
Correlación lineal simple
Para estudiar la relación lineal existente entre dos variables continuas es
necesario disponer de parámetros que permitan cuantificar dicha
relación. Uno de estos parámetros es la covarianza, que indica el grado
de variación conjunta de dos variables aleatorias (Amat, J. 2016).

Siendo x́ e ý la media de cada variable y xi e yi el valor de las variables


para la observación i.

La covarianza depende de las escalas en que se miden las variables


estudiadas, por lo tanto, no es comparable entre distintos pares de
variables. Para poder hacer comparaciones se estandariza la covarianza,
generando lo que se conoce como coeficientes de correlación.

Todos ellos varían entre +1 y -1. Siendo +1 una correlación positiva


perfecta y -1 una correlación negativa perfecta.

Coeficiente de determinación R2
El coeficiente de determinación se define como la proporción de la
varianza total de la variable explicada por la regresión. El coeficiente de
determinación, también llamado R cuadrado, refleja la bondad del ajuste
de un modelo a la variable que pretender explicar (López, J. 2019).
Es importante saber que el resultado del coeficiente de determinación
oscila entre 0 y 1. Cuanto más cerca de 1 se sitúe su valor, mayor será
el ajuste del modelo a la variable que estamos intentando explicar.

En la expresión anterior tenemos una fracción. Así pues, vayamos por


partes. En primer lugar, analizaremos el numerador, es decir, la parte
de arriba.

Para aquellos que no conozcan la expresión de la varianza, les


recomiendo que lean el artículo sobre la misma. Para aquellos que, si la
conozcan, podrán caer en la cuenta de que es la expresión de la
varianza, pero con dos diferencias fundamentales.

La primera diferencia es que la Y lleva un circunflejo o, lo que los


profesores llaman de forma didáctica, “sombrerito”. Ese sombrerito lo
que detalla es que esa Y es la estimación de un modelo sobre lo que
según las variables explicativas vale Y, pero no es el valor real de Y,
sino una estimación de Y.

En segundo lugar, faltaría dividir entre T. Que, en otros casos, se nota


como N o número de observaciones. Sin embargo, dado que la fórmula
del denominador también la llevaría, eliminamos los denominadores
(parte de abajo) de ambas fórmulas para simplificar la expresión. De
esta manera es más fácil trabajar con ella.

A continuación, vamos a realizar el mismo análisis con la parte del


denominador.
En este caso, la única diferencia existente respecto a la fórmula original
de la varianza es la ausencia de su denominador. Es decir, no dividimos
entre T o N. Hecho, que ya hemos aclarado anteriormente.

Correlación positiva y correlación negativa


El coeficiente de correlación entre dos variables puede definirse como la
covarianza existente entre sus dos variables tipificadas y tiene por
expresión de cálculo:

1. Hay correlación negativa: las dos variables se correlacionan en


sentido inverso. A valores altos de una de ellas le suelen
corresponder valores bajos de la otra y viceversa. Cuánto más
próximo a -1 esté el coeficiente de correlación más patente será esta
covariación extrema. Si r= -1 hablaremos de correlación negativa
perfecta lo que supone una determinación absoluta entre las dos
variables

2. Si r = 0 se dice que las variables están correlacionadas: no puede


establecerse ningún sentido de covariación.

3. Propiedad importante: Si dos variables son independientes estarán


correlacionadas, aunque el resultado recíproco no es necesariamente
cierto.

¿Qué es el coeficiente de correlación lineal y qué nos ayuda a


medir?
también conocida como coeficiente de correlación lineal (de Pearson), es
una medida de regresión que pretende cuantificar el grado de variación
conjunta entre dos variables.
El Coeficiente de correlación es una medida que permite conocer el
grado de asociación lineal entre dos variables cuantitativas (X, Y).
El coeficiente de relación lineal mide la fuerza y el sentido de la
relación lineal entre 2 variables cuantitativas, existe correlación si al
aumentar los valores de A lo hacen también los de B y viceversa.

1. Ρ= Coeficiente de correlación.
2. X, Y= Los rendimientos de las dos variables relacionados.
3. σX,Y= Volatilidad de los dos activos relacionados.
4. Cov (x, y): la covarianza entre el valor «x» e «y».
5. σ(x): desviación típica de «x».
6. σ(y): desviación típica de «y».

Actividad 3. Realizar el laboratorio de regresión y correlación


lineal
Descripción de la Actividad:
A partir de la base de datos “Indicadores de accidentalidad -220
municipios 2020 (16-1)”, desarrollar el Laboratorio denominado
Regresión y correlación, el cual se encuentra en el Entorno de
aprendizaje práctico, en la carpeta Guía para el uso de recursos
educativos. El laboratorio lo puede desarrollar con el programa Infostat
o Excel. Donde el estudiante deberá realizar lo siguiente:

a. Identificar dos variables cuantitativas de la situación


estudiada que puedan estar relacionadas.
las variables elegidas para este estudio son:

 Lesionados ene - feb 2019, variable dependiente (Y)


 Usuario de moto, variable independiente (X)

b. Realizar el diagrama de dispersión de dichas variables


y determinar el tipo de relación entre las variables.
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión EstudiantilLesionados ene - feb
Versión Estudiantil 2019 Estudiantil
Versión / Usuario en motoEstudiantil
Versión
L e s io n a d o s e n e - fe b 2 0 1 9

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
213,15
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
157,33
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
101,50
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
45,68
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
-10,15
Versión Estudiantil Versión Estudiantil
-8,15 Versión Estudiantil 103,50
47,68 Versión Estudiantil
159,33 Versión 215,15
Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil
Us uario Versión Estudiantil
en m oto Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Análisis de regresión lineal


Variable N R² R² Aj ECMP AIC
BIC
Lesionados ene- feb 2019 200 0,58 0,57 408,09 1559,99
1569,89

Coeficientes de regresión y estadísticos asociados

Coef Est. E.E. LI(95%) LS(95%) T p-valor


CpMallows VIF
const -2,00 0,90 -3,78 -0,21 -2,21 0,0284

Usuario en moto 0,95 0,06 0,84 1,07 16,42 <0,0001


269,55 1,00

Cuadro de Análisis de la Varianza (SC tipo III)


F.V. SC gl CM F p-valor
Modelo 37754,58 1 37754,58 269,55 <0,0001
Usuario en moto 37754,58 1 37754,58 269,55 <0,0001
Error 27733,42 198 140,07
Total 65488,00 199

después de analizar el grafico y el análisis de regresión lineal que


obtenemos al Realizar en un diagrama de dispersión las variables
Lesionados ene - feb 2019 y Usuario de moto podemos concluir que
tienen correlación bastante aceptable porque se observan en el estudio
de estas variables una alta confiabilidad y una correlación positiva entre
estas variables dependientes(y) e independientes(x), donde notamos
una tendencia lineal en el diagrama de dispersión donde sobresale que
las variables están relacionadas muestran el incremento de lesionados a
medidas que aumenta el usuario de moto.

c. Encuentre el modelo matemático que permite predecir


el efecto de una variable sobre la otra. ¿Es confiable?
el modelo matemático que permite predecir el efecto de una
variable sobre otra está contemplado en la siguiente ecuación.
Y= m(x)+b
Donde;
m= pendiente
b= ordenada de origen
reemplazamos los valores.

Y= 0.95(x) – 2

Para este caso vamos a hallar para (x) usuarios en moto x=25

0.95(25) – 2 = 21,71

Para 50 usuarios de motos, el número de lesionados ene-feb 2019


fueron de 21,71.

¿Es confiable?
para determinar si es confiable este modelo matemático lo
determinaremos mediante el coeficiente de determinación, de la
siguiente manera.

0,58 * 100% = 58%

Lo anterior nos indica que la confiabilidad del modelo es del 58%,


ósea que es un modelo aceptable porque sobrepasa 50% de
confiabilidad.

d. Determine el grado de correlación de las dos variables.

Para hallar el grado de correlación de las 2 variables tenemos que


sacarle raíz cuadrada al coeficiente de determinación, quedando
así.
√ 0,58=0,76
Entonces tenemos que el grado de correlación entre lesionados
ene-feb 2019 y usuario de moto es de 0,76, entonces podemos
afirmar que entre las variables existe una correlación regular.

e. Relacionar la información obtenida con el problema.

De los Indicadores de accidentalidad en los 200 municipios 2019,


Escogimos y Estudiamos las variables cuantitativas discretas,
lesionados ene-feb 2019 y de los fallecidos por actor vial
(usuario de moto), después de haber obtenidos los resultados se
logró identificar las medidas estadísticas bivariantes conociendo su
influencia en la accidentalidad de vehículos y en el grado de
muertes asociadas a los accidentes de tránsito en Colombia.

f. Establezca al menos 3 nuevos valores independientes


para ser hallados a través del modelo matemático
calculado.
Y= m(x)+b

Y= 0.95(x) - 2

Para este caso vamos a hallar para (x) usuarios en moto


x= 15,30 y 60

Y= 0.95(15) - 2
Y= 12,25

Y= 0.95(30) - 2
Y= 26,5

Y= 0.95(60) - 2
Y= 55

Podemos concluir que con un modelo con el 58% de confiabilidad,


conociendo el dato de la variable usuario de moto podemos
calcular un promedio de lesionados ene-feb 2019, según lo
estudiado en la accidentalidad de vehículos y en el grado de
muertes asociadas a los accidentes de tránsito en Colombia.

Actividad 4. Regresión y correlación múltiple.


Descripción de la Actividad:
A partir de la base de datos suministrada “Indicadores de
accidentalidad -220 municipios 2020 (16-1)”, cada estudiante,
deberá:

a. Identificar una variable cuantitativa dependiente y varias


variables cuantitativas independientes del estudio de
investigación.

 Lesionados ene - feb 2019, variable dependiente (Y)


 Motocicleta, variable independiente (X1)
 Otras motos, variable independiente (X2)

b. Realizar el diagrama de dispersión de dichas variables.


Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Lesionados
Versión Estudiantil ene-feb
Versión 2019 Vs
Estudiantil Motocicleta
Versión - Otras
Estudiantil motos
Versión Estudiantil
Res. estudentizados_Lesionados ene-feb 2019

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
9,15
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
6,06
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
2,98
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
-0,11
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
-3,19
Versión Estudiantil Versión Estudiantil
-8,54 Versión Estudiantil 64,04
27,75 Versión Estudiantil
100,33 Versión Estudiantil
136,61
Versión Estudiantil Versión Estudiantil Versión Estudiantil
Predichos Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Lesionados ene-febVersión
Versión Estudiantil 2019 Vs Motocicleta
Estudiantil Versión Estudiantil

RPAR Lesionados ene-feb 2019 Motocicleta


Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
137,94
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
96,14
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
54,34
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
12,54
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
-29,26
Versión Estudiantil Versión Estudiantil
-1,55 Versión Estudiantil 125,50
61,98 Versión Estudiantil
189,03 Versión Estudiantil
252,55
Versión Estudiantil Versión Estudiantil Versión Estudiantil
Motocicleta Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Lesonados ene-feb Versión
Versión Estudiantil 2019 Vs Otras motos
Estudiantil Versión Estudiantil
RPAR Lesionados ene-feb 2019 Otras motos

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
150,09
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
105,87
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
61,65
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
17,43
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
-26,79
Versión Estudiantil Versión Estudiantil
0,30 Versión4,15Estudiantil 8,00
Versión Estudiantil
11,85 Versión Estudiantil
15,70
Versión Estudiantil Versión Estudiantil Versión Estudiantil
Otras motos Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
c. Calcular la recta de regresión y el coeficiente de correlación
para probar estadísticamente su relación.

el modelo matemático que permite predecir el efecto de dos o


más variables sobre otra está contemplado en la siguiente
ecuación.

Y= a(X1) + b(X2) + c
Y= Motocicleta (X1) + Otras motos (X2) + c

Remplazando valores quedaría:

Y= 0,26 (X1) + 5,10 (X2) - 9,66

Para este caso vamos a hallar (X1) = 80 y (X2) = 30

Y= 0,26 (80) + 5,10 (30) – 9,66

Y=20,8 + 153 – 9,66

Y= 164,14

para determinar si es confiable este modelo matemático lo


determinaremos mediante el coeficiente de determinación
0,38 * 100% = 38%
Para hallar el grado de correlación de las variables tenemos que
sacarle raíz cuadrada al coeficiente de determinación, quedando
así.
√ 0 , 3 8=0 , 61
Podemos concluir por este modelo matemático que nos permite
tener un valor aproximado de los lesionados ene-feb 2019 y las
variables independiente Motociclista y Otras motos que los
estudios implementados para este caso solo nos nuestra un 38%
de confiabilidad y afirmar una correlación regular 0,61.

d. Relacionar la información obtenida con el problema.

Después de realizar los estudios y aplicar las medidas estadísticas bivariantes


dentro de los datos estadísticos propuestos indicadores de accidentalidad
en 200 municipios de Colombia en el año 2019 podemos determinar que
el análisis realizado con variable dependiente (Y) lesionados ene-feb 2019
en relación a las variables independientes Motocicleta (X1) y Otras motos
(X2), arrojan una correlación regular y calcular con base al modelo matemático
el porcentaje de confiabilidad que permite analizar la problemática de los
factores que influyen en la accidentalidad de vehículos y en el grado de
muertes asociadas a los accidentes de tránsito en Colombia.

También podría gustarte