Está en la página 1de 11

Regresión y Correlación simple y múltiple.

Trabajo Colaborativo

Wendys Johana Carrascal

Ana Karina Pérez Fernández

Leonardo David Murallas

Sara Beatriz Hernández

María Teresa Aguas Yepes

Grupo No: 204040_104

Tutor: Roberto Mario De León

Escuela de Ciencias Sociales, Artes y Humanidades

Programade Psicología

25/11/2016
Introducción

La utilización del modelo de regresión lineal en los procesos relacionados con el análisis de datos

demanda el conocimiento objetivo e instrumentación de la relación funcional de variables, el

coeficiente de determinación y de correlación y la prueba de hipótesis como pilares

fundamentales para verificar e interpretar su significancia estadística en el intervalo de confianza

determinado. La presentación específica de los temas relacionados con el modelo de regresión

lineal, el análisis de regresión, el uso de la ecuación de regresión como instrumento para estimar

y predecir y la consideración del análisis de residuales ha sido realizada tomando como referente

el estudio de problemas reales tales como los accidendentes de tránsitos en la ciudad de

Medellín, utilizando como plataforma de apoyo la hoja de cálculo Excel. Se consideran en este

trabajo grupal perteneciente a la unidad 3, los elementos teóricos correspondientes al análisis de

regresión lineal, como técnica estadística empleada para estudiar la relación entre variables

determinísticas o aleatorias que resultan de algún tipo de investigación, en la cual se analiza el

comportamiento de dos variables, una dependiente y otra independiente Se muestra mediante la

gráfica de dispersión el posible comportamiento de las variables: lineal directa, inversa, no lineal

directa o no lineal inversa, con el fin de desarrollar las competencias interpretativas y

propositivas requeridas para dimensionar integralmente la importancia de la estadística

inferencial en la vida laboral de un psicólogo y en cualquier otra profesión donde se requieran

ser implementadas.
Justificación

La realización de este trabajo es con el fin de analizar e interpretar la Regresión y correlación

simple y múltiple tomando como punto de partida la base de dato de la alcaldía de Medellín. La

aplicación de este método estadístico nos arroja probabilidades que determinan las relaciones

entre las variables trabajadas y concluir si estas indicen en los 110 accidentes registrados, la

regresión y correlación múltiple nos permite trabajar con dos variables y hasta tres que juegan un

papel importante en el estudio de análisis además de eso nos facilita la comprensión y una posible

hipótesis con cada ejercicio realizado.


Objetivos

General:

Adquirir conocimientos relacionados con Regresion y correlación de variables simples y

múltiples, y aplicar esos conocimientos al problema en estudio.

Específicos:

1. Determinar las variables cuantitativas del problema estudiado.

2. Graficar mediante un diagrama de dispersión las variables cuantitativas del problema en

mención.

3. Determinar la sociabilidad entre las variables cuantitativas dependientes e independientes

y su representación gráfica.

4. Determinar la recta de Regresion y el coeficiente de Correlación de las variables.


Regresión y Correlación lineal Simple

1. Identificar dos variables cuantitativas de la situación estudiada que puedan estar

relacionadas.

Edad y número de muertos

2. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación

entre las variables.

DIAGRAMA DE DISPERSIÓN
14
y = -0,0003x + 4,8368
R² = 1E-06
12

10
N° DE MUERTOS

0
0 10 20 30 40 50 60 70
EDAD

El tipo de asociación entre las variables Edad y N° de Muertos no es directamente proporcional

lo anterior debido a que la pendiente es negativa (el valor o coeficiente X) es decir, mientras la

variable Edad disminuye la variable N° de Muertos también aumenta.


3. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la

otra. ¿Es confiable?

El modelo matemático que permite predecir la relación entre las 2 variables Edad y N°

de Muertos es Y = -0,0003x + 4,8368. Debido a que su R Cuadrado es muy lejano a 1

(1E-06) o en términos porcentuales lejano a 100%, (0,0001) se podría afirmar que la

confianza del modelo es muy mala, pues la edad no se explica por las variaciones en el

N° de muertos.

4. Determine el porcentaje de explicación del modelo y el grado de relación de las dos

variables.

El porcentaje de explicación del modelo de las variables Edad y N° de muertos es de

0.0001% y el grado de relación entre las variables se determina con el coeficiente de

Pearson, el cual se puede calcular aplicando raíz cuadrada al R Cuadrado, hechos los

cálculos el grado de relación entre dichas variables es de 0,01

5. Relacionar la información obtenida con el problema.

Con los resultados obtenidos se puede asegurar que la ecuación de la recta es negativa

entre las dos variables. El R 2 afirma además que el modelo explica el 0.0001% de la

información. Y el valor de r confirma además el grado de relación entre las variables:

Edad que no está directamente relacionada (en un 0.0001%) con el N° de Muertos de los

accidentes ocurridos en la ciudad de Medellín.


Regresión y Correlación Lineal Múltiple:

1. Identificar una variable cuantitativa dependiente y varias variables independientes del

estudio de investigación.

Cuantitativa Dependiente: velocidad

Cuantitativa Independientes: horas y grados de alcohol.

2. Realizar el diagrama de dispersión de dichas variables.

RELACIÓN: HORA VS VELOCIDAD


160

140

y = 0,6779x + 72,894
120
R² = 0,0001

100
VELOCIDAD

80

60

40

20

0
00:00 04:48 09:36 14:24 19:12 00:00 04:48
HORA
RELACIÓN: GRADOS DE ALCOHOL VS VELOCIDAD
160

140

120 y = 0,4983x + 45,552


R² = 0,7676
100
VELOCIDAD

80

60

40

20

0
0 20 40 60 80 100 120
GRADOS DE ALCOHOL DEL CONDUCTOR

3. Calcular la recta de regresión y el coeficiente de correlación para probar estadísticamente

su relación.

Ecuación

Y  a  b1 X 1  b2 X 2

Y  43,2170  2,9867 X 1  16,5328 X 2

R^2= 0,7395, indicando que es cercano a 1, lo que significa que es confiable.

r= 0.8599, que en términos es porcentuales sería 85.99%, entonces la correlación entre

las variables buena, ya que ofrecen un 85,99%.

4. Relacionar la información obtenida con el problema.

Con los resultados obtenidos se puede asegurar que la ecuación de la recta es aceptable

entre las dos variables. El R 2 afirma además que el modelo explica el 73,95% de la

información. Y el valor de r confirma además el grado de relación entre las variables:

Velocidad que está aceptablemente relacionada (con un 85,99%) con las Horas y

Grados de alcohol del conductor, de los accidentes ocurridos en la ciudad de Medellín.


Conclusión

En el presente trabajo se investigó y se realizaron ejercicios de regresión y correlación lineal

simple y múltiple, en síntesis podemos decir que la regresión lineal es una técnica que permite y

facilita cuantificar la relación que puede ser observada cuando se gráfica un diagrama de puntos

dispersos correspondientes a dos variables donde la tendencia general es rectilínea. Abreviada en

la siguiente ecuación

y = a + bx

En esta ecuación, “y” representa los valores de la coordenada a lo largo del eje vertical en el

gráfico (ordenada); en tanto que “x” indica la magnitud de la coordenada sobre el eje horizontal

(abscisa). El valor de “a” (que puede ser negativo, positivo o igual a cero) es llamado

el intercepto; en tanto que el valor de “b” (el cual puede ser negativo o positivo) se denomina

la pendiente o coeficiente de regresión. Mientras que el análisis de correlación se encuentra

estrechamente asociado con el análisis de regresión; donde ambos se pueden considerar como

dos aspectos de un mismo problema.

Por otro lado saber exactamente cómo cuantificar y graficar en un diagrama estas variables

Los valores de “r” pueden calcularse fácilmente en base a una serie de pares de datos de “x” e

“y”, utilizando la misma tabla y montos que se indican en los ejercicios ya resueltos donde se

identifican las variables cuantitativas, los diagramas de dispersión dichas variables, los modelos

temáticos y los porcentajes y grado de relación entre las variables. No obstante se relaciona la

información obtenida de dichos laboratorios.


Bibliografía

 Montero, J.M. (2007).Regresión y Correlación Simple. Madrid: Paraninfo. Paginas.

130 – 172. Recuperado de:

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r

&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219

 Churchill, G.A.(2009).Análisis de Correlación y de Regresión Simple. Mexico City:

CengageLearning. Páginas 675 – 686 Recuperado

de:http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad&i

t=r&p=GVRL&sw=w&asid=e558184ed89e57d11ede116134cfce41

 Churchill, G.A.(2009). "Análisis de Regresión Múltiple." Investigación de mercados.

Mexico City: CengageLearning. Páginas 686 – 695.Recuperado de:

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900234&v=2.1&u=unad&it=r

&p=GVRL&sw=w&asid=49575112db86a0eb46dae86bbaf74cb9

 Montero, J.M. (2007).Regresión y Correlación Múltiple. Madrid: Paraninfo. Páginas

191 – 225.Tomado de:

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100012&v=2.1&u=unad&it=r

&p=GVRL&sw=w&asid=47eaa8f46c19ad13af26a0a74e510de2

También podría gustarte