Está en la página 1de 25

Encabezado: PASO 4

Paso 4- Regresión y Correlación Lineal Simple

Tutor: Diana Carolina Méndez M.

Grupo: 100105_100

Nota del autor

Universidad Nacional Abierta y a Distancia

Estadística Descriptiva

100105
Encabezado: PASO 4
2

Introducción

En este paso 4 correspondiente a la descripción de la información, se abordan los contenidos

estipulados en la unidad 2, por lo cual, la realización de este trabajo está relacionada con la

correlación y la regresión lineal, donde desde el campo de la estadística cada estudiante pone en

práctica el análisis de más de una variable estadística.

Para ello se va a detallar y relacionar variables de la problemática objeto de estudio

(accidentes de tránsito en Armenia Quindío en el año 2017), utilizando medidas bivariantes para

resolver el laboratorio y haciendo un respectivo análisis se detalla si entre las dos variables

trabajadas por cada estudiante existe una relación (Regresión y correlación lineal simple),

utilizando gráficos de dispersión, tablas y todos aquellos recursos que permiten conocer y

entender la problemática anteriormente mencionada.

Finalmente, podrán encontrar los resultados obtenidos en base a la problemática .


Encabezado: PASO 4
3

Justificación

En aras de conocer cada uno de los factores que influyen en la accidentabilidad de una región,

se parte de la información suministrada por la secretaria de tránsito de Armenia Quindío y de su

base de datos, eso para detallar cada aspecto que pudo haber sido el desencadenante de los

accidentes de tránsito, entonces mediante las estadística, se evalúan las variables cuantitativas y

para una mayor comprensión se le hace el grafico correspondiente y se identifica la correlación

lineal, todo lo anterior es relevante y novedoso en la medida que se pueden llegar a conclusiones

con datos numéricos, que lleven a saber cuál es la problemática para posteriormente erradicarla.
Encabezado: PASO 4
4

Objetivos

Generales:

Determinar puntualmente los elementos necesarios para la realización de un análisis de

regresión y correlación con diferentes variables para conocer a profundidad los rasgos que

inciden en los accidentes de tránsito de Armenia Quindío.

Específicos

- Identificar las variables cuantitativas de la situación estudiada que pueden estar

relacionadas.

- Detallar y relacionar variables de la problemática utilizando medidas bivariantes.

- Encontrar modelos matemáticos confiables a través de Excel.

- Realizar e interpretar graficas de dispersión con sus respectivas líneas de tendencia.

- Distinguir el grado de correlación entre variables y poder interpretarla según la tabla de

grado de correlación lineal.


Encabezado: PASO 4
5

REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

A
1. Identificar dos variables cuantitativas de la situación estudiada que puedan estar

relacionadas.

Grados de alcohol y edad

2. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación

entre las variables.

GRADOS DE ALCOHOL - EDAD

GR Á F I CA DE DI SPER SI ÓN ( GRA DOS DE


A LCOHOL Y EDA D)
70
60
50
Y(EDAD)

40
30
20
10
0 y = -0,0832x + 39,529
- 10 20 30 40 50
R² = 0,029860 70 80 90 100
X(GRADOS DE ALCOHOL)

Es inversa, ya que la variable X (grados de alcohol) disminuye su valor, mientras que la

variable Y (edad) aumenta.

3. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre

la otra. ¿Es confiable?

Modelo matemático
Encabezado: PASO 4
6

Coeficiente de determinación
Coeficiente de correlación 0.03

El efecto de los grados de alcohol según la edad nos dice que no existe una correlación

entre los grados de alcohol y la edad, es decir que no hay una tendencia de consumo de más

o menos alcohol dependiendo de la edad.

Tiene un 3% de confiabilidad.

Coeficiente de correlación: 0,03

4. Determine el grado de relación de las dos variables

Según el resultado, se determina que no hay correlación ya que 0<0,03<0,30

5. Relacionar la información obtenida con el problema

EDAD - GRADOS DE ALCOHOL

Se evidencia que estas variables no se encuentran muy relacionadas y podríamos concluir

que los resultados nos muestran que la edad no tiene mucha influencia en el consumo del

alcohol, Se calculó el promedio de grados de alcohol vs la edad, Según los resultados de la

gráfica se determina que mientas un valor aumenta el otro disminuye ,Esto indica que no hay

una correlación permanente, que la problemática de los grados del alcohol en las personas, se

debe estudiar con otra variable para establecer la razón, Según el modelo matemático utilizado

los datos son confiables.


Encabezado: PASO 4
7

B.
1. Identificar dos variables cuantitativas de la situación estudiada que pueden estar

relacionadas

Las variables a trabajar serán edad (x) y velocidad (y).

2. Realice el diagrama de dispersión de dichas variables y determinar el tipo de asociación

entre las

variables.
Encabezado: PASO 4
8

El tipo de asociación entre las variables el lineal ascendente directamente proporcional.

3. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la

otra. ¿Es confiable?

Según el coeficiente de determinación que nos presentó Excel con el modelo matemático se

puede deducir que le grado de confiabilidad en la relación entre las variables y velocidad es del

0.22 %.

4. Determine el grado de relación de las dos variables

GRADO DE RELACION


Con la ayuda de la tabla de grado de correlación lineal y el resultado del grado de relación

entendemos que no hay correlación entre las variables edad y velocidad.


Encabezado: PASO 4
9

5. Relacionar la información obtenida con el problema.

Después de realizar el ejercicio en Excel y obtener el grado de correlación entre las variables

de edad y velocidad se relaciona que la velocidad no tiene nada de dependencia con la edad de

las personas que estaban conduciendo al momento de presentarse el accidente, como se puede

pensar que entre más joven sea la persona a más velocidad va a manejar, pero no es así, ya que

los accidentes reportados a una mayor velocidad eran realizados por personas entre los 32 y 40n

años de edad.

a. Identificar dos variables cuantitativas de la situación estudiada que puedan estar

relacionadas.

- Número de heridos

- Velocidad

b. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación

entre las variables.


Encabezado: PASO 4
10

Relación accidentes de trán. Armenia


20
18 y = 0,0327x + 0,3973
16 R² = 0,0436
Número de heridos

14
12
10
8
6
4
2
0
0 20 40 60 80 100 120 140 160
Velocidad

- Tipo de asociación entre las variables

Tendencia lineal ascendente de dispersión.

c. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la

otra, ¿es confiable?

y = 0,0327x + 0,3973

R² = 0,0436 Coeficiente de determinación

R² = 0,0436 * 100% = 4,36%

Utilizando el método de mínimos cuadrados el resultado arrojó que es confiable en un 4,36%.

d. Determine el grado de relación de las dos variables

Coeficiente de correlación
Encabezado: PASO 4
11

=Raíz (0,0436)

= 0,20

- Tabla de correlación lineal

Como el valor del coeficiente de correlación es 0,20, significa que el r esta entre 0 y 0,30, por

lo cual la tabla nos indica que no hay correlación.

- Relacionar la información obtenida con el problema

Según los datos de la secretaría de transito de Armenia Quindío, y luego del análisis, el grado

de confiabilidad entre las variables velocidad y variable número de heridos es de 4,36%, es decir

bajo, por lo cual se deduce que no hay correlación entre las dos variables, sumado a que el

coeficiente de correlación es de 0,20, y la tabla nos indica que este valor no presenta correlación,

por ende el número de heridos no depende de la velocidad.


Encabezado: PASO 4
12

SOLUCIÓN:
a) Para este análisis escogemos las variables número de Velocidad (X) y muertos (Y), a partir de
estas hacemos un diagrama de dispersión:

4,5

3,5

3
y = 0,0144x - 0,0788
R² = 0,0765
2,5
Series1
2 Lineal (Series1)

1,5

0,5

0
0 20 40 60 80 100 120 140 160

Como podemos observar en el gráfico anterior, tenemos que la recta que describe la relación de
las variables y el coeficiente de correlación son las siguiente:

y = 0,0144x - 0,0788
R² = 0,0765

Para hallar el coeficiente de correlación procedemos hallar la raíz cuadrada de R², de aquí
podemos decir que tenemos un R = 0,27658633, lo que nos indica que las dos variables
presentan una asociación débil, ya que nuestro R es “pequeño”, por lo que podemos decir que la
ecuación recta de regresión encontrada que describe el modelo, no es confiable, por la que las
Encabezado: PASO 4
13

predicciones que se saquen a partir de estas van a tener un margen de error muy amplio.

Con todo esto podemos concluir que la cantidad de muertos en un accidente de tránsito, no
depende de la velocidad en la que se encuentre al momento del accidente, cabe aclarar que si se
puede estudiar un poco más a fondo, la incidencia de los tipos de vehículos, es decir, si el tipo de
vehículo tienen relación con la cantidad de muertos que se presentan en un accidente de tránsito.

Anexo

Laboratorio regresión y correlación

1. El rendimiento del producto de un proceso químico está relacionado con la temperatura de

operación del proceso. Se desea establecer la relación que existe entre la pureza (Y) del

Oxigeno producido y el porcentaje de hidrocarburo (X) que está presente en el

condensador principal en un proceso de destilación, de acuerdo con los siguientes datos:


Encabezado: PASO 4
14

A. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

DIAGRAMA:

El tipo de asociación entre las variables es lineal ascendente directamente proporcional ya que

podemos observar en la imagen que al aumentar los valores en “x” también aumentan los valores

en “y”, y adicionalmente con el grado de correlación también podemos deducir el tipo de

asociación entre variables, y como lo desarrolle en la hoja de Excel me dio un resultado de


Encabezado: PASO 4
15

B. Encuentre el modelo matemático que permite predecir el efecto de una variable

sobre otra. ¿Es confiable?

Según el coeficiente de determinación que nos

arrojó línea de tendencia lo multiplicamos por

100% y allí nos da la confiablidad, es decir que el

modelo matemático que nos dio Excel es el

87,74% confiable.
Encabezado: PASO 4
16

C. Determine el porcentaje de explicación de modelo y el grado de relación de las dos

variables.

PORCENTAJE DE EXPLICACION DE MODELO

GRADO DE RELACION

Con este coeficiente de correlación determinamos el grado de correlación entre las dos

variables según la siguiente tabla.

Podemos observar que nuestro

grado de correlación entre las dos

variables es excelente, ya que

nuestro coeficiente de relación se

encuentra entre 0,90 y 1.

D. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3?


Encabezado: PASO 4
17

Por medio de nuestro modelo matemático que nos arrojó Excel desarrollamos este

punto

Entonces reemplazamos la Y, ya que se refiere a la pureza

Entonces el porcentaje de hidrocarburo es de 1.14% cuando la pureza del químico es

del 91,3

2. El número de
Encabezado: PASO 4
18

libras de vapor (y) consumidas mensualmente por una planta química, se relaciona con la

temperatura ambiental promedio (°F). Para el año 2014, se registraron los siguientes

valores y consumo anual.

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.


Encabezado: PASO 4
19

Tiene un tipo de asociación entre variables es lineal ascendente directamente proporcional.

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre

otra. ¿Es confiable?

Según el coeficiente de determinación

que nos arrojó Excel lo podemos

interpretar que el grado de confiabilidad de

este modelo es del 99,99%.

c. Determine el porcentaje de explicación de modelo y el grado de relación de las dos

variables.

PORCENTAJE DE EXPLICACION DE MODELO

GRADO DE RELACION
Encabezado: PASO 4
20

Y según la tabla de correlación deducimos que el grado de relación entre las dos

variables es excelente ya que está muy próximo a 1.

d. ¿Cuál es el consumo de vapor cuando la temperatura es de 70 °F?

Entonces por medio de la ecuación que nos arrojó el modelo matemático de la gráfica

de dispersión en Excel desarrollamos y reemplazamos.

( )

3. Los investigadores están estudiando la correlación entre la obesidad y la respuesta

individual al dolor. La obesidad se mide como porcentaje sobre el peso ideal (x). La

respuesta al dolor se mide utilizando el umbral de reflejo de reflexión nociceptiva (y) que

es una medida de sensación de punzada. Obsérvese que ambas, X e Y, son variables

aleatorias
Encabezado: PASO 4
21

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

Observando el grafico que nos presenta Excel después de ingresar datos a la gráfica de

dispersión deducimos que el tipo de asociación entre las dos variables es de incorrelacion,

ya que para valores en “x” los valores en “y” pueden ser altos o bajos.

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre

otra. ¿Es confiable?


Encabezado: PASO 4
22

Según el modelo matemático que nos dio en

el Excel deduzco que el grado de confiabilidad

es del 11,15%

c. Determine el porcentaje de explicación de modelo y el grado de relación de las dos

variables.

PORCENTAJE DE EXPLICACION DE MODELO

GRADO DE RELACION

Según el grado de correlación que nos dio afirmo que la correlación entre las dos

variables es mínima, ya que el resultado los comparamos con la tabla de correlación.

d. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje de

sobrepeso de 40?
Encabezado: PASO 4
23

Utilizamos el modelo matemático para hallar esta respuesta.

( )

El umbral de reflejo de flexión nociceptiva cuando hay un porcentaje de sobrepeso del

40 es de 9,126.
Encabezado: PASO 4
24

Conclusiones

Una vez llevada a cabo la actividad, se construyeron graficas de dispersión a partir de dos

variables, en Excel, se formuló modelo matemático para observar la confiabilidad de relación

entre dos variables, además se comprendió la interpretación de los resultados utilizando graficas

de dispersión y grado de correlación lineal entre dos variables.


Encabezado: PASO 4
25

Referencias bibliográficas

- Montero, J.M. (2007).Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 130 –

172. Recuperado

de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r

&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219

- Churchill, G.A.(2009).Análisis de Correlación y de Regresión Simple. México City:

Cengage Learning. Páginas 675 – 686 Recuperado

dehttp://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad&it=r

&p=GVRL&sw=w&asid=e558184ed89e57d11ede116134cfce41

- Churchill, G.A.(2009). "Análisis de Regresión Múltiple." Investigación de mercados.

México City: Cengage Learning. Páginas 686 – 695.Recuperado

de http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900234&v=2.1&u=unad&it=r

&p=GVRL&sw=w&asid=49575112db86a0eb46dae86bbaf74cb9

También podría gustarte