Está en la página 1de 24

PASO 4.

FASE INTERMEDIA (TRABAJO COLABORATIVO 3)


REGRESION LINEAL SIMPLE Y REGRESION LINEAL MULTIPLE
ESTADISTICA DESCRIPTIVA

GRUPO: 100105A_291

ELABORADO POR:

STELLA GUERRERO SANABRIA

ENTREGADO A:

EDWARD FERNANDO TORO

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

ECACEN

TUNJA, Noviembre 2016


INTRODUCCIÓN

Gracias a la regresión lineal simple y múltiple podemos analizar dos variables a la


vez, mediante el diagrama de dispersión y unas fórmulas matemáticas, como el
coeficiente de correlación y determinación, la relación que hay entre dos variables
nos ayuda a sacar más conclusiones de una problemática o en si lograr soluciones
como en este caso los accidentes de tránsito en la ciudad de Medellín, con el fin
de seguir abordando el problema , buscar soluciones y concluir el estudio
realizado por la secretaria de tránsito y transporte de Medellín , tomando en
cuenta las variables cuantitativas diferenciando las dependientes y las
independientes, se realiza el presente trabajo utilizando el tema regresión lineal y
múltiple.
JUSTIFICACIÓN

Al analizar dos variables cuantitativas una independiente(X) y una dependiente(Y),


nos ayuda a entender aún más el estudio de la secretaria de tránsito y transporte
de Medellín, ya que la relación que se presente nos ayuda a concluir y encontrar
posibles soluciones al problema, por ejemplo en el presente trabajo, se relacionó
los grados de alcohol con el número de muertes para saber si entre más grados
de alcohol daba como consecuencia más víctimas fatales, utilizando un diagrama
de dispersión unas medidas matemáticas, los grados de correlación lineal,
igualmente se tomaron otras variantes y se realizó el análisis estadístico con el fin
de interpretar la información.
OBJETIVOS

Generales

 Implementar los conocimientos adquiridos en la unidad 3 sobre regresión y


determinación, en un laboratorio.
 Desarrollar un análisis estadístico de regresión lineal simple y múltiple en
unas variables cuantitativas de la base de datos de la secretaria de tránsito
y transporte de Medellín

Específicos

 Realizar el diagrama de dispersión para determinar el tipo de asociación


entre las variables.
 Encontrar el modelo matemático que permite predecir el efecto de una
variable sobre la otra. Y determinar si es o no confiable.
 Determinar el porcentaje de explicación del modelo y el grado de relación
de las variables.
 Analizar y concluir los resultados obtenidos
ANÁLISIS DE CORRELACIÓN LINEAL SIMPLE DE LAS DOS VARIABLES
CUANTITATIVAS SELECCIONADAS.

Regresión y Correlación lineal Simple

-Identificar dos variables cuantitativas de la situación estudiada que puedan estar


relacionadas.

VELOCIDAD NUMERO DE 68 3
MUERTOS 68 3
    68 3
33 1 69 3
38 1 69 3
40 1 69 3
40 1 69 3
45 1 69 3
45 2 69 3
48 1 69 3
50 2 70 3
50 2 70 3
50 2 70 3
50 2 70 3
51 2 70 3
55 2 70 3
55 1 70 3
55 2 70 3
55 2 71 4
55 2 71 4
55 2 72 4
60 2 72 4
60 2 73 4
60 2 73 4
62 2 73 4
63 2 74 4
65 2 74 4
65 2 74 4
66 2 75 5
66 2 75 5
66 2 75 5
66 2 75 5
66 2 76 5
67 2 77 5
67 3 77 5
67 3 77 5
68 3 77 5
68 3 78 6
78 6
78 6 83 8
79 6 85 8
79 7 86 8
79 7 88 10
80 7 88 9
80 7 88 9
80 7 88 9
80 7 88 10
80 7 95 9
80 7 95 11
80 7 100 11
81 7 105 11
81 8 108 12
81 8 111 12
83 8 138 12
83 8 138 12
83 9 150 12
83 9
83 8

- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de


asociación entre las variables.

VELOCIDAD ACCIDENTES DE TRAN-


SITO
14
12
numero de muertos

10
8 Series2
6
4
2
0
20 40 60 80 100 120 140 160
velocidad

Observando la Grafía esta tiene una relación Directa ya que, a mayor velocidad,
se presentan mayor número de muertes.
- Encuentre el modelo matemático que permite predecir el efecto de una variable
sobre la otra. ¿Es confiable?

VELOCIDAD ACCIDENTES DE TRAN-


SITO
14
12 f(x) = 0.151224745180995 x − 6.24375339038685
R² = 0.790716937813675
numero de muertos

10 Series2
8 Linear (Series2)
6 Linear (Series2)
4
2
0
20 40 60 80 100 120 140 160
velocidad

Es confiable en un 80% según el coeficiente de determinación


R^2= 0,7907
R= 0.8892 coeficiente de correlación

- Determine el porcentaje de explicación del modelo y el grado de relación de las


dos variables.
RTA: es una correlación excelente

- Relacionar la información obtenida con el problema.

Escribir mas

…………………………………..
ANÁLISIS DE CORRELACIÓN MÚLTIPLE DE LAS VARIABLES
CUANTITATIVAS SELECCIONADAS

Regresión y Correlación Lineal Múltiple:

_ Identificar una variable cuantitativa dependiente y varias variables


independientes del estudio de investigación.

Dependiente: número de heridos

Independiente:edad, grados de alcohol, velocidad

- Realizar el diagrama de dispersión de dichas variables y calcular la recta de


regresión y el coeficiente de correlación para probar estadísticamente su relación.

EDADx NUMERO DE 46 3
HERIDOSy 36 3
29 1 35 4
38 2 43 2
52 3 32 3
46 0 24 4
21 2 44 3
18 2 31 3
54 1 50 4
33 0 30 3
52 2 48 4
38 3 53 3
46 3 35 4
29 4 46 2
17 1 45 2
22 2 32 4
55 1 45 3
60 3 31 2
33 3 33 3
32 2 23 2
46 3 56 1
55 2 18 4
19 3 54 3
21 4 33 2
42 3 52 4
38 4 34 3
46 3 46 4
29 5 55 5
17 6 19 4
22 5 21 3
54 3 42 3
17 4 46 3
21 5 36 6
46 5 35 5
55 3 55 4
19 6 22 4
21 5 18 5
42 3 54 6
46 3 33 6
36 4 52 5
35 4 38 7
56 3 46 5
22 4 29 6
23 2 17 7
45 2 22 5
43 3 38 6
34 3 52 6
38 4 46 5
18 2 21 4
54 5 18 7
33 3 54 7
52 4 60 4
38 5 33 7
46 4 32 5
29 3 46 7
17 5
22 4
edad accidentes de transito
8
7
6
numero de heridos

5
4
f(x) = − 0.0151096163881664 x + 4.22228008955157
3 R² = 0.0151933232758135
2
1
0
10 20 30 40 50 60 70
edad

R² = 0,0152

R: Coeficiente ce correlación: 0,12328828


No encontramos correlación

GRADOS DE NUMERO 0,8 3


ALCOHOL DEL DEHERIDOS (Y) 0,9 4
CONDUCTOR(X) 0,7 3
0 1 0,6 3
0,3 2 0,8 3
0 3 0,9 4
0,2 0 1 2
0,6 2 0,9 3
0,4 2 1,2 4
0,2 1 1,1 3
0,6 0 0,8 3
0,7 2 1,2 4
0,5 3 1,4 3
1,4 3 0,8 4
0,8 4 0,9 3
0,6 1 1,2 4
1 2 1,1 2
0,7 1 1 2
0,4 3 1,2 4
0,6 3 1 3
0 2 1,4 2
0,2 3 1,6 3
0,7 2 1,5 2
1,4 1 2,3 3
1,9 4 2,2 5
1,8 3 2 4
1,6 2 2,3 3
1,8 4 2,4 4
1,5 4 2,2 5
1,6 3 2,3 4
2 5 2,4 3
1,8 6 2,5 3
1,7 5 2,5 3
1,6 3 2,4 6
1,2 4 2,3 5
1,8 5 2,6 4
1,7 5 3 4
1,6 3 2,8 5
1,4 6 3,4 6
1,8 5 3,1 6
1,7 3 3,3 5
1,4 3 3,3 7
1,5 4 2,9 5
1,9 4 3 6
2 3 3,2 7
1,9 4 3 5
1,8 2 3,2 6
2,1 2 3,2 6
2,2 3 3,5 5
2 3 3,2 4
2,1 4 3 7
2,3 2 3,2 7
2,4 5 3,3 4
2,2 3 3,4 7
2,4 4 3,4 5
2,1 5 3,5 7
1,9 4
Grados alcohol accidentes de transito
8
7
6
numero de heridos

f(x) = 1.17438381096338 x + 1.63195237066971


5 R² = 0.510851468284134
4
3
2
1
0
0 0.5 1 1.5 2 2.5 3 3.5 4
grados de alcohol

R² = 0,5109
R: Coeficiente ce correlación: 0,71477269
Es una correlación regular
VELOCIDA NUMERO DE 62 4
Dx HERIDOSy 63 3
33 1 65 3
38 2 65 3
40 3 66 4
40 0 66 2
45 2 66 3
45 2 66 4
48 1 66 3
50 0 67 3
50 2 67 4
50 3 67 3
50 3 68 4
51 4 68 3
55 1 68 4
55 2 68 2
55 1 68 2
55 3 69 4
55 3 69 3
55 2 69 2
60 3 69 3
60 2 69 2
60 3 69 1
69 4 81 6
70 3 83 5
70 2 83 4
70 4 83 4
70 4 83 5
70 3 83 6
70 5 83 6
70 6 85 5
70 5 86 7
71 3 88 5
71 4 88 6
72 5 88 7
72 5 88 5
73 3 88 6
73 6 95 6
73 5 95 5
74 3 100 4
74 3 105 7
74 4 108 7
75 4 111 4
75 3 138 7
75 4 138 5
75 2 150 7
76 2
77 3
77 3
77 4
77 2
78 5
78 3
78 4
79 5
79 4
79 3
80 5
80 4
80 3
80 4
80 5
80 4
80 3
81 3
81 3
velocidad accidentes de transito
8
f(x) = 0.0586043805888334 x − 0.626737062562503
7 R² = 0.469348424035794
6
numero de heridos

5
4
3
2
1
0
20 40 60 80 100 120 140 160
velocidad

R² = 0,4693
R: Coeficiente ce correlación: 0,68505474 es una correlación regular

- Relacionar la información obtenida con el problema.

Según los datos anteriores, en el diagrama de dispersión podemos observar que


el número de heridos depende en un 51% los grados de alcohol, y 47 la
velocidad ,pero de la edad no dependen los accidentes de tránsito, los grados de
alcohol pueden dejar heridos pero más muertes, a medida que aumentan los
grados de alcohol los heridos también aumentan lo que quiere decir que es una
relación Directa, es un aspecto que se debe prevenir , y más crear conciencia en
los conductores que no jueguen con la vida de las personas y la de ellos mismos,
también hablamos de la velocidad es un causante de accidentes ya que se
observa que a medida que aumenta la velocidad hay más número de heridos lo
que nos quiere decir que es una relación directa, tener un control de la velocidad
es importante ya que si va a una velocidad alta es más difícil de controlar un
vehículo si llega a suceder algo, por el contrario una variable que no encontramos
correlación es la edad, podemos decir que es una relación inversa ya que
aumenta y disminuye pero nos da a entender que por la edad no se causan los
accidentes si no que estos se presentan dependiendo que tan responsable sea el
conductor, si cumple con las normas de tránsito, la señalización , maneja un buen
nivel de estrés

ANÁLISIS Y CONCLUSIONES, A PARTIR DE LOS RESULTADOS OBTENIDOS


Y APLICADOS AL PROBLEMA O SITUACIÓN ESTUDIADA

“Principales Causas que incrementan e  (inciden)  en el número de accidentes de


tránsito, ocurridos en el territorio nacional”

Tomando como referencia la base de datos de la secretaria de tránsito y el análisis


estadístico de la regresión y determinación de unas variables cuantitativas,
podemos analizar que unas de las causas es los grados de alcohol que posee el
conductor, y la velocidad a la que maneja, por estas dos se presentan heridos y
víctimas fatales, pero ¿cómo podemos disminuir los accidentes de tránsito?,
bueno lo más factible es generar conciencia en las personas, que no conduzcan
en estado de embriaguez, en el caso que quieran salir a una fiesta o reunirse con
amigos, procurar buscar un conductor elegido, o pagar un taxi, así prevenir los
accidentes, las multas implementadas ayudan a disminuir estos sucesos ya que la
gente teme a estas multas. La velocidad también tiene sus multas, pero es
importante concientizar a la gente crear una mejor educación respecto al control y
responsabilidad de conducir que no es un juego.
CONCLUSIONES

 La Regresión y determinación nos ayuda a relacionar dos variables


cuantitativas.
 El número de heridos y el número de muertos dependen de los grados de
alcohol y a velocidad.
 El número de heridos y el número de muertos no dependen de la edad.
 Para sacar el coeficiente de correlación, se necesita del coeficiente de
determinación ya que es la Raíz de este.
 Se debe identificar la variable dependiente y la independiente.
 Encontramos una relación directa que es la que aumenta una magnitud y la
otra también aumenta y si disminuye la otra también, y una inversa que es
si una aumenta la otra disminuye y viceversa
 Con la regresión lineal simple podemos analizar dos variables una
dependiente y la otra independiente, con la regresión lineal múltiple
podemos analizar varias variables a la vez puede ser una dependiente y
varias independientes.
REFERENCIAS BIBLIOGRÁFICAS

 Montero, J.M. (2007).Regresión y Correlación Simple. Madrid:


Paraninfo. Paginas. 130 – 172. Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c8
1e98fcc1361e1929abe203c8219

 Churchill, G.A.(2009).Análisis de Correlación y de Regresión Simple.


Mexico City: CengageLearning. Páginas 675 – 686 Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4058900232&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=e5581
84ed89e57d11ede116134cfce41

 Churchill, G.A.(2009). "Análisis de Regresión Múltiple." Investigación de


mercados. Mexico City: CengageLearning. Páginas 686 –
695.Recuperado de: http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4058900234&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=49575
112db86a0eb46dae86bbaf74cb9

 Montero, J.M. (2007). Regresión y Correlación Múltiple. Madrid:


Paraninfo. Páginas 191 – 225.Tomado de:
http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052100012&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=47eaa
8f46c19ad13af26a0a74e510de2

 
ANEXO

Laboratorio

EJERCICIOS:

1. El rendimiento del producto de un proceso químico está relacionado con la


temperatura de operación del proceso. Se desea establecer la relación que
existe entre la pureza (y) del oxígeno producido y el porcentaje de
hidrocarburo (x) que está presente en el condensador principal en un
proceso de destilación, de acuerdo con los siguientes datos:

X
(% de Y
Hidro (Pureza)
carburos)

0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33

a. Realice el diagrama de dispersión y determine el tipo de asociación


entre las variables.

Proceso quimico
105

100

95
Pureza

90

85

80
0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6
Porcentaje de hidrocarburos

Es directa la relación ya que a medida que aumenta el porcentaje de


hidrocarburos la pureza también.

b. Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. Es confiable?
Proceso quimico
105

100

95 f(x) = 14.9474797321114 x + 74.2833142403948


R² = 0.877435705171556
Pureza

90

85

80
0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6
Porcentaje de hidrocarburos

Es confiable en un 87% según el coeficiente de determinación


R^2= 0,8774
R= 0,93 coeficiente de correlación

c. Determine el porcentaje de explicación del modelo y el grado de relación


de las dos variables.
RTA: La correlación es excelente
d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es
igual a 51,4?
RTA: el porcentaje de hidrocarburo es de -1,53

2. El número de libras de vapor (y) consumidas mensualmente por una planta


química, se relaciona con la temperatura ambiental promedio (en o F). Para el año
2015, se registraron los siguientes valores de temperatura y consumo anual.

2014 Registros de temperatura y


consumos de vapor.

Temperatur Consumo de
Mes
a vapor

Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84

May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98

a. Realice el diagrama de dispersión y determine el tipo de asociación


entre las variables.

Planta quimica
800

700

600

500
libras de vapor

400

300

200

100

0
10 20 30 40 50 60 70 80
Temperatura

La asociación que existe es directa ya que a medida que aumenta la


temperatura y las libras de vapor también.

b. Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. Es confiable?
Planta quimica
800

700
f(x) = 9.20869295859776 x − 6.31838924146257
600 R² = 0.999863869598443

500
libras de vapor

400

300

200

100

0
10 20 30 40 50 60 70 80
Temperatura

 Según el coeficiente de determinación R^2=0,9999 que en


porcentaje es un 100% lo que nos quiere decir que esta es
confiable
 Coeficiente de correlación R=0,99995

c. Determine el porcentaje de explicación del modelo y el grado de relación


de las dos variables.
RTA: la correlación es excelente

3. Los investigadores están estudiando la correlación entre la obesidad y la


respuesta individual al dolor. La obesidad se mide como porcentaje sobre el
peso ideal (x). La respuesta al dolor se mide utilizando el umbral de reflejo de
reflexión nociceptiva (y) que es una medida de sensación de punzada.
Obsérvese que ambas, X e Y, son variables aleatorias

 
x
(porcentaj y (umbral
e de de reflejo
sobrepeso de flexión
) nociceptiva)
89 2
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14

a. Realice el diagrama de dispersión y determine el tipo de asociación entre


las variables.

obesidad
16
14
12
umbral de reflejo

10
8
6
4
2
0
10 20 30 40 50 60 70 80 90 100
% de sobrepeso

b. Ajuste un modelo matemático que permita predecir el efecto de una


variable sobre la otra. Es confiable?
obesidad
16
14
12
umbral de reflejo

10
f(x) = − 0.0628678299960536 x + 11.6418129407526
8 R² = 0.111494544581578
6
4
2
0
10 20 30 40 50 60 70 80 90 100
% de sobrepeso

 Según el coeficiente de determinación R^2=0,1115 que en


porcentaje es un 11% lo que nos quiere decir que esta no es muy
confiable
 Coeficiente de correlación R= 0,33391616

c. Determine el porcentaje de explicación del modelo y el grado de relación


de las dos variables.
RTA: es una correlación mínima
d. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un
porcentaje de sobrepeso, de 50?
RTA: el porcentaje de sobrepeso es de 8,497

También podría gustarte