Está en la página 1de 23

ESTADISTICA DESCRIPTIVA

MOMENTO 3

PRESENTADO POR:

MIRIAM EVELIA ROSERO CÓD: 36.752.129

BENJAMIN ACOSTA CÓD: 15816693

JESSICA ALEJANDRA CAMELO CÓD: 1.030.606.085

YENY LORENA PAZ CÓD:

GRUPO: 100105_142

TUTOR:

HECTOR IVAN BLANCO

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

ESCUELA DE CIENCIAS ADMINISTRATIVAS, CONTABLES, ECONÓMICAS Y DE


NEGOCIOS – ECACEN

MAYO- 2016.
INTRODUCCIÓN.

Por medio del siguiente trabajo se lleva a cabo la aplicación de conocimientos referentes a la
regresión y determinación mediante la realización de ejercicios empleando las medidas de
regresión y correlación lineal simple y múltiple con variables cuantitativas que tienen que ver
con el caso estudiado a cerca de los accidentes de tránsito en la ciudad de Medellín.
JUSTIFICACIÓN.

En el presente informe se compararon datos cuantitativos para determinar su correlación y de ésta


manera analizarla, partiendo de una realidad que conocemos y entendemos se podrán formular
propuestas encaminadas a la transformación de una realidad.

Mediante un proceso gradual de clasificación, organización y tabulación de datos hemos analizado


variables cualitativas y cuantitativas, lo que nos permite en éste momento elaborar un laboratorio
apoyados en el análisis y fórmulas del programa Microsoft Excel.

Además de todo esto el trabajo permite distintas perspectivas que complementan la entrega final,
adquiriendo nuevas experiencias a través de la ejercitación de nuestras habilidades
interpretativas y argumentativas que se reúnen en torno a un tema común en donde prevalece la
objetividad; todo esto a través del trabajo colaborativo en donde asumiendo distintos roles
potencializamos nuestras capacidades y aportamos desde nuestras experiencias y fortalezas, con
responsabilidad y compromiso.
OBJETIVOS.

GENERAL

Determinar la correlación entre dos variables cuantitativas a través de un laboratorio de regresión

y correlación lineal

ESPECÍFICOS

 Analizar datos agrupados para encontrar su relación

 Participar en la consolidación de un trabajo grupal que evidencie los aprendizajes

adquiridos

 Determinar la relación existente entre dos variables cuantitativas a través de las

herramientas Infostat y Excel


LABORATORIO DE REGRESIÓN Y CORRELACIÓN LINEAL.

1-El rendimiento del producto de un proceso químico está relacionado con la temperatura de
operación del proceso. Se desea establecer la relación que existe entre la pureza (y) del oxígeno
producido y el porcentaje de hidrocarburo (x) que está presente en el condensador principal en
un proceso de destilación, de acuerdo con los siguientes datos:

X
(% de Y
Hidrocarburos) (Pureza)
0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.


RENDIMIENTO DEL PRODUCTO DE UN PROCESO QUIMICO
102
y = 14,947x + 74,283
100 R² = 0,8774
98

96
PUREZA

94

92

90

88

86
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8
% DE HIDROCARBURO

Posee tendencia positiva y relación directa entre el % de hidrocarburo y la


pureza puesto que a medida que él % aumenta la pureza también aumenta es
decir que la pureza si depende del % de hidrocarburo. La ecuación matemática
es confiable en un 87,74%.

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra.
Es confiable?

y = 14,947x + 74,283 R² = 0,8774

R²= coeficiente de determinación = 87,74% por lo tanto es confiable

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.

R= coeficiente de correlación
R= raíz cuadrada de 0,8774 R= 0,93% La correlación es excelente

d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3?


y= pureza.

x= hidrocarburo?.

y= 91,3

91,3= 14,947x+74,283

91,3-74,283=14,947x

17,02/14,947=x

x= 1,13

Cuando el oxígeno es igual a 91,3 el porcentaje del hidrocarburo será 1,13%.

2- El número de libras de vapor (y) consumidas mensualmente por una planta química, se
relaciona con la temperatura ambiental promedio (en o F). Para el año 2014, se registraron los
siguientes valores de temperatura y consumo anual.

x Temperatura y Consumo de
Mes
(°F) vapor (Lb)
Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.
CONSUMO MENSUAL DE VAPOR POR UNA PLANTA
QUIMICA
800
y = 9.2087x - 6.3184
CONSUMO DE VAPOR (LB)

700
R² = 0.9999
600
500
400
300
200
100
0
0 10 20 30 40 50 60 70 80
TEMPERATURA °F

Tendencia positiva, existe una relación directa entre la temperatura y el consumo


de vapor, por lo tanto el número de libras de vapor consumidas mensualmente
por una planta química si se relaciona con la temperatura la cual está
representada en °F, su correlación es excelente con un 0,99%, la R² = 99,99 lo
que significa que posee un alto grado de confiabilidad.

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. Es confiable?

y = 9,2087x - 6,3184 R² = 0,9999

R²= coeficiente de determinación= 99,99 % lo cual es confiable.


c.
Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.

R= coeficiente de correlación
R= raíz cuadrada de 0,9999%

R= 0,99% La correlación es excelente


d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 °F?

y= consumo de vapor?
x= temperatura en °F

x= 70 °F
y= 9,2087(70) + 6,3184
y= 644,609 + 6,3184
y= 650,9.

Cuando la temperatura es igual a 70 °F el consumo de vapor será 650,9%

3-Los investigadores están estudiando la correlación entre la obesidad y la respuesta individual al


dolor. La obesidad se mide como porcentaje sobre el peso ideal (x). La respuesta al dolor se mide
utilizando el umbral de reflejo de reflexión nociceptiva (y) que es una medida de sensación de
punzada. Obsérvese que ambas, X e Y, son variables aleatorias.

x (porcentaje y (umbral de reflejo


de sobrepeso) de flexión
nociceptiva)

89 2
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14
a- Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

O BE S I DAD Y RE S P UE S TA I NDI V I DUAL AL


DO LO R
UMBRAL DE REFLEJO DE

16
14
REFELXIÓN

12 y = -0,0629x + 11,642
R² = 0,1115
10
8
6
4
2
0
0 20 40 60 80 100
% DE SOBREPESO

Tendencia negativa, existe una relación inversa entre % de sobrepeso y el umbral de


reflejo de flexión a medida que aumenta el % de sobrepeso, disminuye el Umbral de
reflejo de flexión, la correlación entre las dos variables es mínima con un 0,33%, también
es posible afirmar que este modelo no es recomendable puesto que posee un grado de
confiabilidad muy bajo por tener un R²= 11,15%.

b- Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra.
Es confiable?

y = -0,0629x + 11,642

R² = 0,1115

R²= coeficiente de determinación = 11,15 % por lo tanto no es confiable

c-Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.

R=coeficiente de correlación

R= raíz cuadrada de 0,1115

R= 0,33% La correlación es mínima


d-¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje de sobrepeso,
de 40?

y= umbral de reflejo de flexión nociceptiva?


x= porcentaje de sobrepeso

X= 40 % Sobrepeso
y= (-0,0629) (40)+ 11,642
y= -2,516 + 11,642
y= 9.126

Cuando el porcentaje de sobrepeso es de 40%, el umbral de


reflejo de flexión nociceptiva es de 9,126.

REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE

Identificar dos variables cuantitativas de la situación estudiada que puedan estar


relacionadas.

NUMERO DE HERIDOS DEPENDIENTE Y


VELOCIDAD INDEPENDIENTE X

VELOCIDAD NUMERO
(X) DE
HERIDOS
(Y)
66 3
111 2
66 1
80 2
75 8
66 0
45 0
88 4
55 2
70 6
105 4
88 1
69 2
48 0
70 2
83 2
138 3
68 4
77 2
81 5
50 2
88 4
71 2
55 0
78 2
80 1
68 1
74 3
75 4
83 9
65 0
60 3
83 15
95 2
86 2
68 0
55 1
88 0
63 2
70 0
78 4
83 2
138 3
55 0
66 2
108 4
69 1
72 5
74 3
69 6
79 11
65 2
74 3
77 2
51 1
75 4
72 2
77 6
67 4
55 4
40 2
73 3
69 2
70 0
75 1
55 4
69 1
50 3
73 2
38 0
60 3
50 0
100 4
75 2
80 6
95 4
70 1
66 1
69 1
67 4
83 1
70 2
150 2
55 0
66 1
68 6
79 3
79 2
60 0
33 0
85 2
80 4
81 18
62 9
79 2
76 2
80 2
70 1
80 3
83 2
68 2
79 1
79 2
80 8
75 0
66 0
45 2
77 3
81 4
50 2
88 5
71 2
55 4
78 2
67 2
55 3
40 2
73 0
69 1
70 4

Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación entre


las variables.

INDICES ACCIDENTALIDAD EN MEDELLIN


20
18 y = 0,033x + 0,3492
NUMERO DE HERIDOS

16 R² = 0,0453
14
12
10
8
6
4
2
0
0 20 40 60 80 100 120 140 160
VELOCIDAD
Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra.
Es confiable?

y= 0,033x + 0,3492 R² = 0,0453

R² = coeficiente de determinación= 4,53 % por lo tanto no es confiable.

Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.

R= Coeficiente de correlación
R= Raíz cuadrada de 0,0453

R= 0,21 % No hay correlación

Relacionar la información obtenida con el problema.

En el caso estudiado referente a la accidentabilidad en la Ciudad de Medellín el grado de


confiabilidad entre las variables Velocidad y Número de heridos es de 4,53%, lo cual significa que
no es confiable, no existe correlación entre ellas ya que su coeficiente corresponde a 0,21%, por
lo tanto el número de heridos no depende de la velocidad de los conductores.

REGRESIÓN Y CORRELACIÓN LINEAL MÚLTIPLE

Identificar una variable cuantitativa dependiente y varias variables independientes del estudio de
investigación.

y x1 x2
NUMERO VELOCIDAD GRADOS DE
DE ALCOHOL
MUERTOS DEL
CONDUCTOR
0 66 1,2
1 111 3,0
1 66 0,0
0 80 0,6
0 75 0,0
2 66 0,0
1 45 3,0
2 88 1,4
0 55 2,1
1 70 0,0
0 105 1,6
3 88 2,2
1 69 3,0
2 48 1,1
1 70 2,4
0 83 0,6
0 138 1,6
1 68 0,0
1 77 0,0
1 81 2,1
0 50 1,4
2 88 2,6
1 71 3,0
3 55 2,7
1 78 0,6
0 80 0,0
1 68 2,9
0 74 0,6
1 75 1,8
2 83 0,0
2 65 1,1
2 60 2,4
1 83 0,6
0 95 0,0
0 86 2,9
2 68 1,3
1 55 1,4
4 88 2,1
0 63 0,8
2 70 0,0
0 78 1,2
2 83 3,0
2 138 0,0
1 55 0,6
0 66 1,9
1 108 2,7
0 69 1,1
1 72 2,4
0 74 0,6
0 69 1,6
1 79 0,0
1 65 1,4
0 74 2,1
1 77 0,8
1 51 1,1
0 75 2,4
0 72 0,0
1 77 1,6
0 67 1,2
1 55 3,0
0 40 2,7
1 73 0,6
0 69 0,0
2 70 3,0
1 75 1,1
1 55 2,4
1 69 0,0
0 50 1,6
0 73 0,0
1 38 0,8
0 60 0,3
2 50 1,1
1 100 2,4
1 75 0,6
0 80 0,0
0 95 1,2
2 70 3,0
0 66 2,7
1 69 0,6
0 67 1,9
1 83 1,1
0 70 0,0
0 150 0,6
2 55 1,6
3 66 2,1
1 68 0,8
0 79 0,5
0 79 2,7
1 60 1,1
2 33 2,4
0 85 0,6
1 80 1,6
2 81 1,4
0 62 2,1
1 79 0,0
2 76 3,0
0 80 0,0
1 70 0,6
0 80 1,9
0 83 1,4
1 68 0,0
1 79 2,7
0 79 0,6
0 80 1,9
2 75 2,5
1 66 3,0
0 45 0,6
0 77 0,0
1 81 2,7
1 50 1,3
1 88 2,1
0 71 0,0
2 55 2,6
1 78 3,0
0 67 2,7
1 55 0,6
0 40 1,9
2 73 3,0
1 69 1,1
1 70 2,4

Realizar el diagrama de dispersión de dichas variables.


RELACIÓN: NUMERO DE MUERTOS Vs
VELOCIDAD
4.5
4
NUEMRO DE MUERTOS

3.5
3
2.5
2
1.5
1
0.5
0
0 20 40 60 80 100 120 140 160
VELOCIDAD

RELACION: NUEMERO DE MUERTOS VS GRADOS DE


ALCOHOL
4.5
NUMERO DE MUERTOS

4
3.5
3
2.5
2
1.5
1
0.5
0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5
GRADOS DE ALCOHOL
Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,264226981
Coeficiente de determinación R^2 0,069815897
R^2 ajustado 0,053915314
Error típico 0,82971621
Observaciones 120

ANÁLISIS DE
VARIANZA
Grados Promedio de
de Suma de los Valor crítico
libertad cuadrados cuadrados F de F
Regresión 2 6,045474917 3,022737458 4,39077596 0,014497109
Residuos 117 80,54619175 0,688428989
Total 119 86,59166667

Coeficie Error Estadísti Probabil Inferior Superior Inferior Superior


ntes típico co t idad 95% 95% 95,0% 95,0%
Intercep 0,69339 0,34775 1,99391 0,048487 0,00468 1,38211 0,00468 1,38211
ción 6471 6788 2107 59 2397 0544 2397 0544
- - - -
Variable 0,00187 0,00432 0,43274 0,665999 0,01043 0,00669 0,01043 0,00669
X1 0908 3386 1376 3 3148 1332 3148 1332
Variable 0,21383 0,07404 2,88774 0,004623 0,06718 0,36048 0,06718 0,36048
X2 7562 9969 6795 41 5483 9641 5483 9641

y= 0,69339+ (-0,00187x1)+0,21383x2

y= 0,69339-0,00187x1+0,21383x2
Calcular la recta de regresión y el coeficiente de correlación para probar estadísticamente su
relación.

R^2=0,0698*100
R^2=6,98% El modelo matemático es confiable en un 6,98%
R=0,26 No hay correlación entre las variables

Relacionar la información obtenida con el problema.

Los resultados estadísticos obtenidos indican que no hay relación entre las variables: número de
muertos, grados de alcohol y velocidad, esto lo podemos identificar mediante el modelo
matemático de regresión múltiple, y= 0,69339-0,00187x1+0,21383x2, a lo cual solo podemos
obtener un 6,98% de confiabilidad, teniendo en cuenta que el intervalo de correlación es
invalida o no hay correlación alguna. Por consiguiente e claro decir que los muertos dentro de la
accidentalidad en la ciudad de Medellín no dependieron de los grados de alcohol ni la velocidad.
CONCLUSION

Se puede concluir que se desarrolló con claridad todo el trabajo y se cumplieron cada uno de
los lineamientos expuestos por la universidad nacional abierta y a distancia UNAD,
entendiendo cada uno de los procesos para llevar a cabo un desarrollo de una determina da
investigación.
REFERENCIAS BIBLIOGRÁFICAS

 Estadística descriptiva. Campus virtual UNAD

http://campus03.unad.edu.co/ecbti04/mod/forum/view.php?id=3900

 Ortegón Pava, Milton Fernando. Análisis de las medidas univariantes

https://www.youtube.com/watch?v=Ktk263q-W-4

 Jeanete Buitrago, Cecilia Cárdenas. Fundamentos de estadística. Universidad Santo

Tomás, 2013

También podría gustarte