Está en la página 1de 20

ESTADISTICA DESCRIPTIVA

MOMENTO 3

PRESENTADO POR:

YENITH PARRA ALVAREZ

CODIGO: 30508899

GRUPO: 63

TUTOR:

OTTO EDGARDO OBANDO

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

ESCUELA DE CIENCIAS ADMINISTRATIVAS, CONTABLES, ECONÓMICAS Y DE


NEGOCIOS – ECACEN

JUNIO- 2016.
INTRODUCCIÓN.

Por medio del siguiente trabajo se lleva a cabo la aplicación de conocimientos referentes a la
regresión y determinación mediante la realización de ejercicios empleando las medidas de
regresión y correlación lineal simple y múltiple con variables cuantitativas que tienen que ver
con el caso estudiado a cerca de los accidentes de tránsito en la ciudad de Medellín.
JUSTIFICACIÓN.

En el presente informe se compararon datos cuantitativos para determinar su correlación y de


ésta manera analizarla, partiendo de una realidad que conocemos y entendemos se podrán
formular propuestas encaminadas a la transformación de una realidad.

Mediante un proceso gradual de clasificación, organización y tabulación de datos hemos


analizado variables cualitativas y cuantitativas, lo que nos permite en éste momento elaborar un
laboratorio apoyados en el análisis y fórmulas del programa Microsoft Excel.

Además de todo esto el trabajo permite distintas perspectivas que complementan la entrega final,
adquiriendo nuevas experiencias a través de la ejercitación de nuestras habilidades
interpretativas y argumentativas que se reúnen en torno a un tema común en donde prevalece la
objetividad; todo esto a través del trabajo colaborativo en donde asumiendo distintos roles
potencializamos nuestras capacidades y aportamos desde nuestras experiencias y fortalezas, con
responsabilidad y compromiso.
OBJETIVOS.

GENERAL

Determinar la correlación entre dos variables cuantitativas a través de un laboratorio de regresión

y correlación lineal

ESPECÍFICOS

 Analizar datos agrupados para encontrar su relación

 Participar en la consolidación de un trabajo grupal que evidencie los aprendizajes

adquiridos

 Determinar la relación existente entre dos variables cuantitativas a través de las

herramientas Infostat y Excel


LABORATORIO DE REGRESIÓN Y CORRELACIÓN LINEAL.

1-El rendimiento del producto de un proceso químico está relacionado con la temperatura de
operación del proceso. Se desea establecer la relación que existe entre la pureza (y) del oxígeno
producido y el porcentaje de hidrocarburo (x) que está presente en el condensador principal en
un proceso de destilación, de acuerdo con los siguientes datos:

X Y
(% de 0,99 (Pureza) 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54 a. Realice el diagrama de dispersión y determine
1,11 89,85 el tipo de asociación entre las variables.
1,2 90,39
1,26 93,25
1,32 93,41
Posee tendencia
1,43 positiva y relación directa entre el % de hidrocarburo y la pureza
94,98
puesto que 0,95 87,33 la pureza también aumenta es decir que la
a medida que él % aumenta
pureza si depende del % de hidrocarburo. La ecuación matemática es confiable en
un 87,74%.

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. ¿Es confiable?

y=14,947 x +74,283 R ²=0,8774


R²= coeficiente de determinación = 87,74% por lo tanto es confiable
c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos
variables.

R= coeficiente de correlación
R= raíz cuadrada de 0,8774 R= 0,93% La correlación es excelente

d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3?

y= pureza.

x= hidrocarburo?

y=91,3

91,3=14,947 x +74,283

91,3−74,283=14,947 x

17,02/ 14,947=x

x= 1,13

Cuando el oxígeno es igual a 91,3 el porcentaje del hidrocarburo será 1,13%.

2- El número de libras de vapor (y) consumidas mensualmente por una planta química, se
relaciona con la temperatura ambiental promedio (en o F). Para el año 2014, se registraron los
siguientes valores de temperatura y consumo anual.

Mes x Temperatura y Consumo de


Ene. (°F)
21 vapor (Lb)
185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

CONSUMO MENSUAL DE VAPOR POR UNA PLANTA QUIMICA


800
CONSUMO DE VAPOR (LB)

700
600 f(x) = 9.21x - 6.32
R² = 1
500
400
300
200
100
0
10 20 30 40 50 60 70 80

TEMPERATURA °F

Tendencia positiva, existe una relación directa entre la temperatura y el consumo de


vapor, por lo tanto el número de libras de vapor consumidas mensualmente por una
planta química si se relaciona con la temperatura la cual está representada en °F,
su correlación es excelente con un 0,99%, la R² = 99,99 lo que significa que posee
un alto grado de confiabilidad.

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. Es confiable?

y=9,2087 x−6,3184 R ²=0,9999

R²= coeficiente de determinación= 99,99 % lo cual es confiable.

c.
Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.

R= coeficiente de correlación
R= raíz cuadrada de 0,9999%

R= 0,99% La correlación es excelente


d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 °F?

y= consumo de vapor?
x= temperatura en °F

x=70 ° F
y=9,2087 (70)+ 6,3184
y=644,609+6,3184
y=650,9.

Cuando la temperatura es igual a 70 °F el consumo de vapor será 650,9%

3-Los investigadores están estudiando la correlación entre la obesidad y la respuesta individual


al dolor. La obesidad se mide como porcentaje sobre el peso ideal (x). La respuesta al dolor se
mide utilizando el umbral de reflejo de reflexión nociceptiva (y) que es una medida de sensación
de punzada. Obsérvese que ambas, X e Y, son variables aleatorias.

x (porcentaje y (umbral de reflejo


de sobrepeso) de flexión
89 nociceptiva)
2
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14
UMBRAL DE REFLEJO DE REFELXIÓN o b e s id a d y re s p u e s ta in d iv id u a l a l d o lo r
16
14
12
10 f(x) = - 0.06x + 11.64
R² = 0.11
8
6
4
2
0
10 20 30 40 50 60 70 80 90 100
% DE SOBREPESO
a- Realice el
diagrama de dispersión y determine el tipo de asociación entre las variables.

b- Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra.
Es confiable?

y = -0,0629x + 11,642

R² = 0,1115
Tendencia negativa, existe una relación inversa entre % de sobrepeso y el umbral de reflejo
R²= coeficiente de determinación = 11,15 % por lo tanto no es confiable
de flexión a medida que aumenta el % de sobrepeso, disminuye el Umbral de reflejo de
flexión, la correlación
c-Determine entre
el porcentaje de las dos variables
explicación es mínima
del modelo y elcon un de
grado 0,33%, también
relación de lasesdos
posible
afirmar que este modelo no es recomendable puesto que posee un grado de confiabilidad
variables.
muy bajo por tener un R²= 11,15%.
R=coeficiente de correlación

R= raíz cuadrada de 0,1115

R= 0,33% La correlación es mínima


VEL NU
OCI
66 M 3
111 2
66 1
80 2
75 8
66 0
45 0
88 4
55 2 d-¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje
70 6
105 4 de sobrepeso, de 40?
88 1
69 2
48 0 y= umbral de reflejo de flexión nociceptiva?
70 2 x= porcentaje de sobrepeso
83 2
138 3 X= 40 % Sobrepeso
68 4 y= (-0,0629) (40)+ 11,642
77 2 y= -2,516 + 11,642
81 5 y= 9.126
50 2
88
Cuando 4 el porcentaje de sobrepeso es de 40%, el umbral de
71 2
reflejo de flexión nociceptiva es de 9,126.
55 0
78 2
80 1 REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE
68 1
74 3
Identificar dos variables cuantitativas de la situación estudiada que puedan estar
75 4
83 9 relacionadas.
65 0
60
NUMERO 3 DE HERIDOS DEPENDIENTE Y
83 15
VELOCIDAD INDEPENDIENTE X
95 2
86 2
68 0
55 1
88 0
63 2
70 0
78 4
83 2
138 3
55 0
66 2
108 4
69 1
72 5
74 3
69 6
79 11
65 2
74 3
77 2
INDICES ACCIDENTALIDAD EN MEDELLIN
20
18
NUMERO DE HERIDOS

16
14
12
10
8
6
4
2
0
20 40 60 80 100 120 140 160

VELOCIDAD
Realizar el
diagrama de dispersión de dichas variables y determinar el tipo de asociación entre las
variables.

Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra.
Es confiable?

y= 0,033x + 0,3492 R² = 0,0453

R² = coeficiente de determinación= 4,53 % por lo tanto no es confiable.

Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables.

R= Coeficiente de correlación
R= Raíz cuadrada de 0,0453

R= 0,21 % No hay correlación

Relacionar la información obtenida con el problema.

En el caso estudiado referente a la accidentabilidad en la Ciudad de Medellín el grado de


confiabilidad entre las variables Velocidad y Número de heridos es de 4,53%, lo cual significa
que no es confiable, no existe correlación entre ellas ya que su coeficiente corresponde a 0,21%,
por lo tanto el número de heridos no depende de la velocidad de los conductores.

REGRESIÓN Y CORRELACIÓN LINEAL MÚLTIPLE

Identificar una variable cuantitativa dependiente y varias variables independientes del estudio de
investigación.

y x1 x2
NUMERO VELOCID GRADOS
DE
0 AD
66 DE
1,2
1 111 3,0
1 66 0,0
0 80 0,6
0 75 0,0
2 66 0,0
1 45 3,0
2 88 1,4
0 55 2,1
1 70 0,0
0 105 1,6
3 88 2,2
1 69 3,0
2 48 1,1
1 70 2,4
0 83 0,6
0 138 1,6
1 68 0,0
1 77 0,0
1 81 2,1
0 50 1,4
2 88 2,6
1 71 3,0
3 55 2,7
1 78 0,6
0 80 0,0
1 68 2,9
0 74 0,6
1 75 1,8
2 83 0,0
2 65 1,1
2 60 2,4
1 83 0,6
0 95 0,0
0 86 2,9
2 68 1,3
1 55 1,4
4 88 2,1
0 63 0,8
2 70 0,0
0 78 1,2
2 83 3,0
2 138 0,0
1 55 0,6
0 66 1,9
1 108 2,7
0 69 1,1
1 72 2,4
0 74 0,6
0 69 1,6
1 79 0,0
1 65 1,4
0 74 2,1
1 77 0,8
1 51 1,1
0 75 2,4
0 72 0,0
1 77 1,6
0 67 1,2
1 55 3,0
0 40 2,7
1 73 0,6
0 69 0,0
2 70 3,0
1 75 1,1
1 55 2,4
1 69 0,0
0 50 1,6
0 73 0,0
1 38 0,8
0 60 0,3
2 50 1,1
1 100 2,4
1 75 0,6
0 80 0,0
0 95 1,2
2 70 3,0
0 66 2,7
1 69 0,6
0 67 1,9
1 83 1,1
0 70 0,0
0 150 0,6
2 55 1,6
3 66 2,1
1 68 0,8
0 79 0,5
0 79 2,7
1 60 1,1
2 33 2,4
0 85 0,6
1 80 1,6
2 81 1,4
0 62 2,1
1 79 0,0
2 76 3,0
0 80 0,0
1 70 0,6
0 80 1,9
0 83 1,4
1 68 0,0
1 79 2,7
0 79 0,6
0 80 1,9
2 75 2,5
1 66 3,0
0 45 0,6
0 77 0,0
1 81 2,7
1 50 1,3
1 88 2,1
0 71 0,0
2 55 2,6
1 78 3,0
0 67 2,7
1 55 0,6
0 40 1,9
2 73 3,0
1 69 1,1
1 70 2,4

Realizar el diagrama de dispersión de dichas variables.

RELACIÓN: NUMERO DE MUERTOS Vs VELOCIDAD


4.5
4
3.5
NUEMRO DE MUERTOS

3
2.5
2
1.5
1
0.5
0
20 40 60 80 100 120 140 160
VELOCIDAD
RELACION: NUEMERO DE MUERTOS VS GRADOS DE ALCOHOL
4.5
4
NUMERO DE MUERTOS

3.5
3
2.5
2
1.5
1
0.5
0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5

GRADOS DE ALCOHOL

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,264226981
Coeficiente de determinación R^2 0,069815897
R^2 ajustado 0,053915314
Error típico 0,82971621
Observaciones 120

ANÁLISIS DE
VARIANZA
Grados Promedio de
de Suma de los Valor crítico
libertad cuadrados cuadrados F de F
Regresión 2 6,045474917 3,022737458 4,39077596 0,014497109
Residuos 117 80,54619175 0,688428989
Total 119 86,59166667
Coeficie Error Estadísti Probabil Inferior Superior Inferior Superior
ntes típico co t idad 95% 95% 95,0% 95,0%
Intercep 0,69339 0,34775 1,99391 0,048487 0,00468 1,38211 0,00468 1,38211
ción 6471 6788 2107 59 2397 0544 2397 0544
- - - -
Variable 0,00187 0,00432 0,43274 0,665999 0,01043 0,00669 0,01043 0,00669
X1 0908 3386 1376 3 3148 1332 3148 1332
Variable 0,21383 0,07404 2,88774 0,004623 0,06718 0,36048 0,06718 0,36048
X2 7562 9969 6795 41 5483 9641 5483 9641

y= 0,69339+ (-0,00187x1)+0,21383x2

y= 0,69339-0,00187x1+0,21383x2

Calcular la recta de regresión y el coeficiente de correlación para probar estadísticamente su


relación.

R^2=0,0698*100
R^2=6,98% El modelo matemático es confiable en un 6,98%
R=0,26 No hay correlación entre las variables

Relacionar la información obtenida con el problema.

Los resultados estadísticos obtenidos indican que no hay relación entre las variables: número de
muertos, grados de alcohol y velocidad, esto lo podemos identificar mediante el modelo
matemático de regresión múltiple, y= 0,69339-0,00187x1+0,21383x2, a lo cual solo podemos
obtener un 6,98% de confiabilidad, teniendo en cuenta que el intervalo de correlación es
invalida o no hay correlación alguna. Por consiguiente e claro decir que los muertos dentro de la
accidentalidad en la ciudad de Medellín no dependieron de los grados de alcohol ni la velocidad.
CONCLUSION

Se puede concluir que se desarrolló con claridad todo el trabajo y se cumplieron cada uno de
los lineamientos expuestos por la universidad nacional abierta y a distancia UNAD,
entendiendo cada uno de los procesos para llevar a cabo un desarrollo de una determina da
investigación.
REFERENCIAS BIBLIOGRÁFICAS

 Estadística descriptiva. Campus virtual UNAD

http://campus03.unad.edu.co/ecbti04/mod/forum/view.php?id=3900

 Ortegón Pava, Milton Fernando. Análisis de las medidas univariantes

https://www.youtube.com/watch?v=Ktk263q-W-4

 Jeanete Buitrago, Cecilia Cárdenas. Fundamentos de estadística. Universidad Santo

Tomás, 2013

También podría gustarte