Está en la página 1de 10

LABORATORIO DE REGRESIÓN Y CORRELACIÓN LINEAL

ÁREA: Escuela de Ciencias Básicas Tecnología e


ESTADÍSTICA Ingeniería

CIENCIAS BÁSICAS
CURSO: 100105_205

ESTADÍSTICA TEMA: REGRESIÓN Y CORRELACIÓN LINEALSIMPLE


DESCRIPTIVA

NUMERO DE LA PRÁCTICA 2
NOMBREDE LAPRÁCTICA Regresión y correlación
NOMBREDEL SOFTWARE Infostat - Excel
Libre: x Licenciado:

PRESENTADO POR Camilo Ernesto Pantoja Ortega


CODIGO 1085282800
CURSO
100105_205
100105_205
Aspectos Teóricos:

REGRESIÓN YCORRELACIÓN

En muchos casos se requiere conocer más que el comportamiento de una sola


variable, se requiere conocer la relación entre dos o más variables como la relación
entre producción y consumo; salarios y horas de trabajo; oferta y demanda; salarios y
productividad; la altura de un árbol y el diámetro de su tronco.

Muchos de estos comportamientos tienen una tendencia lineal, aunque hay muchos
otros que lo hacen de forma curva. Para determinar el grado de correlación entre las
variables, no basta con calcular la varianza explicada, pues existe el coeficiente de
determinación coeficiente de correlación; sin embargo, frecuentemente se utiliza un
coeficiente de correlación rectilíneo, siendo este un valor entre -1y1.

Para estas confrontaciones se utiliza el diagrama de dispersión que es plano


cartesiano en el que se marcan los puntos correspondientes a los pares (x,y) de
los valores de las variables.
El análisis de Regresión tiene los siguientes usos: el primero es obtener los
estimadores de los parámetros, estimar la varianza del error, obtener los errores
estándares de los parámetros estimados, probar la hipótesis sobre los parámetros,
cálculo de valores estimados basados en la ecuación estimada, estimar el ajuste o la
falta de ajuste del modelo.

El modelo a utilizar es Y= a+ bx, a es el intercepto, b es la pendiente de la


función, la que nos indica el cambio marginal de Y respecto a X.

EJERCICIOS:

1. El rendimiento del producto de un proceso químico está relacionado con la


temperatura de operación del proceso. Se desea establecer la relación que
existe entre la pureza (y) del oxígeno producido y el porcentaje de
hidrocarburo (x) que está presente en el condensador principal en un
proceso de destilación, de acuerdo con los siguientes datos:

X
Y
(% de Hidro
(Pureza)
carburos)
0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33
a. Realice el diagrama de dispersión y determine el tipo de asociación entre
las variables.

RELACION PUREZA- %PORCENTAJE DE HIDROCARBUROS


102

100 y = 14.947x + 74.283


R² = 0.8774
98

96
Pureza

94

92

90

88

86
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8
% de Hidrocarburos

Tipo de asociación:

De acuerdo al diagrama de dispersión tenemos que la relación entre las dos variables
estudiadas (Pureza – Porcentaje de Hidrocarburos) es directa, ya que se puede identificar
que si el porcentaje de Hidrocarburos presentes en el oxígeno es alto, así mismo el
índice de pureza será alto.

b. Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. Es confiable?

Modelo matemático:

Y=ax +b
y=14,947x+74,283

De acuerdo al coeficiente de determinación (R²) podemos determinar que este modelo


matemático si es confiable para este caso.

R² = 0,8774

c. Determine el porcentaje de explicación del modelo y el grado de relación


de las dos variables.
Para encontrar el índice de confiabilidad multiplicamos el valor obtenido en R² por 100,
obteniendo un valor de 87.74%, lo cual nos permite concluir que el modelo matemático es
muy confiable.

Para obtener el grado de relación de las dos variables (coeficiente de correlación)


encontramos la raíz cuadrada del valor de R².

R²=0,8774
R = √0,8774
r =0,9366

Para determinar cómo es la relación entre las dos variables usamos la siguiente tabla:

Como podemos observar nuestro valor esta entre -1 y 1, por lo cual el método aplicado
es correcto, y podemos decir que la relación es excelente ya que el valor esta entre 0.90
y1

d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es


igual a 51,4?

Para encontrar el porcentaje de hidrocarburo teniendo un valor para la variable


dependiente (y) reemplazamos los términos en la ecuación:

Y=ax +b

51,4= 14,947x+74,283

Despejamos el valor de X:

51,4-74,283=14,947x

-22,883=14,947x
22,883
− =𝑥
14,947

X=-1.53

De acuerdo a esto el porcentaje de hidrocarburo cuando la pureza del oxígeno es


igual a 51,4 es -1.53.
2. El número de libras de vapor (y) consumidas mensualmente por una planta
química, se relaciona con la temperatura ambiental promedio (en o F). Para el año
2015, se registraron los siguientes valores de temperatura y consumo anual.

2014 Registros de temperatura y


consumos de vapor.

Consumo de
Mes Temperatura
vapor
Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98

a. Realice el diagrama de dispersión y determine el tipo de asociación entre


las variables

Registros de temperatura y consumos de vapor


800

700 y = 9.2087x - 6.3184


R² = 0.9999
600
Consumo de vapor (Lb)

500

400

300

200

100

0
0 10 20 30 40 50 60 70 80
Temperatura (o F)
Tipo de asociación:

Al observar el diagrama de dispersión podemos concluir que la asociación entre las


variables: consumo de vapor y temperatura es directa, ya que mientras el valor la variable
independiente (temperatura) aumenta, el valor de la variable dependiente (consumo de
vapor) también aumenta.

b. Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. Es confiable?

Modelo matemático:

Y=ax +b
Y=9,2087x-6,3184

De acuerdo al coeficiente de determinación (R²) podemos decir que este modelo


matemático si es confiable por su proximidad a 1.

R² = 0,9999

c. Determine el porcentaje de explicación del modelo y el grado de relación


de las dos variables.

-Para encontrar el porcentaje de confiabilidad del modelo matemático presentado


anteriormente tomamos el valor obtenido en el coeficiente de determinación (R²) y lo
multiplicamos por 100.

R²=0,999

0,9999*100= 99,99%

Por esto podemos concluir que este modelo matemático representa la relación de las
variables de una forma casi perfecta llegando a un valor de 99,99%.

-Para encontrar el coeficiente de correlación (índice de relación entre las variables)


representado por la letra r, basta con encontrar la raíz cuadrada del valor de R².

R²=0,9999

r =√0,9999

r=0,9999
Para determinar cómo es la relación entre las dos variables usamos nuevamente la tabla:

Como podemos observar nuestro valor esta entre -1 y 1, por lo cual el método aplicado
es correcto, y podemos decir que la relación es excelente llegando casi a la correlación
perfecta con el valor de 0,9999.

3. Los investigadores están estudiando la correlación entre la obesidad y la


respuesta individual al dolor. La obesidad se mide como porcentaje sobre el
peso ideal (x). La respuesta al dolor se mide utilizando el umbral de reflejo de
reflexión nociceptiva (y) que es una medida de sensación de punzada.
Obsérvese que ambas, X e Y, son variables aleatorias

x Y
(porcentaje (umbral de
de reflejo de
sobrepeso) flexión
nociceptiva)
89 2
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.
Relacion :
Umbral de reflejo de flexion nociceptiva Obsesidad - Respuesta al dolor
16

14

12
y = -0.0629x + 11.642
10 R² = 0.1115
8

0
0 10 20 30 40 50 60 70 80 90 100
Porcentaje de sobrepeso

Tipo de asociación:

De acuerdo a la recta la asociación presente entre la variable independiente


(Porcentaje de sobrepeso) y la dependiente (Umbral de reflejo de flexión
nociceptiva) es inversa, ya que a medida que aumenta el porcentaje de sobrepeso
el umbral de reflejo disminuye, aunque el modelo presentado para la dispersión no
presenta un patrón reconocible que permita tener certeza del comportamiento de
la variable dependiente.

b. Ajuste un modelo matemático que permita predecir el efecto de una


variable sobre la otra. Es confiable?.

Modelo matemático:
Y=ax +b
y = -0,0629x + 11,642

La confiabilidad del modelo la encontramos con el coeficiente de determinación.

R² = 0,1115

Al analizar el valor del coeficiente de determinación encontramos que es un valor


muy lejano a 1 y muy cercano a 0, por esto se puede concluir que el modelo
aplicado para encontrar la relación entre las dos variables no es el apropiado.
c. Determine el porcentaje de explicación del modelo y el grado de relación de
las dos variables.

-El porcentaje de confiabilidad del modelo matemático presentado tomamos el valor del
coeficiente de determinación (R²) y lo multiplicamos por 100.

R²=0,1115

0,1115*100= 11,15%

Por esto, el modelo matemático presentado no es el más óptimo para representar la


correlación entre las dos variables.

-El coeficiente de correlación lo determinamos por la raíz cuadrado del valor del
coeficiente de determinación (R²)

R²=0,1115

r =√0,1115

r=0,3339

Para determinar cómo es la relación entre las dos variables usamos nuevamente la tabla:

EL método aplicado es el correcto ya que se obtuvo un valor entre -1 y 1, el grado de


relación entre las variables es mínimo, ya que el índice de correlación esta entre 0.30 y
0.60.

d. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un


porcentaje de sobrepeso, de 50?

Y=ax +b

Y= -0,0629x + 11,642
Reemplazamos el valor de X:

Y= -0,0629 (50) + 11,642

Y=8,497

De acuerdo a esto el umbral de reflejo de flexión nociceptiva, cuando se presenta


un porcentaje de sobrepeso de 50 es 8,497.

También podría gustarte