Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
Agenda
• Definición de Regresión
• Función Aproximante
• Modelos de Regresión
• Análisis de Correlación
– Método de mínimos Cuadrados
• Precisión del modelo de regresión
• Regresión Lineal Simple
2
Definición de Análisis de Regresión
• Es el procedimiento de encontrar la mejor
relación entre variables a partir de una serie
de datos
datos
observados
3
Análisis de Regresión: UTILIDAD
4
Comportamiento Modelado
Dispersión de datos
Pendiente (a)
Intersección
Proyección
b
Datos
Históricos
x
Periodo de Observación Periodo Pronosticado
5
Análisis de Regresión
• Objetivo de la regresión
– Intentar reconocer a partir de un conjunto de
datos observados (xi, yi) si hay (1) relación entre
las variables, de (2) qué tipo, y si es (3) posible
predecir el valor de una de ellas en función de la
otra
6
Diagrama de Dispersión
• El conjunto de observaciones pueden ser
representadas en un diagrama de dispersión
(scatter plot).
7
Diagrama de Dispersión
• En los diagrama de dispersión, cada variables
observadas es representada por una
coordenada
8
Aproximación
• Buscamos una función que sea una buena
aproximación a una nube de puntos (xi,yi),
mediante una curva de algún tipo conocida
Y=f(X)
o Función aproximante o curva aproximante
9
Aproximación
Observación
(xi, yi)
valor
pronosticado o
ajustado
10
Aproximación
11
Tipos de modelos de Regresión
Regresión
Regresión Regresión
lineal no lineal
Regresión Regresión
simple múltiple
12
Tipos de modelos de Regresión
Ŷ=b+aX
Pendiente
b = Ŷ- a X
a
Regresión Regresión
lineal no lineal
13
Ejemplos: RN-L Creciente
Modelo no Lineal
Buen ajuste
Cuando x crece,
y crece
14
Ejemplos: RN-L Decreciente
Modelo no Lineal
Buen ajuste
Cuando x crece,
y decrece
15
Tipos de modelos de Regresión
Regresión
Regresión Regresión
lineal no lineal
Regresión Regresión
simple múltiple
16
Regresión simple Regresión múltiple
18
Ejemplos: Relación directa
Modelo
Lineal Para los valores de
X mayores que la
media le
corresponden
valores de Y
mayores también
Cuando x crece,
y crece
19
Ejemplos: Relación inversa
Modelo
Lineal Para los valores de
X mayores que la
media le
corresponden
valores de Y
menores
Cuando x crece,
y decrece
20
Ejemplos
− Variables no relacionadas
− Ninguna curva de regresión es adecuada
Para valores de X
por encima de la
media tenemos
valores de Y por
encima y por
debajo en
proporciones
similares
no-correlación 21
ANÁLISIS DE REGRESIÓN
22
Análisis de Regresion
• Podemos hacer un ajuste visual
– trazando una curva aproximante que representa
los datos observados
− las constantes del
modelo matemático
se obtienen del
mismo gráfico
23
Análisis de Regresión
• Podemos utilizar el método de mínimos cuadrados
– Coeficientes de regresión del modelo matemático
Coeficientes de Regresión
• b : ordenada en el origen,
constante 𝐲𝐲�ii= f(x)
• a : pendiente de la recta Aproximación
(xi, 𝐲𝐲� i) 24
25
valor
pronosticado o
ajustado Modelo
𝐲𝐲�i= f(x) Estimado de la
Recta
Ŷ=b+aX
Pendiente
a
b = Ŷ- a X
Coeficientes de Regresión
a : pendiente de la recta b : ordenada en el origen, constante
26
valor
pronosticado o
ajustado
𝐲𝐲�i= f(x)
Ŷ=b+aX
Pendiente
a
b = Ŷ- a X
MÉTODO DE ESTIMACIÓN
27
Mínimos Cuadrados: Regresión Lineal 28
Valor Observado
o Efectivo Yo
𝑒𝑒 = 𝑌𝑌 𝑜𝑜 − 𝑌𝑌�
Ŷ Residuo
(error en el ajuste)
Valor estimado
Xi
Encontrar los coeficientes de regresión, de manera que la suma de los cuadrados
de los residuos sea mínima
29
30
Mínimos Cuadrados: Regresión Lineal
32
Otros modelos de regresión
• Se pueden considerar otros tipos de modelos,
en función del aspecto que presente el
diagrama de dispersión (regresión no lineal)
33
Mínimos Cuadrados: Regresión no
Lineal
Y = a0 + a 1 x + a 2 x 2
(1) Aplicando sumatorias ΣY = a0n + a1ΣX + a2 ΣX2
(2) *X y aplicando sumatorias ΣXY = a0 ΣX + a1 ΣX2 + a2 ΣX3
(3) *X2 y aplicando sumatorias ΣX2Y = a0 ΣX2+ a1 ΣX3 + a2 ΣX4
34
Mínimos Cuadrados: Regresión no
Lineal
• Ecuaciones de curvas aproximantes:
Y=a+bx
𝒀𝒀 = 𝑎𝑎 + 𝑏𝑏 𝒙𝒙 + 𝑐𝑐 𝒙𝒙2
𝒀𝒀 = 𝑎𝑎 𝒙𝒙𝑏𝑏
𝒀𝒀 = 𝑎𝑎 𝑏𝑏 𝒙𝒙
35
Transformación de Datos
LINEALIZACIÓN DE RELACIONES NO
LINEALES
36
Linealización de relaciones no lineales
1. Exponencial
y
y = α1e β1x
Ln (y) = y*
β1>0
x
y = α1e β1x
• Transformación de Datos
𝑦𝑦 ∗ = ln 𝑌𝑌 Ŷ* = b* + a X*
𝑥𝑥 ∗ = 𝑥𝑥 ∗
𝑏𝑏 = ln 𝛼𝛼1
38
Linealización de relaciones no lineales
2. Ley de Potencia
39
Linealización de relaciones no lineales
2. Ley de Potencia
• Transformación de Datos
𝑦𝑦 ∗ = Log(𝑦𝑦) Ŷ* = b* + a X*
𝑥𝑥 ∗ = 𝐿𝐿𝐿𝐿𝐿𝐿 (𝑥𝑥) ∗
𝑏𝑏 = log 𝛼𝛼2
40
Linealización de relaciones no lineales
3. Tasa de crecimiento saturada
1 𝜷𝜷𝟑𝟑 1 1
= -
𝑦𝑦 𝜶𝜶𝟑𝟑 𝑥𝑥 𝛼𝛼3
• Transformación de Datos
∗
𝑦𝑦 =
1 Ŷ* = b* + a X*
𝑦𝑦
1 ∗ 1 𝛽𝛽3
∗
𝑥𝑥 = 𝑏𝑏 = − 𝑎𝑎 =
𝑥𝑥 𝛼𝛼3 𝛼𝛼3
Linealización de relaciones no lineales 43
β1>0 x
y = α1e β1 x
y = α2x β2
y = α3
β3 + x
x x x
ln y log y 1/y
Pendiente = β3/α3
Pendiente = β1
Pendiente = β2 Intersección = 1/α3
x log x 1/x
Intersección = ln α1 Intersección = log α2
Mínimos Cuadrados: Regresión no
Lineal -MULTIVARIABLES
Z = a0 + a1X + a2Y
Aplicando sumatorias ΣZ = a0N + a1 ΣX + a2 ΣY
*X y aplicando sumatorias ΣXZ = a0 ΣX + a1 ΣX2 + a2 ΣXY
*Y y aplicando sumatorias ΣYZ = a0 ΣY+ a1 ΣXY + a2 ΣY2
46
Análisis de
Variabilidad
Datos Observados
47
48
Covarianza de dos variables X e Y
• La covarianza es la medida de dispersión conjunta de
un par de variables
• La covarianza entre dos variables, Sxy ó Cov(x,y), nos
indica si la posible relación entre dos variables es
directa o inversa
49
Covarianza de dos variables X e Y
𝑛𝑛
1
𝑆𝑆𝑥𝑥𝑥𝑥 = � 𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ 𝑦𝑦𝑖𝑖 − 𝑦𝑦�
𝒏𝒏 − 2
𝑖𝑖=1
50
Covarianza de dos variables X e Y
• Magnitud de la covarianza
– Si el valor absoluto de la covarianza es alto,
indica una estrecha relación en los dos conjuntos
de datos (xi, yi), ya sea de forma positiva o
negativa
– Si es cercano o igual a 0, significa que los
conjuntos de datos casi no tienen relación
51
Varianza
• Es una medida vinculada a la dispersión de
una variable considerada frente a su media
• Sus unidades es el cuadrado de la unidad de la
variable en estudio
• Establece la variabilidad de una variable, a
mayor valor, mayor variabilidad.
52
Varianza de una Muestra
𝑛𝑛
1 2
𝑆𝑆𝑦𝑦𝑦𝑦 = � 𝑦𝑦𝑖𝑖 − 𝑦𝑦̅
𝒏𝒏 − 2
𝑖𝑖=1
– 𝑆𝑆𝑦𝑦𝑦𝑦 : Varianza
– 𝑦𝑦𝑖𝑖 : Término del conjunto de datos
– 𝑦𝑦:
� Media de la muestra
– n: tamaño de la muestra
53
Desviación Estándar Muestral
𝑆𝑆 = 𝑆𝑆 2
𝑆𝑆 = 𝑆𝑆𝑦𝑦𝑦𝑦 − 𝒂𝒂𝑆𝑆𝑥𝑥𝑥𝑥
54
Precisión del Modelo de
Regresión
55
Coeficiente de Correlación Lineal de
Pearson
• Se denota con la letra r
• Este coeficiente indica si los puntos tienen una
tendencia a disponerse alineadamente
– Excluyendo rectas horizontales y verticales
• r es útil para determinar si hay relación lineal
entre dos variables
– No servirá para otro tipo de relaciones:
cuadrática, logarítmica, etc.
56
57
Coeficiente de Correlación Lineal de
Pearson (r)
• De su signo obtenemos el que la posible
relación sea directa o inversa ( mismo signo
que Sxy)
• Es adimensional
– Sólo toma valores en [-1,1]
– Las variables son no-correlacionadas r=0
Relación Variables no Relación Directa
Inversa perfecta correlacionadas casi perfecta
-1 0 1
58
Coeficiente de Correlación Lineal de
Pearson (r)
• De su signo obtenemos el que la posible
relación sea directa o inversa ( mismo signo
que Sxy)
• Es adimensional
– Sólo toma valores en [-1,1]
– Las variables son no-correlacionadas r=0
Relación Inversa Variables no Relación Directa
perfecta correlacionadas casi perfecta
-1 0 1
Relación Inversa Variables no Relación Directa
perfecta correlacionadas casi perfecta
-1 0 1 59
Coeficiente de Correlación Lineal de
Pearson (r)
Relación Variables no Relación Directa
Inversa perfecta correlacionadas casi perfecta
-1 0 1
60
Coeficiente de Correlación Lineal de
Pearson (r)
r= -0.5 r= -0.999
r= 0.4 r= 0.99
61
Coeficiente de Correlación Lineal de
Pearson (r)
r=
r=
r=
62
Precisión del modelo de regresión
• La precisión de un modelo de regresión se
mide usando una cantidad llamada:
– Coeficiente de Determinación ( R2)
• R2 representa la proporción de variabilidad
del modelo ajustado
• variabilidad total en las observaciones de Y
que se explica por la línea de regresión
63
Coeficiente de determinación (R2)
Variabilidad
en el eje Y La franja rosada
(sombreada)
indica la zona
donde varían los
valores de Y.
64
Coeficiente de Determinación (R2)
Errores de proyección
( eje Y)
Residuo
(error en el ajuste)
Valor estimado
Valor Observado o
Efectivo
2
2
𝑆𝑆𝑥𝑥𝑥𝑥
𝑅𝑅 =
𝑆𝑆𝑥𝑥𝑥𝑥 𝑆𝑆𝑦𝑦𝑦𝑦
65
66
Valor Pronosticado
Valor Observado
Precio (USD)
Ŷ=b+aX
67
2
𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟
𝑅𝑅 = 1 −
𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇
Cuanto menor sea la dispersión del error residual mejor será el
ajuste de regresión
69
PASOS PARA REALIZAR UNA
REGRESIÓN
70
Generar una Regresión Lineal
Pasos a seguir:
1. Realizar un diagrama de dispersión en
coordenadas rectangulares.
71
72
x y x2 x*y y2
73
Ejercicio Práctico
Ejercicio 1
• Se tienen datos experimentales que
representan la relación que existe entre el
cambio del volumen (pulg3) de un gas y la
presión (psi) del mismo
– Donde P = f(V).
• Se conoce que el comportamiento del gas ideal
sigue la forma funcional:
PVk =C 74
Práctico
PVk = C
• Datos:
75
Ejercicio Práctico
• Realizar:
1. El diagrama de dispersión en coordenadas rectangulares.
2. El diagrama de dispersión en coordenadas y escalas adecuadas,
conociendo que el comportamiento de modelo
3. Determinar gráficamente las constantes K y C, de la ecuación
aproximante.
4. Determinar mediante el método de Mínimos Cuadrados, las
constantes K y C, de la ecuación aproximante.
5. Calcular la variabilidad de los datos
6. Compare los valores de K y C obtenidos en los puntos 3 y 4
7. Presente el modelo matemático de su regresión
8. Estimar P, cuando V=100 , 150 y 200 pulg3.
9. Realizar la curva de la ecuación aproximante
10. Estimar la precisión de la regresión
76
Ejercicio Practico
1. Diagrama de dispersión en coordenadas rectangulares
77
Ejercicio Practico 78
α2
β2<0
β2>0
α2
Ejercicio Practico
2. Diagrama de dispersión en coordenadas y escalas
adecuadas, conociendo que el comportamiento de modelo
Log-Log
10
Datos Observados
1
1 10 100 1000
Volumen (in3)
80
Ejercicio Practico 81
�*
𝒀𝒀 = b + a X* 82
Ejercicio Practico 83
2.5
2
Y*=Log(P)
1.5
Gráficamente determinar la
1
pendiente y el coeficiente
de intersección en el eje y
0.5
Datos Transformados
0 • ∆x= 2.7-2 = 0.7
0 1 2 3 • ∆y=0.5-1.5= -1
X*=Log(V)
3
2.5
2
1.5
1 log(𝐶𝐶) = 4.3
0.5 Datos Transformados
0 C = 10^4.3=19952.6
0 1 2 3
X*=Log(V) Pendiente = K=-1.43
Ejercicio Practico 85
n: 6
87
= (6*17.92-12*9.11)/(6*24.22-12*12)= -1.4
=[9.11-(-1.4)*12]/6 = 4.327
a=a1 Pendiente -1.40
b=a0 Constante 4.327
Ejercicio Practico 89
Pendiente a= -1.40
Constante b= 4.327
−𝒌𝒌 = −𝟏𝟏. 𝟒𝟒
log(𝐶𝐶) = 4.327
𝐂𝐂 = 104.327 = 𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐
Ejercicio Practico 90
𝑆𝑆 = 𝑆𝑆𝑦𝑦𝑦𝑦 − 𝒂𝒂𝑆𝑆𝑥𝑥𝑥𝑥
S: 0.017
Ejercicio Practico 91
𝑆𝑆 = 𝑆𝑆𝑦𝑦𝑦𝑦 − 𝒂𝒂𝑆𝑆𝑥𝑥𝑥𝑥
S: 0.017
Ejercicio Practico 92
𝒌𝒌 = 𝟏𝟏. 𝟒𝟒
80
70
Datos Observados
𝐂𝐂 = 𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐
60 Modelo de Regresion
Presion (psi)
50
P*Vk =C 40
30
20
P*V1.4 = 𝟐𝟐𝟏𝟏𝟐𝟐𝟐𝟐𝟐𝟐 10
0
0 50 100 150 200 250
Volumen (in3)
Ejercicio Practico 93
80
P*V1.4 = 𝟐𝟐𝟏𝟏𝟐𝟐𝟐𝟐𝟐𝟐 70
Datos Observados
Modelo de Regresion
60
Presion (psi)
50
40
30
Volumen Presion 20
3
(in ) (psi)
10
100 33.0
0
150 18.7 0 50 100 150 200 250
200 12.5 Volumen (in3)
Ejercicio Practico 94
80
70
Datos Observados
Ecuación aproximante Modelo de Regresion
60
P*V1.4 = 𝟐𝟐𝟏𝟏𝟐𝟐𝟐𝟐𝟐𝟐
Presion (psi)
50
40
30
20
10
0
0 50 100 150 200 250
Volumen (in3)
Ejercicio Practico 95
= -0.999
Relación Inversa de
Variables
Ejercicio Practico 96
𝑅𝑅 2 =
𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅
=
𝑆𝑆𝑆𝑆𝑆𝑆
Sxy: -0.073
𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆
97
Ejercicio 2
• Los datos de laboratorio de un estudio reológico son
presentados en la tabla adjunta
• Conociendo que la relación esfuerzo de corte (τ, Pa) y
velocidad de deformación (ℽ, s-1) responden a la
ecuación de Ostwald de Waele
𝜏𝜏 = 𝑘𝑘𝛾𝛾 𝑚𝑚
• Emplee la técnica de mínimos cuadrados y determine
los valores del índice de consistencia ( k, s -1) y el
índice de fluidez (m, Pa/s)
98
τ : Esfuerzo γ:Tasa de
Ejercicio 2 de Corte deformación
(Pa) (1/s)
68 25000
63 21000
𝑚𝑚 58 17800
𝜏𝜏 = 𝑘𝑘𝛾𝛾 53 14900
48 12250
44 10300
• El índice de fluidez (𝑚𝑚) para 39 8500
emulsiones crudo-agua a 29 4800
menudo está en el rango 0.2-0.6; 24 3200
Indique si es el caso 19 1950
• Sí m = 1 el fluido es newtoniano 15 1250
• Sí m < 1 es pseudoplástico 11 650
• Sí m > 1 es dilatante 7.5 330
6 220
99
Práctico Kr Agua- Condensado
Sw Krw Krow
Ejercicio 3 0.5527 0.0319 0.7513
1. Determine el mejor 0.5675 0.0638 0.5477
ajuste para el 0.5822 0.0956 0.3847
siguiente conjunto de 0.5969 0.1275 0.2577
datos 0.6116 0.1594 0.1623
2. Presente la ecuación
0.6264 0.1913 0.0939
de las curvas
aproximantes 0.6411 0.2231 0.0481
3. Genere las curvas 0.6558 0.255 0.0203
aproximantes 0.6705 0.2869 0.006
0.6853 0.3188 0.0008
0.7 0.3506 0
100
101
Práctico
Ejercicio 4
1. El grafico de la función “Y” se utiliza para determinar la
Presión de burbuja (Pb). Es un método de prueba y error donde
se estiman diferentes presiones de burbuja, y el valor adecuado
de Pb permite el mejor comportamiento lineal de la función “Y”
𝑷𝑷𝒃𝒃 − 𝑷𝑷
𝒀𝒀 =
𝑷𝑷 𝑽𝑽𝒓𝒓 − 1
Donde: Función Y
3.50
Vr = Volumen relativo 3.00
2.50
Función Y 2.00
1.50
1.00
0.50
-
0 500 1000 1500 2000 2500 3000
Presión
Práctico :Ejercicio 4
Presión Volumen
1. Considerando los siguientes
datos de laboratorio (tabla (psi) Relativo
anexa), indique cual es la 2653 1.0163
mejor estimación de presión 2568 1.0279
de burbuja (Pb). 2470 1.0419
2. Considere los siguientes 2160 1.1003
valores de Pb: 2000, 2500, 1860 1.1851
2800, 3200,3600 1563 1.3134
3. Del mejor ajuste del punto 1270 1.5118
anterior indique los valores de 969 1.8765
pendiente (a) y constante de 660 2.6166
intersección en el eje (b) 440 3.856
102