3.-Tema 3 - Regresion

Tema 3: Análisis de Regresión
1
Agenda
• Definición de Regresión
• Función Aproximante
• Modelos de Regresión
• Análisis de Correlación
– Método de mínimos Cuadrados
• Precisión del modelo de regresión
• Regresión Lineal Simple
2
Definición de Análisis de Regresión
• Es el procedimiento de encontrar la mejor
relación entre variables a partir de una serie
de datos
datos
observados
3
Análisis de Regresión: UTILIDAD
– Permite predecir un valor basándonos en el

conocimiento de otro
• Valor a predecir: variable dependiente,
explicativa o respuesta (y)
• Valor conocido: variable independiente o
regresora (x)
4
Comportamiento Modelado
y Ŷ=b+aX (aproximación simplificada)
Dispersión de datos
Pendiente (a)
Intersección
Proyección
b
Datos
Históricos
x
Periodo de Observación Periodo Pronosticado
5
Análisis de Regresión
• Objetivo de la regresión
– Intentar reconocer a partir de un conjunto de
datos observados (xi, yi) si hay (1) relación entre
las variables, de (2) qué tipo, y si es (3) posible
predecir el valor de una de ellas en función de la
otra
6
Diagrama de Dispersión
• El conjunto de observaciones pueden ser
representadas en un diagrama de dispersión
(scatter plot).
7
Diagrama de Dispersión
• En los diagrama de dispersión, cada variables
observadas es representada por una
coordenada
8
Aproximación
• Buscamos una función que sea una buena
aproximación a una nube de puntos (xi,yi),
mediante una curva de algún tipo conocida
Y=f(X)
o Función aproximante o curva aproximante
9
Aproximación
Observación
(xi, yi)
valor
pronosticado o
ajustado
Aproximación 𝐲𝐲�i= f(x)

(xi, 𝐲𝐲�i)
10
Aproximación
• Debemos de asegurarnos de que la diferencia

entre los valores Yi (observación) e 𝒀𝒀�𝒊𝒊
(aproximación) sea tan pequeña como sea
posible.
Yi (observación) 𝒀𝒀�𝒊𝒊 (aproximación)
11
Tipos de modelos de Regresión
Regresión
Regresión Regresión
lineal no lineal
simple múltiple
12
Ŷ=b+aX
Pendiente
b = Ŷ- a X
a
lineal no lineal
13
Ejemplos: RN-L Creciente
Modelo no Lineal
Buen ajuste
Cuando x crece,
y crece
14
Ejemplos: RN-L Decreciente
Modelo no Lineal
Buen ajuste
Cuando x crece,
y decrece
15
Regresión
lineal no lineal
simple múltiple
16
Regresión simple Regresión múltiple
Interviene una sola Interviene dos o más

variable independiente variables independientes
17
Regresión Lineal Simple
18
Ejemplos: Relación directa
Modelo
Lineal Para los valores de
X mayores que la
media le
corresponden
valores de Y
mayores también
Cuando x crece,
y crece
19
Ejemplos: Relación inversa
Modelo
Lineal Para los valores de
X mayores que la
media le
corresponden
valores de Y
menores
Cuando x crece,
y decrece
20
Ejemplos
− Variables no relacionadas
− Ninguna curva de regresión es adecuada
Para valores de X
por encima de la
media tenemos
valores de Y por
encima y por
debajo en
proporciones
similares
no-correlación 21
ANÁLISIS DE REGRESIÓN
22
Análisis de Regresion
• Podemos hacer un ajuste visual
– trazando una curva aproximante que representa
los datos observados
− las constantes del
modelo matemático
se obtienen del
mismo gráfico
23
Análisis de Regresión
• Podemos utilizar el método de mínimos cuadrados
– Coeficientes de regresión del modelo matemático
Ŷ=b+aX Valor Observado

(xi, yi)
Coeficientes de Regresión
• b : ordenada en el origen,
constante 𝐲𝐲�ii= f(x)
• a : pendiente de la recta Aproximación
(xi, 𝐲𝐲� i) 24
25
valor
pronosticado o
ajustado Modelo
𝐲𝐲�i= f(x) Estimado de la
Recta
Ŷ=b+aX
Pendiente
a
b = Ŷ- a X
Coeficientes de Regresión
a : pendiente de la recta b : ordenada en el origen, constante
26
valor
pronosticado o
ajustado
𝐲𝐲�i= f(x)
Ŷ=b+aX
Pendiente
a
b = Ŷ- a X
La recta ajustada es una estimación de la verdadera recta de regresión

Estimando la Recta Ajusta
MÉTODO DE ESTIMACIÓN
27
Mínimos Cuadrados: Regresión Lineal 28
Valor Observado
o Efectivo Yo
𝑒𝑒 = 𝑌𝑌 𝑜𝑜 − 𝑌𝑌�
Ŷ Residuo
(error en el ajuste)
Valor estimado
Xi
Encontrar los coeficientes de regresión, de manera que la suma de los cuadrados
de los residuos sea mínima
29
Mínimos Cuadrados: Regresión Lineal
• solución del sistema de ecuaciones: Coeficientes de Regresión
a : pendiente de la recta b : ordenada en el origen

Ecuación:
Y = b + ax
(1) Aplicando sumatorias ΣY = b*n + a ΣX
(2) *(x) + sumatorias ΣXY = b ΣX +a ΣX2

• Solución del sistema de ecuaciones:
30
a : pendiente de la recta b : ordenada en el origen,

31
constante
OTROS MODELOS DE REGRESIÓN
32
Otros modelos de regresión
• Se pueden considerar otros tipos de modelos,
en función del aspecto que presente el
diagrama de dispersión (regresión no lineal)
33
Mínimos Cuadrados: Regresión no
Lineal
Y = a0 + a 1 x + a 2 x 2
(1) Aplicando sumatorias ΣY = a0n + a1ΣX + a2 ΣX2
(2) *X y aplicando sumatorias ΣXY = a0 ΣX + a1 ΣX2 + a2 ΣX3
(3) *X2 y aplicando sumatorias ΣX2Y = a0 ΣX2+ a1 ΣX3 + a2 ΣX4
34
Lineal
• Ecuaciones de curvas aproximantes:
Y=a+bx
𝒀𝒀 = 𝑎𝑎 + 𝑏𝑏 𝒙𝒙 + 𝑐𝑐 𝒙𝒙2
𝒀𝒀 = 𝑎𝑎 𝒙𝒙𝑏𝑏
𝒀𝒀 = 𝑎𝑎 𝑏𝑏 𝒙𝒙
35
Transformación de Datos
LINEALIZACIÓN DE RELACIONES NO
LINEALES
36
Linealización de relaciones no lineales
1. Exponencial
y
y = α1e β1x
Ln (y) = y*
β1>0
x
𝐿𝐿𝐿𝐿 𝑦𝑦 = ln 𝛼𝛼1 + 𝛽𝛽1 x

• Empleando algunas operaciones matemáticas
37
1. Exponencial
y
y = α1e β1x
• Transformación de Datos
𝑦𝑦 ∗ = ln 𝑌𝑌 Ŷ* = b* + a X*
𝑥𝑥 ∗ = 𝑥𝑥 ∗
𝑏𝑏 = ln 𝛼𝛼1
38
2. Ley de Potencia
𝐿𝐿𝑜𝑜𝑜𝑜 𝑦𝑦 = log 𝛼𝛼2 + 𝛽𝛽2 Logx

• Empleando algunas operaciones matemáticas
39
2. Ley de Potencia
𝑦𝑦 ∗ = Log(𝑦𝑦) Ŷ* = b* + a X*
𝑥𝑥 ∗ = 𝐿𝐿𝐿𝐿𝐿𝐿 (𝑥𝑥) ∗
𝑏𝑏 = log 𝛼𝛼2
40
3. Tasa de crecimiento saturada
1 𝜷𝜷𝟑𝟑 1 1
= -
𝑦𝑦 𝜶𝜶𝟑𝟑 𝑥𝑥 𝛼𝛼3
Empleando algunas operaciones matemáticas

41
42

3. Tasa de crecimiento saturada
∗
𝑦𝑦 =
1 Ŷ* = b* + a X*
𝑦𝑦
1 ∗ 1 𝛽𝛽3
∗
𝑥𝑥 = 𝑏𝑏 = − 𝑎𝑎 =
𝑥𝑥 𝛼𝛼3 𝛼𝛼3
Linealización de relaciones no lineales 43
1. Exponencial 2. Ley de Potencia 3. Tasa de crecimiento

saturada
y y y
β1>0 x
y = α1e β1 x
y = α2x β2
y = α3
β3 + x
x x x
ln y log y 1/y
Pendiente = β3/α3
Pendiente = β1
Pendiente = β2 Intersección = 1/α3
x log x 1/x
Intersección = ln α1 Intersección = log α2
Lineal -MULTIVARIABLES
Z = a0 + a1X + a2Y
Aplicando sumatorias ΣZ = a0N + a1 ΣX + a2 ΣY
*X y aplicando sumatorias ΣXZ = a0 ΣX + a1 ΣX2 + a2 ΣXY
*Y y aplicando sumatorias ΣYZ = a0 ΣY+ a1 ΣXY + a2 ΣY2
• solución del sistema de ecuaciones:
46
Análisis de
Variabilidad
Datos Observados
47
48
Covarianza de dos variables X e Y
• La covarianza es la medida de dispersión conjunta de
un par de variables
• La covarianza entre dos variables, Sxy ó Cov(x,y), nos
indica si la posible relación entre dos variables es
directa o inversa
• El signo de la covarianza nos dice si el aspecto de la

nube de puntos es creciente o no.
49
𝑛𝑛
1
𝑆𝑆𝑥𝑥𝑥𝑥 = � 𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ 𝑦𝑦𝑖𝑖 − 𝑦𝑦�
𝒏𝒏 − 2
𝑖𝑖=1
• El signo de la covarianza nos dice si el aspecto de la

nube de puntos es creciente o decreciente
50
• Magnitud de la covarianza
– Si el valor absoluto de la covarianza es alto,
indica una estrecha relación en los dos conjuntos
de datos (xi, yi), ya sea de forma positiva o
negativa
– Si es cercano o igual a 0, significa que los
conjuntos de datos casi no tienen relación
51
Varianza
• Es una medida vinculada a la dispersión de
una variable considerada frente a su media
• Sus unidades es el cuadrado de la unidad de la
variable en estudio
• Establece la variabilidad de una variable, a
mayor valor, mayor variabilidad.
52
Varianza de una Muestra
𝑛𝑛
1 2
𝑆𝑆𝑦𝑦𝑦𝑦 = � 𝑦𝑦𝑖𝑖 − 𝑦𝑦̅
𝒏𝒏 − 2
𝑖𝑖=1
– 𝑆𝑆𝑦𝑦𝑦𝑦 : Varianza
– 𝑦𝑦𝑖𝑖 : Término del conjunto de datos
– 𝑦𝑦:
� Media de la muestra
– n: tamaño de la muestra
53
Desviación Estándar Muestral
𝑆𝑆 2 = 𝑆𝑆𝑦𝑦𝑦𝑦 − 𝑎𝑎𝑆𝑆𝑥𝑥𝑥𝑥 Ŷ=b+aX
𝑆𝑆 = 𝑆𝑆 2
𝑆𝑆 = 𝑆𝑆𝑦𝑦𝑦𝑦 − 𝒂𝒂𝑆𝑆𝑥𝑥𝑥𝑥
54
Precisión del Modelo de
Regresión
55
Coeficiente de Correlación Lineal de
Pearson
• Se denota con la letra r
• Este coeficiente indica si los puntos tienen una
tendencia a disponerse alineadamente
– Excluyendo rectas horizontales y verticales
• r es útil para determinar si hay relación lineal
entre dos variables
– No servirá para otro tipo de relaciones:
cuadrática, logarítmica, etc.
56
57
Pearson (r)
• De su signo obtenemos el que la posible
relación sea directa o inversa ( mismo signo
que Sxy)
• Es adimensional
– Sólo toma valores en [-1,1]
– Las variables son no-correlacionadas  r=0
Relación Variables no Relación Directa
Inversa perfecta correlacionadas casi perfecta
-1 0 1
58
Pearson (r)
• De su signo obtenemos el que la posible
relación sea directa o inversa ( mismo signo
que Sxy)
• Es adimensional
– Sólo toma valores en [-1,1]
– Las variables son no-correlacionadas  r=0
Relación Inversa Variables no Relación Directa
perfecta correlacionadas casi perfecta
-1 0 1
Relación Inversa Variables no Relación Directa
perfecta correlacionadas casi perfecta
-1 0 1 59
Pearson (r)
Relación Variables no Relación Directa
Inversa perfecta correlacionadas casi perfecta
-1 0 1
60
Pearson (r)
r= -0.5 r= -0.999
r= 0.4 r= 0.99
61
Pearson (r)
r=
r=
r=
62
Precisión del modelo de regresión
• La precisión de un modelo de regresión se
mide usando una cantidad llamada:
– Coeficiente de Determinación ( R2)
• R2 representa la proporción de variabilidad
del modelo ajustado
• variabilidad total en las observaciones de Y
que se explica por la línea de regresión
63
Coeficiente de determinación (R2)
Variabilidad
en el eje Y  La franja rosada
(sombreada)
indica la zona
donde varían los
valores de Y.
64
Coeficiente de Determinación (R2)
Errores de proyección
( eje Y)
Residuo
(error en el ajuste)
Valor estimado
Valor Observado o
Efectivo
2
2
𝑆𝑆𝑥𝑥𝑥𝑥
𝑅𝑅 =
𝑆𝑆𝑥𝑥𝑥𝑥 𝑆𝑆𝑦𝑦𝑦𝑦
65
66
Valor Pronosticado
Valor Observado
Ventas Error residual
Precio (USD)
Ŷ=b+aX
67

Ŷ=b+aX
2 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝑆𝑆𝑆𝑆𝑆𝑆

𝑅𝑅 = =
𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆
𝑆𝑆𝑆𝑆𝑆𝑆 = 𝑎𝑎 ∗ 𝑆𝑆𝑥𝑥𝑥𝑥 Suma de cuadrados de la regresión
𝑆𝑆𝑆𝑆𝑆𝑆 = 𝑆𝑆𝑦𝑦𝑦𝑦 − 𝑎𝑎 ∗ 𝑆𝑆𝑥𝑥𝑦𝑦 Suma de los cuadrados de los errores
𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 = 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹ó𝑛𝑛 + 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓
𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 = 𝑆𝑆𝐶𝐶𝐶𝐶 + 𝑆𝑆𝑆𝑆𝑆𝑆

2 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡−𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟
𝑅𝑅 = =
𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇
2
𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟
𝑅𝑅 = 1 −
𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇
Cuanto menor sea la dispersión del error residual mejor será el
ajuste de regresión
R2 = r2  sólo cierto para la regresión lineal simple!!!

68
Coeficiente de Determinación (R2)
• R2 es una cantidad adimensional que sólo puede
tomar valores en [0, 1]
• Para R2 cerca de 1
– Ajuste de regresión lineal bueno
– La línea de regresión puede explicar una gran porción
de la variabilidad en los valores de y
• Para R2 cerca de 0
– puede significar que el modelo de línea recta no
representa completamente la relación entre las
variables
– Ajuste lineal malo
69
PASOS PARA REALIZAR UNA
REGRESIÓN
70
Generar una Regresión Lineal
Pasos a seguir:
1. Realizar un diagrama de dispersión en
coordenadas rectangulares.
2. Inspeccionar el diagrama de dispersión y observar si los puntos se

adecuan a una línea recta, caso de ser positivo, ir al paso 3
– Si los datos no se ajustan a una línea recta, realice la transformación de los
datos y con los datos transformados continúe con el paso 3
3. Generar un modelo matemático que permita representar la distribución
de puntos
71
72

3. Generar un modelo matemático que permita representar la
distribución de puntos
– Si realizo transformación de datos, presentar el modelo en su
formato natural
Empleando la técnica de Mínimos Cuadrados
 Calcular los parámetros necesarios para el calculo (tabla)
‒ Si transformo los datos, emplee x* y y* para el análisis de regresión
 Estimar los coeficientes de regresión (a, b)
 Presentar el modelo matemático de la regresión en su formato
natural (ecuación de la curva aproximante/ ecuación de la línea
ajustada)
Datos de análisis n: no de pares ordenados
x y x2 x*y y2
∑x ∑y ∑x2 ∑(x*y) ∑y2

4. Estimar la precisión de su regresión (R2)
5. Realizar pronostico con su modelo
73
Ejercicio Práctico
Ejercicio 1
• Se tienen datos experimentales que
representan la relación que existe entre el
cambio del volumen (pulg3) de un gas y la
presión (psi) del mismo
– Donde P = f(V).
• Se conoce que el comportamiento del gas ideal
sigue la forma funcional:
PVk =C 74
Práctico
PVk = C
• Datos:
75
Ejercicio Práctico
• Realizar:
1. El diagrama de dispersión en coordenadas rectangulares.
2. El diagrama de dispersión en coordenadas y escalas adecuadas,
conociendo que el comportamiento de modelo
3. Determinar gráficamente las constantes K y C, de la ecuación
aproximante.
4. Determinar mediante el método de Mínimos Cuadrados, las
constantes K y C, de la ecuación aproximante.
5. Calcular la variabilidad de los datos
6. Compare los valores de K y C obtenidos en los puntos 3 y 4
7. Presente el modelo matemático de su regresión
8. Estimar P, cuando V=100 , 150 y 200 pulg3.
9. Realizar la curva de la ecuación aproximante
10. Estimar la precisión de la regresión
76
Ejercicio Practico
1. Diagrama de dispersión en coordenadas rectangulares
Observe que los

datos no
presentan
disposición lineal
 Realizar
Transformación
de Datos
77
Ejercicio Practico 78
2. Diagrama de dispersión en coordenadas y escalas adecuadas, conociendo que

el comportamiento de modelo
Comportamiento del Modelo

1. Diagrama de dispersión en
coordenadas rectangulares

Comportamiento del Modelo
α2
β2<0
β2>0
α2
Ejercicio Practico
2. Diagrama de dispersión en coordenadas y escalas
adecuadas, conociendo que el comportamiento de modelo
Grafico de Dispersión de los

Datos Observados Observar que es
100 necesario
transformar los
valores de “x” y “y”
o usar una hoja
Presion (psi)
Log-Log
10
Datos Observados
1
1 10 100 1000
Volumen (in3)
80

Grafico de Dispersión de los Observar que es

Datos Transformados necesario
2
transformar los
valores de “x” y
1.5 “y” o usar una
hoja Log-Log
Y*=Log(P)
0.5 X*=Log(V) Y*=Log(P)

Datos Transformados 1.79 1.84
1.84 1.75
0 1.91 1.63
0 0.5 1 1.5 2 2.5
2.00 1.50
X*=Log(V) 2.13 1.33
2.34 1.06
Ejercicio Práctico
Transformación de los Datos:
P*Vk = C
• Aplicando logaritmos:
log P + k log V = log C
• Ordenando términos:
log (P) = log (C ) - k log (V)
�*
𝒀𝒀 = b + a X* 82
3. Determinar gráficamente las constantes K y C, de la ecuación aproximante
Grafico de Dispersión de los Curva aproximante

Datos Transformados
3
2.5
2
Y*=Log(P)
1.5
Gráficamente determinar la
1
pendiente y el coeficiente
de intersección en el eje y
0.5
Datos Transformados
0 • ∆x= 2.7-2 = 0.7
0 1 2 3 • ∆y=0.5-1.5= -1
X*=Log(V)
Pendiente = ∆y /∆x =-1.43

3. Determinar gráficamente las constantes K y C, de la ecuación aproximante
Grafico de Dispersión de los

Datos Transformados
5
4.5
4
3.5
Y*=Log(P)
3
2.5
2
1.5
1 log(𝐶𝐶) = 4.3
0.5 Datos Transformados
0 C = 10^4.3=19952.6
0 1 2 3
X*=Log(V) Pendiente = K=-1.43
4. Determinar mediante el método de Mínimos Cuadrados, las constantes K y C,

de la ecuación aproximante.
N V (in3) P (psi) X*=Log(V) Y*=Log(P) X2 X*Y y2

1 61.11 68.88 1.79 1.84 3.19 3.28
2 69.55 55.71 1.84 1.75 3.39 3.22
3 81.48 42.32 1.91 1.63 3.65 3.11
4 99.83 31.96 2.00 1.50 4.00 3.01
5 133.48 21.61 2.13 1.33 4.52 2.84
6 218.34 11.37 2.34 1.06 5.47 2.47
∑X* 12.00 ∑Y* 9.11 ∑X2 24.22 ∑(X*Y)17.92 ∑Y2
4. Determinar mediante el método de Mínimos Cuadrados, las constantes K y C, de

la ecuación aproximante.
X*=Log(V) Y*=Log(P) X2 X*Y y2

1.79 1.84 3.19 3.28 3.38
1.84 1.75 3.39 3.22 3.05
1.91 1.63 3.65 3.11 2.65
2.00 1.50 4.00 3.01 2.26
2.13 1.33 4.52 2.84 1.78
2.34 1.06 5.47 2.47 1.11
12.00 9.11 24.22 17.92 14.23
n: 6
87
Ejercicio Practico: Mínimos Cuadrados
• solución del sistema de ecuaciones:
a : pendiente de la recta b : ordenada en el origen,

constante

1.79 1.84 3.19 3.28 3.38
1.84 1.75 3.39 3.22 3.05
1.91 1.63 3.65 3.11 2.65
2.00 1.50 4.00 3.01 2.26
2.13 1.33 4.52 2.84 1.78
2.34 1.06 5.47 2.47 1.11
n: 6
12.00 9.11 24.22 17.92 14.23
= (6*17.92-12*9.11)/(6*24.22-12*12)= -1.4
=[9.11-(-1.4)*12]/6 = 4.327
a=a1 Pendiente -1.40
b=a0 Constante 4.327

Pendiente a= -1.40
Constante b= 4.327
−𝒌𝒌 = −𝟏𝟏. 𝟒𝟒
log(𝐶𝐶) = 4.327
𝐂𝐂 = 104.327 = 𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐
N (y𝑦𝑦i-y − 𝑦𝑦)�2 2 (yi-y

𝑖𝑖 prom −)*(x
𝑥𝑥𝑖𝑖prom 𝑥𝑥̅ i-X𝑦𝑦prom ) 𝑦𝑦�
𝑖𝑖 − 1
𝑛𝑛
1 0.103 -0.069 𝑆𝑆𝑥𝑥𝑥𝑥 = � 𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ 𝑦𝑦𝑖𝑖 − 𝑦𝑦�

𝒏𝒏 − 2
𝑖𝑖=1
2 0.052 -0.036
3 0.012 -0.010 Sxy: -0.073
4 0.000 0.000
5 0.033 -0.023
6 0.213 -0.156 𝑛𝑛
1
0.414 -0.294 𝑆𝑆𝑦𝑦𝑦𝑦 = � 𝑦𝑦𝑖𝑖 − 𝑦𝑦� 2
𝒏𝒏 − 2
𝑖𝑖=1
Pendiente a= -1.40
Syy: 0.103
S: 0.017
N (y𝑦𝑦i-y − 𝑦𝑦)�2 2 (yi-y

𝑖𝑖 prom −)*(x
𝑥𝑥𝑖𝑖prom 𝑥𝑥̅ i-X𝑦𝑦prom ) 𝑦𝑦�
𝑖𝑖 − 1
𝑛𝑛
1 0.103 -0.069 𝑆𝑆𝑥𝑥𝑥𝑥 = � 𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ 𝑦𝑦𝑖𝑖 − 𝑦𝑦�

𝒏𝒏 − 2
𝑖𝑖=1
2 0.052 -0.036
3 0.012 -0.010 Sxy: -0.073
4 0.000 0.000
5 0.033 -0.023
6 0.213 -0.156 𝑛𝑛
1
0.414 -0.294 𝑆𝑆𝑦𝑦𝑦𝑦 = � 𝑦𝑦𝑖𝑖 − 𝑦𝑦� 2
𝒏𝒏 − 2
𝑖𝑖=1
El signo de la covarianza nos dice que la

relación entre X* y Y* es decreciente
Syy: 0.103
S: 0.017
7. Presente el modelo matemático de su regresión
𝒌𝒌 = 𝟏𝟏. 𝟒𝟒
80
70
Datos Observados
𝐂𝐂 = 𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐
60 Modelo de Regresion
Presion (psi)
50
P*Vk =C 40
30
20
P*V1.4 = 𝟐𝟐𝟏𝟏𝟐𝟐𝟐𝟐𝟐𝟐 10
0
0 50 100 150 200 250
Volumen (in3)
8. Estimar P, cuando V=100 , 150 y 200 pulg3
80
P*V1.4 = 𝟐𝟐𝟏𝟏𝟐𝟐𝟐𝟐𝟐𝟐 70
Datos Observados
Modelo de Regresion
60
Presion (psi)
50
40
30
Volumen Presion 20
3
(in ) (psi)
10
100 33.0
0
150 18.7 0 50 100 150 200 250
200 12.5 Volumen (in3)
9. Realizar la curva de la ecuación aproximante
80
70
Datos Observados
Ecuación aproximante Modelo de Regresion
60
P*V1.4 = 𝟐𝟐𝟏𝟏𝟐𝟐𝟐𝟐𝟐𝟐
Presion (psi)
50
40
30
20
10
0
0 50 100 150 200 250
Volumen (in3)

1.79 1.84 3.19 3.28 3.38
1.84 1.75 3.39 3.22 3.05
1.91 1.63 3.65 3.11 2.65
2.00 1.50 4.00 3.01 2.26
2.13 1.33 4.52 2.84 1.78
2.34 1.06 5.47 2.47 1.11
12.00 9.11 24.22 17.92 14.23
= -0.999
Relación Inversa de
Variables
𝑅𝑅 2 =
𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅
=
𝑆𝑆𝑆𝑆𝑆𝑆
Sxy: -0.073
𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆
𝑆𝑆𝑆𝑆𝑆𝑆 = 𝑎𝑎 ∗ 𝑆𝑆𝑥𝑥𝑥𝑥 = 0.103 Syy: 0.103

𝑆𝑆𝑆𝑆𝑆𝑆 = 𝑆𝑆𝑦𝑦𝑦𝑦 − 𝑎𝑎 ∗ 𝑆𝑆𝑥𝑥𝑦𝑦 =0.000288 Pendiente a= -1.40
𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 = 𝑆𝑆𝐶𝐶𝐶𝐶 + 𝑆𝑆𝑆𝑆𝑆𝑆 = 𝟎𝟎. 𝟏𝟏𝟏𝟏𝟏𝟏288

0.103
𝑅𝑅2 =
0.103288
𝑅𝑅2 = 𝟎𝟎. 𝟗𝟗𝟗𝟗𝟗𝟗

EJERCICIOS PROPUESTOS
97
Ejercicio 2
• Los datos de laboratorio de un estudio reológico son
presentados en la tabla adjunta
• Conociendo que la relación esfuerzo de corte (τ, Pa) y
velocidad de deformación (ℽ, s-1) responden a la
ecuación de Ostwald de Waele
𝜏𝜏 = 𝑘𝑘𝛾𝛾 𝑚𝑚
• Emplee la técnica de mínimos cuadrados y determine
los valores del índice de consistencia ( k, s -1) y el
índice de fluidez (m, Pa/s)
98
τ : Esfuerzo γ:Tasa de
Ejercicio 2 de Corte deformación
(Pa) (1/s)
68 25000
63 21000
𝑚𝑚 58 17800
𝜏𝜏 = 𝑘𝑘𝛾𝛾 53 14900
48 12250
44 10300
• El índice de fluidez (𝑚𝑚) para 39 8500
emulsiones crudo-agua a 29 4800
menudo está en el rango 0.2-0.6; 24 3200
Indique si es el caso 19 1950
• Sí m = 1 el fluido es newtoniano 15 1250
• Sí m < 1 es pseudoplástico 11 650
• Sí m > 1 es dilatante 7.5 330
6 220
99
Práctico Kr Agua- Condensado
Sw Krw Krow
Ejercicio 3 0.5527 0.0319 0.7513
1. Determine el mejor 0.5675 0.0638 0.5477
ajuste para el 0.5822 0.0956 0.3847
siguiente conjunto de 0.5969 0.1275 0.2577
datos 0.6116 0.1594 0.1623
2. Presente la ecuación
0.6264 0.1913 0.0939
de las curvas
aproximantes 0.6411 0.2231 0.0481
3. Genere las curvas 0.6558 0.255 0.0203
aproximantes 0.6705 0.2869 0.006
0.6853 0.3188 0.0008
0.7 0.3506 0
100
101
Práctico
Ejercicio 4
1. El grafico de la función “Y” se utiliza para determinar la
Presión de burbuja (Pb). Es un método de prueba y error donde
se estiman diferentes presiones de burbuja, y el valor adecuado
de Pb permite el mejor comportamiento lineal de la función “Y”
𝑷𝑷𝒃𝒃 − 𝑷𝑷
𝒀𝒀 =
𝑷𝑷 𝑽𝑽𝒓𝒓 − 1
Donde: Función Y
3.50
Vr = Volumen relativo 3.00
2.50
Función Y 2.00
1.50
1.00
0.50
-
0 500 1000 1500 2000 2500 3000
Presión
Práctico :Ejercicio 4
Presión Volumen
1. Considerando los siguientes
datos de laboratorio (tabla (psi) Relativo
anexa), indique cual es la 2653 1.0163
mejor estimación de presión 2568 1.0279
de burbuja (Pb). 2470 1.0419
2. Considere los siguientes 2160 1.1003
valores de Pb: 2000, 2500, 1860 1.1851
2800, 3200,3600 1563 1.3134
3. Del mejor ajuste del punto 1270 1.5118
anterior indique los valores de 969 1.8765
pendiente (a) y constante de 660 2.6166
intersección en el eje (b) 440 3.856
102

3.-Tema 3 - Regresion

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

3.-Tema 3 - Regresion

Cargado por

Copyright:

Formatos disponibles

Tema 3: Análisis de Regresión

– Permite predecir un valor basándonos en el

y Ŷ=b+aX (aproximación simplificada)

Aproximación 𝐲𝐲�i= f(x)

• Debemos de asegurarnos de que la diferencia

Yi (observación) 𝒀𝒀�𝒊𝒊 (aproximación)

Interviene una sola Interviene dos o más

Ŷ=b+aX Valor Observado

La recta ajustada es una estimación de la verdadera recta de regresión

Mínimos Cuadrados: Regresión Lineal

• solución del sistema de ecuaciones: Coeficientes de Regresión

a : pendiente de la recta b : ordenada en el origen

(2) *(x) + sumatorias ΣXY = b ΣX +a ΣX2

• Solución del sistema de ecuaciones:

a : pendiente de la recta b : ordenada en el origen,

• Solución del sistema de ecuaciones:

𝐿𝐿𝐿𝐿 𝑦𝑦 = ln 𝛼𝛼1 + 𝛽𝛽1 x

𝐿𝐿𝑜𝑜𝑜𝑜 𝑦𝑦 = log 𝛼𝛼2 + 𝛽𝛽2 Logx

Empleando algunas operaciones matemáticas

Linealización de relaciones no lineales

1. Exponencial 2. Ley de Potencia 3. Tasa de crecimiento

• solución del sistema de ecuaciones:

• El signo de la covarianza nos dice si el aspecto de la

• El signo de la covarianza nos dice si el aspecto de la

𝑆𝑆 2 = 𝑆𝑆𝑦𝑦𝑦𝑦 − 𝑎𝑎𝑆𝑆𝑥𝑥𝑥𝑥 Ŷ=b+aX

Ventas Error residual

Coeficiente de determinación (R2)

2 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝑆𝑆𝑆𝑆𝑆𝑆

𝑆𝑆𝑆𝑆𝑆𝑆 = 𝑎𝑎 ∗ 𝑆𝑆𝑥𝑥𝑥𝑥 Suma de cuadrados de la regresión

𝑆𝑆𝑆𝑆𝑆𝑆 = 𝑆𝑆𝑦𝑦𝑦𝑦 − 𝑎𝑎 ∗ 𝑆𝑆𝑥𝑥𝑦𝑦 Suma de los cuadrados de los errores

𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 = 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹𝑹ó𝑛𝑛 + 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓

𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 = 𝑆𝑆𝐶𝐶𝐶𝐶 + 𝑆𝑆𝑆𝑆𝑆𝑆

R2 = r2  sólo cierto para la regresión lineal simple!!!

2. Inspeccionar el diagrama de dispersión y observar si los puntos se

Generar una Regresión Lineal

∑x ∑y ∑x2 ∑(x*y) ∑y2

Observe que los

2. Diagrama de dispersión en coordenadas y escalas adecuadas, conociendo que

Comportamiento del Modelo

2. Diagrama de dispersión en coordenadas y escalas adecuadas, conociendo que

Comportamiento del Modelo

Grafico de Dispersión de los

2. Diagrama de dispersión en coordenadas y escalas adecuadas, conociendo que

Grafico de Dispersión de los Observar que es

0.5 X*=Log(V) Y*=Log(P)

log (P) = log (C ) - k log (V)

3. Determinar gráficamente las constantes K y C, de la ecuación aproximante

Grafico de Dispersión de los Curva aproximante

Pendiente = ∆y /∆x =-1.43

3. Determinar gráficamente las constantes K y C, de la ecuación aproximante

Grafico de Dispersión de los

4. Determinar mediante el método de Mínimos Cuadrados, las constantes K y C,

N V (in3) P (psi) X*=Log(V) Y*=Log(P) X2 X*Y y2

4. Determinar mediante el método de Mínimos Cuadrados, las constantes K y C, de

X*=Log(V) Y*=Log(P) X2 X*Y y2

Ejercicio Practico: Mínimos Cuadrados

• solución del sistema de ecuaciones:

a : pendiente de la recta b : ordenada en el origen,

4. Determinar mediante el método de Mínimos Cuadrados, las constantes K y C, de

4. Determinar mediante el método de Mínimos Cuadrados, las constantes K y C, de

5. Calcular la variabilidad de los datos

N (y𝑦𝑦i-y − 𝑦𝑦)�2 2 (yi-y

1 0.103 -0.069 𝑆𝑆𝑥𝑥𝑥𝑥 = � 𝑥𝑥𝑖𝑖 − 𝑥𝑥̅ 𝑦𝑦𝑖𝑖 − 𝑦𝑦�

0.5 X=Log(V) Y=Log(P)

N V (in3) P (psi) X=Log(V) Y=Log(P) X2 X*Y y2

X=Log(V) Y=Log(P) X2 X*Y y2

X=Log(V) Y=Log(P) X2 X*Y y2