Está en la página 1de 40

Facultad de Ingeniería Química y Metalúrgica

Escuela Académico Profesional de Ingeniería Química

CURSO : ESTADISTICA APLICADA


A LA INGENIERIA

TEMA : Regresion y Correlación


Y = a + bx
Lineal

DOCENTE : M(o). JULIO MUÑOZ VILELA

efecto causas
Facultad de Ingeniería

Análisis de Regresión

Es una Técnica paramétrica Las variables X e Y deben


utilizada para predecir y/o ser de naturaleza
explicar el valor de una cuantitativa y de
variable dependiente (y), preferencia continua.
dado el valor de otras Son estudios de la relación
variables relacionadas funcional entre 2 variables
independientes (x) relacionadas.
Facultad de Ingeniería

Regresión lineal simple

En Regresion lineal tenemos No todos los puntos se


que ajustar una recta a los hallarán sobre la recta.
puntos observados, a fin de
usarla para predecir el valor Pero la recta ajustada se
de Y ( variable dependiente) supone que pasa lo más
para un valor dado de X cerca posible de todos
( variable independiente) los puntos.
Facultad de Ingeniería

Regresion lineal simple

A la recta se le llama recta y = a + bx


de regresión cuya ecuación
es la de la regresión lineal
simple.
Variable Intersección Variable Pendiente
Para cada valor de X dependiente en Y independiente de la recta

prefijado, hay una


subpoblación de valores Y.
Facultad de Ingeniería

Regresion lineal simple

Minimizar esta distancia


(Error)

Mínimos Cuadrados
Facultad de Ingeniería

Mínimos Cuadrados

Utiliza un Es fácil de analizar y La


error computacionalmente interpretación
cuadrado que más rápido. es mucho más
tiene buenas fácil que otras
propiedades técnicas.
matemáticas
Facultad de Ingeniería

Coeficientes de Mínimos Cuadrados


“n” datos
2 variables Y = concentración X = temperatura
σ𝒚 σ𝒙
𝒂= −𝒃
𝒏 σ 𝒙𝒚 − σ 𝒙𝜮𝒚 𝒄𝒐𝒗(𝒙, 𝒚) 𝒏 𝒏
𝒃= =
𝟐
𝒏𝜮𝒙 − ෌ 𝒙 𝟐 𝑺𝟐𝒙
ഥ − 𝒃𝒙
𝒂=𝒚 ഥ

Ecuación de la Recta y = ax + b
Facultad de Ingeniería

Error

No importa cuán No podemos eliminar por


poderoso sea el algoritmo completo el error, pero
que elijamos, siempre aún podemos intentar
habrá un error reducirlo al nivel más
irreductible. bajo
Facultad de Ingeniería

Error estándar de estimación Syx

- La predicción perfecta es - El error estándar de estimación,


prácticamente imposible por lo simbolizado Syx, tiene el mismo
tanto es necesaria una medida concepto de la desviación estándar.
que indique que tan precisa es - La desviación estándar mide la
una predicción de Y basada en dispersión alrededor de la media.
X. - El error estándar de estimación
- Esta medida es llamada el mide la dispersión alrededor de la
Error estándar de estimación línea de regresión
Facultad de Ingeniería

Error estándar de estimación Syx

Se calcula con la siguiente


formula: Varianza residual
2
2 2
σ 𝑦 − 𝑦ො
σ 𝑦 − 𝑦ො 𝑠 𝑦𝑥=
𝑠𝑦𝑥 = 𝑛−2
𝑛−2

2
2
σ 𝑦 − 𝑎 σ 𝑦 − 𝑏 σ 𝑥𝑦 σ 𝑦 − 𝑎 σ 𝑦 − 𝑏 σ 𝑥𝑦
𝑠𝑦𝑥 = 𝑠2𝑦𝑥 =
𝑛−2 𝑛−2
Facultad de Ingeniería

Error estándar de estimación Syx


Facultad de Ingeniería

Intervalos de confianza (1-α)


Se calcula con la siguiente formula:

1 (𝑥 − 𝑥)ҧ 2
𝐼𝐶(𝑌)1−α = (a + bx ± 𝑡 ∝ ∗ 𝑆𝑦𝑥 ∗ 1 + +
𝑛−2;1− 2 𝑛 σ(𝑥𝑖 − 𝑥)ҧ 2

𝟏 (𝒙 − 𝒙ഥ)𝟐
ෝ±𝒕
𝑰𝑪(𝒀)𝟏−𝜶 = 𝒚 ∝ ∗ 𝑺𝒚𝒙 ∗ 𝟏 + + 𝟐
𝒏−𝟐;𝟏−
𝟐 𝒏 ( σ 𝒙 𝒊 )
σ 𝒙𝟐𝒊 −
𝒏
Facultad de Ingeniería

Nociones de Regresión no lineal


ECUACIÓN TRANSFORMACION LINEAL
En muchos casos , cuando 𝒚 = 𝒂𝒃𝒙 𝐞𝐱𝐩𝐨𝐧𝐞𝐧𝐜𝐢𝐚𝐥 𝐥𝐨𝐠 𝒚 = 𝒍𝒐𝒈𝒂 + 𝒙(𝒍𝒐𝒈𝒃)

los valores en pareja de 𝒚 = 𝒂𝒙𝒃 𝐩𝐨𝐭𝐞𝐧𝐜𝐢𝐚𝐥 𝐥𝐨𝐠 𝒚 = 𝒍𝒐𝒈𝒂 + 𝒃(𝒍𝒐𝒈𝒙)

variables X e Y ; no se 𝒚 = 𝟏/(𝐚 + 𝐛𝐱) 𝐡𝐢𝐩𝐞𝐫𝐛𝐨𝐥𝐢𝐜𝐚 𝒚´ = 𝒂 + 𝒃𝒙 , 𝒔𝒊𝒆𝒏𝒅𝒐 𝒚´ = 𝟏/𝒚

ajustan a una línea recta. Regresion cuadrática o TRANSFORMACION LINEAL


Se puede conseguir que parabólica

una relación no lineal sea ෍ 𝒀 = 𝒏𝒂 + 𝒃𝟏 ෍ 𝑿 + 𝒃𝟐 ෍ 𝑿𝟐


transformada en una
relación lineal mediante la ෍ 𝑿𝒀 = 𝒂 ෍ 𝑿 + 𝒃𝟏 ෍ 𝑿𝟐 + 𝒃𝟐 ෍ 𝑿𝟑
transformación de la 𝒚 = 𝒂 + 𝒃𝟏 𝑿 + 𝒃𝟐 𝑿𝟐
variable. ෍ 𝑿𝟐 𝒀 = 𝒂 ෍ 𝑿𝟐 + 𝒃𝟏 ෍ 𝑿𝟑 + 𝒃𝟐 ෍ 𝑿𝟒
Facultad de Ingeniería

Correlación lineal simple

Es una técnica que permite r2 : es el coeficiente de


medir la fuerza o intensidad determinación y se suele
de la relación entre 2 variables expresar en porcentaje,
linealmente relacionados, su indica en que porcentaje es
grado de relación y su sentido.
explicada la variabilidad total
Se logra a través del
coeficiente de Correlación de de Y por la relación lineal
Pearson : “ r” entre ambas variables.
Facultad de Ingeniería

Diagrama de dispersión

Es la representación
grafica que permite
detectar la relación
entre variables
cuantitativas.
Es el primer indicio de la
forma o naturaleza de la
relación entre variables.
Facultad de Ingeniería

Correlación lineal simple


𝛴𝑥𝑦 cov 𝑥𝑦
cov 𝑥, 𝑦 = − 𝑥ҧ 𝑦ത 𝑟=
𝑛 𝑆𝑥 ⋅ 𝑠𝑦
෌𝒙𝟐 Guía para interpretar el Coeficiente de Pearson “r”

𝒔𝟐𝒙 = ഥ𝟐
−𝒙
𝒏
𝟐
෌𝒚
𝟐 ഥ 𝟐
𝒔𝒚 = −𝒚
𝒏
Facultad de Ingeniería

Ejercicios

Una empresa farmacéutica conduce un estudio para evaluar la


relación entre 3 dosis de un nuevo agente hipnótico y tiempo
de sueño. Cuando la dosis del agente hipnótico se incrementa
en 1 mg/kg. ¿ cuanto se incrementara la hora de sueño
inducido?. Los resultados son presentados en la siguiente tabla:
Tiempo de 4 6 5 9 8 7 13 11 9
sueño en
horas
Dosis 3 3 3 10 10 10 15 15 15
( mg/kg)
Facultad de Ingeniería
Solucion
Prueba X Y X2 Y2 XY resolución Predicción Y´ (Y – Y´)2
1 3 4 9 16 12 Y´= 3.38 + 0.5 (3) 4.88 0.7744
2 3 6 9 36 18 Y´= 3.38 + 0.5 (3) 4.88 1.2544
3 3 5 9 25 15 Y´= 3.38 + 0.5 (3) 4.88 0.0144
4 10 9 100 81 90 Y´= 3.38 + 0.5 (10) 8.38 0.3844
35 10 8 100 64 80 Y´= 3.38 + 0.5 (10) 8.38 0.1444
6 10 7 100 49 70 Y´= 3.38 + 0.5 (10) 8.38 1.9044
7 15 13 225 169 195 Y´= 3.38 + 0.5 (15) 10.88 4.4944
8 15 11 225 121 165 Y´= 3.38 + 0.5 (15) 10.88 0.0144
9 15 9 225 81 135 Y´= 3.38 + 0.5 (15) 10.88 3.5344
Total 84 72 1002 642 780 12.5196
Facultad de Ingeniería

Estimadores de los mínimos cuadrados

𝒏 σ 𝒙𝒚 − σ 𝒙𝜮𝒚 𝟗 𝟕𝟖𝟎 − (𝟖𝟒)(𝟕𝟐)


𝒃= 𝟐 𝟐
= 𝟐
= 𝟎. 𝟓
𝒏𝜮𝒙 − ෌ 𝒙 𝟗 𝟏𝟎𝟎𝟐 − (𝟖𝟒)

𝟕𝟐 𝟖𝟒
ഥ − 𝒃𝒙ഥ ⇒ 𝒂 =
𝒂=𝒚 − 𝟎. 𝟓 = 𝟖 − 𝟒. 𝟔𝟕 = 𝟑. 𝟑𝟑
𝟗 𝟗

Obtención de la Ecuación de la recta

𝐲 = 𝒂 + 𝒃𝒙 ⇒ 𝒚 = 𝟑. 𝟑𝟑 + 𝟎. 𝟓𝒙
Regresion lineal simple
Facultad de Ingeniería
Facultad de Ingeniería

Ejercicio 2

En una curva de calibración, la densidad óptica varia


dependiendo de la concentración de biomasa, como se muestra
en la siguiente tabla:
Concentración 1 2 4 5 8 10 12 15
(mM) (X)
Densidad óptica 4 9 18 20 35 41 47 60
(%trasmitancia)

Estimar cuanto será la densidad óptica , si la concentración de la biomasa


es 9 mM.
Facultad de Ingeniería
Prueba CONCENTRACION DENSIDAD (𝐗 − 𝑿
ഥ ) (𝐘 − 𝒀ഥ ) (𝐗 − 𝑿 ഥ) 𝟐 ഥ )*(𝐘 − 𝒀
(𝐗 − 𝑿 ഥ)
X OPTICA Y
Regresion lineal simple

1 1 4 -6.125 -25.25 37.515625 154.65625


2 2 9 -5.125 -20.25 26.265625 103.78125
3 4 18 -3.125 -11.25 9.765625 35.15625
4 5 20 -2.125 -9.25 4.515625 19.65625
5 8 35 0.875 5.75 0.765625 5.03125
6 10 41 2-875 11.75 8.265625 33.78125
7 12 47 4.875 17.75 23.765625 86.53125
8 15 160 7.875 30.75 62.015625 242.15625
Total 57 234 172.875 680.75
Promedio 7.125 29.25
Facultad de Ingeniería

ഥ ∗ 𝒀𝒊 − 𝒀
෌ 𝑿𝒊 − 𝑿 ഥ 680.75
Regresion lineal simple

𝒃= = = 𝟑. 𝟗𝟑𝟖

σ 𝑿𝒊 − 𝑿 𝟐 172.875

ഥ − 𝒃ഥ
𝒂=𝒚 𝒙 𝒂 = 𝟐𝟗. 𝟐𝟓 − 𝟑. 𝟗𝟑𝟖 𝟕. 𝟏𝟐𝟓 = 𝟏𝟗𝟑

𝒚ෝ𝒊 = 𝒂 + 𝒃𝒙 𝒚ෝ𝒊 = 𝟏. 𝟏𝟗𝟑 + 𝟑. 𝟗𝟑𝟖𝒙


𝒚ෝ𝒊 = 𝟏. 𝟏𝟗𝟑 + 𝟑. 𝟗𝟑𝟖(𝟗)
𝒚ෝ𝒊 =
Facultad de Ingeniería

Ejercicios con intervalos de confianza

Los siguientes datos pertenecen al numero de suscriptores en una plataforma de


capacitación ( en miles de suscriptores) y el tiempo en meses desde que se abrió la
plataforma :
X (MES) 1 4 6 2 5

Y (MILES DE 2.1 3.3 4.4 3 4


SUSCRIPTORES)

Estimar el numero de suscriptores en el mes 11 y definir el intervalo de confianza


si se desea que sea al 95% de confiabilidad.
Facultad de Ingeniería

Ejercicios con intervalos de confianza


meses vs n° suscriptores
5
y = 0.4198x + 1.8488
4.5 R² = 0.9436

4
X (MES) 1 4 6 2 5 3.5

n° suscriptores
3

2.5
Y (MILES DE
2
SUSCRIPTORES) 2.1 3.3 4.4 3 4 1.5

0.5

0
0 1 2 3 4 5 6 7
meses
Facultad de Ingeniería

Ejercicios con intervalos de confianza

muest X Y X2 Y2 XY resolución Predicción Y´ (Y – Y´)2


1 1 2.1 1 4.41 2.1 Y´= 1.8488 + 0.42 (1) 2.2686 0.02843
2 4 3.3 16 10.89 13.2 Y´= 1.8488+ 0.42 (4) 3.5279 0.05194
3 6 4.4 36 19.36 26.4 Y´= 1.8488 + 0.42 (6) 4.3674 0.00106
4 2 3 4 9 6 Y´= 1.8488 + 0.42 (2) 2.6884 0.09711
5 5 4 25 16 20 Y´= 1.8488 + 0.42 (5) 3.9477 0.00274
Total 18 16.8 82 59.66 67.7 0.18128
Facultad de Ingeniería

Estimadores de los mínimos cuadrados

𝒏 σ 𝒙𝒚 − σ 𝒙𝜮𝒚 𝟓 𝟔𝟕. 𝟕 − (𝟏𝟖)(𝟏𝟔. 𝟖)


𝒃= 𝟐 𝟐
= 𝟐
= 𝟎. 𝟒𝟏𝟗𝟖
𝒏𝜮𝒙 − ෌ 𝒙 𝟓 𝟖𝟐 − (𝟏𝟖)

𝟏𝟔. 𝟖 𝟏𝟖
ഥ − 𝒃𝒙ഥ ⇒ 𝒂 =
𝒂=𝒚 − 𝟎. 𝟒𝟏𝟗𝟖 = 𝟏. 𝟖𝟒𝟖𝟖
𝟓 𝟓

Estimación en la Ecuación de la recta 𝐲 = 𝒂 + 𝒃𝒙

𝒚 = 𝟏. 𝟖𝟒𝟖𝟖 + 𝟎. 𝟒𝟏𝟗𝟖𝒙 ෝ = 𝟏. 𝟖𝟒𝟖𝟖 + 𝟎. 𝟒𝟏𝟗𝟖 𝟏𝟏 = 𝟔. 𝟒𝟔𝟔𝟑


𝒚
Facultad de Ingeniería

෌ 𝒙𝟐 𝟖𝟐
𝒔𝟐𝒙 ഥ𝟐 𝟐 𝑺𝒙 = 𝟑. 𝟒𝟒 = 𝟏. 𝟖𝟓
Formulas para el calculo
= −𝒙 = − 𝟑. 𝟔 = 𝟑. 𝟒𝟒
𝒏 𝟓

෌ 𝒚𝟐 𝟓𝟗. 𝟔𝟔 𝑺𝒚 = 𝟎. 𝟔𝟒𝟐𝟒 = 𝟎. 𝟖𝟎𝟏


𝒔𝟐𝒚 = −𝒚 =ഥ𝟐 − 𝟑. 𝟑𝟔 𝟐
= 𝟎. 𝟔𝟒𝟐𝟒
𝒏 𝟓

𝜮𝒙𝒚 𝟔𝟕. 𝟕
𝒄𝒐𝒗 𝒙, 𝒚 = ഥ𝒚
−𝒙 ഥ= − 𝟑. 𝟔 𝟑. 𝟑𝟔 = 𝟏. 𝟒𝟒𝟒
𝒏 𝟓
𝟐
𝟐
σ 𝒚 − 𝒂 σ 𝒚 − 𝒃 σ 𝒙𝒚
𝒔 𝒚𝒙 = =
𝒏−𝟐
𝟓𝟗. 𝟔𝟔 − 𝟏. 𝟖𝟒𝟖𝟖 𝟏𝟔. 𝟖 − 𝟎. 𝟒𝟏𝟗𝟕𝟔𝟕(𝟔𝟕. 𝟕)
= 𝟎. 𝟎𝟔𝟎𝟒𝟑
𝟓−𝟐
Facultad de Ingeniería

Intervalos de Confianza

𝟏 (𝒙 − 𝒙ഥ)𝟐
ෝ±𝒕
𝑰𝑪(𝒀)𝟏−𝜶 = 𝒚 ∝ ∗ 𝑺𝒚𝒙 ∗ 𝟏 + + 𝟐
𝒏−𝟐;𝟏− 𝟐 𝒏 (σ 𝒙 𝒊 )
σ 𝒙𝟐𝒊 −
𝒏
ෝ = 𝟏. 𝟖𝟒𝟖𝟖 + 𝟎. 𝟒𝟏𝟗𝟖 𝟏𝟏 = 𝟔. 𝟒𝟔𝟔𝟑
𝒚

𝒕(𝒏−𝟐;𝟏−∝ൗ ) = 𝒕 𝟓−𝟐;𝟏−𝟎.𝟎𝟐𝟓 =𝟑.𝟏𝟖𝟐


𝟐

𝑺𝒚𝒙 = 0.245817 ഥ = 𝟑. 𝟔
𝒙

෍ 𝒙𝟐𝒊 = 𝟖𝟐 𝒙= 11
Facultad de Ingeniería

Intervalos de Confianza

𝟏 (𝟏𝟏−𝟑.𝟔)𝟐
𝑰𝑪(𝒀)𝟏−𝜶 = 𝟔. 𝟒𝟔𝟔𝟑 ± 𝟑. 𝟏𝟖𝟐 ∗ (𝟎. 𝟐𝟒𝟓𝟖𝟏𝟕) ∗ 𝟏 + 𝟓
+ (𝟏𝟖)𝟐
=
𝟖𝟐 −
𝟓

𝑰𝑪(𝒀)𝟏−𝜶 =
Facultad de Ingeniería

Ejercicios
En la producción de herramientas , el método para deformar el acero a
temperatura normal, mantiene una relación lineal con la dureza del mismo ya
que, a medida que la deformación crece, se ve afectada la dureza del acero. Para
investigar esta relación se evaluaron 12 muestras de acero, los resultados
obtenidos se muestran a continuación:
Muestra 1 2 3 4 5 6 7 8 9 10 11 12

Deformación 6 9 10 11 13 15 18 22 26 28 33 35
(en mm)
Dureza brinell 68 67 66 53 52 50 48 44 40 37 34 32
(en kg/mm2)
Facultad de Ingeniería

Ejercicios

a) Estime la dureza brinell de las muestras de acero cuando la


deformación del acero es 15.5 mm. Justifique su respuesta.
b) Determine el error estándar de estimación
c) Estime con 90% de confianza, la dureza brinell del acero , cuando la
deformación del acero es 26 mm
d) Determine el coeficiente de correlación de pearson
Facultad de Ingeniería

Ejercicios
Los datos que se muestran a continuación muestran el contenido de carbono (%)
y la resistencia a la tracción de cierto tipo de barra de acero

Barra 1 2 3 4 5 6 7 8 9 10 11 12

Carbono (%) 2 2.4 2.2 2.3 2.5 2.8 2.2 2.7 2.4 2.3 2.0 2.2
Resistencia 43 46 45 44 45 48 43 47 44 45 42 44
(en kg/cm2)

Estime la ecuación de regresión que permita predecir la resistencia a la tracción


de las barras de este tipo de acero a partir del contenido de carbono.
Determine el coeficiente de correlacion de pearson.
Facultad de Ingeniería

Ejercicios
Se encontró la siguiente información entre la concentración de cierta sustancia,
expresada en porcentaje, y la lectura en el colorímetro en lux, para una muestra
aleatoria de tamaño 8
Concentración 4 5 5 6 7 7 8 9
(X)
Lectura (Y) 80 170 200 260 330 334 390 430
Bajo el supuesto que existe una relación lineal entre variables.
a) Determinar el modelo de regresion lineal
b) Encuentre un intervalo con una confianza del 95%, para estimar la lectura en
el colorímetro de todas las sustancias que tengan una concentración de 6.5%
c) Esbose un grafico que muestre la ecuación de regresion estimada.
Facultad de Ingeniería

Ejercicios
Se desea estudiar si la resistencia de una mezcla de hormigón es explicada por el
numero de días de fragüe de dicha mezcla. Para ello se tomo una muestra de 12
mezclas, obteniéndose la siguiente información.

Mezcla 1 2 3 4 5 6 7 8 9 10 11 12

Días de 1 2 3 7 2 3 7 7 3 2 1 10
fragüe
Resistencia 13 21.9 29.8 32.4 24.5 30.4 34.5 26.2 24.2 24.5 13 42.6
(kg/cm2)
Facultad de Ingeniería

Ejercicios

a) Estime la resistencia de las mezclas cuando los días de fragüe han sido 9
días. Justifique su respuesta.
b) Determine el error estándar de estimación
c) Estime con 90% de confianza, la resistencia de la mezcla , cuando la los
días de fragüe son 6 dias
d) Determine el coeficiente de correlación de pearson
Facultad de Ingeniería

Ejercicios
El concreto experimenta un marcado incremento característico en la plasto
deformación. Cuando se calienta por primera vez bajo carga. Se efectuó un
experimento en 12 especímenes de concreto, con el fin de investigar el
comportamiento ante esfuerzos térmicos transitorios, en el cual se mide la rapidez
del calentamiento, en °C/min. Y nivel de carga, en porcentaje. La información es:

Rapidez 0.1 0.12 0.14 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.48 0.50
Nivel de 0.05 0.01 0.08 0,08 0.1 0.19 0.18 0.23 0.25 0.33 0.35 0.41
carga
Facultad de Ingeniería

Ejercicios

a) Estime la resistencia de las mezclas cuando los días de fragüe han sido 9
días. Justifique su respuesta.
b) Determine el error estándar de estimación
c) Estime con un 95% de confianzael nivel de carga promedio que
soportan los espcimenes de concreto cuando la rapidez del
calentamiento es de 0.18°C/min.
d) Determine el coeficiente de correlación de pearson
Facultad de Ingeniería
Tabla t student
Facultad de Ingeniería
Tabla t student

También podría gustarte