Está en la página 1de 29

ANALISIS DE

CORRELACIN Y ANLISIS
DE REGRESIN NO LINEAL
ESTADSTICA PARA INGENIERIA II
SESIN 05
1
LOGRO
Al finalizar la sesin, El estudiante ser capaz de:

Evaluar estimar e interpretar el grado de asociacin de dos variables mediante
el coeficiente de correlacin.
Comprender la relacin entre el grado de asociacin y el coeficiente de
determinacin.
Determinar si la asociacin entre dos variables es significativa.
Diferenciar entre el modelo de regresin lineal y los no lineales
Estimar los diferentes modelos de regresin no lineales efectuando las
transformaciones de variables correspondientes y saber efectuar la eleccin del
mejor modelo.


2
El presidente de la compaa Autos Per S.A desea mejorar el
rendimiento de gasolina de los autos que fabrica su compaa, los
ingenieros le indican que para mejorarlo se debe de disminuir el tamao
del motor. Sin embargo, la compaa tiene como ventaja competitiva la
fabrica de autos con los mejores motores del mercado, es por ello, que el
vicepresidente necesita estar seguro de la relacin entre el rendimiento de
gasolina y el tamao del motor antes de efectuar algn cambio.
Existe alguna relacin entre rendimiento de
gasolina de un auto y el tamao del motor?
4
Anlisis de correlacin
5
Es el estudio del grado de asociacin existente entre dos variables
aleatorias.
Sobre la base de las observacin simultnea de dos variables en
cada elemento de una muestra aleatoria, se trata de averiguar si el
comportamiento de una variable est asociado al comportamiento
de la otra variable, y si tal asociacin existe, saber si es o no
significativa.
El indicador del grado de asociacin existente entre dos variable
aleatorias X e Y es llamado coeficiente de correlacin.
Anlisis de correlacin
Expresa el grado de asociacin lineal entre dos variables.
El coeficiente de correlacin lineal estimado es:





El valor de r puede variar dentro del intervalo -1 s r s + 1

(
(

|
.
|

\
|
|
.
|

\
|
(
(

|
.
|

\
|
|
.
|

\
|
|
.
|

\
|
|
.
|

\
|
|
.
|

\
|
=


= = = =
= = =
2
1 1
2
2
1 1
2
1 1 1
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i i
y y n x x n
y x y x n
r
Coeficiente de correlacin
Asociacin lineal directa No hay asociacin lineal
Asociacin lineal inversa No hay asociacin lineal
Tipos de correlacin
El valor absoluto de r indica la fuerza de la relacin entre X y Y.
El signo indica la direccin de la relacin (directa o inversamente
proporcional)
r = 1 Correlacin positiva perfecta
r = -1 Correlacin negativa perfecta
r = 0 No hay relacin lineal entre X y Y
Interpretacin de la correlacin
2
R r =
El coeficiente de correlacin es la raz cuadrada del coeficiente
de determinacin, anteponiendo (signo + o -), de acuerdo a la
direccin de la relacin (directa o inversa).
Relacin de la correlacin y el
coeficiente de determinacin
10
Si el inters es verificar si el coeficiente de correlacin estimado
sugiere o no la existencia de una asociacin significativa entre las
variables de estudio, se tendr la siguiente hiptesis:
Hiptesis:




Estadstico de prueba
La correlacin entre ambas variables no es significativa
( 2)
2
~
1
2

c n
r
t t
r
n
0 : H
0 : H
1
0
=
=

La correlacin entre ambas variables es significativa


Pruebas de correlacin
11
Ejercicio:
El ingeniero principal de Autos Per S.A con la finalidad de demostrar que
existe relacin entre el tamao del motor y el consumo de gasolina obtiene al
azar la informacin de 7 autos recientemente ensamblados:





a) Halle e interprete el coeficiente de correlacin.
b) Existe relacin lineal entre las variables medidas por el ingeniero de Autos
Per? Utilice un nivel de significacin del 5%.
Y = Tamao del
motor (en cc)
115 106.4 105.3 108.9 108.4 105.6 107.8
X = Consumo de
gasolina (en
km/galn)
42.52 36.69 35.15 40.18 39.56 35.41 36.72
a) Halle e interprete el coeficiente de correlacin.
b) Existe relacin lineal entre las variables medidas por el ingeniero de Autos
Per? Utilice un nivel de significacin del 5%.
0 : H
0
=
La correlacin entre el tamao del motor y el consumo de
gasolina no es significativa
La correlacin entre el tamao del motor y el consumo de
gasolina es significativa
0 : H
1
=
Como p-valor = 0.003 < 0.05
Se rechaza Ho.


Con un nivel de significancia del 5% la correlacin entre el tamao del motor
y el consumo de gasolina es significativa
14
Anlisis de Regresin No Lineal
Qu hacer si la relacin entre ambas
variables no es lineal?
El gerente de produccin de la compaa Llantas Lima S.A ha solicitado
la creacin de un modelo de regresin para estimar el porcentaje de vida
til de llantas en base a la cantidad de millas recorridas. Al realizar el
diagrama de dispersin se obtuvo el siguiente grfico:








Existe una relacin lineal entre el porcentaje de vida til de llantas y la
cantidad de millas recorridas? Es posible crear un modelo de regresin?




0
20
40
60
80
100
120
0 10 20 30 40 50
P
o
r
c
e
n
t
a
j
e

t
i
l

d
e

l
a
s

l
l
a
n
t
a
s
Millas recorridas
Anlisis de regresin no lineal
La relacin existente entre las variables no siempre ocurren
de manera lineal.
En estos casos, se debe buscar una respuesta en los
llamados modelos no lineales; es decir, aquellos modelos
en los cuales se supone una relacin de tipo no lineal entre
las variables dependiente Y y la variable independiente X.
Modelo Ecuacin de regresin
Transformacin
apropiada
Exponencial
Potencia
Cuadrtica
y Ln y = *
x
e y
1
0

|
| =
1
0

|
| x y =
2
2 1 0

x x y | | | + + =
y Ln y = *
x Ln x = *
Modelos de regresin no lineal
Los modelos de regresin no lineal ms conocidos son:
exponencial, potencia y cuadrtico.
Anlisis de regresin no lineal

y
0
b

0
1
< b

x

0
b

0
1
> b

y
x
Funcin exponencial

0
b

1
1
> b

y
x
1 0
1
< b <


0
1
< b

x
y
Funcin potencia
19
Eleccin del mejor modelo
Cmo elegir el mejor modelo?


Modelo R
2
Exponencial R
2
exponencial

Potencia
R
2
potencia


Cuadrtica
R
2
cuadrtica


Paso 1: Prioridad del modelo con el
mayor valor de R
2

Paso 2: Validar el modelo
Si el modelo elegido no es vlido, se debe
elegir el siguiente en el orden de prioridad
Paso 3: Predecir con el modelo validado.
20
Los ingenieros de la empresa Llantas S.A a cargo de la resistencia de
llantas tienen como objetivo evaluar si existe una relacin entre el
porcentaje de vida til de las llantas y las millas recorridas (en miles) con
el fin de mejorar su durabilidad.
Para realizar este anlisis, se obtuvieron registros de 8 llantas elegidas
al azar:




a) Realice el diagrama de dispersin.
b) Genere los modelo de regresin no lineal: exponencial, potencia y
cuadrtico, y ordene por orden de prioridad de acuerdo al R
2.
c) Valide el mejor modelo. Qu modelo elegiran los ingenieros a
cargo del proyecto? Justifique.
21
Ejercicio:
Millas recorridas (X) 1 2 5 15 25 30 35 40
Porcentaje vida til (Y) 99 95 85 55 30 24 20 15
a) Realice el diagrama de dispersin
22
b) Genere los modelo de regresin no lineal: exponencial, potencia y
cuadrtico, y ordene por orden de prioridad de acuerdo al R
2

23
Modelo cuadrtico
Anlisis de regresin: Porcentaje vida til (Y) vs. Millas recorridas (X), x2

Anlisis de Varianza

Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Regresin 2 8803.58 4401.79 3018.76 0.000
Millas recorridas (X) 1 1475.73 1475.73 1012.06 0.000
x2 1 288.94 288.94 198.16 0.000
Error 5 7.29 1.46
Total 7 8810.88


Resumen del modelo

R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
1.20754 99.92% 99.88% 99.79%


Coeficientes

EE del
Trmino Coef coef. Valor T Valor p VIF
Constante 103.149 0.873 118.18 0.000
Millas recorridas (X) -3.950 0.124 -31.81 0.000 17.75
x2 0.04389 0.00312 14.08 0.000 17.75


Ecuacin de regresin

Porcentaje vida til (Y) = 103.149 - 3.950 Millas recorridas (X) + 0.04389 x2
b) Genere los modelo de regresin no lineal: exponencial, potencia y
cuadrtico, y ordene por orden de prioridad de acuerdo al R
2

24
Modelo exponencial
Anlisis de regresin: LnY vs. Millas recorridas (X)

Anlisis de Varianza

Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Regresin 1 3.99757 3.99757 2286.42 0.000
Millas recorridas (X) 1 3.99757 3.99757 2286.42 0.000
Error 6 0.01049 0.00175
Total 7 4.00806


Resumen del modelo

R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
0.0418138 99.74% 99.69% 99.60%


Coeficientes

EE del
Trmino Coef coef. Valor T Valor p VIF
Constante 4.6685 0.0245 190.68 0.000
Millas recorridas (X) -0.04880 0.00102 -47.82 0.000 1.00


Ecuacin de regresin

LnY = 4.6685 - 0.04880 Millas recorridas (X)

b) Genere los modelo de regresin no lineal: exponencial, potencia y
cuadrtico, y ordene por orden de prioridad de acuerdo al R
2

25
Modelo potencia
Anlisis de regresin: LnY vs. Lnx

Anlisis de Varianza

Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Regresin 1 3.4343 3.43432 35.92 0.001
Lnx 1 3.4343 3.43432 35.92 0.001
Error 6 0.5737 0.09562
Total 7 4.0081


Resumen del modelo

R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
0.309228 85.69% 83.30% 71.77%


Coeficientes

EE del
Trmino Coef coef. Valor T Valor p VIF
Constante 4.902 0.223 21.96 0.000
Lnx -0.4944 0.0825 -5.99 0.001 1.00


Ecuacin de regresin

LnY = 4.902 - 0.4944 Lnx
26
b) Genere los modelo de regresin no lineal: exponencial, potencia y
cuadrtico, y ordene por orden de prioridad de acuerdo al R
2

Modelo R
2
Exponencial 99.74%
Potencia 85.69%
Cuadrtica
99.92%

c) Qu modelo elegiran los ingenieros a cargo del proyecto? Justifique.

27
Validacin del modelo cuadrtico
0 : H
2 0
= |
0 : H
2 1
= |
Como p-valor = 0.000 < 0.05. Se rechaza Ho.

Con un nivel de significancia del 5% el modelo cuadrtico
es vlido
Por lo tanto, los ingenieros deben elegir el modelo cuadrtico
Modelo cuadrtico validado:

28
2
04389 . 0 950 . 3 149 . 103

x x y + =
Cul ser el porcentaje de vida til de una llanta que tiene recorridos
30 mil millas?

2
) 30 ( 04389 . 0 ) 30 ( 950 . 3 149 . 103

+ = y
231 . 24

= y
Respuesta: una llanta que tiene un recorrido de 30 mil millas tendr
24.23% de porcentaje de vida til

Autoevaluacin
1. El coeficiente de correlacin indica el grado de asociacin
existente entre dos variables.

2. La variable dependiente en los modelos de regresin no lineal
siempre deben transformarse aplicando el logaritmo neperiano.

3. Todos los modelos no lineales son transformables a lineales

( V )
Indique V o F segn corresponda en los siguientes
enunciados:
29
( F )
( F )

También podría gustarte