Está en la página 1de 14

23/06/2016

Estadstica y probabilidad

Lineal

Simple
Mltiple
Parablico

Regresin

Exponencial
No Lineal

Potencia
Logartmico
Etc.

23/06/2016

Anlisis de regresin lineal

Anlisis de Regresin Lineal


Se usa para determinar la relacin entre dos variables.
Supone una relacin entre la variable de respuesta, Y, la variable
X, que es una funcin lineal:

y
b0 b1 x

23/06/2016

Modelo de Regresin Lineal Simple

y
b0 b1 x

X
b0 es la interseccin con el eje Y.
b1 es la pendiente de la lnea

Anlisis de Regresin Simple - pasos


Existen muchas maneras de encarar un anlisis de correlacin. Nosotros
recomendamos la siguiente:
1.
2.
3.
4.
5.
6.

Elaborar el diagrama de dispersin


Calcular el coeficiente de correlacin.(Probar la Hiptesis)
Calcular el coeficiente de determinacin.
Hacer la prueba de significancia del modelo. .(Probar la Hiptesis)
Plantear el modelo.
Realizar estimaciones si el modelo es significativo.

Indudablemente, que el uso tanto del Excel o del SPSS, facilita los clculos.

23/06/2016

Ecuaciones de Mnimos Cuadrados


Ecuacin:

y
b0 b1 x
x y
x
y

x
x n
i

Pendiente:

b1

Corte con el eje Y:

b0 y b1 x

Diagrama de dispersin (nube de puntos)

Algo de relacin positiva

Mucha relacin negativa

Mucha relacin positiva

Poca relacin negativa

Ninguna relacin entre X e Y

23/06/2016

Valores de la variable dependiente

Diagrama de dispersin y la Ecuacin de estimacin


Observacin real
Desviacin

Desviacin

Desviacin
Desviacin

Desviacin
Desviacin

Desviacin

Punto en la lnea
de tendencia

Y a bx
Valores de la variable independiente

Coeficiente de Correlacin Lineal (R):


El coeficiente de correlacin lineal R mide el grado de afinidad
o asociacin entre dos variables cuando ellas estn relacionadas
mediante una lnea recta.
Se calcula de la siguiente forma:
R

n xi yi xi yi

n xi2 xi

n yi2 yi

23/06/2016

Correlacin
Respuestas: qu intensidad tiene la relacin lineal entre las
variables?

El coeficiente de correlacin se identifica normalmente como r .


Los valores varan entre -1 y +1 .
Mide el grado de asociacin.

Coeficiente de Correlacin
Correlacin negativa
perfecta

-1,0

Correlacin
positiva perfecta

Sin correlacin

-0,5

Aumento de la correlacin negativa

+0,5

+1,0

Aumento de la correlacin
positiva

23/06/2016

Coeficiente de correlacin y modelo de regresin


Y

r=1

r = -1
^

Y
^
Y =
i

X
Y

r = 0,89
^Y

X
Y

r=0
^

La Correlacin y su interpretacin
1.

El valor de r siempre est entre 1 y 1. Es decir 1 r 1.

2.

En la interpretacin clsica del coeficiente de correlacin, se


sostiene que si:
a) 0.00 r < 0.20, existe una correlacin no significativa
b) 0.20 r < 0.40, existe una correlacin baja
c) 0.40 r < 0.70, existe una significativa correlacin
d) 0.70 r < 1.00, existe un alto grado de asociacin

23/06/2016

Coeficiente de determinacin R2
Mide la bondad explicativa del modelo, es decir la capacidad del
modelo para explicar las variaciones en la variable dependiente
como consecuencia de cambios en la variable independiente
Cuando ms alto sea el valor de R2, mejor ser el modelo de
regresin lineal simple para explicar la variacin de la variable Y.

R2 = (coeficiente de correlacin)2 x 100


0 R2 1.

Anlisis Estadstico: Del Modelo


H0: 0=1=0: El modelo no es significativo,
Ha: al menos uno de ellos es diferente de cero: El modelo es significativo.
Se utiliza la prueba F, cuya frmula es la siguiente:

R2
Fc k 12
1 R
nk

donde: n = nmero de observaciones


k = nmero de parmetros en el modelo.
k-1 = grados de libertad del numerador
n-k = grados de libertad del denominador
Comparar con el valor de la distribucin F de la tabla:

Ft Fk1, n k

Si Fc > Ft se rechaza H0

23/06/2016

Anlisis Estadstico: De la pendiente del modelo: 1


H0: 1=0, Ha: 1 0.

Para probar la significancia de 1 se utiliza la prueba t, cuya frmula es la siguiente:


1
1
tc 1
tc

en el caso se desconozcan algunos valores, se calcula con la siguiente frmula:

tc

Fc

Luego comparar con el valor de la distribucin t de la tabla:

t t t n 2

Si tc > tt se rechaza H0
Se determina el intervalo de confianza para el parmetro 1:

1 t n2 1 1 t n2
1

Anlisis de correlacin - ejemplo


Copy SA, empresa que tiene una gran fuerza
de ventas, desea determinar si existe una
relacin entre el nmero de llamadas
telefnicas de venteas hechas en un mes, y
la cantidad de copiadoras vendidas durante
ese lapso. El gerente selecciona al azar una
muestra de 10 representantes, y determina
el nmero de tales llamadas que hizo cada
uno en el mes anterior y la cantidad de
productos vendidos.

Vendedor
V
V
V
V
V
V
V
V
V
V

01
02
03
04
05
06
07
08
09
10

N de
llamadas
20
40
20
30
10
10
20
20
20
30

N
copiadoras
vendidas
30
60
40
60
30
40
40
50
30
70

23/06/2016

Diagrama de dispersin - Excel


N copiadoras vendidas

Se observa que los datos


siguen una determinada
tendencia. Por lo tanto
amerita hacer el anlisis de
correlacin
correspondiente.

80
70
60
50
40
30
20
10
0
0

10

20

30

40

50

Coeficiente de correlacin y determinacin con Excel


N de llamadas
N de llamadas
N copiadoras vendidas

1
0.759014109

N copiadoras vendidas
1

r = 0.759 lo que indica que existe una fuerte correlacin.

Calculando el coeficiente de determinacin:


r= (0.759)= 0.576 esto nos indica que el 57.6% de las ventas de fotocopiadoras es explicada por
las llamadas realizados por los vendedores.

10

23/06/2016

Anlisis de regresin con Excel


Resumen
Estadsticas de la regresin
Coeficiente de correlacin mltiple
0.75901411
Coeficiente de determinacin R^2
0.57610242
R^2 ajustado
0.52311522
Error tpico
9.900824
Observaciones
10

Y = 18.947 + 1.184 X

ANLISIS DE VARIANZA
Grados de
libertad
Regresin
Residuos
Total

1
8
9

Coeficientes
Intercepcin
N de llamadas

Promedio de
los
cuadrados
1065.78947 1065.78947
784.210526 98.0263158
1850

Suma de
cuadrados

18.9473684
1.18421053

Error tpico

F
10.8724832

Valor crtico
de F
0.01090193

Estadstico t Probabilidad Inferior 95%

8.49881856
0.35914063

2.22941204
3.29734487

0.05634865 -0.65095499
0.01090193 0.35603021

Superior
95%

Inferior
95.0%

38.5456918 -0.65095499
2.01239085 0.35603021

Anlisis de regresin con Excel

N copiadoras vendidas

N de llamadas Curva de regresin ajustada


80
70
60
50
40
30
20
10
0
0

10

20

30

40

50

N de llamadas

11

23/06/2016

Anlisis de regresin mltiple


En el anlisis de regresin simple, se relaciona una variable dependiente (Y) con una variable independiente (X).
Ahora analizaremos funciones que relacionan a dos o mas variables independientes (X1, X2, Xn). A este analisis, se le
llama regresin multiple.
La funcin matemtica para una regresin mltiple es:

Y = a + b1 X1 + b2 X2 + b3 X3 + .+ bn Xn
Donde a es la intercepcin Y
Donde b1, b2, b3 y bn son coeficientes de regresin.
Estos tipos de problemas, los resolveremos utilizando el Excel

Forma General de resultados presentado por MS Excel


Resumen
Estadsticas de la regresin
Coef iciente de correlacin mltiple

R
R2

Coef iciente de determinacin R^2


R^2 ajustado

R ajust.

Error tpico

Se

Observaciones

ANLISIS DE VARIANZA H0: 0= 1=...= p =0


Grados de
lib ertad
Regresin
Residuos

Variable Independiente 2

Valor crtico
de F

MSR / MSE

Probabilidad

SSR

MSR = SSR / p

SSE

MSE = SSE / (n p 1)

n1

SST

0
1
2

....
Variable Independiente k

Coeficientes

Variable Independiente 1

Promedio de los
cuadrados

np1

Total

Intercepcin

Suma de
cuadrados

...

Error tpico

...
p

Estadstico t

Prob ab ilidad

t0

p0

t1

p1

t2

p2

...

...
pp

tp

Inferior 95%

0 t nk
1 t nk
2 t nk

Superior 95%
0

...

0 t nk
1 t nk
2 tn k

...

p tn k p t n k
p

12

23/06/2016

Anlisis de regresin mltiple - Ejemplo


Casa

La empresa Salsberry Realty vende


casas en la costa este de EEUU. Una
de las preguntas que los posibles
compradores hacen con mas
frecuencia es: Si adquirimos este
inmueble, cunto tendramos que
pagar por su calefaccin durante
este invierno?. Para responder esta
pregunta se consideraron tres
variables, para esto se selecciono
una muestra de 20 inmuebles recin
vendidos.

Costo de
Temperatur
calecfaccion a exterior

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

250
360
165
43
92
200
355
290
230
120
73
205
400
320
72
272
94
190
235
139

35
29
36
60
65
30
10
7
21
55
54
48
20
39
60
20
58
40
27
30

Aislamiento Antigedad
en el
del
desvan
calefactor
3
6
4
10
7
3
6
9
5
6
5
5
6
7
10
10
9
11
2
5
12
4
5
1
5
15
4
7
8
6
5
8
7
3
8
11
9
8
7
5

Anlisis de regresin mltiple Solucin con Excel


Y = 417.29 - 4.58 X1 14.83 X2 + 6.10 X3
Resumen
Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones

0.8967553
0.80417007
0.76745195
51.0485536
20

ANLISIS DE VARIANZA
Grados de
libertad
Regresin
Residuos
Total

Intercepcin
Temperatura exterior
Aislamiento en el desvan
Antigedad del calefactor

Suma de
cuadrados
3
16
19

171220.473
41695.2772
212915.75

Coeficientes

Error tpico

427.193803
-4.58266263
-14.8308627
6.10103206

59.6014293
0.77231935
4.75441228
4.01212017

Promedio de
los
cuadrados
57073.4909
2605.95482

Estadstico t
7.16750937
-5.93363692
-3.11938928
1.52065038

F
21.901182

Probabilidad
2.2376E-06
2.1004E-05
0.00660596
0.14786248

Valor crtico
de F
6.5618E-06

Inferior 95%

Superior
95%

Inferior
95.0%

300.844446
-6.21990615
-24.9097642
-2.40428082

553.543161
-2.94541911
-4.75196117
14.6063449

300.844446
-6.21990615
-24.9097642
-2.40428082

13

23/06/2016

14

También podría gustarte