Está en la página 1de 14

23/06/2016

Estadstica y probabilidad

Simple
Lineal
Mltiple

Regresin Parablico
Exponencial
No Lineal Potencia
Logartmico
Etc.

1
23/06/2016

Anlisis de regresin lineal

Anlisis de Regresin Lineal

Se usa para determinar la relacin entre dos variables.

Supone una relacin entre la variable de respuesta, Y, la variable


X, que es una funcin lineal:

b0 b1 x
y

2
23/06/2016

Modelo de Regresin Lineal Simple


b0 b1 x
y
Y

b0 es la interseccin con el eje Y.


b1 es la pendiente de la lnea

Anlisis de Regresin Simple - pasos

Existen muchas maneras de encarar un anlisis de correlacin. Nosotros


recomendamos la siguiente:

1. Elaborar el diagrama de dispersin


2. Calcular el coeficiente de correlacin.(Probar la Hiptesis)
3. Calcular el coeficiente de determinacin.
4. Hacer la prueba de significancia del modelo. .(Probar la Hiptesis)
5. Plantear el modelo.
6. Realizar estimaciones si el modelo es significativo.
Indudablemente, que el uso tanto del Excel o del SPSS, facilita los clculos.

3
23/06/2016

Ecuaciones de Mnimos Cuadrados

Ecuacin: y b0 b1 x
x y
x y
n
i i
i i

Pendiente: b1
x
x n
2
2 i
i

Corte con el eje Y: b0 y b1 x

Diagrama de dispersin (nube de puntos)

Algo de relacin positiva Mucha relacin positiva Poca relacin negativa

Mucha relacin negativa Ninguna relacin entre X e Y

4
23/06/2016

Diagrama de dispersin y la Ecuacin de estimacin

Observacin real
Valores de la variable dependiente

Desviacin

Desviacin Desviacin

Desviacin
Desviacin

Desviacin
Desviacin Punto en la lnea
de tendencia
Y a bx
Valores de la variable independiente

Coeficiente de Correlacin Lineal (R):

El coeficiente de correlacin lineal R mide el grado de afinidad


o asociacin entre dos variables cuando ellas estn relacionadas
mediante una lnea recta.
Se calcula de la siguiente forma:

n xi yi xi yi
R
n xi2 xi n yi2 yi
2 2

5
23/06/2016

Correlacin
Respuestas: qu intensidad tiene la relacin lineal entre las
variables?

El coeficiente de correlacin se identifica normalmente como r .


Los valores varan entre -1 y +1 .
Mide el grado de asociacin.

Coeficiente de Correlacin
Correlacin negativa Correlacin
perfecta Sin correlacin positiva perfecta

-1,0 -0,5 0 +0,5 +1,0

Aumento de la correlacin negativa Aumento de la correlacin


positiva

6
23/06/2016

Coeficiente de correlacin y modelo de regresin

Y r=1 Y r = -1
Y ^ = a + b X
i i
^
Y = a + b X
i i

X X

Y r = 0,89 Y r=0

^Y = a + b X Y^ = a + b X
i i i i

X X

La Correlacin y su interpretacin
1. El valor de r siempre est entre 1 y 1. Es decir 1 r 1.
2. En la interpretacin clsica del coeficiente de correlacin, se
sostiene que si:
a) 0.00 r < 0.20, existe una correlacin no significativa
b) 0.20 r < 0.40, existe una correlacin baja
c) 0.40 r < 0.70, existe una significativa correlacin
d) 0.70 r < 1.00, existe un alto grado de asociacin

7
23/06/2016

Coeficiente de determinacin R2
Mide la bondad explicativa del modelo, es decir la capacidad del
modelo para explicar las variaciones en la variable dependiente
como consecuencia de cambios en la variable independiente
Cuando ms alto sea el valor de R2, mejor ser el modelo de
regresin lineal simple para explicar la variacin de la variable Y.
R2 = (coeficiente de correlacin)2 x 100
0 R2 1.

Anlisis Estadstico: Del Modelo


H0: 0=1=0: El modelo no es significativo,
Ha: al menos uno de ellos es diferente de cero: El modelo es significativo.
Se utiliza la prueba F, cuya frmula es la siguiente:

R2
Fc k 12
1 R
nk
donde: n = nmero de observaciones
k = nmero de parmetros en el modelo.
k-1 = grados de libertad del numerador
n-k = grados de libertad del denominador
Comparar con el valor de la distribucin F de la tabla: Ft Fk1, n k
Si Fc > Ft se rechaza H0

8
23/06/2016

Anlisis Estadstico: De la pendiente del modelo: 1


H0: 1=0, Ha: 1 0.
Para probar la significancia de 1 se utiliza la prueba t, cuya frmula es la siguiente:
1 1
tc 1 tc
1 1

en el caso se desconozcan algunos valores, se calcula con la siguiente frmula:


tc Fc
Luego comparar con el valor de la distribucin t de la tabla:
t t t n 2
Si tc > tt se rechaza H0
Se determina el intervalo de confianza para el parmetro 1:

1 t n2 1 1 t n2
1 1

Anlisis de correlacin - ejemplo


Copy SA, empresa que tiene una gran fuerza N
N de
Vendedor copiadoras
de ventas, desea determinar si existe una llamadas
vendidas
relacin entre el nmero de llamadas V 01 20 30
telefnicas de venteas hechas en un mes, y V 02 40 60
la cantidad de copiadoras vendidas durante V 03 20 40
ese lapso. El gerente selecciona al azar una V 04 30 60
muestra de 10 representantes, y determina V 05 10 30
el nmero de tales llamadas que hizo cada V 06 10 40
V 07 20 40
uno en el mes anterior y la cantidad de V 08 20 50
productos vendidos. V 09 20 30
V 10 30 70

9
23/06/2016

Diagrama de dispersin - Excel


N copiadoras vendidas

80
Se observa que los datos
70
siguen una determinada
60 tendencia. Por lo tanto
50 amerita hacer el anlisis de
40 correlacin
30
correspondiente.
20
10
0
0 10 20 30 40 50

Coeficiente de correlacin y determinacin con Excel


N de llamadas N copiadoras vendidas
N de llamadas 1
N copiadoras vendidas 0.759014109 1

r = 0.759 lo que indica que existe una fuerte correlacin.

Calculando el coeficiente de determinacin:

r= (0.759)= 0.576 esto nos indica que el 57.6% de las ventas de fotocopiadoras es explicada por
las llamadas realizados por los vendedores.

10
23/06/2016

Anlisis de regresin con Excel


Resumen

Estadsticas de la regresin Y = 18.947 + 1.184 X


Coeficiente de correlacin mltiple 0.75901411
Coeficiente de determinacin R^2 0.57610242
R^2 ajustado 0.52311522
Error tpico 9.900824
Observaciones 10

ANLISIS DE VARIANZA
Promedio de
Grados de Suma de Valor crtico
los F
libertad cuadrados de F
cuadrados
Regresin 1 1065.78947 1065.78947 10.8724832 0.01090193
Residuos 8 784.210526 98.0263158
Total 9 1850

Superior Inferior
Coeficientes Error tpico Estadstico t Probabilidad Inferior 95%
95% 95.0%
Intercepcin 18.9473684 8.49881856 2.22941204 0.05634865 -0.65095499 38.5456918 -0.65095499
N de llamadas 1.18421053 0.35914063 3.29734487 0.01090193 0.35603021 2.01239085 0.35603021

Anlisis de regresin con Excel


N de llamadas Curva de regresin ajustada

80
N copiadoras vendidas

70
60
50
40
30
20
10
0
0 10 20 30 40 50
N de llamadas

11
23/06/2016

Anlisis de regresin mltiple


En el anlisis de regresin simple, se relaciona una variable dependiente (Y) con una variable independiente (X).
Ahora analizaremos funciones que relacionan a dos o mas variables independientes (X1, X2, Xn). A este analisis, se le
llama regresin multiple.
La funcin matemtica para una regresin mltiple es:

Y = a + b1 X1 + b2 X2 + b3 X3 + .+ bn Xn
Donde a es la intercepcin Y
Donde b1, b2, b3 y bn son coeficientes de regresin.
Estos tipos de problemas, los resolveremos utilizando el Excel

Forma General de resultados presentado por MS Excel


Resumen

Estadsticas de la regresin
Coef iciente de correlacin mltiple R
Coef iciente de determinacin R^2 R2
2
R^2 ajustado R ajust.
Error tpico Se
Observaciones n

ANLISIS DE VARIANZA H0: 0= 1=...= p =0


Grados de Suma de Promedio de los Valor crtico
lib ertad cuadrados cuadrados F de F
Regresin p SSR MSR = SSR / p MSR / MSE Probabilidad
Residuos np1 SSE MSE = SSE / (n p 1)
Total n1 SST

Coeficientes Error tpico Estadstico t Prob ab ilidad Inferior 95% Superior 95%
Intercepcin 0 0
t0 p0 0 t nk 0 t nk

0 0

Variable Independiente 1 1 1
t1 p1 1 t nk 1 t nk

1 1

Variable Independiente 2 2 2
t2 p2 2 t nk
2
2 tn k 2

.... ... ... ... ... ... ...


Variable Independiente k p p
tp pp p tn k p t n k
p p

12
23/06/2016

Anlisis de regresin mltiple - Ejemplo


Aislamiento Antigedad
Costo de Temperatur
Casa en el del
La empresa Salsberry Realty vende calecfaccion a exterior
desvan calefactor
casas en la costa este de EEUU. Una 1 250 35 3 6
2 360 29 4 10
de las preguntas que los posibles 3 165 36 7 3
compradores hacen con mas 4 43 60 6 9
5 92 65 5 6
frecuencia es: Si adquirimos este 6 200 30 5 5
inmueble, cunto tendramos que 7 355 10 6 7
pagar por su calefaccin durante 8 290 7 10 10
9 230 21 9 11
este invierno?. Para responder esta 10 120 55 2 5
pregunta se consideraron tres 11 73 54 12 4
12 205 48 5 1
variables, para esto se selecciono 13 400 20 5 15
una muestra de 20 inmuebles recin 14 320 39 4 7
15 72 60 8 6
vendidos. 16 272 20 5 8
17 94 58 7 3
18 190 40 8 11
19 235 27 9 8
20 139 30 7 5

Anlisis de regresin mltiple Solucin con Excel


Y = 417.29 - 4.58 X1 14.83 X2 + 6.10 X3

Resumen

Estadsticas de la regresin
Coeficiente de correlacin mltiple 0.8967553
Coeficiente de determinacin R^2 0.80417007
R^2 ajustado 0.76745195
Error tpico 51.0485536
Observaciones 20

ANLISIS DE VARIANZA
Promedio de
Grados de Suma de Valor crtico
los F
libertad cuadrados de F
cuadrados
Regresin 3 171220.473 57073.4909 21.901182 6.5618E-06
Residuos 16 41695.2772 2605.95482
Total 19 212915.75

Superior Inferior
Coeficientes Error tpico Estadstico t Probabilidad Inferior 95%
95% 95.0%

Intercepcin 427.193803 59.6014293 7.16750937 2.2376E-06 300.844446 553.543161 300.844446


Temperatura exterior -4.58266263 0.77231935 -5.93363692 2.1004E-05 -6.21990615 -2.94541911 -6.21990615
Aislamiento en el desvan -14.8308627 4.75441228 -3.11938928 0.00660596 -24.9097642 -4.75196117 -24.9097642
Antigedad del calefactor 6.10103206 4.01212017 1.52065038 0.14786248 -2.40428082 14.6063449 -2.40428082

13
23/06/2016

14

También podría gustarte