Está en la página 1de 35

COEFICIENTE DE CORRELACIN Y DETERMINACIN

A. COEFICIENTE DE CORRELACIN:

1. Definicin:
El coeficiente de correlacin es un ndice que se utiliza para determinar si existe
una relacin entre X y Y, indica el grado en el cual la variacin de una
variable(X) se relaciona con la variacin de otra variable (Y).
El anlisis de correlacin es un conjunto de tcnicas estadsticas, empleadas para
medir la intensidad de la asociacin entre dos variables.
En probabilidad y estadstica, la correlacin indica la fuerza y la direccin de una
relacin lineal entre dos variables aleatorias. Se considera que dos variables
cuantitativas estn correlacionadas cuando los valores de una de ellas varan
sistemticamente con respecto a los valores homnimos de la otra: si tenemos
dos variables (A y B) existe correlacin si al aumentar los valores de A lo hacen
tambin los de B y viceversa. La correlacin entre dos variables no implica, por s
misma, ninguna relacin de causalidad.

2. Objetivo del anlisis:
El principal objetivo del anlisis del coeficiente de correlacin consiste en
determinar qu tan intensa es la relacin entre las variables dadas.
3. Propiedades de r:

Como r siempre positivo, resulta que la propiedad fundamental del
coeficiente de correlacin es:
-1 r +1





Donde se deduce que:
a) Si r >0, entonces existe correlacin directa positiva
b) Si r<0, se trata de una correlacin de inversa colectiva
c) Si r
2
=1, los datos forman una lnea recta, en el caso de correlacin
rectilnea.
d) Si r=+1, hay una correlacin perfecta colectiva.
e) Si r=-1, hay una correlacin perfecta negativa
f) Si r=0, los datos son incorrelacionados.

El signo de r es el mismo que el signo de b (coeficiente angular) de la
ecuacin Y*= a + bX.
En la interpretacin clsica del coeficiente de correlacin, se sostiene que si:
a) 0.00 r< 0.20 existe correlacin no significativa
b) 0.20 r< 0.40 existe una correlacin baja.
c) 0.40 r< 0.70 existe una significativa correlacin.
d) 0.70 r< 1.00 existe alto grado de asociacin.
Sin embargo, estos valores resultan arbitrarios, puesto que depender de la
naturaleza del problema que se investiga, as como el tamao de la muestra.
4. Diagrama de dispersin:

El primer paso a seguir para ver si existe relacin entre dos variables es
examinar la grfica de los datos observados o conocidos. Esta grafica o
esquema se llama diagrama de dispersin.
Un diagrama de dispersin nos puede dar dos tipos de informacin:
a. Visualmente podemos buscar patrones que indican que las variables
estn relacionadas.



b. Si esto sucede podemos ver qu tipo de ecuacin de estimacin
describe esta relacin.
El diagrama de dispersin es un medio visual para probar la fuerza posible
de relacin entre dos variables.


Modelo lineal:
Mediante frmulas paramtricas sin utilizar media aritmtica de las
variables.
Ecuacin de ajuste:




Parmetro de posicin:


(

)( ) ()()


()




Parmetro de dispersin o inclinacin:


()()()
(

) ()










Coeficiente de correlacin:


()()
[

()

][

()

]



El coeficiente de correlacin para cualquier mtodo sern los mismos, lo
importante es el contenido o significado que tiene el coeficiente de
correlacin (R).


Ejemplo:
Se realiza un estudio de mercado, con la finalidad de determinar la demanda del
producto (calzado) en un determinado mercado; para lo cual tenemos los
siguientes dados:











Aos demanda
1995
1996
1997
1998
1999
2000
2100
2000
3200
3100
4500
4900



1paso se procede a realizar el diagrama de dispersin:



2 Luego calculamos los valores de:

aos n x Demanda(y) xy X
2
Y
2
1995
1996
1997
1998
1999
2000
1
2
3
4
5
6
1
2
3
4
5
6
2100
2000
3200
3100
4500
4900
2100
4000
9600
12400
22500
29400
1
4
9
16
25
36
4410000
4000000
10240000
9610000
20250000
24010000
21 19800 80000 91 72520000
0
1000
2000
3000
4000
5000
6000
1994 1995 1996 1997 1998 1999 2000 2001
DEMANDA
AOS
Digrama de dispersion de la Demanda
demanda




3 Se procede a encontrar el modelo lineal:
Formula lineal:
Y = a+ bx


Frmula para encontrar (a):


(

)() ()()
(

) ()




Reemplazando

()() ()()
() ()




Frmula para encontrar (b):


() ()()

()







Reemplazando:


() ()()
() ()



Reemplazo en la ecuacin de ajuste: Y = a+bX
Y =1160 + 611.4 (X)















Aos D.H. ajuste
1
2
3
4
5
6
7
8
9
10
1771.4
2382.8
2994.2
3605.6
4217
4828.4
5437
6048
6663
7274



La grafica de proyeccin:


Frmula para realizar el coeficiente de correlacin:


()()
[

()

][

()

]



Se reemplaza:

() ()()
[()

][() ()

]



0
1000
2000
3000
4000
5000
6000
7000
8000
1994 1996 1998 2000 2002 2004 2006
DEMANDA
AOS
D.H. AJUSTADA
demanda
demanda ajustada








Si R =0.95, significa que el modelo se ajusta a la informacin histrica en
un grado de asociacin igual a 95 y que existe una dispersin de datos
histricos respecto a la curva de ajuste en un grado 5

Encontramos el coeficiente de determinacin (R
2
) .Solo se eleva al
cuadrado al coeficiente de correlacin:


()()
[

()

][

()

]




R
2
= 0.90


R
2
=significa que el 90% de la varianza de y es explicada por la varianza de x;
es decir que la influencia que x sobre y es de 90%. Todo esto nos indica que el
modelo se ajusta a la nube de puntos en un grado de 95 pero la variable x
explica a la variable y en tan solo 90%.



2



Ejemplo n 2
Al gerente de la compaa Telefnica le gustara hacer notar en la prxima junta
el aumento de telfonos vendidos. Para ello decide reunir informacin acerca de la
de la demanda de telfonos en los ltimos 10 aos:





















Aos DEMANDA
2001 1352.00
2002 1434.96
2003 1566.73
2004 1300.50
2005 1831.00
2006 1867.60
2007 2069.50
2008 1947.00
2009 2257.50
2010 2409.30



1paso se procede a realizar el diagrama de dispersin:


2 Luego calculamos los valores de:

AOS n X Y(demanda) XY X
2
Y
2
2001 1 1 1352.00 1352.00 1 1,827,904
2002 2 2 1434.96 2869.92 4 2,059,110
2003 3 3 1566.73 4700.19 9 2,454,643
2004 4 4 1300.50 5202.00 16 1,691,300
2005 5 5 1831.00 9155.00 25 3,352,561
2006 6 6 1867.60 11205.60 36 3,487,930
2007 7 7 2069.50 14486.50 49 4,282,830
2008 8 8 1947.00 15576.00 64 3,790,809
2009 9 9 2257.50 20317.50 81 5,096,306
2010 10 10 2409.30 24093.00 100 5,804,727
0
500
1000
1500
2000
2500
3000
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
D
E
M
A
N
D
A

AOS
DIAGRAMA DE DISPERSION
Demanda



10 55 18036.09 108957.71 385 33848120

3 Se procede a encontrar el modelo lineal:
Formula lineal:

Y = a+ bx


Frmula para encontrar (a):


(

)() ()()
(

) ()




Reemplazando

()( ) ()( )
() ()










Frmula para encontrar (b):



() ()()

()




Reemplazando:


() ()()
() ()




Reemplazo en la ecuacin de ajuste: Y = a + bx

Y =1152.994 + 118.293(x)



































AOS D.H.
AJUSTE
1 1271.287
2 1389.58
3 1507.873
4 1626.166
5 1744.459
6 1862.752
7 1981.045
8 2099.338
9 2217.631
10 2335.924
11 2454.217
12 2572.51
13 2690.803



La grafica de proyeccin:




Frmula para realizar el coeficiente de correlacin:


()()
[

()

][

()

]






0
500
1000
1500
2000
2500
3000
1 2 3 4 5 6 7 8 9 10 11 12 13
DEMANDA
AOS
DEMANDA AJUSTADA
DEMANDA
DEMANDA AJUSTADA



Se reemplaza:


( ) ()( )
[()

][() ( )

]









Si R =0.93, significa que el modelo se ajusta a la informacin histrica en
un grado de asociacin igual a 93 y que existe una dispersin de datos
histricos respecto a la curva de ajuste en un grado de 7

Encontramos el coeficiente de determinacin (R
2
) .Solo se eleva al
cuadrado al coeficiente de correlacin:

()()
[

()

][

()

]




R
2
= 0.86

R
2
=significa que el 86% de la varianza de y es explicada por la varianza de x;
es decir que la influencia que x sobre y es de 86%. Todo esto nos indica que el
modelo se ajusta a la nube de puntos en un grado de 93 pero la variable x
explica ala variable y en tan solo 86%.
2



Ejemplo n 3
Segn un estudio tcnico econmico para la instalacin de una nueva planta
productora de cocinas a gas, a instalarse en la ciudad de Trujillo, se requiere
realizar un estudio de mercado con la finalidad de determinar la demanda dirigida
este nuevo proyecto para lo cual se cuenta con la siguiente informacin:

AOS DEMANDA
2006 60600
2007 66300
2008 62600
2009 74400
2010 76400
2011 78200

1paso se procede a realizar el diagrama de dispersin:










0
10000
20000
30000
40000
50000
60000
70000
80000
90000
2006 2007 2008 2009 2010 2011
DEMANDA
AOS
DIAGRAMA DE DISPERSION
DEMANDA




2 Luego calculamos los valores de:

AOS n X Y(demanda) XY X
2
Y
2
2006 1 1 60,600 60,600 1 3,672,360,000
2007 2 2 66,300 132,600 4 4,395,690,000
2008 3 3 62,600 187,800 9 3,918760,000
2009 4 4 64,400 297,600 16 4,147,360,00
2010 5 5 76,400 382,000 25 5,836,960,000
2011 6 6 72,200 469,200 36 5,212,840,000
6 21 418,500 1529,800 91 29,474,370,000


3 Se procede a encontrar el modelo lineal:
Formula lineal:

Y = a+ bx


Frmula para encontrar (a):


(

)() ()()
(

) ()









Reemplazando

()() ()()
() ()





Frmula para encontrar (b):


() ()()

()





Reemplazando:


() ()()
() ()






Reemplazo en la ecuacin de ajuste: Y = a + Bx

Y =56740 + 3717.14(x)























AOS D.H. AJUSTE
1 60457
2 64174
3 67891
4 71609
5 75326
6 79043
7 82760
8 86477
9 90194



La grafica de proyeccin:




Frmula para realizar el coeficiente de correlacin:


()()
[

()

][

()

]





0
10000
20000
30000
40000
50000
60000
70000
80000
90000
100000
1 2 3 4 5 6 7 8 9
DEMANDA
AOS
DEMANDA
DEMANDA AJUSTADA



Se reemplaza:


() ()()
[()

][() ()




Si R =0.92, significa que el modelo se ajusta a la informacin histrica en
un grado de asociacin igual a 92 y que existe una dispersin de datos
histricos respecto a la curva de ajuste en un grado de 8

Encontramos el coeficiente de determinacin (R
2
) .Solo se eleva al
cuadrado al coeficiente de correlacin:

()()
[

()

][

()

]




R
2
= 0.85

R
2
=significa que el 85% de la varianza de y es explicada por la varianza de x;
es decir que la influencia que x sobre y es de 85%. Todo esto nos indica que el
modelo se ajusta a la nube de puntos en un grado de 92 pero la variable x
explica ala variable y en tan solo 85%.
2



Ejercicio n 4:
Un economista realiza un estudio acerca de la oferta de zapatos en el distrito del
porvenir con la finalidad de determinar la oferta del producto para ello cuenta con
la siguiente informacin:

AOS OFERTA
2006 32300
2007 32700
2008 30800
2009 33300
2010 36100
2011 38400

1paso se procede a realizar el diagrama de dispersin:



0
5000
10000
15000
20000
25000
30000
35000
40000
45000
2006 2007 2008 2009 2010 2011
OFERTA
AOS
DIAGRAMA DE DISPERSION
OFERTA



2 Luego calculamos los valores de:
AOS n X Y(oferta) XY X
2
Y
2
2006 1 1 32300 32300 1 1,043,290,000
2007 2 2 32700 65400 4 1,069,290,000
2008 3 3 30800 92400 9 948,640,000
2009 4 4 33300 133200 16 1,108,890,000
2010 5 5 36100 180500 25 1,303,210,000
2011 6 6 38400 230400 36 1,474,560,000
6 21 203,600 734200 91 6,947,880,000


3 Se procede a encontrar el modelo lineal:
Formula lineal:

Y = a+ bx


Frmula para encontrar (a):


(

)() ()()
(

) ()




Reemplazando

()() ()()
() ()












Frmula para encontrar (b):



() ()()

()




Reemplazando:


() ()()
() ()




Reemplazo en la ecuacin de ajuste: Y = a + bx

Y =29613.3 + 1234.2(x)































AOS O.H. AJUSTE
1 30847.5
2 32081.7
3 33315.9
4 34550.1
5 35784.3
6 37018.5
7 38252.7
8 39486.9
9 40721.1



La grafica de proyeccin:




Frmula para realizar el coeficiente de correlacin:


()()
[

()

][

()

]







0
5000
10000
15000
20000
25000
30000
35000
40000
45000
1 2 3 4 5 6 7 8 9
OFERTA
AOS
O.H.AJUSTADA
OFERTA
OFERTA AJUSTADA



Se reemplaza:



() ()()
[()

][() ()




Si R =0.83, significa que el modelo se ajusta a la informacin histrica en
un grado de asociacin igual a 83 y que existe una dispersin de datos
histricos respecto a la curva de ajuste en un grado de 7

Encontramos el coeficiente de determinacin (R
2
) .Solo se eleva al
cuadrado al coeficiente de correlacin:

()()
[

()

][

()

]



R
2
= 0.69


R
2
=significa que el 69% de la varianza de y es explicada por la varianza de x;
es decir que la influencia que x sobre y es de 69%. Todo esto nos indica que el
modelo se ajusta a la nube de puntos en un grado de 83 pero la variable x
explica ala variable y en tan solo 69%.

2



EJERCICIO N 5
El administrador de la empresa coca - cola realiza un estudio acerca del mercado de
gaseosas en la ciudad de Chiclayo con la finalidad de determinar la oferta del producto
para ello cuenta con la siguiente informacin:

AOS OFERTA
2005 30600
2006 36300
2007 32600
2008 40400
2009 46400
2010 48200


1paso se procede a realizar el diagrama de dispersin:

0
10000
20000
30000
40000
50000
60000
2005 2006 2007 2008 2009 2010
OFERTA
AOS
GRAFICO DE DISPERSION
OFERTA



2 Luego calculamos los valores de:

AOS n X Y(oferta) XY X
2
Y
2
2005 1 1 30,600 30600 1 936360000
2006 2 2 36,300 72600 4 1317690000
2007 3 3 32,600 97800 9 1062760000
2008 4 4 40,400 161600 16 1632160000
2009 5 5 46,400 232000 25 2152960000
2010 6 6 48,200 289200 36 2323240000
6 21 234500 883800 91 9425170000

3 Se procede a encontrar el modelo lineal:
Formula lineal:

Y = a+ bx


Frmula para encontrar (a):


(

)() ()()
(

) ()





Reemplazando

()() ()()
() ()





Frmula para encontrar (b):


() ()()

()




Reemplazando:


() ()
() ()





Reemplazo en la ecuacin de ajuste: Y = a + Bx

Y =26473.33 + 3602.85(x)













LA GRAFICA DE PROYECCIN:



0
10000
20000
30000
40000
50000
60000
70000
1 2 3 4 5 6 7 8 9
OFERTA
AOS
O.H. AJUSTADA
0FERTA
OFERTA AJUSTADA
AOS O.H. AJUSTE
1 30076.18
2 33679.03
3 37281.88
4 40884.73
5 44487.58
6 48090.43
7 51693.28
8 55296.13
9 58898.98



Frmula para realizar el coeficiente de correlacin:


()()
[

()

][

()

]



Se reemplaza:


() ()()
[()

][() ()




Si R =0.93, significa que el modelo se ajusta a la informacin histrica en
un grado de asociacin igual a 93 y que existe una dispersin de datos
histricos respecto a la curva de ajuste en un grado de 7

Encontramos el coeficiente de determinacin (R
2
) .Solo se eleva al
cuadrado al coeficiente de correlacin:

()()
[

()

][

()

]




2




R
2
= 0.86

R
2
=significa que el 86% de la varianza de y es explicada por la varianza de x;
es decir que la influencia que x sobre y es de 86%. Todo esto nos indica que el
modelo se ajusta a la nube de puntos en un grado de 93 pero la variable x
explica ala variable y en tan solo 86%.






















BIBLIOGRAFA:
ESTADISTICA DESCRIPTIVA Moya Caldern Rufino
ESTADSTICA Murray Spiegel
ESTADSTICA PARA ADMINISTRACIN Y ECONOMA Mason/
Lind / Marchal.
ESTADISTICA DESCRIPTIVA Jos Montero Lorenzo.
ELEMENTOS BSICOS DE LA ESTADISTICA ECONOMICA Y
EMPRESARIAL F. J. Barn Lpez
ESTADSTICA ELEMENTAL vila acosta R.B.

También podría gustarte