Documentos de Académico
Documentos de Profesional
Documentos de Cultura
c or re la c i n
tra ta
de
e sta b le ce r
la
re la ci n
de p e nd e n ci a q ue e xi ste e n tre la s d o s va ri ab l e s qu e in te r vi en e n
en un a dis tr i buc i n b idim e ns io na l .
Es d e ci r, d e te rm in a r si l o s cam bi o s en u n a de la s va ri ab l e s
in fl u ye n en lo s ca mb io s de la o tra . En ca so de qu e su ced a ,
di rem o s qu e la s va ri a b le s e st n co rre la ci o na d a s o q u e h a y
c orr e la c in e n tre e ll a s.
Tip os de c orr e la c i n
1 C or r e la c in dir e c ta
La co rrel a ci n d ire cta se da cu an d o al au me n ta r un a de
la s va ri ab l e s l a o tra a um en ta .
La re cta co rre sp o nd i en te a la nu b e d e pu n to s de l a
di stri b u ci n e s u n a re cta cre ci e n te .
2 C or r e la c in in ve r s a
La co rrel a ci n i n ve rsa se d a cu a n do a l au me n ta r un a de
la s va ri ab l e s l a o tra d i sm in u ye .
La re cta co rre sp o nd i en te a la nu b e d e pu n to s de l a
di stri b u ci n e s u n a re cta d e cre ci en te .
3 C or r e la c in nu la
La co rrel a ci n n ul a se d a cu a n do n o ha y de p e nd e n cia d e
ni n g n tip o e n tre l a s va ri a b le s.
En e ste ca so se di ce qu e l as va ria b l e s so n in co rrel a d a s y
la nu b e de pu n to s ti e n e un a fo rm a red o n de a d a .
Gr a do de c orr e la c in
El gr a do de c or r e lac i n in di ca l a p ro xi mi d ad q u e h a y
en tre l o s p u n to s de la n ub e d e p u n to s. Se p u ed e n da r tre s
ti po s:
1 . C or re la c i n fuer te
2 . C or re la c i n d bil
La co rre l a ci n se r d b il cua n to m s se p a rad o s e st n l o s
pu n to s d e l a re cta .
3 . C or re la c i n nula
Definicin
En el caso de que se est estudiando dos variables aleatorias x e y sobre una
poblacin estadstica; el coeficiente de correlacin de Pearson se simboliza con la
letra
, siendo la expresin que nos permite calcularlo:
Donde:
es la covarianza de
Int
erpretacin
El valor del ndice de correlacin vara en el intervalo [-1,1]:
Horas de TV a la semana
7
0
28
50
28
28
20
12
7
17
El primer paso es ordenar los datos de la primera columna. Despus, se crean dos
columnas ms. Ambas son para ordenar (establecer un lugar en la lista) de las dos
primeras columnas. Despus se crea una columna "d" que muestra las diferencias
entre las dos columnas de orden. Finalmente, se crea otra columna "d 2". Esta
ltima es slo la columna "d" al cuadrado.
Despus de realizar todo esto con los datos del ejemplo, se debera acabar con
algo como lo siguiente:
CI (i)
86
97
99
100
100
103
orden(i)
1
2
3
4.5
4.5
6
orden(t)
1
6
8
10
8
8
d
0
4
5
5.5
3.5
2
d2
0
16
25
30.25
12.25
4
106
110
113
113
7
17
7
12
7
8
9.5
9.5
2.5
5
2.5
4
4.5
3
7
5.5
20.25
9
49
30.25
Ntese como el nmero de orden de los valores que son idnticos es la media de
los nmeros de orden que les corresponderan si no lo fueran.
Los valores de la columna d2 pueden ser sumados para averiguar
El valor de n es 10. As que esos valores pueden ser sustitudos en la frmula.
De lo que resulta
.
Determinando la significacin estadstica