Está en la página 1de 6

Correlacin 1.

- Definicin La correlacin trata de establecer la relacin o dependencia que existe entre las dos variables que intervienen en una distribucin bidimensional. Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables estn correlacionadas o que hay correlacin entre ellas. 2.- Tipos de Correlacin Correlacin positiva o directa: La correlacin directa se da cuando al aumentar una de las variables la otra aumenta. La recta correspondiente a la nube de puntos de la distribucin es una recta creciente.

Correlacin negativa o inversa: La correlacin inversa se da cuando al aumentar una de las variables la otra disminuye. La recta correspondiente a la nube de puntos de la distribucin es una recta decreciente.

Correlacin nula: La correlacin nula se da cuando no hay dependencia de ningn tipo entre las variables. En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma redondeada.

3.- Grados de Correlacin Correlacin fuerte: La correlacin ser fuerte cuanto ms cerca estn los puntos de la recta.

Correlacin dbil: La correlacin ser dbil cuanto ms separados estn los puntos de la recta.

4.- Medidas de Correlacin Coeficiente de Correlacin de Pearson El coeficiente de correlacin de Pearson es un ndice que mide la relacin lineal entre dos aleatorias cuantitativas. A diferencia de la covarianza, la correlacin de Pearson es independiente de la escala de medida de las variables. En el caso de que se est estudiando dos variables aleatorias x e y sobre una poblacin estadstica; el coeficiente de correlacin de Pearson se simboliza con la letra x,y, siendo la expresin que nos permite calcularlo:

Donde: y y y XY es la covarianza de (X,Y) X es la desviacin estndar de la variable X Y es la desviacin estndar de la variable Y

De manera anloga podemos calcular este coeficiente sobre un estadstico muestral, denotado como rxy a:

El valor del ndice de correlacin vara en el intervalo [-1,1]: y Si r = 1, existe una correlacin positiva perfecta. El ndice indica una dependencia total entre las dos variables denominada relacin directa: cuando una de ellas aumenta, la otra tambin lo hace en proporcin constante. Si 0 < r < 1, existe una correlacin positiva. Si r = 0, no existe relacin lineal. Pero esto no necesariamente implica que las variables son independientes: pueden existir todava relaciones no lineales entre las dos variables. Si -1 < r < 0, existe una correlacin negativa. Si r = -1, existe una correlacin negativa perfecta. El ndice indica una dependencia total entre las dos variables llamada relacin inversa: cuando una de ellas aumenta, la otra disminuye en proporcin constante.

y y

y y

Ejemplo: Una compaa de seguros considera que el nmero de vehculos (y) que circulan por una determinada autopista a ms de 120 km/h, puede ponerse en funcin del nmero de accidentes (x) que ocurren en ella. Durante 5 das obtuvo los siguientes resultados: Accidentes Xi N de Vehculos Yi 5 15 7 18 2 10 1 8 9 20

Construimos una tabla, teniendo en cuenta que la frecuencia absoluta es uno. Debemos conocer la media aritmtica de las dos variables, las varianzas, las desviaciones estndares y la covarianza. Media Aritmtica xi yi 5 7 2 1 9 24 Varianza xi2 15 18 10 8 20 71 25 49 4 1 81 160 yi2 225 324 100 64 400 1113 Covarianza xi * yi 75 126 20 8 180 409

fi 1 1 1 1 1 5

Se halla las medias aritmticas


 

Se hallan las varianzas y desviaciones estndar


Covarianza:


Correlacin lineal de Pearson:


XY X Y 13 64 2 993 4 578

0 995

0 995

Interpretacin La covariancia es positiva, entonces la correlacin es directa. Por lo tanto al aumentar la velocidad aumentar el nmero de accidentes. Coeficiente de Correlacin de Spearman El coeficiente de correlacin de Spearman, (ro) es una medida de la correlacin (la asociacin o interdependencia) entre dos variables aleatorias continuas. Para calcular , los datos son ordenados y reemplazados por su respectivo orden.
  

Donde: y y D: Diferencia entre los correspondientes estadsticos de orden de x - y. N: Nmero de parejas.

Ejemplo Se han analizado el coeficiente intelectual de 10 personas y el nmero de horas que miran televisin. El resultado fue el siguiente: Horas de TV a la semana 7 0 28 50 28 28 20 12 7 17

CI 106 86 100 100 99 103 97 113 113 110

Se ordenan los datos de la primera columna. Despus, se crean dos columnas ms. Ambas son para ordenar (establecer un lugar en la lista) de las dos primeras columnas. Despus se crea una columna "d" que muestra las diferencias entre las dos columnas de orden. Finalmente, se crea otra columna "d2". Esta ltima es slo la columna "d" al cuadrado.

CI (i) 86 97 99 100 100 103 106 110 113 113

Horas de TV a la semana (t) 0 20 28 50 28 28 7 17 7 12

orden(i) 1 2 3 4.5 4.5 6 7 8 9.5 9.5

orden(t) 1 6 8 10 8 8 2.5 5 2.5 4

d 0 4 5 5.5 3.5 2 4.5 3 7 5.5 40

d2 0 16 25 30.25 12.25 4 20.25 9 49 30.25 196

TOTAL

Para datos idnticos, se saca la media del nmero de orden que le correspondera si no lo fueran. Se aplica la formula de Correlacin de Spearman:
  

Interpretacin: La correlacin es negativa o inversa, por lo tanto: A ms coeficiente intelectual menos horas de TV

También podría gustarte