Está en la página 1de 7

CORRELACION DE PEARSON:

El coeficiente de correlacin de Pearson es un ndice estadstico que mide la relacin lineal entre dos variables cuantitativas. A diferencia de la covarianza, la correlacin de Pearson es independiente de la escala de medida de las variables. El clculo del coeficiente sagas g de correlacin lineal se realiza dividiendo la covariancia por el producto de las desviaciones estndar de ambas variables:

La formula suele aparecer expresada como: -La primera expresin se resuelve utilizando la covarianza y las desviaciones tpicas de las dos variables (en su forma insesgada). -La segunda forma se utiliza cuando partimos de las puntuaciones tpicas empricas. Este estadstico, refleja el grado de relacin lineal que existe entre dos variables. El resultado numrico flucta entre los rangos de +1 a -1.
Tras

realizar el clculo del coeficiente de correlacin de Pearson (r) debemos determinar si dicho coeficiente es estadsticamente diferente de cero. Para dicho calculo se aplica un Tes. basado en la distribucin de la t de student.

Si el valor del r calculado (en el ejemplo previo r = 0.885) supera al valor del error estndar multiplicado por la t de Student con n-2 grados de libertad, diremos que el coeficiente de correlacin es significativo. El nivel de significacin viene dado por la decisin que adoptemos al buscar el valor en la tabla de la t de Student. En el ejemplo previo con 20 nios, los grados de libertad son 18 y el valor de la tabla de la t de student para una seguridad del 95% es de 2.10 y para un 99% de seguridad el valor es 2.88. (Tabla 2)

Como quiera que r = 0.885 > a 2.10 * 0.109 = 2.30 podemos asegurar que el coeficiente de correlacin es significativo (p<0.05). Si aplicamos el valor obtenido en la tabla de la t de Student para una seguridad del 99% (t = 2.88) observamos que como r = 0.885 sigue siendo > 2.88 * 0.109 = 0.313 podemos a su vez asegurar que el coeficiente es significativo (p<0.001). Este proceso de razonamiento es vlido tanto para muestras pequeas como para muestras grandes. En esta ltima situacin podemos comprobar en

la tabla de la t de student que para una seguridad del 95% el valor es 1.96 y para una seguridad del 99% el valor es 2.58.

Intervalo de confianza del coeficiente de correlacin. La distribucin del coeficiente de correlacin de Pearson no es normal pero no se puede transformar r para conseguir un valor z que sigue una distribucin normal (transformacin de Fisher) y calcular a partir del valor z el intervalo de confianza. La transformacin es:

LN representa el logaritmo neperiano en la base e

donde n representa el tamao maestral. El 95% intervalo de confianza de z se calcula de la siguiente forma:

Tras calcular los intervalos de confianza con el valor z debemos volver a realizar el proceso inverso para calcular los intervalos del coeficiente r

Utilizando el ejemplo de la Tabla 1, obtenemos r = 0.885

95% intervalo de confianza de z

Tras calcular los intervalos de confianza de z debemos proceder a hacer el clculo inverso para obtener los intervalos de confianza de coeficiente de correlacin r que era lo que buscbamos en un principio antes de la transformacin logartmica.

0.726 a 0.953 son los intervalos de confianza (95%) de r.

Presentacin de la correlacin Se debe mostrar siempre que sea posible la grfica que correlaciona las dos variables de estudio (Fig 1). El valor de r se debe mostrar con dos decimales junto con el valor de la p si el test de hiptesis se realiz para demostrar que r es estadsticamente diferente de cero. El nmero de observaciones debe a su vez estar indicado.

Interpretacin de la correlacin El coeficiente de correlacin como previamente se indic oscila entre 1 y +1 encontrndose en medio el valor 0 que indica que no existe asociacin lineal entre las dos variables a estudio. Un coeficiente de valor reducido no indica necesariamente que no exista correlacin ya que las variables pueden presentar una relacin no lineal como puede ser el peso del recin nacido y el tiempo de gestacin. En este caso el r infraestima la asociacin al medirse linealmente. Los mtodos no paramtrico estaran mejor utilizados en este caso para mostrar si las variables tienden a elevarse conjuntamente o a moverse en direcciones diferentes.

Este procedimiento estadstico para medir la correlacin o asociacin es complementario del coeficiente de correlacin parcial de Kendall; a su vez, es una segunda opcin de la correlacin de Spearman. La razn por la que se expone este modelo estadstico se debe a la necesidad de comprender la mecnica aritmtica y la interpretacin de la prueba, pues se requiere conocerla para realizar el coeficiente parcial de Kendall. La frmula es la siguiente: Donde: (tau) = coeficiente de correlacin de Kendall. S = puntuacin efectiva de los rangos. N = tamao de la muestra en parejas de variables. Frmula para determinar el nivel de significancia mediante el valor Z: Donde: Z = valor Z de la distribucin normal. = coeficiente de correlacin de Kendall. N = tamao de la muestra. Pasos: 1. Alinear las observaciones del rango menor al mayor de la variable independiente (X), de manera que se deje el rango que corresponde a la pareja de la variable dependiente (Y).

2. Obtener la puntuacin efectiva (S) en la variable dependiente, en funcin del orden de ocurrencia
de los rangos de Y con respecto a X. 3. Contar el nmero de parejas y aplicar la frmula. 4. Calcular el nivel de significancia en funcin del valor Z, de acuerdo con la ecuacin, presentada anteriormente. 5. Una vez calculado el valor Z, se obtiene la probabilidad de su magnitud en la tabla de coeficientes de correlacin en niveles de p 0.05 y 0.01. 6. Decidir si se acepta o rechaza la hiptesis.

Ejemplo: Un investigador est interesado en saber si el desarrollo mental de un nio se asocia a la educacin formal de la madre. De esta manera, obtiene la calificacin de desarrollo mental en la escala de Gesell de ocho nios elegidos aleatoriamente y se informa del grado de escolaridad de las madres. Eleccin de la prueba estadstica. Se desea medir asociacin o correlacin. Las calificaciones de la educacin formal de cada madre estn dadas en una medicin cualitativa, pero tienen una escala ordinal, por lo cual es posible ordenarlas en rangos. Vase: Flujograma 6

Planteamiento de la hiptesis.

Hiptesis alterna (Ha). El desarrollo mental de los hijos es una variable dependiente de la educacin formal de la madre; por lo tanto, existe una correlacin significativa. Hiptesis nula (Ho). La asociacin entre las variables educacin formal de la madre y desarrollo mental de los hijos no es significativa, ni hay correlacin.

Nivel de significacin. Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho. Zona de rechazo. Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha. Desarrollo mental de algunos nios y escolaridad de las madres.

Aplicacin de la prueba estadstica. Inicialmente, las observaciones de las variables X y Y se ordenan en rangos. Arreglo en rangos de las observaciones presentadas en la tabla anterior.

De acuerdo con esto, se efecta un ordenamiento natural de los rangos de las variables X y Y. Rangos de la variable independiente X y su correspondiente de la variable dependiente.

El clculo de la puntuacin efectiva (S) se realiza con el ordenamiento de los rangos de la variable dependiente (Y). El primer valor del rango de Y es 1. Respecto a los dems rangos, existen siete mayores que Y y ninguno es menor, de manera que queda: S = (7 - 0) +

Despus est el rango 5, luego se hallan tres por arriba y tres por debajo de ste y se contina: S = (7 - 0) + (3 - 3) + En rango siguiente es el 3, del cual cuatro son mayores y uno menor, y queda: S = (7 - 0) + (3 - 3) + (4 - 1) + El rango inmediato es el 2, y los cuatro subsecuentes son mayores y ninguno menor: S = (7 - 0) + (3 - 3) + (4 - 1) + (4 - 0) + Despus se halla el rango 7, en el que uno es mayor y dos menores: S = (7 - 0) + (3 - 3) + (4 - 1) + (4 - 0) + (1 - 2) + Finalmente, se encuentra el rango 8, el subsecuente es el 6, que es menor y se concluye el clculo de S, como sigue: S = (7 - 0) + (3 - 3) + (4 - 1) + (4 - 0) + (1 - 2) + (0 - 1) S = 7 + 0 + 3 + 4 - 1 - 1 = 12 Aplicamos la ecuacin de la prueba estadstica.

Calculamos el nivel se significancia.

Una vez calculado el valor Z, se obtiene la probabilidad en la tabla de coeficientes de correlacin en niveles de p 0.05 y 0.01; a su vez en buscamos en la tabla de probabilidades asociadas en valores extremos como los de 2 en la distribucin normal. Se localiza el valor 1.4 y en la interseccin de la columna 0.09, se observa el valor 0.0681, el cual corresponde a la probabilidad de obtener un valor Z de esta magnitud, que difiere del promedio y es mayor que el nivel de significancia. Decisin. Como el valor Z tiene mayor probabilidad que el nivel de significancia, se acepta Ho y se rechaza Ha. Interpretacin. La correlacin entre las variables educacin materna y desarrollo mental del hijo no es significativa. Esta misma conclusin se obtuvo mediante el coeficiente de correlacin de Spearman.

En la seccin de coeficiente de correlacin de Spearman se seal que al aumentar el tamao de la muestra, existe mayor probabilidad de empates o ligas entre los rangos de las observaciones. Para esta condicin se presenta la siguiente ecuacin:

Donde: (tau) = coeficiente de correlacin de Kendall. S = puntuacin efectiva de los rangos. N = tamao de la muestra en parejas de variables. Lx = sumatoria de ligas o empates dados en la variable independiente (X). Ly = sumatoria de ligas o empates dados en la variable dependiente (Y). El nivel de significancia se obtiene de la misma manera.

También podría gustarte