Está en la página 1de 5

Coeficiente de correlación de Pearson

En estadística, el coeficiente de correlación de Pearson es una medida de la relación lineal entre


dos variables aleatorias cuantitativas. De manera menos formal, podemos definir el coeficiente de
correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos
variables siempre y cuando ambas sean cuantitativas y continuas.

El índice numérico más común usado para medir una correlación es el “coeficiente de Pearson”.
El coeficiente de Pearson (también llamado coeficiente de correlación del producto-momento), se
representa con el símbolo ‘r’ y proporciona una medida numérica de la correlación entre dos
variables.

Es útil reconocer la fórmula usada para calcular el coeficiente de Pearson. Recuerde que al describir
la relación entre dos variables, necesitamos responder al menos cuatro preguntas:

(1) ¿Están relacionadas las variables entre sí? Si los cambios en el valor de una de las variables
van acompañados de cambios en el valor de la otra, las variables parecen estar relacionadas.

(2) Si las variables parecen estar relacionadas, ¿qué tan fuerte es la relación entre las
variables? En otras palabras, ¿están estrechamente o sólo levemente relacionadas?

(3) ¿La relación entre las variables es ‘positiva’ o ‘negativa’?

(4) ¿Cuál es la relación causal entre las variables?

El coeficiente de Pearson no entrega respuestas a tres de estas cuatro preguntas: (1) sobre la
pregunta uno, nos indica si dos variables parecen estar correlacionadas o no; (2) con respecto a la
pregunta dos, el coeficiente de Pearson indica la fuerza de la aparente relación; y (3) el coeficiente,
por último, nos indica si la aparente relación es positiva o negativa. Como ya sabemos, el análisis
de correlación no puede responder a la última pregunta.

El coeficiente de correlación de Pearson (r) se mide en una escala de 0 a 1, tanto en dirección


positiva como negativa. Un valor de “0” indica que no hay relación lineal entre las variables. Un
valor de “1” o “–1” indica, respectivamente, una correlación positiva perfecta o negativa perfecta
entre dos variables. Normalmente, el valor de se ubicará en alguna parte entre 0 y 1 o entre 0 y –1.

Por último, tenga en mente el coeficiente de Pearson mide sólo relaciones lineales entre variables,
y no es útil para medir relaciones que no son lineales.
El Coeficiente de correlación de Pearson es un valor estadístico que se obtiene de una muestra para
determinar si los datos presentan correlación. Dentro de las variables que se someten a estudio y
relacionan a través del Coeficiente de Pearson encontramos situaciones como las siguientes: ¿las
calificaciones profesionales de los maestros están correlacionadas en forma positiva o negativa con
el rendimiento de los estudiantes? ¿Qué sucede con el tamaño de la clase? ¿Y el gasto en
educación? Se usa mucho en proyectos de investigación que intentan demostrar como algún suceso
influye en otro. La fórmula estadística que se usa para la resolución es la siguiente:
Ejemplo:
En una empresa se seleccionan 6 trabajadores, se anotaros sus años de servicio y el tiempo de
permiso en horas, solicitado el último mes, los resultados obtenidos fueron:

X 1 3 2 4 5 4
Y 1 1 3 4 6 5

a) Representar gráficamente los datos anteriores. Razonar si los datos muestran correlación
positiva o negativa.
b) Calcular el coeficiente de correlación e interpretarlo en términos de la situación real.

a) 8
6
6 5
4
4 3

2 1 1

0
0 1 2 3 4 5 6

Los datos muestran una correlación directa o positiva, pues cuando crece X también crece Y.
b)
Interpretación: Como el coeficiente de correlación es 0,82 (que varía entre -1 y 1) podemos
deducir que existe bastante relación entre una variable y otra. Y además se trata de una relación
creciente, en el sentido de que al aumentar los valores de la X (número de años de servicio)
aumentas los valores de las Y (las horas de permiso).
Asimetría: Coeficiente de Bowley
Se define el coeficiente de Bowley como un método para la definición de asimetría que en una
serie de datos se estudia el coeficiente de asimetría de Bowley. Es muy utilizado para poder
analizar las distribuciones de datos.

Para determinar este coeficiente se considera que en una distribución de datos simétrica no
solamente tiene relevancia la uniformidad central, con esto nos referimos a la tendencia en el
comportamiento de los datos. Además, también es importante la uniformidad no central, lo que
quiere decir que para los datos que están un poco más alejados de los centros que se analizan, se
requiere también una configuración especial.

Significa que tanto al extremo izquierdo y derecho de la distribución se debe encontrar un


comportamiento similar, de lo contrario es imposible hablar de simetría. Particularmente, para este
coeficiente las medidas de uniformidad central o tendencia central utilizadas corresponden a la
mediana, mientras que al hablar de uniformidad no central se buscan las medidas de posición no
centrales tipo cuartiles. De este modo el coeficiente de asimetría de Bowley parte de la diferencia
que existe entre los datos centrales y los datos no centrales.

Numéricamente el coeficiente corresponde a una relación entre la suma de los datos asociados al
cuartil 3 y el cuartil 1, menos dos medianas, todo dividido por la diferencia de los datos entre el
cuartil 3 y el cuartil 1. (AB= (Q3+Q1- 2Me)/Q3-Q1). Cuando el coeficiente es mayor que cero
(AB>0) nos encontramos con una asimetría positiva en la distribución de datos. Será negativa
cuando el coeficiente es menor que cero.

Si el coeficiente es igual a cero significa que la suma de los datos correspondientes al cuartil 3 y
cuartil 1 son exactamente iguales a dos medianas, lo que hace alusión a la simetría de la
distribución.

También podría gustarte