Está en la página 1de 21

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA

Dpto. de Estadística e Informática

ESTADISTICA APLICADA A LA
ECONOMÍA Y LOS NEGOCIOS I

Análisis de Correlación

Carlos López de Castilla Vásquez


Ciclo 2019-II
OBJETIVOS

Conocer las condiciones para usar el coeficiente de correlación

Calcular el coeficiente de correlación de Pearson y Spearman

Interpretar y analizar el coeficiente de correlación de Pearson y Spearman

 Métodos Estadísticos para la Investigación I 2019-I


Coeficiente de correlación de Pearson

•  El coeficiente de correlación de Pearson mide la


fuerza de la relación lineal existente entre dos
variables cuantitativas.
• Su valor es independiente de las unidades en
que se midan las variables.
• Este coeficiente toma valores desde -1 hasta 1.
• Se usa cuando los datos están medidos en una
escala de intervalo o de razón y provienen de
una distribución normal.

 Métodos Estadísticos para la Investigación I 2019-I


Coeficiente de correlación de Pearson

-0.10 < r < 0.10 Casi nula


-0.20 < r ≤ -0.10 0.10 ≤ r < 0.20 Muy baja
-0.40 < r ≤ -0.20 0.20 ≤ r < 0.40 Baja
-0.60 < r ≤ -0.40 0.40 ≤ r < 0.60 Media
-0.80 < r ≤ -0.60 0.60 ≤ r < 0.80 Alta
r ≤ -0.80 r > 0.80 Muy alta

 Métodos Estadísticos para la Investigación I 2019-I


Coeficiente de correlación de Pearson
• El coeficiente de correlación está dada por:

Siendo:
 SPXY: suma de productos corregidos de X e Y.
SCX : suma de cuadrados corregidos de X.
SCY : suma de cuadrados corregidos de Y.

 Métodos Estadísticos para la Investigación I 2019-I


Coeficiente de correlación de Pearson
• Prueba de hipótesis para el coeficiente de correlación de Pearson

Hipótesis:
 
H0: ρ = 0 (No existe correlación entre X e Y)
H1: ρ ≠ 0 (Si existe correlación entre X e Y)
  r
tc  ~ t( n 2)
Estadístico de prueba: (1  r 2 ) / ( n  2)

Regla de Decisión:
 
La hipótesis nula se rechaza con un nivel de significación α si:
t c  t   / 2, n  2  o t c  t  1 / 2,n  2 

Usando p-valor:
 Si p-valor ≤ α , entonces se RHo y se acepta la H1.
 Por lo tanto si existe correlación lineal (asociación) entre las variables X e Y
 Métodos Estadísticos para la Investigación I 2019-I
Coeficiente de correlación de Pearson
Ejemplo 27
Un ingeniero pesquero está interesado en evaluar 12
ejemplares de trucha en un estudio de índole
acuícola, con la finalidad de verificar si existe una
correlación entre la longitud del cuerpo y su ancho.

Asumiendo de que las variables cumplen el supuesto


de normalidad, responda las siguientes preguntas:
Coeficiente de correlación de Pearson
a. Estime e interprete el coeficiente de correlación
de Pearson para la longitud y el ancho de las
truchas.
Cálculos previos:
X: Longitud
Y: Ancho

Existe una muy baja correlación positiva entre la longitud y el ancho de


las truchas.
Coeficiente de correlación de Pearson

b. Realice la prueba estadística más adecuada para


verificar si existe correlación entre la longitud y el
ancho de las truchas. Use α=0.05
P1) Planteamiento de hipótesis
H0: ρ = 0 (No existe correlación entre X e Y)
H1: ρ ≠ 0 (Si existe correlación entre X e Y)
P2) Nivel de significación: α=0.05
P3) Estadístico de prueba y desarrollo
Coeficiente de correlación de Pearson

P3) Estadístico de prueba y desarrollo:

P4) Criterios de decisión

Como t(0.025,10)<tc<t(0.975,10)=2.228
entonces no se rechaza Ho.
Coeficiente de correlación de Pearson

P5) Conclusión
A un nivel de significación del 5% no se rechaza Ho.
Luego no se puede afirmar que exista correlación
entre la longitud y el ancho de las truchas.
CORRELACIÓN DE VARIABLES CUANTITATIVAS

Coeficiente de Correlación de Spearman

El coeficiente de correlación de Spearman (1904) es una


prueba no paramétrica cuando se quiere medir la
relación entre dos variables y no cumplen el supuesto de
normalidad en la distribución de tales valores, o cuando
una o ambas variables estudiadas son de tipo ordinal.
Toma valores entre -1 y 1, y se interpreta exatamente
igual que el coeficiente de correlación de Pearson.

 Métodos Estadísticos para la Investigación I 2019-I


CORRELACIÓN DE VARIABLES CUANTITATIVAS

Coeficiente de Correlación de Spearman

Suponga que se toma una muestra aleatoria (x1,


Y1), ... , (xn' Yn) de n pares de observaciones.
Si las Xi y las Yi se ordenan en sentido ascendente y se
calcula la correlación muestral de estos puestos, el
coeficiente resultante se llama coeficiente de
correlación de orden de Spearman. La fórmula para
calcular este coeficiente es:
n
  6 d2  i
rs  1  i 1

n  n  1
2

 Métodos Estadísticos para la Investigación I 2019-I


CORRELACIÓN DE VARIABLES CUANTITATIVAS

Coeficiente de Correlación de Spearman


di = son las diferencias entre los puestos de los miembros de los
distintos pares n = nº de datos
 
Prueba de Hipótesis de coeficiente de correlación de Spearman
 
Hipótesis:
 
H0: ρ = 0 (No existe correlación entre X e Y)
H1: ρ ≠ 0 (Si existe correlación entre X e Y)
  n

Cálculo de rs: 6 di2


rs  1  i 21
 
 
n n 1

 Métodos Estadísticos para la Investigación I 2019-I


CORRELACIÓN DE VARIABLES CUANTITATIVAS

Regla de Decisión:
 
Rechazar Ho si rs < - rs,/2 r, o rs > rs,/2
 
Nota:
Si n > 30, se puede calcular: y utilizar la tabla de la distribución normal
 

 Métodos Estadísticos para la Investigación I 2019-I


CORRELACIÓN DE VARIABLES CUANTITATIVAS

Ejemplo 28
Se sospecha que la abundancia de la especie de
gramínea Poa bulbosa en los pastizales depende en gran
medida de la humedad que hay en el suelo. Para
comprobar esta hipótesis se realizó un muestreo con
una cuadrícula de 20 cm de lado obteniéndose una
muestra al azar de 12 cuadriculas de pasto. En cada
cuadrícula se midió la cobertura de la especie y la
humedad del suelo mediante un TDR. Ambas son
variables cuantitativas y no se ajustaron una distribución
normal. Realice la prueba estadística más adecuada
utilizando un α=0.05  

 Métodos Estadísticos para la Investigación I 2019-I


CORRELACIÓN DE VARIABLES CUANTITATIVAS

Pasos para hallar rs:


 
1. Clasificar por jerarquìa los valores de X desde 1
hasta n (el número de parejas de valores de X e Y
en la muestra).
2. Clasificar por jerarquía los valores de Y desde 1
hasta n.
3. Calcular di, para cada pareja de observaciones,
restando la jerarquía de Yi de la jerarquía de Xi.
4. Elevar al cuadrado cada di y calcular, la suma de
los valores elevados al cuadrado.
5. Calcula rs
 Métodos Estadísticos para la Investigación I 2019-I
CORRELACIÓN DE VARIABLES CUANTITATIVAS

Obs Cobertura(X) Humedad(Y) Rango (X) Rango (Y) di di2


1 82 42 2 3 -1 1
2 98 46 6 4 2 4
3 87 39 5 2 3 9
4 40 37 1 1 0 0
5 116 65 10 8 2 4
6 113 88 9 11 -2 4
7 111 86 8 10 -2 4
8 83 56 3 6 -3 9
9 85 62 4 7 -3 9
10 126 92 12 12 0 0
11 106 54 7 5 2 4
12 117 81 11 9 2 4
Suma 52

 Métodos Estadísticos para la Investigación I 2019-I


CORRELACIÓN DE VARIABLES CUANTITATIVAS

P1) Planteamiento de hipótesis


H0: No existe correlación entre la cobertura de la especie y
la humedad del suelo
H1: Existe correlación entre la cobertura de la especie y la
humedad del suelo
P2) Nivel de significación: α=0.05
P3) Estadístico de prueba y desarrollo
6 x52
Calculo de rs rs  1   0,818
12 x  122  1

rs, = 0,5804 ( 2 colas)


/2

si n= 12 y para α=0.05, la tabla de Spearman arroja el valor de rs,α/2=0.5804

 Métodos Estadísticos para la Investigación I 2019-I


CORRELACIÓN DE VARIABLES CUANTITATIVAS

0.025 de área 0.025 de área

-0.5804 -0.5804

Como rs =0.818 es mayor a rs,α/2= 0.5804 , entonces se rechaza Ho.


P5) Conclusión
A un nivel de significación del 5% se rechaza Ho. Por lo tanto hay
correlación entre la cobertura de Poa bulbosa y la humedad del
suelo.

 Métodos Estadísticos para la Investigación I 2019-I


 Métodos Estadísticos para la Investigación I 2019-I

También podría gustarte