Está en la página 1de 17

Estadística

Clase 6
Correlación
de dos
variables cuantitativas
https://www.youtube.com/watch?v=1qkAU--IK8Y
Estadística
Correlación de dos variables

Correlación
X Y

Se entiendo como Altura (m) Peso (kg)


correlación a la
correspondencia o relación 1,55 53,50
es decir si las variables 1,60 54,20
cambian o cavarían de
forma conjunta. 1,65 60,90

1,63 65,70
Por ejemplo si tomamos
dos variables cuantitativas 1,74 68,20
que varía de forma
conjunta como la altura y el 1,79 70,40
peso de las personas, se
1,76 74,60
podría decir que a medida
que aumenta la altura 1,87 76,80
aumenta el peso.
En este caso el peso (y) 1,97 85,30
depende de la altura (x).
Estadística

Correlación de dos variables


CORRELACIÓN
2 variables

Si Los datos siguen No


una Distribución
NORMAL

Se aplica pruebas paramétricas Se aplica pruebas no paramétricas

Coeficiente de correlación de Pearson Coeficiente de correlación de Spearman


Variables Cuantitativas Variables Cualitativas
Cualitativa-Cuantitativa
Correlación de dos variables
CUANTITATIVAS
Covarianza
La covarianza de una muestra bidimensional es la media aritmética de los productos
de las desviaciones de cada una de las variables respecto a sus medias respectivas.
La covarianza es un valor que indica el grado de variación conjunta de dos variables
aleatorias respecto a sus medias y determinar si existe una dependencia entre
ambas variables, las ecuaciones pueden ser:

El signo de la covarianza nos indica la tendencia de la correlación de los datos


Si el signo es positivo se tiene a una correlación positiva y si tiene signo negativo
tiene una correlación negativa

Covarianza Covarianza
signo positivo (+) signo negativo (-)
Correlación de dos variables
CUANTITATIVAS
Ejemplo
Dados los datos de las variables peso y estatura, calcule la covarianza
n X( estatura m) Y (peso Kg) (Xi-Med X) (Yi-Med Y) (Xi-Med X)(Yi-Med Y)
1 1,55 53,50 -0,18 44,760 -8,007
2 1,60 54,20 -0,13 45,460 -5,859
3 1,65 60,90 -0,08 52,160 -4,115
4 1,63 65,70 -0,10 56,960 -5,633
5 1,74 68,20 0,01 59,460 0,661
6 1,79 70,40 0,06 61,660 3,768
7 1,76 74,60 0,03 65,860 2,049
8 1,87 76,80 0,14 68,060 9,604
9 1,97 85,30 0,24 76,560 18,460
Promedio 1,73 67,73 Suma 10,927 10,93
Des. Estad 0,108 8,740 C(X,Y)=
n 9
9

C(X,Y)= 1,21

En esta ejemplo el
signo de la covarianza
es positivo, lo que nos
indica que hay una
correlación positiva
entre las dos variables
Correlación de dos variables
CUANTITATIVAS
Correlación de dos variables
CUANTITATIVAS
Coeficiente de correlación de Pearson ( r )

El coeficiente de correlación de Pearson es una mejor medida de la correlación


de dos variables, se calcula a dividiendo la covarianza por el producto de la
desviación estándar de X y desviación estándar de Y.

El valor del coeficiente de correlación de Pearson ( r ) esta en re -1 y +1

-1 ≤ r ≤ 1

Si r > 0 existe una correlación lineal directa entre las dos variables
Si r < 0 existe una correlación lineal inversa entre las dos variables
Si r ≈ 0 No existe correlación lineal entre las variables, o son variables independientes
Correlación de dos variables
CUANTITATIVAS
Correlación de dos variables
CUANTITATIVAS
Coeficiente de correlación de Pearson ( r )
Cuanto mas se acerquen los puntos experimentales a una recta el valor del coeficiente de
correlación de Pearson ( r ) tiende a 1 o a -1 y se dice que existe una fuerte correlación
directa o inversa; mientras los puntos experimentales se alejan de una recta el valor de (r )
disminuye hasta cero y se dice que no existe correlación entre las dos variables o existe
independencia entre ellas .
Para decir que existe una fuerte correlación entre las dos variables el valor de (r ) debe ser
por lo menos mayor a dos nueves r = 0,99 o r = - 0,99 , otros actores indican que debe
se mayor a 3 nueves r = 0,999 o r = - 0,999
Correlación de dos variables
CUANTITATIVAS
Coeficiente de correlación de Pearson (r) y Coeficiente de
determinación R^2

El coeficiente de determinación R2
Es una medida de la proporción de la variabilidad explicada por el modelo ajustado.
Sugiere que el modelo ajustado a los datos explica un porcentaje de la variabilidad
observada en la respuesta,
Se podría decir que coeficiente de determinación R2 es el porcentaje de la variable Y que
es influida por la variable X
Su valor esta comprendido entre 0 y 1 que representa la fracción de puntos (X,Y) que
siguen la línea de ajuste por regresión de un conjunto de datos con dos variables.
También se le conoce como bondad del ajuste. Para calcularlo se toma el cociente entre la
varianza de los datos Ŷi estimados por el modelo de regresión y la varianza de los datos Yi
correspondientes a cada Xi de los datos.

R2 = Sŷ / Sy

En donde SỸ es el valor calculado de de la desviación estandar de los datos de Y


calculado con la ecuación ajustada de los datos experimentales, y SY es la desviación
estandar de los datos experimentales de Y.
Correlación de dos variables
CUANTITATIVAS
Coeficiente de correlación de Pearson ( r ) y Coeficiente de
determinación R^2

Si el 100% de los datos están sobre la línea de la función de regresión, entonces


el coeficiente de determinación R2 será 1.

Por el contrario, si para un conjunto de datos y cierta función de ajuste el


coeficiente R2 resultase ser igual a 0.5, entonces puede decirse que el ajuste es
satisfactorio o bueno en un 50%.

De manera similar, cuando el modelo de regresión arroja valores de R2 inferiores


a 0.5, ello indica que la función de ajuste elegida no se adapta satisfactoriamente
a los datos, siendo por lo tanto necesario buscar otra función de ajuste.

Y cuando la covarianza o el coeficiente de correlación tiende a cero, entonces las


variables X e Y de los datos no guardan relación alguna, y por tanto R2 también
tenderá a cero.
Correlación de dos variables
CUANTITATIVAS
Coeficiente de correlación de Pearson (r) y Coeficiente de
determinación R^2
Ejemplo
Para la determinación de un analito se preparó un serie de soluciones estándares en el
intervalo de 0 a 12 ng/ml, las cuales se midieron en un equipo de espectrometría de
absorción atómica y se obtuvieron los siguientes valores:

X
(Concentración del analito) 0 2 4 6 8 10 12
(ng/ml)
Y
2,10 5,00 9,00 12,60 17,30 21,00 24,70
(Absorbancia)

a) Calcule el coeficiente e correlación de Pearson (r) )


b) Calcule las constantes a y b de la recta de ajuste y determine la ecuación Y = bx+a
c) Calcule el coeficiente de determinación R2
d)Calcule la concentración de una muestra que contiene el analito problema la cual se
analizó por triplicado dando los siguientes valores de absorbancia Abs: 18,0 -18,7- 18,5
Ejemplo
Para la determinación de un analito se preparó un serie de soluciones estándares en el intervalo de 0 a
12 ng/ml, las cuales se midieron en un equipo de espectrometría de absorción atómica y se obtuvieron
los siguientes valores:
X (Concentración del analito) (ng/ml) 0 2 4 6 8 10 12
Y (Absorbancia) 2,10 5,00 9,00 12,60 17,30 21,00 24,70

a) Calcule el coeficiente e correlación de Pearson (r)


Para calcular el coeficiente de correlación de Pearson se utiliza el método de los mínimos cuadrados

X (Concentración del
n Y (Absorvancia) . Ỹ = 1,9303X + 1,5179
analito) (ng/ml)
1 0 2,10 -6,00 36,00 -11,00 121,00 66,00 1,518
2 2 5,00 -4,00 16,00 -8,10 65,61 32,40 5,379
3 4 9,00 -2,00 4,00 -4,10 16,81 8,20 9,239
4 6 12,60 0,00 0,00 -0,50 0,25 0,00 13,100
5 8 17,30 2,00 4,00 4,20 17,64 8,40 16,960
6 10 21,00 4,00 16,00 7,90 62,41 31,60 20,821
7 12 24,70 6,00 36,00 11,60 134,56 69,60 24,682

PROMEDIO 6,00 13,10


DESV.EST 8,35 8,340
SUMA 112,00 418,28 216,20

216,20
r=
√112 x √464,14

r = 0,999
Ejemplo
Para la determinación de un analito se preparó un serie de soluciones estándares en el intervalo de 0 a 12
ng/ml, las cuales se midieron en un equipo de espectrometría de absorción atómica y se obtuvieron los
siguientes valores:

X (Concentración del analito) (ng/ml) 0 2 4 6 8 10 12


Y (Absorbancia) 2,10 5,00 9,00 12,60 17,30 21,00 24,70
b) Calcule las constantes a y b de la recta de ajuste y determine la ecuación Y = bx+a
X (Concentración del
n Y (Absorvancia) . Ỹ = 1,9303X + 1,5179
analito) (ng/ml)
1 0 2,10 -6,00 36,00 -11,00 121,00 66,00 1,518
2 2 5,00 -4,00 16,00 -8,10 65,61 32,40 5,379
3 4 9,00 -2,00 4,00 -4,10 16,81 8,20 9,239
4 6 12,60 0,00 0,00 -0,50 0,25 0,00 13,100
5 8 17,30 2,00 4,00 4,20 17,64 8,40 16,960
6 10 21,00 4,00 16,00 7,90 62,41 31,60 20,821
7 12 24,70 6,00 36,00 11,60 134,56 69,60 24,682

PROMEDIO 6,00 13,10


DESV.EST 8,35 8,340
SUMA 112,00 418,28 216,20
a: pendiente
Y = aX +b 216,20
a=
112,00
Y = ax +b
a = 1,93036
Y = 1,93035X + 1,5178
b: ordenada al origen
b = 13,10 - 1,93036 *6
b= 1,5179
Correlación de dos variables
CUANTITATIVAS

El valor de R2 que se obtiene en el


Excel es el coeficiente de
determinación, no confundir con el
coeficiente de correlación lineal de
r= √(R2)
Pearson. r= √(0,9978)
El Coeficiente de correlación lineal de
r= 0,999
Pearson se calcula con la ecuación:

r = √(R2)
Ejemplo
Para la determinación de un analito se preparó un serie de soluciones estándares en el intervalo de 0 a 12
ng/ml, las cuales se midieron en un equipo de espectrometría de absorción atómica y se obtuvieron los
siguientes valores:

X (Concentración del analito) (ng/ml) 0 2 4 6 8 10 12


Y (Absorbancia) 2,10 5,00 9,00 12,60 17,30 21,00 24,70
c) Calcule el coeficiente de determinación R2
X (Concentración del
n Y (Absorvancia) . Ỹ = 1,9303X + 1,5179
analito) (ng/ml)
1 0 2,10 -6,00 36,00 -11,00 121,00 66,00 1,518
2 2 5,00 -4,00 16,00 -8,10 65,61 32,40 5,379
3 4 9,00 -2,00 4,00 -4,10 16,81 8,20 9,239
4 6 12,60 0,00 0,00 -0,50 0,25 0,00 13,100
5 8 17,30 2,00 4,00 4,20 17,64 8,40 16,960
6 10 21,00 4,00 16,00 7,90 62,41 31,60 20,821
7 12 24,70 6,00 36,00 11,60 134,56 69,60 24,682

PROMEDIO 6,00 13,10


DESV.EST 8,35 8,340
SUMA 112,00 418,28 216,20

El valor de R2 se calcula como la relación de la R2 = Sŷ / Sy


desviación estándar calculada de los valores de Y 8,340
R2 =
prima obtenida con la ecuación ajustada 8,35
Ỹ = aX + b , sobre la desviación estándar de los R2= 0,999
valores experimentales de Y.
R2= 0,999*100
R2 = Sŷ / Sy
R2= 99,90%
La variable Y es influida en un 99,9%
por la variable X
Ejemplo
Para la determinación de un analito se preparó un serie de soluciones estándares en el intervalo de 0 a
12 ng/ml, las cuales se midieron en un equipo de espectrometría de absorción atómica y se obtuvieron
los siguientes valores:
X (Concentración del analito) (ng/ml) 0 2 4 6 8 10 12
Y (Absorbancia) 2,10 5,00 9,00 12,60 17,30 21,00 24,70
d)Calcule la concentración de una muestra que contiene el analito problema la cual se analizó por
triplicado dando los siguientes valores de absorbancia Abs: 18,0 -18,7- 18,5
X (Concentración del
n Y (Absorvancia) . Ỹ = 1,9303X + 1,5179
analito) (ng/ml)
1 0 2,10 -6,00 36,00 -11,00 121,00 66,00 1,518
2 2 5,00 -4,00 16,00 -8,10 65,61 32,40 5,379
3 4 9,00 -2,00 4,00 -4,10 16,81 8,20 9,239
4 6 12,60 0,00 0,00 -0,50 0,25 0,00 13,100
5 8 17,30 2,00 4,00 4,20 17,64 8,40 16,960
6 10 21,00 4,00 16,00 7,90 62,41 31,60 20,821
7 12 24,70 6,00 36,00 11,60 134,56 69,60 24,682

PROMEDIO 6,00 13,10


DESV.EST 8,35 8,340
SUMA 112,00 418,28 216,20
Y = 1,93035X + 1,5178 α 0,05
Abs 1 = 18,0 = 1,93035X + 1,5179 n 3
Abs 2 = 18,7 = 1,93035X + 1,5180 gl = n-3 2
Abs 3 = 18,5 = 1,93035X + 1,5181 t(α/2 ;gl)
X1= (18,0 -1,5178)/1,93935 = 8,50 t(0,025;2) 4,303
X2= (18,7 -1,5178)/1,93936 = 8,86
X3= (18,5 -1,5178)/1,93937 = 8,76 u = Xmedia ± t(α/2 ;gl) . S/√n
PROMEDIO= 8,71 u= 8,81 ± 4,303 * 0,186/ √3
DESV.ESTA= 0,186 u= 8,71 ± 0,18 ng/mL

También podría gustarte