Está en la página 1de 6

Correlación y asociación: estadística descriptiva bivariante 01.04.

21

Correlación
 Estudio conjunto de 2 variables cuantitativas.
 A la derecha se tiene una posible manera de recoger datos obtenidos observando 2
variables en varios individuos de una muestra.
o En cada fila se tiene los datos de cada individuo.
o Cada columna representa los valores que toma una variable sobre los mismos.
o Los individuos no se muestran en ningún orden en particular.
 Dichas observaciones pueden ser representadas en un diagrama de dispersión
(scatterplot). En ellos, cada individuo es un punto cuyas coordenadas son los valores de
las variables.
 El objetivo es intentar reconocer a partir del mismo si hay relación entre las variables, de
que tipo, y si es posible predecir el valor de una de ellas en función de la otra.

Diagramas de dispersión o nube de puntos


 Se tienen las alturas y pesos de 30 individuos representados en un diagrama de dispersión
scatterplot.
 Los puntos tienden a mostrar cierta tendencia
lineal, ya que parece que el peso aumenta con la
altura.
 Cuando en el grafico se ve que hay cierta
tendencia lineal en las observaciones, se utilizara
una medida de correlación o una medida
estadística que permita cuantificar el grado de esa
relación.
 Cuando en el grafico no se ve una tendencia lineal
de las observaciones, no significa que no hay
relación en las variables, sino que puede haber
otro tipo de relación.

Relación directa e inversa


 Incorrelación
o No hay una tendencia lineal, los puntos se dispersan bastante por el plano.
o Los puntos quedan dispersos en todos los cuadrantes.
 Fuerte relación directa
o Hay una tendencia lineal, los puntos se alinean.
o A medida que una variable aumenta, la otra también aumenta.
o La mayoría de los puntos quedan dispersos en los cuadrantes 1 y 3.
 Cierta relación inversa
o Hay una tendencia lineal inversa, los puntos se alinean, pero de manera inversa.
o A medida que una variable aumenta, la otra disminuye.
o La mayoría de los puntos quedan dispersos en los cuadrantes 2 y 4.
Coeficiente de correlación lineal de Pearson
 El coeficiente de correlación lineal de Pearson de 2 variables, r, indica si los puntos tienen una
tendencia a disponerse alineadamente (excluyendo rectas horizontales y verticales).
 Tiene el mismo signo que Sxy (covarianza) por tanto de su signo se obtiene el que la posible
relación sea directa o inversa.
 r es útil para determinar si hay relación lineal entre 2 variables, pero no servirá para otro tipo
de relaciones.

Propiedades de r
 Es adimensional.
 Solo toma valores entre [-1,1].
o r=0  las variables son incorreladas.
o r=-1  relación inversa perfecta entre dos variables.
o r=1  relación directa casi perfecta entre dos variables.
 Cuanto mas cerca este r de +1 o -1, mejor será el grado de relación lineal
o Siempre que no existan observaciones atípicas.

Correlaciones positivas Correlaciones negativas

Otros coeficientes de correlación


 Cuando las variables presentan un nivel de medición ordinal, es posible preguntarse sobre si
hay algún tipo de correlación entre ellas.
 Existen:
o p (ro) de Spearman.
o t (tau) de Kendall.
 Para variables cuantitativas continuas y dicotómicas usar el coeficiente punto biserial o Eta.

Ejemplos
 r=0,665 – p=0,01
o Relación directa entre 2 variables.
o A medida que aumenta la edad, aumenta el peso.
o Si se analiza el grafico, no se ve una relación lineal
o entre los puntos.
o No es una correlación valida para asociarla desde el punto de
vista lineal.
 r=-0,665 – p=0,01
o Relación inversa entre 2 variables.
o A medida que aumenta la edad, la creatinina disminuye.
o Si se analiza el grafico, se ve una relación lineal
entre los puntos.
o Es una correlación valida para asociarla desde el punto de
vista lineal.

IMPORTANTE
 Si el grafico no muestra una relación o tendencia lineal ya sea directa o inversa, las medidas de
correlación como el r y el p-valor, no sirve.
 Esto quiere decir que el grafico manda por sobre las medidas estadísticas.

Probabilidad para decidir o p-valor


 Permite determinar si la medida estadística que esta entregando el programa o el análisis de
datos es valida.
 Si el p-valor o probabilidad de decisión es menor a un valor definido por el investigador, en
este caso, un 10% (0,1), la correlación es valida.
 El 10% es el nivel de significancia, es definido por el investigador y siempre tiene que ser
menor a 10%.

Ejemplo 1
 Evaluar la influencia de distintas fuentes de estrés en el rendimiento académico de
estudiantes de odontología.
 La carga de trabajo mostró una correlación negativa con el rendimiento académico  r=-0,86 – p=0,003
o Relación inversa entre 2 variables.
o La correlación es significativa si el valor definido por el investigador es del 10%.
 La practica preclínica y clínica mostraron una correlación positiva  r=0,77 – p=0,002
o Relación directa entre 2 variables.
o La correlación es significativa si el valor definido por el investigador es del 10%.

Ejemplo 2
 Estudio comparativo de calidad de sueño en pacientes bruxistas y no bruxistas
 Los pacientes bruxistas presentar peor calidad de sueno que aquellos que no lo son (p=0,009).
o La correlación es significativa si el valor definido por el investigador es del 10%.
 Solo entregan la probabilidad, ya que no hay presencia de variables cuantitativas, por lo tanto,
el coeficiente de Pearson no puede ser utilizado.

Asociación
 Estudio conjunto de 2 variables cualitativas.
Consumo de Bruxista No bruxista Total
Ejemplo 1
fármacos
 Consumo de medicamentos en
pacientes bruxistas y no bruxistas. No consume 26 30 56
 Chi cuadrado  0,686 Si consume 22 18 40
 p  0,408 Total 48 48 96
 En este caso no hay asociación entre ambas variables, ya que la p es mayor al un valor
definido por el investigador, en este caso, un 5% (0,05).
Ejemplo 2
 Consumo de medicamentos con mal y buen dormir
 Chi cuadrado  0,729
 p  0,393 Consumo de Mal dormir Buen dormir Total
 En este caso no hay asociación entre ambas fármacos
variables, ya que la p es mayor al un valor No consume 39 17 56
definido por el investigador, en este caso, un Si consume 31 9 40
5% (0,05). Total 70 26 96

Ejemplo 3
 Calidad de sueño y bruxismo
 Chi cuadrado  6,75
 p  0,009
 En este caso hay asociación significativa Calidad del sueño Bruxista No bruxista Total
entre ambas variables, ya que la p es Buena 26 38 64
menor al un valor definido por el Mala 22 10 32
investigador, en este caso, un 5% (0,05). Total 48 48 96

Pruebas de diagnóstico
 Las pruebas o exámenes diagnósticos presentan probabilísticamente la situación del paciente,
distinguiéndose los eventos.
o El paciente esta sano.
o El paciente esta enfermo.
o El examen da positivo.
o El examen da negativo.
 Esta situación la vemos en Estado del paciente Total
la siguiente tabla: Enfermo Sano
Resultado Positivo a b a+b
del Negativo c d c+d
examen Total a+c b+d a+b+c+d
 Se sospecha que un paciente puede padecer cierta enfermedad, que tiene una incidencia de la
enfermedad en la población (probabilidad de que la enfermedad la padezca una persona
elegida al zar; probabilidad de estar enfermo).
 Como ayuda al diagnóstico de la enfermedad, se le hace pasar una serie de pruebas que dan
como resultado: positivo o negativo.
 Previamente, sobre el test diagnóstico a utilizar, han debido ser estimadas las cantidades:
o Sensibilidad
 Probabilidad de que el test de positivo sobre una persona que sabemos
que padece la enfermedad, así de la tabla se deduce:
o Especificidad
 Probabilidad de que el test de negativo sobre una persona que sabemos
que no padece la enfermedad, así de la tabla se deduce:
 Lo que se busca generalmente en los exámenes es que sean altamente sensibles y altamente
específicos.
Ejemplo 1
 Validación de instrumento de Estado del paciente Total
ansiedad dental Con ansiedad Sin ansiedad
 Sensibilidad  512/553 = Resultado Positivo 512 60 572
0,93 del Negativo 41 83 124
 Especificidad  83/143 = examen Total 553 143 696
0,58
 Conclusiones
o El test es un 93% sensible y un 58% especifico.
o El examen discrimina en un 93% a los que presentan ansiedad, pero solo en un 58%
sin ansiedad.

Medidas de riesgo
 Una forma similar a la anterior se usa comúnmente en epidemiologia, pues el sujeto se clasifica,
según una variable respuesta (enfermo o sano) y una variable explicativa (expuesto o no
expuesto), así:
Estado del paciente Total
 Así es posible calcular las
Enfermo Sano
probabilidades de ocurrencia para:
o P(enfermo - Exposición Expuesto a b a+b
a la No expuesto c d c+d
expuesto).
enfermedad Total a+c b+d a+b+c+d
o P(sano - expuesto).
o P(enfermo - no expuesto).
o P(sano - no expuesto).
 Y como medidas de asociación corrientemente se utilizan 2:
o Riesgo relativo (RR)

o Odds ratio (OR)

 Estas medidas de asociación, que miden la fuerza con la que una enfermedad o evento de
salud esta relacionada con un factor.
o Si RR u OR son 1  implica que no hay asociación entre la enfermedad y la exposición.
o Si RR u OR son menor que 1  la exposición es un factor protector.
o Si RR u OR son mayor que 1  la exposición es un factor de riesgo.
 El riesgo relativo o RR solo se puede calcular en diseños transversales o prospectivos.
 El odds ratio o OR se puede calcular en diseños transversales, prospectivos y retrospectivos.
 El fácil observar que si el RR de enfermos es pequeño (prevalencia baja), RR y OR son
numéricamente similares.
Estado del paciente Total
Ejemplo 1
Enfermo Sano
 Asociación entre una
Enfermeda Complicaciones 160 43 203
cardiopatía isquémica y la
d Sin complicaciones 70 90 160
enfermedad periodontal.
periodontal Total 230 133 363
 RR  (160/203)/(70/160) = 1,8
o Interpretación
 La enfermedad periodontal constituye un factor de riesgo en la enfermedad
(cardiopatía isquémica), el factor de riesgo (RR=1,8) indica que los sujetos
expuestos a la enfermedad periodontal presentan 1,8 veces mas posibilidades
de presentar la cardiopatía que aquellos que no están expuestos.
 Considerando un estudio de cohortes.
 OR  (160x90)/(70x43) = 4,78
o Interpretación
 La enfermedad periodontal constituye un factor de riesgo en la enfermedad
(cardiopatía isquémica), el factor de riesgo (OR=4,78) indica que los sujetos
expuestos a la enfermedad periodontal presentan 4,78 veces mas posibilidades
de presentar la cardiopatía que aquellos que no están expuestos.
 Considerando un estudio de casos y controles.

También podría gustarte