Está en la página 1de 31

BIOESTADISTICA: Correlación

lineal, Pruebas paramétricas y


no paramétricas
Prof. Marvin Querales
marvin.querales@cloud.uautonoma.cl
Semestre primavera 2023
Correlación lineal entre dos
variables
Representación gráfica de una relación entre dos variables
cuantitativas: Gráfico de dispersión
rendimiento

rendimiento

rendimiento
inteligencia inteligencia inteligencia

Sin relación Relación lineal negativa


Relación lineal positiva
Representación gráfica de una relación (2)

rendimiento

inteligencia rendimiento inteligencia

Relación lineal Relación no lineal


Representación gráfica de una relación (3)
rendimiento

rendimiento

rendimiento
inteligencia inteligencia inteligencia

Relación lineal perfecta Relación lineal Relación lineal débil


(casi perfecta) fuerte/moderada

Ahora necesitamos un índice que nos informe tanto del grado en que X e Y están
relacionadas, y si la relación es positiva o negativa
Coeficiente de correlación (lineal) de Pearson

H0: No hay correlación lineal entre las variables.


H1: Hay correlación lineal entre las variables.

Si se rechaza la H0, el Coeficiente de correlación indica el tipo y grado de la relación.

• El índice de correlación de Pearson no puede valer menos de -1 ni más de +1.


• Un índice de correlación de Pearson de -1 indica una relación lineal negativa perfecta
• Un índice de correlación de Pearson de +1 indica una relación lineal positiva perfecta.
• Un índice de correlación de Pearson de 0 indica ausencia de relación lineal. (Un valor
cercano a 0 del índice no implica que no haya algún tipo de relación no lineal: el índice
de Pearson mide relación lineal.)
Coeficiente de correlación (lineal) de Pearson

Interpretación

Hemos de tener en cuenta qué es lo que estamos midiendo para poder


interpretar cuán grande es la relación entre las variables bajo estudio. En
muchos casos, depende del área bajo estudio.

En todo caso, es muy importante efectuar el


diagrama de dispersión. Por ejemplo, en el
caso de la izquierda, es claro que no hay
relación entre inteligencia y rendimiento. Sin
embargo, si calculamos el índice de
correlación de Pearson nos dará un valor muy
rendimiento

elevado, causado por la puntuación atípica en


la esquina superior derecha.

inteligencia
Coeficiente de correlación (lineal) de Pearson
Interpretación (3)
Es importante indicar que el coeficiente de correlación de Pearson puede verse
afectado por la influencia de terceras variables.
Por ejemplo, si fuéramos a un colegio y medimos la estatura y pasamos una prueba
de habilidad verbal, saldrá que los más altos también tienen más habilidad
verbal...claro, que eso puede ser debido simplemente a que en el colegio los niños
más altos serán mayores en edad que los más bajos.

Si se parcializa esta “tercera” variable


(mediante “correlación parcial”, que ya
veremos más adelante), difícilmente habrá
una relación de importancia entre estatura
Habilidad numérica

14 a
y habilidad numérica.
12 a
10 a
8a Hay muchos casos en que es la tercera
6 años variable la causante de una alta relación
entre X e Y (y ello muchas veces es difícil de
identificar)
Estatura
5.4 Otros coeficientes: variables semi-cuantitativas

Claro está, es posible obtener medidas del grado de relación de variables


cuando éstas no sean cuantitativas.

El caso en que las variables X e Y sean ordinales

Cuando tenemos variables con escala ordinal, podemos establecer el orden entre
los valores, pero no sabemos las distancias entre los valores. (Si supiéramos la
distancia entre los valores ya estaríamos al menos en una escala de intervalo)

Podemos calcular el coeficiente de correlación de Spearman


Coeficiente de correlación de Spearman (propiedades)

Primera. Se encuentra acotado, como el coeficiente de Pearson entre -1 y +1.

Un coeficiente de Spearman de +1 quiere decir que el que es primero en X es


primero en Y, el que es segundo en X es segundo en I, etc
Un coeficiente de Sperman de -1 quiere decir que el que es primero en X es
último en Y, el segundo en X es el penúltimo en Y, etc.

Segunda. Su cálculo es muy sencillo (más que el del coeficiente de correlación


de Pearson). No obstante, con los ordenadores y un programa estadístico, esto
es irrelevante estos días...
Estadística Paramétrica

Parte de la estadística inferencial que realiza


procedimientos basados principalmente en variables
cuantitativas y distribuciones conocidas

Se requiere del CUMPLIMIENTO DE Permite realizar los


siguientes procedimientos:
SUPUESTOS, alguno de los cuales pueden
ser Normalidad, Homogeneidad de
1. Estimación puntual
varianzas, aleatoriedad, entre otros..
2. Estimación por intervalos
3. Contraste de hipótesis
DEPENDE DE LA PRUEBA ESTADÍSTICA A
REALIZAR
Prueba para
Prueba de Hipótesis a
Objetivo Supuestos cumplimiento del
realizar
supuesto

1 muestra:
comparar el La variable se debe Prueba de Shapiro-Wilk
Prueba T de Student para (hasta 50 observaciones)
promedio de una distribuir
una muestra o Prueba de
muestra contra un normalmente
valor específico Kolmogorov-Sminorv
con corrección de
La variable se debe
Lillieford (más de 50
distribuir
2 muestras observaciones
normalmente
independientes:
comparar los Prueba T de Student para
promedios dos grupos
obtenidos en dos independientes Se debe evaluar la
Prueba de Levene o
grupos homogeneidad de
Prueba de Barlett
independientes. varianzas
Prueba para
Prueba de Hipótesis a
Objetivo Supuestos cumplimiento del
realizar
supuesto
2 muestras
pareadas:
Prueba de Shapiro-Wilk
comparar los La variable se debe
Prueba T de Student para (hasta 50 observaciones)
promedios distribuir
dos grupos relacionados o Prueba de
obtenidos en dos normalmente
Kolmogorov-Sminorv
grupos
con corrección de
relacionados.
Lillieford (más de 50
Los ERRORES se deben
observaciones
distribuir
k muestras normalmente
independientes: Se debe evaluar la
comparar los Prueba de Levene o
Análisis de Varianza homogeneidad de
promedios Prueba de Barlett
(ANOVA) varianzas
obtenidos en mas
de dos grupos Prueba de las Rachas
Los errores deben ser
independientes. Prueba de Durbin-
aleatorios
Watson
Prueba para
Prueba de Hipótesis a
Objetivo Supuestos cumplimiento del
realizar
supuesto
k muestras
pareadas:
comparar los Las diferencias entre
Análisis de Varianza de Prueba de Esfericidad
promedios las varianzas por pares
medidas repetidas de Mauchly
obtenidos en más deben ser iguales
dos grupos
relacionados.
Estadística NO Paramétrica
Parte de la estadística inferencial que realiza
procedimientos sobre variables cuyas distribuciones no
requieren ser conocidas

No se requiere del CUMPLIMIENTO DE Permite realizar


SUPUESTOS principalmente
contrastes de hipótesis
Se utilizan como contraparte a
las pruebas paramétricas, pero Permite hipótesis para
sus resultados son mas débiles variables nominales,
ordinales y cuantitativas
De igual forma, generan un P-valor que se contrasta con el
valor de alfa
Objetivo Prueba de Hipótesis a realizar Condición

Variables cualitativas. Puede


Asociación de dos Prueba de Chi-Cuadrado o en su
ser cuantitativas siempre y
variables categóricas defecto, prueba Exacta de Fisher*
cuando se categorice.
1 muestra: comparar la
mediana e una muestra Prueba de Wilcoxon para una
contra un valor muestra
específico
La variable puede ser ordinal
2 muestras
o cuantitativita
independientes:
Prueba de Wilcoxon U-Mann
comparar la suma de
Whitney
rangos obtenidos en dos
grupos independientes.
Prueba de Hipótesis a
Objetivo Condición
realizar
2 muestras pareadas:
comparar la suma de los Prueba de los signos de
rangos asociados a signos en Wilcoxon
dos grupos relacionados.

k muestras independientes:
comparar la suma de los
Prueba de Kruskall Wallis La variable puede ser
rangos en mas de dos grupos
ordinal o cuantitativita
independientes.

k muestras pareadas:
comparar la suma de los
rangos en mas de dos grupos Prueba de Friedman
pareados.
Evaluación de ajustes a la normalidad: Histograma
Evaluación de ajustes a la normalidad: Histograma
Pruebas de Hipótesis para evaluar normalidad

Para ello utilizaremos la Prueba de Kolmogorov-


Smirnov (si hay más de 50 unidades de análisis) o
Shapiro-Wilk (si hay 50 o menos unidades de análisis)

• H0: La variable se distribuye normal

• H1: La variable no se distribuye normal.


• Si el valor de P (o sig. Bilateral) es menor o igual a un valor alfa
preestablecido, la variable NO ES NORMAL.

• Si el valor de P (o sig. Bilateral) es mayor a un valor alfa preestablecido, la


variable ES NORMAL.

Ejemplo:
Una de nuestras variables de
estudio presenta el siguiente
resultado en la prueba de
normalidad Kolmogorov-smirnov
Considerando un alfa=0.05, ¿La
variable se distribuye según la ley
normal?

Dado que P=0,259 > 0,05 → La variable se distribuye


normal.
Pruebas de Hipótesis para una
muestra
Prueba T de Student - Prueba de
Wilcoxon
Prueba Paramétrica: Prueba T de Student

• Basada en la distribución T de Student.

• Se contrasta el valor promedio de la muestra en estudio


contra un valor preestablecido

• El sistema de hipótesis establecido es el siguiente:


𝐻0 : 𝜇 = 𝜇0 Se estima un valor de T calculado, el cual si
𝐻1 : 𝜇 ≠ 𝜇0 es mayor a un valor de T tabulado,
entonces rechazamos la Hipótesis nula
𝐻0 : 𝜇 ≤ 𝜇0
De igual forma, la prueba genera un p-Valor
𝐻1 : 𝜇 > 𝜇0 que se compara con el alfa establecido y se
𝐻0 : 𝜇 ≥ 𝜇0 concluye si hay diferencias significativas o
𝐻1 : 𝜇 < 𝜇0 no.
Prueba T de Student para 1 muestra:
Ejemplo

Se aplica un test para evaluar el nivel de conocimiento que tienen los escolares
sobre el COVID-19. El test fue aplicado a 45 sujetos, quienes obtuvieron una
calificación promedio de 62,17 puntos con una desviación estándar de 5,83 puntos.
Se sabe que un puntaje superior a 60 puntos es indicativo de buen conocimiento.
Existe evidencia para decir que el grupo posee un buen nivel de conocimiento?
Alfa= 0.05
Ho: El promedio de la prueba es menor o Igual a 60 (el grupo
tiene problemas).
H1: El promedio es mayor a 60 (el grupo no tiene problemas)
Prueba T de Student para 1 muestra:
Ejemplo

No se rechaza la Hipótesis nula de


normalidad. Por tanto, la variables
es normal

Se rechaza la Hipótesis nula. Por tanto se concluye


que el promedio es significativamente superior a 60
puntos, lo que significa que el grupo posee un buen
conocimiento.
Prueba NO Paramétrica: Prueba de
Wilcoxon
• Alternativa No paramétrica a la prueba T de student de una
muestra.

• Contrasta la mediana de una variable con una valor específico, por


tanto puede ser aplicada a variables en escala ordinal.

• El sistema de hipótesis establecido es el siguiente:


𝐻0 : 𝑀𝑒𝑑 = 𝑀𝑒𝑑0
Se estima un valor de W calculado, el cual si
𝐻1 : 𝑀𝑒𝑑 ≠ 𝑀𝑒𝑑0 es mayor a un valor de W tabulado,
entonces rechazamos la Hipótesis nula
𝐻0 : 𝑀𝑒𝑑 ≤ 𝑀𝑒𝑑0
𝐻1 : 𝑀𝑒𝑑 > 𝑀𝑒𝑑0 De igual forma, la prueba genera un p-Valor
que se compara con el alfa establecido y se
𝐻0 : 𝑀𝑒𝑑 ≥ 𝑀𝑒𝑑0
concluye si hay diferencias significativas o
𝐻1 : 𝑀𝑒𝑑 < 𝑀𝑒𝑑0 no.
Prueba NO Paramétrica: Prueba de
Wilcoxon para 1 muestra- Ejemplo

Se midieron en sangre los niveles de la hormona T4-libre en 59 sujetos


pertenecientes a una comunidad insular del sur de Chile. Se considera un valor
disminuido de esta hormona si la misma es inferior a los (1,5 ng/dL). Considerando
que la variable T4-libre no se distribuye normal, puede inferir que el grupo posee
bajos niveles de esta hormona al 90% de confianza?

Ho: La mediana de T4-libre es mayor o Igual a 1,5 ng/dL.


H1: La mediana de T4-Libre es menor a 1,5 ng/dL.
Prueba NO Paramétrica: Prueba de
Wilcoxon- Ejemplo

Se rechaza la Hipótesis nula de


normalidad. Por tanto, la variables
NO es normal

NO se rechaza la Hipótesis nula. Por tanto se concluye


que la mediana no es significativamente menor a 1.5
ng/dL, lo que significa que el grupo no posee niveles
bajos de esta hormona.
BIOESTADISTICA: Correlación
lineal, Pruebas paramétricas y
no paramétricas
Prof. Marvin Querales
marvin.querales@cloud.uautonoma.cl
Semestre primavera 2023

También podría gustarte