Está en la página 1de 22

UNIVERSIDAD NACIONAL DEL CALLAO

ESCUELA DE POSGRADO

MAESTRÍA EN SALUD PÚBLICA

BIOESTADÍSTICA

Mg. Jorge Luis ILQUIMICHE MELLY


ANÁLISIS DE
CORRELACIÓN Y
DE REGRESIÓN
LINEAL
BIOESTADÍSTICA
ANÁLISIS DE
CORRELACIÓN Y
DE REGRESIÓN
LINEAL
• Covarianza.
• Coeficiente de Correlación
lineal de Pearson.
• Coeficiente de
Determinación.
• Relación entre variables.
• Diagrama de Dispersión.
• Análisis de regresión lineal.
• Predicción.
ANÁLISIS DE CORRELACIÓN

DEFINICIÓN
El análisis de correlación es una técnica estadística que mide el grado
de asociación o afinidad entre las variables cuantitativas consideradas
en un estudio.
Se llamará correlación simple cuando se trata de analizar la relación
entre dos variables.

Se llamará correlación lineal o rectilínea si la función es una recta y de


correlación no lineal cuando la función es una curva o una función de
grado superior.
ANÁLISIS DE CORRELACIÓN

OBJETIVOS:
• Estimar la relación entre dos variables
cuantitativas.
• Calcular la recta de regresión por el método de los
mínimos cuadrados.
• Predecir, estimar o pronosticar la variable de
estudio. ,
CORRELACIÓN

Mide el grado de relación

Variables cuantitativas Variables cualitativas

Correlación momento – Correlación de rango o


Producto de Pearson Spearman
CORRELACIÓN
Correlación simple o
2 variables bivariada
Relación
>2 variables Correlación Múltiple

Ejemplos:
 Número de horas de estudio y rendimiento académico.
 Gastos en publicidad e ingreso total
 Precio de un producto y cantidad demandada del mismo.
CORRELACIÓN
DIAGRAMA DE DISPERSIÓN:
“NUBE DE PUNTOS”
ANÁLISIS DE CORRELACIÓN
COVARIANZA
 La covarianza es un valor que indica el grado de variación conjunta de dos
variables aleatorias.
 Es el dato básico para determinar si existe una dependencia entre ambas
variables y además es el dato necesario para estimar otros parámetros
básicos, como el coeficiente de correlación lineal o la recta de regresión.
ANÁLISIS DE CORRELACIÓN
COEFICIENTE DE CORRELACIÓN LINEAL DE
PEARSON (R)

 El coeficiente de correlación de Pearson es una medida de la relación lineal


entre dos variables aleatorias cuantitativas. 
 El coeficiente de correlación de Pearson es un índice que puede utilizarse para
medir el grado de relación de dos variables siempre y cuando ambas sean
cuantitativas.
ANÁLISIS DE CORRELACIÓN
COEFICIENTE DE CORRELACIÓN DE PEARSON
El Coeficiente de Correlación de Pearson, es el estadígrafo que mide el grado de asociación o
afinidad entre las variables cuantitativas y se denota por “r”, la cual se define como:

𝑛 𝑛 𝑛
𝑛∑ 𝑋𝑖 𝑌 𝑖 − ∑ 𝑋 𝑖 ∑ 𝑌 𝑖
𝑖 =1 𝑖 =1 𝑖=1
𝑟=

√ (∑ ) √ (∑ )
𝑛 𝑛 2 𝑛 𝑛 2

𝑛∑ 𝑋 − 𝑛∑ 𝑌 −
2 2
𝑖 𝑋𝑖 𝑖 𝑌𝑖
𝑖=1 𝑖 =1 𝑖 =1 𝑖=1

Para interpretar la correlación que existe entre las variables se debe tener en cuenta la siguiente
escala:
Si 0.00 ≤ r < ± 0.20 existe correlación no significativa
Si ± 0.20 ≤ r < ± 0.40 existe una correlación baja.
Si ± 0.40 ≤ r < ± 0.70 existe una correlación significativa.
Si ± 0.70 ≤ r < ± 1.00 existe un alto grado de correlación.
Si r = 1 existe una correlación perfecta positiva.
Si r = -1 existe una correlación perfecta negativa.
CORRELACIÓN
COEFICIENTE DE CORRELACIÓN
LINEAL SIMPLE
𝑁 ∑ 𝑋𝑌 − ( ∑ 𝑋 )( ∑ 𝑌 )
 Población: 𝜌=
√[ 𝑁 ∑ 𝑌 − (∑ 𝑌 )
2 2
] √[ 𝑁 ∑ 𝑋 − (∑ 𝑋 )
2 2
]

𝑛 ∑ 𝑋𝑌 − ( ∑ 𝑋 ) ( ∑ 𝑌 )
 Muestra 𝑟=
√[ 𝑛 ∑ 𝑌 2
−(∑ 𝑌 )
2
] √ [𝑛 ∑ 𝑋 2
− (∑ 𝑋 )
2
]
El rango (intervalo de variación) de ρ ò r, es:

-1 < ρ < 1

-1 0 1
Correlación lineal No hay relación lineal Correlación lineal positiva
CORRELACIÓN
ESCALAS DE
 Si, ρCORRELACIÓN
ó r se encuentra en:

1.00 CORRELACIÓN PERFECTA Y


POSITIVA
0.90 - 0.99 CORRELACIÓN MUY ALTA
0.70 - 0.89 CORRELACIÓN ALTA
0.40 - 0.69 CORRELACIÓN MODERADA
0.20 - 0.39 CORRELACIÓN BAJA
0.01 - 0.19 CORRELACIÓN MUY BAJA
0 No existe correlación
-1 CORRELACIÓN PERFECTA Y NEGATIVA
ANÁLISIS DE CORRELACIÓN
Representación gráfica:

APLICACIÓN

Se han examinado una serie de soluciones patrón de fluoresceína en un


espectrómetro de fluorescencia y han conducido a las siguientes
intensidades de fluorescencia (en unidades arbitrarias). Determinar el
coeficiente de correlación.

Variables              

X: Concentración (pg ml-1) 0 2 4 6 8 10 12

Y: Intensidad de fluorescencia 2.1 5.0 9.0 12.6 17.3 21.0 24.7


ANÁLISIS DE CORRELACIÓN
Solución
En la práctica tales cálculos pueden ser realizados en una calculadora o computadora, junto con otros cálculos. Los
resultados se presentan en una tabla, como sigue:
N° X Y XY X2 Y2
1 0 2.1 0 0 4.41
2 2 5 10 4 25
3 4 9 36 16 81
4 6 12.6 75.6 36 158.76
5 8 17.3 138.4 64 299.29
6 10 21 210 100 441
7 12 24.7 296.4 144 610.09
Suma 42 91.7 766.4 364 1619.55

1. Resultados previos del análisis de correlación.


Interpretación: Usando los totales en la formula se tiene que r = 0.998, lo
que significa que existe un alto grado de relación significativa entre las
variables X: concentración y Y: intensidad de fluorescencia.
CORRELACIÓN
EJERCICIO PROPUESTO
En la empresa “PAVIRICOS S.R.L.” que se dedican a la comercialización agrícola, se desea estudiar el
efecto del número de horas por semana (X), en el sueldo de los trabajadores obreros (Y) para 2007. La
información de los 10 trabajadores obreros da los siguientes resultados:

Realizar el diagrama de dispersión e interpretar.


Averiguar si existe relación entre las dos variables mencionadas.
EL COEFICIENTE DE DETERMINACIÓN (R²)

 R² es el cuadrado del coeficiente de correlación de Pearson, el cual es


válido para la regresión lineal simple.
 Es una medida de la bondad de ajuste del modelo de regresión hallado.
 Indica qué porcentaje de la variabilidad de la variable de respuesta Y es
explicada por su relación lineal con X.
 El valor estadístico de R² varía de cero a uno.
ANÁLISIS DE REGRESIÓN LINEAL SIMPLE

2 variables regresión
Representar esta simple
relación mediante una
 Si existe relación →r≠0 → forma matemática >2 variables
Regresión múltiple

Línea recta Línea curva

Regresión Lineal Regresión No Lineal


ANÁLISIS DE REGRESIÓN LINEAL SIMPLE

El análisis de regresión es una técnica estadística que consiste en


determinar la relación funcional entre dos variables cuantitativas en
estudio.

Esta relación funcional entre las variables, es una ecuación matemática


de la forma:
Y= A + B X
que recibe el nombre también de Función de Regresión o Modelo de
Regresión.
A: es el intercepto, es decir, A es el valor de Y cuando X=0
B: es la pendientes, es decir, es el incremento de Y, cuando X aumenta en una unidad.

La finalidad del Análisis de Regresión es hacer pronósticos es decir, hacer


estimaciones futuros de la variable dependiente (Y), para un valor de Xo.
ANÁLISIS DE REGRESIÓN LINEAL SIMPLE

PROCEDIMIENTO:

a) Realizar el diagrama de dispersión y ver el comportamiento de la nube de puntos. Esta


nube nos indicara si la pendientes de la recta es positiva o negativa .

b) Aplicar el método de los Mínimos Cuadrados Ordinarios para estimar los parámetros
de la ecuación de la recta. Las fórmulas dada por este método son las siguientes:

c) Para hacer el pronóstico o el valor estimado de Y, reemplazar en la ecuación


matemática el respectivo valor de Xo, de la siguiente manera:

Y = A + B (Xo)
Y

x
x
Δy Δ y 
B=
Δx 
x Δx
x
A
X
ANÁLISIS DE REGRESIÓN LINEAL SIMPLE

 APLICACIÓN

Calcular la ecuación de regresión (la pendientes y el intercepto) de la recta de regresión


para los datos expuestos anteriormente.
Solución Calculo de la pendiente
N° X Y XY X2 Y2
1 0 2.1 0 0 4.41
2 2 5 10 4 25
3 4 9 36 16 81
4 6 12.6 75.6 36 158.76
5 8 17.3 138.4 64 299.29
6 10 21 210 100 441
7 12 24.7 296.4 144 610.09
Suma 42 91.7 766.4 364 1619.55
𝐵= ¿ ¿
Calculo del intercepto:

𝐴=( ) ( )
91.7 42
𝑨=𝒀 − 𝑩 𝑿 −1.93 =13.1 −1.93 ( 6 )=1.52
7 7

La ecuación de la recta de regresión lineal es: Y= A + B X

También podría gustarte