Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Lineal 𝑦 = 𝑏 + 𝑏 𝑥 + 𝑏 𝑏𝑥 + 𝑏 𝑥
Cuadrática 𝑦= 𝑏 ⋅𝑥
Cúbica 𝑦 = 𝑏 ⋅ 𝑒𝑏 𝑥
Potencia 𝑦 = 𝑏 + 𝑏 ln 𝑥
𝑏
Exponencial 𝑦 =𝑏 +
𝑦 = 𝑏 𝑏𝑥𝑥
Logarítmica
𝑦 = 𝑒 +𝑏 𝑥
𝑦 = 𝑒𝑏 +
𝑏
Bioestadística Aplicada con SPSS
(179, 85)
90
Peso (Kg)
70
60
50
44
Regresión Lineal Simple y Correlación
𝑋 𝑋 𝑋
Relación exponencial
Relación logarímica Relación inversa
𝑋 𝑋 𝑋
que mejor se ajusta a la nube de puntos será, por tanto, aquella que hace
mínima la suma de los cuadrados de los residuos. *
Rectas de regresión
En el caso de que la nube de puntos tenga forma lineal y optemos por ex-
plicar la relación entre 𝑋 e 𝑌 mediante una recta 𝑦 = 𝑎 + 𝑏𝑥 , los parámetros
a determinar son 𝑎 (punto de corte con el eje de ordenadas) y 𝑏 (pendiente
de la recta). Los valores de estos parámetros que hacen mínima la suma de
residuos al cuadrado, determinan la recta óptima. Esta recta se conoce co-
mo recta de regresión de𝑌sobre y𝑋explica la variable en función
𝑌 de la
*
El cuadrado es para evitar que se compensen los residuos positivos con los negativos.
45
Bioestadística Aplicada con SPSS
(𝑥𝑖, 𝑦𝑗)
𝑦𝑗
𝑒𝑖𝑗 = 𝑦𝑗 − 𝑓 (𝑥𝑖)
𝑌𝑓 (𝑥𝑖 )
𝑥𝑖
46
Regresión Lineal Simple y Correlación
Figura 4.4: Rectas de regresión de Estatura sobre Peso y de Peso sobre ̄ Estatura.
Las rectas de regresión siempre se cortan en el punto de medias (𝑥, 𝑦)
entre 𝑋 e 𝑌. Cuando todos los residuos son nulos, la recta pasa por todos los
sobre 𝑋 y la de 𝑋 sobre 𝑌 coinciden (figura
4.5(a)).
𝑌 𝑋
Por contra, cuando no existe relación lineal entre las variables, la recta 𝑦de= 𝑦
gresión
re- de sobre tiene pendiente nula, y ̄por tanto la ecuación es ,
en la que, efectivamente no aparece 𝑥, o 𝑥 = 𝑥 en el caso de la recta de regre-
4.1.2. Correlación
El principal objetivo de la regresión simple es construir un modelo funcio-
nal 𝑦 = 𝑓(𝑥) que explique lo mejor posible la relación entre dos variables 𝑋
(variable independiente) e 𝑌 (variable dependiente) medidas en una
misma
muestra. Generalmente, el modelo construido se utiliza para realizar
infe- rencias predictivas
𝑌 de en función 𝑋 de en el resto de la población.
Pero aunque la regresión garantiza que el modelo construido es el mejor
posible,
47
Bioestadística Aplicada con SPSS
𝑌
𝑋 sobre 𝑌 = 𝑌 sobre 𝑋
𝑦̄
𝑌 𝑋
sobre
𝑥̄
𝑋
48
Regresión Lineal Simple y Correlación
muestra en la figura (4.3). Estas distancias, son en realidad, los errores pre-
dictivos del modelo sobre los propios valores de la muestra.
Cuanto más pequeños sean los residuos, mejor se ajustará el modelo a la
nube de puntos, y por tanto, mejor explicará la relación entre 𝑋 e𝑌 . Cuando
todos los residuos son nulos, la curva de regresión pasa por todos los
puntos de la nube, y entonces se dice que la relación es perfecta, o bien
que
una existe
dependencia funcional entre 𝑋 e 𝑌 (figura 4.5(a)). Por contra,
cuando
𝑌 𝑋
los residuos sean grandes, el modelo no explicará bien la relación entre e
, y por tanto, sus predicciones no serán fiables (figura 4.5(b)).
Varianza residual
Una primera medida de correlación, construida a partir de los residuos es la
varianza residual, que se define como el promedio de los residuos al
cuadra- do 𝑖,𝑗 𝑖𝑗 𝑖𝑗 𝑖,𝑗 𝑗 𝑖 𝑖𝑗
𝑟𝑦 ∑ 𝑛𝑒 𝑛 ∑ (𝑦 − 𝑓 (𝑥 ))𝑛𝑛
𝑠 = =
Cuando los residuos son nulos, entonces y eso indica que hay
depen- dencia funcional. Por otro lado, 𝑠= cuando las variables son
independientes, con respecto al modelo0𝑟�� de regresión ajustado, entonces
los residuos se con- vierten en las desviaciones 𝑌 de los valores de con
respecto a su media, y se
cumple que 𝑠𝑟𝑦 = 𝑠𝑦. Así pues, se cumple que
𝑟𝑦 𝑦
0≤𝑠 ≤𝑠
Según esto, cuanto menor sea la varianza residual, mayor será la dependen-
cia entre 𝑋 e 𝑌, de acuerdo al modelo ajustado. No obstante, la varianza
tiene como unidades las unidades de al𝑌cuadrado, y eso dificulta su inter-
pretación.
Coeficiente de determinación
Puesto que el valor máximo que puede tomar la varianza residual es la va-
rianza de 𝑌, se puede definir fácilmente un coeficiente a partir de la compa-
ración de ambas medidas. Surge así el coeficiente de determinación que se
define como 𝑅 = 1 − 𝑠𝑟𝑦𝑦
Se cumple que 0 ≤ 𝑅 ≤ 𝑠1
49
Bioestadística Aplicada con SPSS
𝑠𝑥𝑠𝑥𝑠𝑦𝑦
𝑟=
Coeficiente de correlación
Otra medida de dependencia bastante habitual es el coeficiente de correla-
ción, que se define como la raíz cuadrada del coeficiente de determinación:
𝑅=±
𝑠𝑠𝑟𝑦𝑦
1−
tomando la raíz del mismo signo que la covarianza.
La única ventaja del coeficiente de correlación con respecto al coeficiente
de determinación, es que tiene signo, y por tanto, además del grado de
de- pendencia entre
𝑋 𝑌 e , también nos habla de si la relación es directa
(signo
+) o inversa (signo -). Su interpretación es:
50
Regresión Lineal Simple y Correlación
51
Bioestadística Aplicada con SPSS
8
8
𝑦 = −0𝑟, 0=2𝑥0+ 4,07 𝑦 = 0,25𝑟𝑥 =− 02,9571𝑥 + 8,05
7
7
6
6
4
4
3
3
2
0 2
4
𝑋 6 8 10
0 2
𝑋 6 8 10
4
unEnla
Figura 4.6:
obtenido 𝑅 = figura
, lo quedeindica
la izquierda se ha ajustado
que el modelo un modelo
no explica nada delineal y se
la relación
ha
,nla figura
eentre 𝑋 e𝑌 ,de
pero no podemos
la derecha afirmar
se observa que
que 𝑌e son
al𝑋 ajustar unindependientes. De 𝑅 =
modelo parabólico,
hecho,
e 𝑌., lo que indica que casi hay una dependencia funcional parabólica entre 𝑋
20
Se pide:
52
Regresión Lineal Simple y Correlación
En vista del diagrama, ¿qué tipo de modelo crees que explicará mejor
c)laCalcular
relaciónlaentre
recta Bdey regresión
A? de 𝐵 sobre 𝐴.
53
Bioestadística Aplicada con SPSS
131
03 02
Se pide:
a) Crear las variables horas y suspensos e introducir estos datos.
b) Calcular la recta de regresión de suspensos sobre horas y dibujar-
la.
i que este caso vale −1,23 e indica que por cada hora de estudio
El coeficiente
adicional de regresión
se obtienen es la pendiente
1,23 suspensos de la recta de regresión,
menos.
d) La relación lineal entre estas dos variables, ¿es mejor o peor que la
del ejercicio anterior? Comentar los resultados a partir las gráficas
de las rectas de regresión y sus residuos.
i La relación lineal entre estas dos variables es peor que la del ejer-
cicio anterior, pues en este caso hay residuos.
55
Bioestadística Aplicada con SPSS
Se pide:
i
Seleccionar el menú Analizar Correlaciones Bivariadas..
..
Seleccionar ambas variables en el campo Variables del cuadro de diálogo y hacer click sobre el botón Aceptar.
56
Regresión Lineal Simple y Correlación
57
Bioestadística Aplicada con SPSS
ultados obtenida, la tabla denominada Coeficientes, y en la columna B de los Coeficientes no estandarizados, enco
iar.
Se desea calcular:
58
Regresión Lineal Simple y Correlación
59