Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadı́stica y Probabilidad
Capı́tulo 3. Estudio estadı́stico de la relación lineal de
dos variables cuantitativas.
Profesor
Luis Antonio Herrera Pérez
Correo Institucional
laherrerap1@libertadores.edu.co
3. Estudio estadı́stico de la relación lineal de
dos variables cuantitativas.
Espacio
Académico
Estadı́stica y
Probabilidad
3. Estudio
estadı́stico de la
relación lineal de 3.1 Datos bivariados
dos variables
cuantitativas 3.2 Gráfico de dispersión
3.1 Datos
bivariados 3.3 Covarianza
3.2 Gráficos de
dispersión
3.4 Coeficiente de correlación lineal de Pearson
3.3 Covarianza 3.5 Introducción a la regresión lineal simple. Usos y
3.4 Coeficiente aplicaciones.
de correlación
lineal de Pearson
3.5 Introducción
a la regresión
lineal simple.
Usos y
aplicaciones
Bibliografı́a
3.1 Datos bivariados
Espacio
Académico
Estadı́stica y
Datos bivariados
Probabilidad
Cuando a un mismo individuo se le miden dos variables, los
datos resultantes se denominan datos bivariados (Mendenhall,
3. Estudio
estadı́stico de la et al., 2010).
relación lineal de
dos variables
cuantitativas
Individuo No. X Y
3.1 Datos
bivariados 1 X1 Y1
3.2 Gráficos de 2 X2 Y2
dispersión
.. .. ..
3.3 Covarianza . . .
3.4 Coeficiente i Xi Yi
de correlación
lineal de Pearson .. .. ..
. . .
3.5 Introducción
a la regresión n Xn Yn
lineal simple.
Usos y
aplicaciones Tabla 1: Estructura tabular de datos bivariados.
Bibliografı́a
3.1 Datos bivariados
Espacio
Académico
Estadı́stica y
Algunos aspectos a considerar cuando se estudia la relación
Probabilidad lineal de dos variables cuantitativas X e Y .
3.2 Gráficos de
los valores de la variable X aumentan también los valores
dispersión de la variable Y , o si a medida que disminuyen los valo-
3.3 Covarianza res de la variable X disminuyen también los valores de la
3.4 Coeficiente
de correlación
variable Y .
lineal de Pearson
Se dice que las variables X e Y tienen una relación lineal
3.5 Introducción
a la regresión inversamente proporcional, si a medida que aumentan
lineal simple.
Usos y los valores de la variable X disminuyen los valores de la
aplicaciones
variable Y , o si a medida que disminuyen los valores de la
Bibliografı́a
variable X aumentan los valores de la variable Y .
3.2 Gráficos de dispersión
Espacio
Académico Gráficos de dispersión
Estadı́stica y
Probabilidad Estos gráficos suelen ser utilizados para examinar la posible relación
de dos variables cuantitativas (Anderson, 2008).
3. Estudio A B C
estadı́stico de la ● ● ●
relación lineal de 20
20
● ●
● ●
● ●
● ●
dos variables
1.5
cuantitativas ●
● ●
●
●
●
1.0
15
15
● ● ●
3.1 Datos ● ●
●
bivariados ●
0.5
● ●
● ●
Y
Y
● ●
3.2 Gráficos de
10
10
● ●
● ●
dispersión
0.0
● ● ●
●
● ● ● ●
●
3.3 Covarianza
−0.5
●
5
5
● ●
● ● ●
3.4 Coeficiente ●
● ●
●
●
−1.0
de correlación ●
● ●
● ●
X X X
3.5 Introducción
a la regresión Figura 1: Algunos gráficos de dispersión; A) Las variables X e Y
lineal simple.
Usos y tienen una relación lineal directamente proporcional; B) Las variables
aplicaciones
X e Y tienen una relación lineal inversamente proporcional; C) Las
Bibliografı́a
variables X e Y no tienen una relación lineal.
3.2 Gráficos de dispersión
Espacio
Académico
Estadı́stica y Ejemplo de un gráfico de dispersión
Probabilidad
A continuación se presenta el espacio en pies cuadrados de una muestra de 12
viviendas residenciales y su precio en miles de dólares:
3. Estudio
estadı́stico de la Vivienda No. Espacio (en pies cuadrados) Precio (en miles de dólares)
relación lineal de
1 1360 278.5
dos variables
cuantitativas 2 1940 375.7
3 1750 339.5
3.1 Datos 4 1500 329.8
bivariados 5 1790 320.5
6 1750 310.3
3.2 Gráficos de 7 2230 460.5
dispersión 8 1600 305.2
9 1450 288.6
3.3 Covarianza
10 1870 365.7
3.4 Coeficiente 11 2210 425.3
de correlación 12 1480 268.8
lineal de Pearson
Espacio
Académico
Solución:
Estadı́stica y
Probabilidad ●
450
●
3. Estudio
estadı́stico de la
400
relación lineal de
dos variables ●
cuantitativas ●
350
3.1 Datos ●
bivariados ●
●
3.2 Gráficos de ●
300
dispersión ●
3.3 Covarianza ●
lineal de Pearson
3.5 Introducción
a la regresión Figura 2: Gráfico de dispersión Espacio vs Precio.
lineal simple.
Usos y Interpretación: Del gráfico anterior y en términos de tendencia, se puede apreciar
aplicaciones
que a medida que aumenta el valor del espacio de las viviendas, aumenta tam-
Bibliografı́a bién el valor de su precio, por lo que estas dos variables, gráficamente, estarı́an
presentando una relación lineal directamente proporcional.
3.3 Covarianza
Espacio
Académico
Estadı́stica y Covarianza
Probabilidad
Es una medida que permite estudiar la relación lineal que podrı́a
3. Estudio
existir entre dos variables cuantitativas (Anderson, 2008).
estadı́stico de la
relación lineal de Notación a tener en cuenta:
dos variables
cuantitativas
Covarianza poblacional:
3.1 Datos
bivariados ! !
N
P N
P
3.2 Gráficos de N N Xi Yi
dispersión P P i=1 i=1
(Xi − µx ) (Yi − µy ) Xi Yi − N
3.3 Covarianza i=1 i=1
σxy = =
3.4 Coeficiente N N
de correlación
lineal de Pearson
Covarianza muestral:
3.5 Introducción
n n
a la regresión P P
lineal simple. n
P n
P Xi Yi
i=1 i=1
Usos y
aplicaciones
Xi − X Yi − Y Xi Yi − n
i=1 i=1
Sxy = =
Bibliografı́a
n−1 n−1
3.3 Covarianza
Espacio
Académico
Estadı́stica y Una estructura que permite calcular fácilmente algunas de las
Probabilidad
sumatorias presentadas anteriormente.
3. Estudio Individuo No. X Y XY
estadı́stico de la
relación lineal de 1 X1 Y1 X1 Y1
dos variables
cuantitativas 2 X2 Y2 X2 Y2
3.1 Datos .. .. .. ..
bivariados . . . .
3.2 Gráficos de i Xi Yi Xi Yi
dispersión
.. .. .. ..
3.3 Covarianza . . . .
3.4 Coeficiente n Xn Yn Xn Yn
de correlación
lineal de Pearson
n
P n
P n
P
Sumatorias Xi Yi Xi Yi
3.5 Introducción
a la regresión i=1 i=1 i=1
lineal simple.
Usos y Tabla 3: Estructura tabular para calcular algunas sumatorias.
aplicaciones
Bibliografı́a
3.3 Covarianza
Espacio
Académico
Estadı́stica y
Probabilidad
3.2 Gráficos de Si el valor de σxy o Sxy resulta ser menor que 0, entonces
dispersión
se dice que las variables X e Y tienen una relación
3.3 Covarianza
lineal inversamente proporcional.
3.4 Coeficiente
de correlación
lineal de Pearson
Si el valor de σxy o Sxy es igual a 0, entonces se dice que
3.5 Introducción
las variables X e Y no tienen una relación lineal.
a la regresión
lineal simple.
Usos y
aplicaciones
Bibliografı́a
3.3 Covarianza
Espacio
Académico
Estadı́stica y Ejemplo del cálculo de la covarianza
Probabilidad
Teniendo en cuenta el ejemplo analizado anteriormente, don-
3. Estudio de se deseaba estudiar la relación que podrı́a existir entre el
estadı́stico de la
relación lineal de
espacio de una muestra de viviendas (X X ) y su precio (Y
Y ), da-
dos variables
cuantitativas
tos presentados en la tabla 2, calcule e interprete la covarianza
3.1 Datos entre las dos variables en estudio.
bivariados
3.3 Covarianza
3.4 Coeficiente
de correlación
lineal de Pearson
3.5 Introducción
a la regresión
lineal simple.
Usos y
aplicaciones
Bibliografı́a
3.3 Covarianza
Espacio
Académico
Estadı́stica y Ejemplo del cálculo de la covarianza
Probabilidad
Teniendo en cuenta el ejemplo analizado anteriormente, don-
3. Estudio de se deseaba estudiar la relación que podrı́a existir entre el
estadı́stico de la
relación lineal de
espacio de una muestra de viviendas (X X ) y su precio (Y
Y ), da-
dos variables
cuantitativas
tos presentados en la tabla 2, calcule e interprete la covarianza
3.1 Datos entre las dos variables en estudio.
bivariados
3.5 Introducción Interpretación: Debido a que el valor de la covarianza muestral Sxy resultó ser
a la regresión mayor que 0 (15681.48 aproximadamente), se puede concluir que las dos varia-
lineal simple.
Usos y bles en estudio tienen una relación lineal directamente proporcional. Lo anterior
aplicaciones indica que a medida que aumenta el valor del espacio de las viviendas, aumenta
Bibliografı́a también el valor de su precio, coincidiendo ası́ con la interpretación realizada en
el correspondiente gráfico de dispersión.
3.4 Coeficiente de correlación lineal de
Pearson.
Espacio
Académico Coeficiente de correlación lineal de Pearson
Estadı́stica y
Probabilidad Es una medida que permite estudiar la relación lineal que podrı́a existir entre dos
variables cuantitativas, incluyendo el grado de fortaleza de la relación (Anderson,
2008).
3. Estudio
estadı́stico de la Notación a tener en cuenta:
relación lineal de
dos variables Coeficiente de correlación lineal de Pearson poblacional:
cuantitativas
Bibliografı́a
3.4 Coeficiente de correlación lineal de
Pearson.
Espacio
Académico Ejemplo del cálculo del coeficiente de correlación lineal de Pear-
Estadı́stica y
Probabilidad son.
Teniendo en cuenta el ejemplo analizado anteriormente, donde
3. Estudio
estadı́stico de la se deseaba estudiar la relación que podrı́a existir entre el es-
relación lineal de
dos variables pacio de una muestra de viviendas (X X ) y su precio (Y Y ), datos
cuantitativas
presentados en la tabla 2, calcule e interprete el coeficiente de
3.1 Datos
bivariados correlación lineal de Pearson entre las dos variables en estudio.
3.2 Gráficos de
dispersión Solución:
3.3 Covarianza
3.4 Coeficiente
de correlación
lineal de Pearson
3.5 Introducción
a la regresión
lineal simple.
Usos y
aplicaciones
Bibliografı́a
3.4 Coeficiente de correlación lineal de
Pearson.
Espacio
Académico Ejemplo del cálculo del coeficiente de correlación lineal de Pear-
Estadı́stica y
Probabilidad son.
Teniendo en cuenta el ejemplo analizado anteriormente, donde
3. Estudio
estadı́stico de la se deseaba estudiar la relación que podrı́a existir entre el es-
relación lineal de
dos variables pacio de una muestra de viviendas (X X ) y su precio (Y Y ), datos
cuantitativas
presentados en la tabla 2, calcule e interprete el coeficiente de
3.1 Datos
bivariados correlación lineal de Pearson entre las dos variables en estudio.
3.2 Gráficos de
dispersión Solución:
3.3 Covarianza Sxy 15681.48
r= Sx Sy = (285.03)(58.61) = 0.94
3.4 Coeficiente
de correlación
lineal de Pearson
Interpretación: Debido a que el valor del coeficiente de correlación lineal de
3.5 Introducción Pearson muestral r resultó ser cercano a 1 (0.94 aproximadamente), se puede
a la regresión
lineal simple.
concluir que las dos variables en estudio tienen una fuerte relación lineal direc-
Usos y tamente proporcional. Lo anterior indica que a medida que aumenta el valor del
aplicaciones espacio de las viviendas, aumenta también el valor de su precio. Observe que
Bibliografı́a esta interpretación coincide con aquella realizada en la covarianza y el gráfico de
dispersión correspondiente, sólo que en este caso se agrega el grado de fortaleza
de la relación.
3.5 Introducción a la regresión lineal simple.
Usos y aplicaciones.
Espacio
Académico
Estadı́stica y
Probabilidad Introducción a la regresión lineal simple
Esta metodologı́a permite modelar mediante una lı́nea recta,
3. Estudio
estadı́stico de la
una variable dependiente Y en función de una variable inde-
relación lineal de
dos variables
pendiente o predictora X (Mendenhall, et al., 2010).
cuantitativas
3.1 Datos
De manera general, el propósito es ajustar la ecuación de una
bivariados lı́nea recta de la forma:
3.2 Gráficos de
dispersión
3.3 Covarianza
Ŷi = β̂0 + β̂1Xi para i = 1, ..., n
3.4 Coeficiente
de correlación
Donde Ŷi corresponde al valor estimado de la variable depen-
lineal de Pearson
diente Y para el i − ésimo individuo, β̂0 al valor estimado del
3.5 Introducción
a la regresión intercepto de la recta, β̂1 al valor estimado de la pendiente de
lineal simple.
Usos y
la recta, y Xi al valor observado de la variable independiente X
aplicaciones
para el i − ésimo individuo.
Bibliografı́a
3.5 Introducción a la regresión lineal simple.
Usos y aplicaciones.
Espacio
Académico
Estadı́stica y
Probabilidad
Fórmulas para el cálculo de β̂1 y β̂0
Bajo el método de mı́nimos cuadrados (MC), los valores de β̂1
3. Estudio
estadı́stico de la
y β̂0 pueden ser calculados mediante las siguientes fórmulas:
relación lineal de
dos variables
n
n
P P
cuantitativas n
P Xi Yi
i=1 i=1
3.1 Datos Xi Yi − n
bivariados
i=1
3.2 Gráficos de
β̂1 = n
2
P
dispersión n Xi
Xi2 −
P i=1
3.3 Covarianza
n
3.4 Coeficiente
i=1
de correlación
lineal de Pearson y
3.5 Introducción
a la regresión
β̂0 = Y − β̂1 X
lineal simple.
Usos y Observación: Y corresponde al promedio aritmético muestral de la variable de-
aplicaciones
pendiente Y y X corresponde al promedio aritmético muestral de la variable
Bibliografı́a independiente X . Note además que el valor de β̂0 depende del valor de β̂1 .
3.5 Introducción a la regresión lineal simple.
Usos y aplicaciones.
Espacio
Académico
Estadı́stica y
Probabilidad
3.3 Covarianza
las variables X e Y tienen una relación lineal inver-
3.4 Coeficiente
samente proporcional.
de correlación
lineal de Pearson Si el valor de β̂1 es igual a 0, entonces se dice que las
3.5 Introducción variables X e Y no tienen una relación lineal.
a la regresión
lineal simple.
Usos y
aplicaciones
Bibliografı́a
3.5 Introducción a la regresión lineal simple.
Usos y aplicaciones.
Espacio
Académico
Estadı́stica y
Ejemplo de regresión lineal simple
Probabilidad
Teniendo en cuenta el ejemplo analizado anteriormente, donde
se deseaba estudiar la relación que podrı́a existir entre el es-
3. Estudio
estadı́stico de la pacio de una muestra de viviendas (X X ) y su precio (Y
Y ), datos
relación lineal de
dos variables presentados en la tabla 2, ajuste la ecuación de la lı́nea recta
cuantitativas
obtenida mediante el método de MC, para estudiar la relación
3.1 Datos
bivariados lineal que podrı́a existir entre las dos variables en estudio.
3.2 Gráficos de
dispersión Solución:
3.3 Covarianza
Para encontrar la ecuación de la lı́nea recta obtenida por el método de MC, es
3.4 Coeficiente necesario calcular los valores de β̂1 y β̂0 , los cuales están dados por:
de correlación
lineal de Pearson ! !
n
P n
P
n Xi Yi
3.5 Introducción P i=1 i=1
Xi Yi − (20930)(4068.4)
(20930)(4068.4)
a la regresión i=1
n 7268464− 12
lineal simple. β̂1 = n
!2 = (20930)2
(20930)
= 0.1930
Usos y
P
Xi 37399100− 12
n
i=1
aplicaciones Xi2 −
P
n
i=1
Bibliografı́a
β̂0 = Y − β̂1 X = 339.0333 − 0.1930(1744.1667) = 2.4091
3.5 Introducción a la regresión lineal simple.
Usos y aplicaciones.
Espacio
Académico
Solución:
Estadı́stica y
Probabilidad β̂0 β̂1
2.4091 0.1930
3. Estudio
estadı́stico de la
relación lineal de Tabla 4: Valores de β̂0 y β̂1 obtenidos por el método de MC para los
dos variables
cuantitativas
datos de la tabla 2.
3.1 Datos
bivariados De esta forma, la ecuación de la lı́nea recta obtenida por el
3.2 Gráficos de método de MC, que permite estudiar la relación lineal entre las
dispersión
dos variables Espacio y Precio, está dada por:
3.3 Covarianza
3. Estudio
estadı́stico de la
Observación: Debido a que el valor estimado de la pendiente
relación lineal de
dos variables
de la recta β̂1 , resultó ser mayor que 0 (0.1930 aproximadamen-
cuantitativas te), se puede concluir que las dos variables en estudio tienen
3.1 Datos
bivariados
una relación lineal directamente proporcional. Lo anterior indica
3.2 Gráficos de que a medida que aumenta el valor del espacio de las vivien-
dispersión
das, aumenta también el valor de su precio, coincidiendo ası́
3.3 Covarianza
con la interpretación realizada en el correspondiente gráfico de
3.4 Coeficiente
de correlación dispersión, la covarianza y el coeficiente de correlación lineal
lineal de Pearson
de Pearson, sin incluir para éste último el grado de fortaleza de
3.5 Introducción
a la regresión la relación.
lineal simple.
Usos y
aplicaciones
Bibliografı́a
3.5 Introducción a la regresión lineal simple.
Usos y aplicaciones.
Espacio
Académico
Estadı́stica y
Probabilidad Coeficiente de determinación
Es una medida de bondad de ajuste de la lı́nea recta ajustada
3. Estudio
estadı́stico de la por el método de MC (Anderson, 2008). En otras palabras, es
relación lineal de
dos variables una medida que permite determinar qué tan bueno es el ajuste
cuantitativas
de la lı́nea recta ajustada por el método de MC.
3.1 Datos
bivariados
Notación a tener en cuenta:
3.2 Gráficos de
dispersión
Coeficiente de determinación poblacional:
3.3 Covarianza
R 2 = ρ2 × 100
3.4 Coeficiente
de correlación
lineal de Pearson
3.5 Introducción
a la regresión
Coeficiente de determinación muestral:
lineal simple.
Usos y
aplicaciones Re2 = r 2 × 100
Bibliografı́a
3.5 Introducción a la regresión lineal simple.
Usos y aplicaciones.
Espacio
Académico
Estadı́stica y
Probabilidad
3. Estudio
Interpretación del coeficiente de determinación
estadı́stico de la
relación lineal de
dos variables
Si el valor de R 2 o Re2 es cercano al 100 %, entonces se
cuantitativas dice que la lı́nea recta obtenida por el método de MC se
3.1 Datos
bivariados
ajusta muy bien a los datos, y ası́, la variable Y está siendo
3.2 Gráficos de explicada muy bien por la lı́nea recta ajustada.
dispersión
Si el valor de R 2 o Re2 es cercano al 0 %, entonces se dice
3.3 Covarianza
3.4 Coeficiente
que la lı́nea recta obtenida por el método de MC no se
de correlación
lineal de Pearson
ajusta muy bien a los datos, y ası́, la variable Y no está
3.5 Introducción
siendo explicada muy bien por la lı́nea recta ajustada.
a la regresión
lineal simple.
Usos y
aplicaciones
Bibliografı́a
3.5 Introducción a la regresión lineal simple.
Usos y aplicaciones.
Espacio
Académico
Estadı́stica y Ejemplo del coeficiente de determinación
Probabilidad
Teniendo en cuenta la ecuación de la lı́nea recta ajustada en
3. Estudio
el ejemplo anterior, donde se deseaba estudiar la relación que
estadı́stico de la X)
podrı́a existir entre el espacio de una muestra de viviendas (X
relación lineal de
dos variables y su precio (Y Y ), datos presentados en la tabla 2, calcule e
cuantitativas
3.1 Datos
interprete el coeficiente de determinación correspondiente a la
bivariados lı́nea recta ajustada.
3.2 Gráficos de
dispersión
3. Estudio
estadı́stico de la Estimación de valores de la variable dependiente e independien-
relación lineal de
dos variables te.
cuantitativas
Al ajustar la ecuación de una lı́nea recta o modelo de regresión
3.1 Datos
bivariados lineal simple, es posible utilizar éste para estimar valores de
3.2 Gráficos de la variable dependiente (Y Y ) a partir de valores de la variable
dispersión
3.3 Covarianza
independiente (X X ). Ası́ mismo, es posible utilizar el modelo
3.4 Coeficiente
para estimar valores de la variable independiente (X X ) a partir
de correlación
lineal de Pearson
de valores de la variable dependiente (Y Y ).
3.5 Introducción
a la regresión
lineal simple.
Usos y
aplicaciones
Bibliografı́a
3.5 Introducción a la regresión lineal simple.
Usos y aplicaciones.
Espacio
Académico Ejemplo de estimación de un valor de la variable dependiente,
Estadı́stica y
Probabilidad haciendo uso de una ecuación de una lı́nea recta.
Teniendo en cuenta la ecuación de la lı́nea recta ajustada en
3. Estudio
estadı́stico de la
el ejemplo anterior, donde se deseaba estudiar la relación que
relación lineal de
dos variables
X)
podrı́a existir entre el espacio de una muestra de viviendas (X
cuantitativas y su precio (Y Y ), datos presentados en la tabla 2, estime el
3.1 Datos
bivariados
valor del precio de una vivienda, cuyo espacio es de 1510 pies
3.2 Gráficos de cuadrados.
dispersión
3.2 Gráficos de
Solución:
dispersión En este caso, se conoce un valor de la variable dependiente (Precio Precio = 300
300) y
3.3 Covarianza se consulta por el valor estimado de la variable independiente correspondiente
ˆ
(Espacio = ¿?
¿?). Al reemplazar el valor del precio de la vivienda, en la ecuación de
3.4 Coeficiente
de correlación ˆ = 2.4091 + 0.1930Espacio
la lı́nea recta o modelo de regresión lineal simple Precio 0.1930Espacio,
lineal de Pearson se tiene que 300 = 2.4091 + 0.1930Espacio
0.1930Espacio, y al despejar de éste la variable Es-
3.5 Introducción pacio, se tiene que:
a la regresión
lineal simple.
Usos y ˆ 300 − 2.4091
Espacio = = 1541.92
aplicaciones 0.1930
Bibliografı́a
Ası́, se estima que el espacio de una vivienda cuyo precio sea de 300 mil dólares,
es de 1541.92 pies cuadrados aproximadamente.
Bibliografı́a
Espacio
Académico
Estadı́stica y
Probabilidad
3. Estudio
estadı́stico de la
relación lineal de
dos variables
Anderson D., Sweeny D. y Williams T. Estadı́stica para
cuantitativas administración y economı́a. Décima edición. Editorial Cen-
3.1 Datos
bivariados
gage Learning. México, 2008.
3.2 Gráficos de
dispersión
Mendenhall W., Beaver R. y Beaver B. Introducción a la
3.3 Covarianza probabilidad y estadı́stica. Décima tercera edición. Editorial
3.4 Coeficiente Cengage Learning. México, 2010.
de correlación
lineal de Pearson
3.5 Introducción
a la regresión
lineal simple.
Usos y
aplicaciones
Bibliografı́a
Espacio
Académico
Estadı́stica y
Probabilidad
3. Estudio
estadı́stico de la
relación lineal de
dos variables
cuantitativas
3.1 Datos
bivariados
3.2 Gráficos de
Gracias
dispersión
3.3 Covarianza
3.4 Coeficiente
de correlación
lineal de Pearson
3.5 Introducción
a la regresión
lineal simple.
Usos y
aplicaciones
Bibliografı́a